Radeon Open Compute “ROCm” Stack v3.1 vydán s RAS pro Vega 7nm, podpora SLURM pro lepší správu zdrojů, ale Navi stále chybí

Hardware / Radeon Open Compute “ROCm” Stack v3.1 vydán s RAS pro Vega 7nm, podpora SLURM pro lepší správu zdrojů, ale Navi stále chybí 2 minuty čtení

AMD Radeon



Nová verze zásobníku Radeon Open Compute nebo „ROCm“ je nyní k dispozici k dispozici ke stažení. Radeon Open Compute v3.1 přináší spoustu funkcí, ale kupodivu stále chybí podpora AMD Navi i GFX10.

ROCm, nejrozšířenější univerzální platforma pro výpočty urychlené GPU, je nyní ve verzi 3.1. Nejnovější aktualizace modulární platformy, která dodavatelům hardwaru umožňuje vytvářet ovladače podporující rámec ROCm, obsahuje některé velmi očekávané funkce, jako je podpora RAS pro 7nm Vega a podpora SLURM pro GPU AMD. Z dosud neznámých důvodů však ROCm stále nemá úplnou podporu pro architekturu AMD Navi nové generace.

Co je nového v Radeon ROCm v3.1:

Největší a nejzřejmější změna v nové instalaci Radeon ROCm v3.1 je ve struktuře instalačního adresáře ROCm. Nová instalace sady nástrojů ROCm nainstaluje balíčky do / opt / rocm- složku. Dříve byly balíčky nástrojů ROCm instalovány do / opt / rocm složku.



Nová verze ROCm má vylepšenou podporu spolehlivosti, přístupnosti a opravitelnosti (RAS) pro GPU Vega 7nm. Toto 7nm dílo Vega je pravděpodobně pod mikroskopem stále pro Vegánský „Arcturus“ výpočetní akcelerátor přicházející letos. Podpora zahrnuje:



  • UMC RAS ​​- HBM ECC (neopravitelná chybová injekce), vyřazení stránky, obnovení RAS pomocí GPU (BACO) reset
  • GFX RAS - GFX, MMHUB ECC (neopravitelná chybová injekce), obnovení RAS pomocí resetování GPU (BACO)
  • PCIE RAS - PCIE_BIF ECC (neopravitelná chybová injekce), obnovení RAS pomocí GPU (BACO) reset

Radeon ROCm v3.1 také dostává podporu SLURM pro GPU AMD. SLURM nebo Simple Linux Utility pro správu zdrojů je jedním z vysoce preferovaných a snadno používaných systémů pro správu a plánování úloh pro clustery Linux. SLURM je preferován, protože je otevřený, odolný vůči chybám a vysoce škálovatelný.

Tento systém nyní může dobře komunikovat s GPU AMD. Nejnovější verze SLURM 20.02.0 obsahuje doplňky AMD, které umožňují SLURM automaticky detekovat a konfigurovat GPU AMD. Rovněž shromažďuje a hlásí spotřebu energie grafických čipů. Podpora SLURM je užitečným doplňkem vzhledem k rostoucímu počtu nasazení superpočítačů využívajících grafické karty Radeon a další větší klastry AMD GPU.

Navzdory zahrnutí několika funkcí stále neexistují žádné známky podpory GFX10 / Navi v ROCm. The Stránka GitHub pro ROCm byl aktualizován, aby odrážel všechny změny, poznámky k instalaci a známé problémy.



Značky amd