Spuštění NVIDIA Ampere A100 250W TDP GPU na PCIe 4.0 vytvořené pro AI, datovou vědu a superpočítače se slibovaným 90% výkonem modelu 400W

Hardware / Spuštění NVIDIA Ampere A100 250W TDP GPU na PCIe 4.0 vytvořené pro AI, datovou vědu a superpočítače se slibovaným 90% výkonem modelu 400W 2 minuty čtení

Nvidia



NVIDIA oficiálně uvedla A100, grafický procesor kompatibilní s PCIe 4.0 založený na architektuře Ampere nové generace. Ačkoli má NVIDIA nižší profil TDP 250 W, slibuje, že GPU PCIe 4.0 Ampere A100 bude schopna nabídnout až 90 procent výkonu plného GPU A100 HGX 400 W. Třetí varianta rostoucí rodiny GPU Ampere A100, A100 PCIe, je určena pro servery s klastry Artificial Intelligence (AI), Data Science a Supercomputing.

NVIDIA odhalila variantu GPU A100 s rozhraním PCI-Express 4.0. GPU je založeno na 7nm Ampere mikroarchitektuře. Společnost také oznámila několik systémů s napájením A100 od předních výrobců serverů, včetně Asus, Dell, Cisco, Lenovo a dalších. 250W akcelerátor A100 PCIe 4.0 GPU je docela podobný plné 400W variantě TDP a NVIDIA také slibuje téměř stejný výkon navzdory výraznému poklesu profilu TDP.



Grafická karta NVIDIA A100 Ampere v provedení PCIe 4.0 se stejnou konfigurací GPU A100 HGX 400 W, ale při 250 W:

NVIDIA ohlásila svůj akcelerátor PCIe 4.0 A100 PCIe GPU. Grafický procesor Ampere je k dispozici pro nejrůznější případy průmyslového použití se systémy od jediného grafického procesoru A100 PCIe až po servery využívající dvě karty současně prostřednictvím 12 kanálů NVLINK, které poskytují celkem 600 GB / s šířku pásma propojení. 250W TDP A100 PCIe GPU akcelerátor se ve srovnání s 400W A100 HGX GPU příliš nemění, pokud jde o základní konfiguraci.



GPU GA100 má specifikace 400W varianty A100 HGX s 6912 jádry CUDA uspořádanými do 108 jednotek SM, 432 tenzorových jader a 40 GB paměti HBM2, které poskytují stejnou šířku pásma paměti 1,55 TB / s (zaokrouhleno na 1,6 TB / s). Nasazení balíčku GPU na Standard PCIe 4.0 měl svou vlastní nevýhodu významného snížení TDP. To údajně znamená 10 až 50 procentní výkonnostní trest na základě pracovního vytížení. Varianta 250 W TDP GPU A100 je navíc vhodnější pro krátké záblesky než pro trvalé zátěže.

NVIDIA A100 Ampere GPU In PCIe 4.0 Form-Factor Performance:

Vzhledem k výraznému snížení profilu TDP se dalo předpokládat, že karta bude mít nižší hodiny, aby kompenzovala méně vstupu TDP. Metriky výkonu, které NVIDIA vydala, jsou však opravdu překvapivé, protože se dost blíží variantě 400 W TDP. Výkon FP64 je stále ohodnocen na 9,7 / 19,5 TFLOPs, výkon FP32 je ohodnocen na 19,5 / 156/312 TFLOPs (Sparsity), výkon FP16 je ohodnocen na 312/624 TFLOPs (Sparsity) a INT8 je ohodnocen na 624/1248 TOPs ( Řídkost).



Jednoduchá matematika naznačuje a NVIDIA zaručuje, že grafická karta PCIe 4.0 250 W A100 založená na amperech může přinést 90 procent výkonu karty A100 HGX (400 W) v nejlepších serverových aplikacích. To je ospravedlnitelné, protože nové variantě trvá výše uvedené úkoly kratší dobu. Čísla by však měla platit pouze pro krátké intervaly. Ve složitých situacích, které vyžadují trvalé schopnosti GPU, může 250W PCIe 4.0 GPU přinést výkon až 400% GPU A100 HGX až o 90 procent až o 50 procent.

Mikroarchitektura Ampere jistě nové A100 prospěje. NVIDIA slibuje alespoň 20násobné zvýšení výkonu oproti předchůdci založenému na Voltě. Grafická karta PCIe 4.0 A100 je vybavena technologií více instancí GPU. To znamená, že jeden model A100 lze rozdělit až na sedm samostatných grafických procesorů pro zpracování různých výpočetních úloh. I když to podporuje segmentaci, je tu NVLink 3. generace, který umožňuje připojení několika GPU do jednoho obrovského GPU.

Značky nvidia