NVIDIA Ampere A100 250W TDP GPU na PCIe 4.0 vyrobené pre AI, dátovú vedu a superpočítače boli spustené so sľubovaným 90-percentným výkonom 400W modelu

Hardware / NVIDIA Ampere A100 250W TDP GPU na PCIe 4.0 vyrobené pre AI, dátovú vedu a superpočítače boli spustené so sľubovaným 90-percentným výkonom 400W modelu 2 minúty prečítané

Nvidia



NVIDIA oficiálne uviedla A100, grafický procesor kompatibilný s PCIe 4.0 založený na architektúre Ampere novej generácie. Aj keď má NVIDIA nižší profil TDP 250 W, sľubuje, že grafická karta PCIe 4.0 Ampere A100 bude schopná ponúknuť až 90 percent výkonu plného GPU A100 HGX s výkonom 400 W. Tretia varianta rozširujúcej sa rodiny GPU Ampere A100, A100 PCIe, je určená pre servery s klastrami Artificial Intelligence (AI), Data Science a Supercomputing.

NVIDIA odhalila variant grafického procesora A100 s rozhraním PCI-Express 4.0. GPU je založený na 7nm Ampere mikroarchitektúre. Spoločnosť navyše oznámila niekoľko systémov napájaných na A100 od popredných výrobcov serverov vrátane spoločností Asus, Dell, Cisco, Lenovo a ďalších. 250W akcelerátor A100 PCIe 4.0 GPU je dosť podobný úplnému variantu 400 W TDP a NVIDIA tiež sľubuje takmer totožný výkon aj napriek výraznému poklesu profilu TDP.



Grafická karta NVIDIA A100 Ampere v prevedení PCIe 4.0 s rovnakou konfiguráciou GPU A100 HGX 400 W, ale pri 250 W:

NVIDIA ohlásila svoj akcelerátor PCIe 4.0 A100 PCIe GPU. Grafická karta Ampere GPU je k dispozícii pre najrôznejšie prípady priemyselného použitia so systémami od jediného grafického procesora A100 PCIe až po servery využívajúce dve karty súčasne prostredníctvom 12 kanálov NVLINK, ktoré poskytujú celkovú šírku pásma 600 GB / s. 250W TDP A100 PCIe GPU akcelerátor sa v porovnaní s 400W A100 HGX GPU príliš nemení, pokiaľ ide o základnú konfiguráciu.



Grafický procesor GA100 má špecifikácie variantu 400 W A100 HGX s 6912 jadrami CUDA usporiadanými do 108 jednotiek SM, 432 jadier tenzora a 40 GB pamäte HBM2, ktoré poskytujú rovnakú šírku pásma pamäte 1,55 TB / s (zaokrúhlené na 1,6 TB / s). Avšak nasadenie balíka GPU na serveri Štandard PCIe 4.0 malo svoju vlastnú nevýhodu významného zníženia TDP. To údajne znamená 10 až 50 percentný trest výkonu na základe pracovnej záťaže. Navyše, 250W TDP variant grafického procesora A100 je vhodnejší skôr na krátke záblesky ako na trvalé zaťaženie.

Grafická karta NVIDIA A100 Ampere v prevedení PCIe 4.0:

Vďaka výraznému zníženiu profilu TDP sa dalo predpokladať, že karta bude obsahovať nižšie hodiny, aby kompenzovala menší vstup TDP. Výkonové metriky, ktoré NVIDIA vydala, sú však skutočne prekvapivé, pretože sa dosť približujú 400W variantu TDP. Výkon FP64 je stále hodnotený na 9,7 / 19,5 TFLOPs, výkon FP32 je hodnotený na 19,5 / 156/312 TFLOPs (Sparsity), výkon FP16 je hodnotený na 312/624 TFLOPs (Sparsity) a INT8 je hodnotený na 624/1248 TOP ( Riedkosť).



Jednoduchá matematika naznačuje a NVIDIA zaručuje, že grafická karta PCIe 4.0 250 W A100 založená na ampéroch môže poskytnúť 90 percent výkonu karty A100 HGX (400 W) v najlepších serverových aplikáciách. Je to ospravedlniteľné, pretože dokončeniu vyššie uvedených úloh trvá novému variantu kratšie obdobie. Čísla by však mali platiť iba pre krátke intervaly. V zložitých situáciách, ktoré si vyžadujú trvalé schopnosti GPU, môže 250W PCIe 4.0 GPU poskytnúť výkon až 400% GPU A100 HGX GPU kdekoľvek až od 90 percent do 50 percent.

Mikroarchitektúra Ampere novej A100 určite prospeje. NVIDIA sľubuje minimálne 20-násobné zvýšenie výkonu oproti predchodcovi založenému na Volte. Grafická karta PCIe 4.0 A100 je vybavená technológiou viacerých inštancií GPU. To znamená, že jeden procesor A100 možno rozdeliť až na sedem samostatných grafických procesorov, aby zvládol rôzne výpočtové úlohy. Aj keď to podporuje segmentáciu, je tu NVLink 3. generácie, ktorý umožňuje spojenie niekoľkých GPU do jedného obrovského GPU.

Značky nvidia