NVIDIA Ampere A100 250W TDP GPU PCIe 4.0-l, mis on loodud tehisintellekti, andmeteaduse ja superarvutite jaoks, käivitatud 400 W mudeli lubatud 90-protsendilise jõudlusega

Riistvara / NVIDIA Ampere A100 250W TDP GPU PCIe 4.0-l, mis on loodud tehisintellekti, andmeteaduse ja superarvutite jaoks, käivitatud 400 W mudeli lubatud 90-protsendilise jõudlusega 2 minutit loetud

Nvidia



NVIDIA tõi ametlikult turule järgmise põlvkonna Ampere arhitektuuril põhineva PCIe 4.0-ga ühilduva GPU A100. Kuigi sellel on madalam 250 W TDP profiil, lubab NVIDIA, et PCIe 4.0 Ampere A100 GPU suudab pakkuda kuni 90 protsenti kogu 400 W A100 HGX GPU jõudlusest. Kasvava Ampere A100 GPU perekonna kolmas variant A100 PCIe on mõeldud serveritele, mis käitavad tehisintellekti (AI), andmeteaduse ja ülarvutite klastreid.

NVIDIA tõi välja A100 GPU PCI-Express 4.0 variandi. GPU põhineb 7 nm Ampere mikroarhitektuuril. Lisaks teatas ettevõte ka juhtivate serveritootjate, sealhulgas Asuse, Delli, Cisco, Lenovo ja paljude teiste A100 toitel töötavatest süsteemidest. 250W A100 PCIe 4.0 GPU kiirendi on üsna sarnane 400W TDP täisvariandiga ning ka NVIDIA on paljulubav peaaegu identse jõudlusega, vaatamata TDP profiili märkimisväärsele langusele.



NVIDIA A100 amprine GPU PCIe 4.0 vormifaktoris sama 400 W A100 HGX GPU konfiguratsiooniga, kuid 250 W juures:

NVIDIA teatas oma PCIe 4.0 A100 PCIe GPU kiirendist. Ampere GPU on saadaval mitmesuguste tööstuslikuks kasutamiseks mõeldud juhtumite jaoks, mille süsteemid varieeruvad ühest A100 PCIe GPU-st kuni serveriteni, mis kasutavad korraga kahte kaarti 12 NVLINK kanali kaudu, mis edastavad omavahel ühendatud ribalaiust kokku 600 GB / s. 250W TDP A100 PCIe GPU kiirendi ei muutu põhikonfiguratsiooni osas palju võrreldes 400W A100 HGX GPU-ga.



GA100 GPU-l on 400W A100 HGX variandi spetsifikatsioonid koos 6912 CUDA südamikuga, mis on paigutatud 108 SM-i ühikutesse, 432 tensori südamikku ja 40 GB HBM2-mälu, mis tagab sama mälu ribalaiuse 1,55 TB / s (ümardatuna 1,6 TB / s) s). Kuid GPU-paketi juurutamine PCIe 4.0 standard oli oma puudus, mis vähendab oluliselt TDP-d. Väidetavalt tähendab see töökoormusel põhinevat 10–50-protsendilist tulemustasu. Veelgi enam, A100 GPU 250W TDP variant sobib pigem lühikeste purskete kui püsivate koormuste jaoks.

NVIDIA A100 Ampere GPU PCIe 4.0 vormifaktori jõudluses:

TDP-profiili märkimisväärse vähenemise tõttu võib eeldada, et kaardil on väiksemad kellad, et kompenseerida vähem TDP-sisendit. NVIDIA avaldatud jõudlusmõõdikud on aga tõeliselt üllatavad, kuna jõuavad 400W TDP variandile üsna lähedale. FP64 jõudlus on endiselt hinnatud 9,7 / 19,5 TFLOP-le, FP32 jõudlus on hinnatud 19,5 / 156/312 TFLOP-le (Sparsity), FP16 jõudlus on hinnatud 312/624 TFLOP-le (Sparsity) ja INT8 on hinnatud 624/1248 TOPile ( Hõredus).



Lihtne matemaatika näitab ja NVIDIA kinnitab, et Ampere-põhine PCIe 4.0 250W A100 GPU suudab 90 protsenti A100 HGX-kaardi (400W) jõudlusest edastada serverirakendustes. See on õigustatud, kuna ülalnimetatud ülesannete täitmine võtab uue variandi jaoks vähem aega. Numbrid peaksid kehtima aga ainult lühikeste intervallide järel. Keerulistes olukordades, mis vajavad püsivaid GPU võimekust, suudab 250 W PCIe 4.0 GPU pakkuda 400 W A100 HGX GPU jõudlust kuni 90 protsendist kuni 50 protsendini.

Ampere mikroarhitektuur tuleb kindlasti uuele A100-le kasuks. NVIDIA lubab Volta-põhise eelkäijaga võrreldes vähemalt 20X jõudlust tõsta. PCIe 4.0 A100 GPU sisaldab mitme eksemplari GPU tehnoloogiat. See tähendab, et ühe A100 saab jaotada kuni seitsmesse eraldi GPU-sse, et hakkama saada erinevate arvutusülesannetega. Ehkki see suurendab segmenteerimist, on olemas 3. põlvkonna NVLink, mis võimaldab ühendada mitu GPU ühte hiiglaslikku GPU-d.

Sildid nvidia