Kas yra Nvidia Ampere?

Kalbant apie GPU, „Nvidia“ yra pirmaujanti ekspertė. Verslas nuo 1993 m. „Nvidia“ sukūrė platų aukščiausios kokybės profesionalių ir vartotojų GPU asortimentą. Geros procesorių architektūros slypi už jų produkto sėkmę, ypač jų pagrindinės linijos - „GeForce“. „Nvidia“ GPU peržengė žaidimų erdvę, išplėtė savo dalyvavimą giluminiame mokyme, dirbtiniame intelekte (AI) ir pagreitintoje analizėje. „Nvidia“ prieš dešimtmetį įsiskverbė į duomenų centrų rinką, pradedant „Fermi“ lustais. Vėlesni kartojimai buvo atliekami, ir įmonė nuolat išleido GPU, kurie patenkina nepasotinamą greitesnio duomenų perdavimo procesų spartos poreikį duomenų centruose. „Nvidia“ GPU keitėsi bėgant metams, o architektūros projektai pirmiausia skatina evoliuciją.

Nvidia Ampere architektūra

GPU gamintojų konkurencija yra rimta, tačiau „Nvidia“ nieko nesulaiko, kad užimtų aukščiausią vietą. Tiesą sakant, „Nvidia“ per pastarąjį dešimtmetį dominavo dirbtinio intelekto rinkoje. 2020 m. Naujienos apie pirmąjį „Nvidia“ 7 nm (vartotojams skirtų dalių 8 nm) GPU su 54 milijardais tranzistorių, suspaustų tokioje mažoje formoje, sukėlė nemenką šurmulį. Kodinis Amperas po prancūzų matematiko André-Marie Ampère, „Nvidia“ procesoriaus architektūra žymiai pagerina savo pirmtakus „Turing“ ir „Volta“, žadėdama daugiau funkcijų, geresnį efektyvumą ir aukštesnį našumą esant mažesniam galios lygiui. „Ampere“ yra už antrosios „Nvidia“ RTX GPU kartos, „RTX 30“ serijos, ir sakoma, kad ji yra dvigubai greitesnė už „RTX 20“ serijos analogus. „Ampere“ architektūra taip pat yra „Nvidia A100“ duomenų centro GPU jėga.

Ampero specifikacijos

„Ampere“ yra pirmasis „Nvidia“ 7nm / 8nm GPU, antroji vartotojų spindulių sekimo karta ir turi trečią tenzoriaus branduolių kartą. „Ampere“ yra pagrindinė GA100, GA102 ir GA104 GPU architektūra, įterpta į „GeForce RTX 3090“, „RTX 3080“, „RTX 3070“ ir naujausią „RTX 3060“. „Nvidia“ taip pat turėtų išleisti „RTX 3050“ ateinančiais mėnesiais. Tuo tarpu įmonės „GA100 GPU“ suteikia 20 kartų daugiau skaičiavimo galios nei ankstesnių kartų duomenų centro GPU. Čia pateikiama „Nvidia“ Ampere pagrįstų profesionalių ir vartotojų GPU apžvalga [1]:

GPU	GA100	GA102	GA102	GA104
Grafinė kortelė	„Nvidia A100“	„GeForce RTX 3090“	„GeForce RTX 3080“	„GeForce RTX 3070“
Procesas (nm)	TSMC N7	„Samsung 8N“	„Samsung 8N“	„Samsung 8N“
Tranzistoriai (milijardai)	54	28.3	28.3	17.4
Štampo dydis (mm ^ 2)	826	628.4	628.4	392.5
GPC konfigūracija	8 × 16	7 × 12	6 × 12	6 × 8
Trumpoji žinutė	108	82	68	46
CUDA šerdys	6912	10496	8704	5888
RT šerdys	Nė vienas	82	68	46
„Tensor Core“	432	328	272	184
„Boost Clock“ (MHz)	1410 m	1700 m	1710 m	1730 m
VRAM greitis (Gbps)	2.43	19.5 („GDDR6X“)	19 (GDDR6X)	14 (GDDR6)
VRAM (GB)	40 (maks. 48)	24	10	8
Magistralės plotis	5120 (maks. 6144)	384	320	256
ROP	128	112	96	96
TMU	864	656	544	368
„GFLOPS FP32“	19492 m	35686	29768	20372 m
RT TFLOPS	Nėra	69	58	40
„Tensor TFLOPS FP16“ (retas)	312 (628)	143 (285)	119 (238)	81 (163)
Pralaidumas (GB / s)	1555 m	936	760	448
TBP (vatai)	400 (250 PCIe)	350	320	220

„Nvidia A100“

„Nvidia A100“ yra pirmasis GPU, kuris naudojo „Ampere“ architektūrą. Įmonės mikroschema yra skirta duomenų centrams ir skirta daugeliui GPU reikalaujančioms užduotims, tokioms kaip gilus mokymasis ir dirbtinis intelektas. Pastatytas naudojant TSMC 7 nm procesą, jame yra nepaprastai daug - 54 milijardai tranzistorių. Jis pralenkė ankstesnes įmonės GPU kartas - 20 kartų padidino našumą, turėdamas 6 912 CUDA branduolių, 432 tekstūros atvaizdavimo vienetus, 160 ROP, trečiosios kartos „Tensor“ branduolius ir 40 GB VRAM su atminties pralaidumu, kuris viršija 1.6 TB / sek. „DGX A100“ yra pirmoji pasaulyje dirbtinio intelekto sistema, turinti aštuonių „A100“ grupę ir nemažą 199 000 USD kainą.

„GeForce RTX 30“ serija

Be dominuojančios įmonės rinkos, „Nvidia“ visada turi omenyje vartotojus, ypač žaidėjus ir kūrėjus. „Ampere“ architektūra taip pat pritaikyta „Nvidia“ vartotojų vaizdo plokštėse. Antroji „GeForce RTX“ karta turi „Ampere“ pagrįstus GPU, padidindama našumą dvigubai daugiau nei ankstesnė karta.

Daugeliu aspektų „Ampere“ turi daugiau nei dvigubai didesnę apdorojimo galią nei Tiuringas. Tai padvigubino Turingo „shader“ našumą dvigubai daugiau nei FP32 CUDA branduolių. Tiksliau, jis turi 30 „Shader-TFLOPS“, 2.7 kartus daugiau nei Turingo, o tai tik 11 „Shader-TFLOPS“. Panašiai Turingo „Tensor Core“ matuoja 89 Tensor-TFLOPS, tačiau „Ampere“ šį rodiklį padidino daugiau nei dvigubai su savo 238 „Tensor-TFLOPS“. Nepamirškite apie savo spindulių sekimo pagrindinius rodiklius, kurie yra 58 RT-TFLOPS, 1.7 kartus greičiau nei „Turing“ 34 RT-TFLOPS, o norint, kad GPU veiktų dar greičiau, „Ampere“ lustas prisijungia prie greičiausios pasaulyje atminties „Micron G6X“.

„RTX 30“ serija gaminama naudojant „Samsung 8N Nvidia Custom Process“ su 28 milijardais GA102 tranzistorių ir 17 milijardų GA104 tranzistorių. „Titan“ klasės RTX 3090 variklis yra GA102 GPU ir užtikrina ypač galingą vartotojų kortelių našumą. Skirtingai nuo ankstesnių kartų, „RTX 3090“ gali naudoti trečiosios šalys, kad galėtų kurti pagal užsakymą.

„RTX 3080“ taip pat naudoja „GA102“ GPU, kuris du kartus viršija „RTX 2080“ našumą ir įspūdingą 4K žaidimų meistriškumą. „RTX 3070“, maitinamas GA104 GPU, yra lygus „RTX 2080 Ti“ už pusę kainos. Neseniai išleistas „RTX 3060“ taip pat niekada nesužavėjo savo stulbinančiu našumu, kurį lemia patobulintos spindulių sekimo šerdys, „Tensor“ branduoliai, nauji srautiniai daugiaprocesoriai ir didelės spartos G6 atmintis.

Nepaisant masiško našumo padidėjimo, naujieji RTX GPU neapsunkina kišenės. Kur kas greitesnės vaizdo plokštės yra lengvai prieinamos, kai reikia nustatyti kainas. „Nvidia GeForce“ flagmano „RTX 3080“ kaina prasideda nuo 699 USD, „RTX 3070“ parduodama už 499 USD, o „RTX 3060“ kaina yra 329 USD. Aukštesnės klasės „RTX 3090“ kainuoja 1 499 USD; vis dar gerokai pigios, atsižvelgiant į „Titan“ lygio našumą.

Praėjus vos keliems mėnesiams po išleidimo, pranešama, kad trūksta „Ampere“ pagrįstų vaizdo plokščių, ir tai nenuostabu, kad „Ampere“ veikia nepriekaištingai už prieinamą kainą. Tiems, kurie ketina atnaujinti GPU, dabar pats geriausias laikas pasinaudoti „Nvidia“ Ampere pagrįstais GPU.

Šaltiniai

[1] Waltonas, Jarredas. „Nvidia RTX 30 serijos amperų architektūros giluminis nardymas: viskas, ką žinome“. https: // www.toms aparatine įranga.com / features / nvidia-ampere-architecture-deep-dive. 2020 m. Spalio 13 d.