Nvidia

Kas yra Nvidia Ampere?

Kas yra Nvidia Ampere?

Kalbant apie GPU, „Nvidia“ yra pirmaujanti ekspertė. Verslas nuo 1993 m. „Nvidia“ sukūrė platų aukščiausios kokybės profesionalių ir vartotojų GPU asortimentą.  Geros procesorių architektūros slypi už jų produkto sėkmę, ypač jų pagrindinės linijos - „GeForce“. „Nvidia“ GPU peržengė žaidimų erdvę, išplėtė savo dalyvavimą giluminiame mokyme, dirbtiniame intelekte (AI) ir pagreitintoje analizėje. „Nvidia“ prieš dešimtmetį įsiskverbė į duomenų centrų rinką, pradedant „Fermi“ lustais. Vėlesni kartojimai buvo atliekami, ir įmonė nuolat išleido GPU, kurie patenkina nepasotinamą greitesnio duomenų perdavimo procesų spartos poreikį duomenų centruose. „Nvidia“ GPU keitėsi bėgant metams, o architektūros projektai pirmiausia skatina evoliuciją.  

Nvidia Ampere architektūra

GPU gamintojų konkurencija yra rimta, tačiau „Nvidia“ nieko nesulaiko, kad užimtų aukščiausią vietą. Tiesą sakant, „Nvidia“ per pastarąjį dešimtmetį dominavo dirbtinio intelekto rinkoje. 2020 m. Naujienos apie pirmąjį „Nvidia“ 7 nm (vartotojams skirtų dalių 8 nm) GPU su 54 milijardais tranzistorių, suspaustų tokioje mažoje formoje, sukėlė nemenką šurmulį. Kodinis Amperas po prancūzų matematiko André-Marie Ampère, „Nvidia“ procesoriaus architektūra žymiai pagerina savo pirmtakus „Turing“ ir „Volta“, žadėdama daugiau funkcijų, geresnį efektyvumą ir aukštesnį našumą esant mažesniam galios lygiui. „Ampere“ yra už antrosios „Nvidia“ RTX GPU kartos, „RTX 30“ serijos, ir sakoma, kad ji yra dvigubai greitesnė už „RTX 20“ serijos analogus. „Ampere“ architektūra taip pat yra „Nvidia A100“ duomenų centro GPU jėga.

Ampero specifikacijos

„Ampere“ yra pirmasis „Nvidia“ 7nm / 8nm GPU, antroji vartotojų spindulių sekimo karta ir turi trečią tenzoriaus branduolių kartą. „Ampere“ yra pagrindinė GA100, GA102 ir GA104 GPU architektūra, įterpta į „GeForce RTX 3090“, „RTX 3080“, „RTX 3070“ ir naujausią „RTX 3060“. „Nvidia“ taip pat turėtų išleisti „RTX 3050“ ateinančiais mėnesiais. Tuo tarpu įmonės „GA100 GPU“ suteikia 20 kartų daugiau skaičiavimo galios nei ankstesnių kartų duomenų centro GPU. Čia pateikiama „Nvidia“ Ampere pagrįstų profesionalių ir vartotojų GPU apžvalga [1]:

GPU GA100 GA102 GA102 GA104
Grafinė kortelė „Nvidia A100“ „GeForce RTX 3090“ „GeForce RTX 3080“ „GeForce RTX 3070“
Procesas (nm) TSMC N7 „Samsung 8N“ „Samsung 8N“ „Samsung 8N“
Tranzistoriai (milijardai) 54 28.3 28.3 17.4
Štampo dydis (mm ^ 2) 826 628.4 628.4 392.5
GPC konfigūracija 8 × 16 7 × 12 6 × 12 6 × 8
Trumpoji žinutė 108 82 68 46
CUDA šerdys 6912 10496 8704 5888
RT šerdys Nė vienas 82 68 46
„Tensor Core“ 432 328 272 184
„Boost Clock“ (MHz) 1410 m 1700 m 1710 m 1730 m
VRAM greitis (Gbps) 2.43 19.5 („GDDR6X“) 19 (GDDR6X) 14 (GDDR6)
VRAM (GB) 40 (maks. 48) 24 10 8
Magistralės plotis 5120 (maks. 6144) 384 320 256
ROP 128 112 96 96
TMU 864 656 544 368
„GFLOPS FP32“ 19492 m 35686 29768 20372 m
RT TFLOPS Nėra 69 58 40
„Tensor TFLOPS FP16“ (retas) 312 (628) 143 (285) 119 (238) 81 (163)
Pralaidumas (GB / s) 1555 m 936 760 448
TBP (vatai) 400 (250 PCIe) 350 320 220

„Nvidia A100“ 

„Nvidia A100“ yra pirmasis GPU, kuris naudojo „Ampere“ architektūrą. Įmonės mikroschema yra skirta duomenų centrams ir skirta daugeliui GPU reikalaujančioms užduotims, tokioms kaip gilus mokymasis ir dirbtinis intelektas. Pastatytas naudojant TSMC 7 nm procesą, jame yra nepaprastai daug - 54 milijardai tranzistorių. Jis pralenkė ankstesnes įmonės GPU kartas - 20 kartų padidino našumą, turėdamas 6 912 CUDA branduolių, 432 tekstūros atvaizdavimo vienetus, 160 ROP, trečiosios kartos „Tensor“ branduolius ir 40 GB VRAM su atminties pralaidumu, kuris viršija 1.6 TB / sek. „DGX A100“ yra pirmoji pasaulyje dirbtinio intelekto sistema, turinti aštuonių „A100“ grupę ir nemažą 199 000 USD kainą.

„GeForce RTX 30“ serija

Be dominuojančios įmonės rinkos, „Nvidia“ visada turi omenyje vartotojus, ypač žaidėjus ir kūrėjus. „Ampere“ architektūra taip pat pritaikyta „Nvidia“ vartotojų vaizdo plokštėse. Antroji „GeForce RTX“ karta turi „Ampere“ pagrįstus GPU, padidindama našumą dvigubai daugiau nei ankstesnė karta.

Daugeliu aspektų „Ampere“ turi daugiau nei dvigubai didesnę apdorojimo galią nei Tiuringas. Tai padvigubino Turingo „shader“ našumą dvigubai daugiau nei FP32 CUDA branduolių. Tiksliau, jis turi 30 „Shader-TFLOPS“, 2.7 kartus daugiau nei Turingo, o tai tik 11 „Shader-TFLOPS“. Panašiai Turingo „Tensor Core“ matuoja 89 Tensor-TFLOPS, tačiau „Ampere“ šį rodiklį padidino daugiau nei dvigubai su savo 238 „Tensor-TFLOPS“. Nepamirškite apie savo spindulių sekimo pagrindinius rodiklius, kurie yra 58 RT-TFLOPS, 1.7 kartus greičiau nei „Turing“ 34 RT-TFLOPS, o norint, kad GPU veiktų dar greičiau, „Ampere“ lustas prisijungia prie greičiausios pasaulyje atminties „Micron G6X“.

„RTX 30“ serija gaminama naudojant „Samsung 8N Nvidia Custom Process“ su 28 milijardais GA102 tranzistorių ir 17 milijardų GA104 tranzistorių. „Titan“ klasės RTX 3090 variklis yra GA102 GPU ir užtikrina ypač galingą vartotojų kortelių našumą. Skirtingai nuo ankstesnių kartų, „RTX 3090“ gali naudoti trečiosios šalys, kad galėtų kurti pagal užsakymą.

„RTX 3080“ taip pat naudoja „GA102“ GPU, kuris du kartus viršija „RTX 2080“ našumą ir įspūdingą 4K žaidimų meistriškumą. „RTX 3070“, maitinamas GA104 GPU, yra lygus „RTX 2080 Ti“ už pusę kainos. Neseniai išleistas „RTX 3060“ taip pat niekada nesužavėjo savo stulbinančiu našumu, kurį lemia patobulintos spindulių sekimo šerdys, „Tensor“ branduoliai, nauji srautiniai daugiaprocesoriai ir didelės spartos G6 atmintis.

Nepaisant masiško našumo padidėjimo, naujieji RTX GPU neapsunkina kišenės. Kur kas greitesnės vaizdo plokštės yra lengvai prieinamos, kai reikia nustatyti kainas. „Nvidia GeForce“ flagmano „RTX 3080“ kaina prasideda nuo 699 USD, „RTX 3070“ parduodama už 499 USD, o „RTX 3060“ kaina yra 329 USD. Aukštesnės klasės „RTX 3090“ kainuoja 1 499 USD; vis dar gerokai pigios, atsižvelgiant į „Titan“ lygio našumą.

Praėjus vos keliems mėnesiams po išleidimo, pranešama, kad trūksta „Ampere“ pagrįstų vaizdo plokščių, ir tai nenuostabu, kad „Ampere“ veikia nepriekaištingai už prieinamą kainą. Tiems, kurie ketina atnaujinti GPU, dabar pats geriausias laikas pasinaudoti „Nvidia“ Ampere pagrįstais GPU.

Šaltiniai

[1] Waltonas, Jarredas. „Nvidia RTX 30 serijos amperų architektūros giluminis nardymas: viskas, ką žinome“. https: // www.toms aparatine įranga.com / features / nvidia-ampere-architecture-deep-dive. 2020 m. Spalio 13 d.

Kaip pakeisti pelės ir jutiklinių plokščių slinkimo kryptį sistemoje „Windows 10“
Pelė ir Jutiklinė dalisTai ne tik palengvina skaičiavimus, bet ir efektyvesnį bei mažiau laiko reikalaujantį. Mes neįsivaizduojame gyvenimo be šių pri...
Kaip pakeisti pelės žymeklio ir žymeklio dydį, spalvą ir schemą sistemoje „Windows 10“
„Windows 10“ pelės žymeklis ir žymeklis yra labai svarbūs operacinės sistemos aspektai. Tai galima pasakyti ir apie kitas operacines sistemas, taigi, ...
Nemokami ir atvirojo kodo žaidimų varikliai, skirti kurti „Linux“ žaidimus
Šiame straipsnyje bus pateiktas nemokamų ir atvirojo kodo žaidimų variklių, kurie gali būti naudojami kuriant 2D ir 3D žaidimus „Linux“, sąrašas. Toki...