Kokia yra geriausia giluminio mokymosi grafikos plokštė?

Jei procesorius yra kompiuterio smegenys, tai GPU yra siela. Nors dauguma kompiuterių gali veikti be gero GPU, giliai mokytis neįmanoma be jo. Taip yra todėl, kad giliam mokymuisi reikalingos sudėtingos operacijos, tokios kaip manipuliavimas matrica, išskirtinės skaičiavimo prielaidos ir didelė skaičiavimo galia.

Patirtis yra gyvybiškai svarbi ugdant įgūdžius, reikalingus norint giliai mokytis naujose srityse. Greitas GPU reiškia greitą praktinės patirties įgijimą per greitą atsiliepimą. GPU yra keli branduoliai, kad būtų galima atlikti lygiagrečius skaičiavimus. Jie taip pat turi platų atminties pralaidumą, kad lengvai valdytų šią informaciją.

Geriausias mūsų rekomenduojamas geriausios grafikos plokštės giliam mokymuisi pasirinkimas yra „Nvidia Geforce RTX 2080 Founders Edition“. Pirkite dabar už 1 940 USD „Amazon“

Atsižvelgdami į tai, mes siekiame atsakyti į klausimą: „Kokia yra geriausia vaizdo plokštė dirbtiniam intelektui, mašininiam mokymuisi ir giliam mokymuisi?“Apžvelgiant keletą šiuo metu 2021 m. Esančių vaizdo plokščių. Peržiūrėtos kortelės:

„AMD RX Vega 64“

„NVIDIA Tesla V100“

„Nvidia Quadro RTX 8000“

„GeForce RTX 2080 Ti“

„NVIDIA Titan RTX“

Žemiau pateikiami rezultatai:

„AMD RX Vega 64“

„Radeon RX Vega 64“

funkcijos

Išleidimo data: 2017 m. Rugpjūčio 14 d
„Vega“ architektūra
„PCI Express“ sąsaja
Laikrodžio greitis: 1247 MHz
Srauto procesoriai: 4096
VRAM: 8 GB
Atminties pralaidumas: 484 GB / s

Apžvalga

Jei jums nepatinka NVIDIA GPU arba jūsų biudžetas neleidžia išleisti daugiau nei 500 USD grafikos plokštei, tada AMD turi išmanią alternatyvą. Turint pakankamai RAM, greitą atminties pralaidumą ir daugiau nei pakankamai srautinių procesorių, AMD RS Vega 64 labai sunku nepaisyti.

„Vega“ architektūra yra ankstesnių „RX“ kortelių atnaujinimas. Kalbant apie našumą, šis modelis yra artimas „GeForce RTX 1080 Ti“, nes abu šie modeliai turi panašų VRAM. Be to, „Vega“ palaiko natūralų pusinį tikslumą (FP16). ROCm ir „TensorFlow“ veikia, tačiau programinė įranga nėra tokia subrendusi, kaip NVIDIA vaizdo plokštėse.

Apskritai „Vega 64“ yra tinkamas giluminio mokymosi ir dirbtinio intelekto GPU. Šis modelis kainuoja gerokai mažiau nei 500 USD, todėl darbas pradedantiesiems atliekamas. Tačiau profesionalioms programoms rekomenduojame pasirinkti NVIDIA kortelę.

„AMD RX Vega 64“ informacija: „Amazon“

„NVIDIA Tesla V100“

„Tesla V100“

Funkcijos:

Išleidimo data: 2017 m. Gruodžio 7 d
„NVIDIA Volta“ architektūra
PCI-E sąsaja
112 TFLOPS „Tensor Performance“
640 „Tensor Core“
5120 „NVIDIA CUDA®“ šerdys
VRAM: 16 GB
Atminties pralaidumas: 900 GB / s
Apskaičiuokite API: CUDA, DirectCompute, OpenCL ™, OpenACC®

Apžvalga:

„NVIDIA Tesla V100“ yra begemotas ir viena iš geriausių vaizdo plokštių dirbtiniam intelektui, mašininiam mokymuisi ir giliam mokymuisi. Ši kortelė yra visiškai optimizuota ir yra supakuota su visomis gėrybėmis, kurių gali prireikti šiam tikslui.

„Tesla V100“ yra 16 ir 32 GB atminties konfigūracijos. Turėdami daugybę VRAM, AI pagreitį, didelį atminties pralaidumą ir specializuotus tensoriaus branduolius giliam mokymuisi, galite būti tikri, kad kiekvienas jūsų treniruočių modelis veiks sklandžiai ir per trumpesnį laiką. Konkrečiai, „Tesla V100“ gali suteikti 125TFLOPS gilaus mokymosi našumo tiek treniruotėms, tiek išvadoms [3], kuriuos įgalino NVIDIA „Volta“ architektūra.

„NVIDIA Tesla V100“ informacija: „Amazon“ (1)

„Nvidia Quadro RTX 8000“

„Nvidia Quadro Rtx 8000“

Funkcijos:

Išleidimo data: 2018 m. Rugpjūtis
Tiuringo architektūra
576 „Tensor Core“
CUDA šerdys: 4 608
VRAM: 48 GB
Atminties pralaidumas: 672 GB / s
16.3 TFLOPS
Sistemos sąsaja: PCI-Express

Apžvalga:

„Quadro RTX 8000“ yra specialiai sukurtas giliai mokytis matricos aritmetikos ir skaičiavimų, tai yra aukščiausios klasės vaizdo plokštė. Kadangi ši kortelė turi didelę VRAM talpą (48 GB), šį modelį rekomenduojama tirti ypač dideliems skaičiavimo modeliams. Naudojant kartu su „NVLink“, talpa gali būti padidinta iki 96 GB VRAM. Kas yra daug!

72 RT ir 576 „Tensor“ branduolių derinys, skirtas patobulintoms darbo eigoms, suteikia daugiau nei 130 TFLOPS našumą. Palyginti su brangiausia grafika mūsų sąraše - „Tesla V100“ - šis modelis gali pasiūlyti 50 procentų daugiau atminties ir vis tiek sugeba kainuoti mažiau. Net įdiegtoje atmintyje šis modelis pasižymi išskirtiniu našumu dirbdamas su didesniais partijų dydžiais viename GPU.

Vėlgi, kaip ir „Tesla V100“, šį modelį riboja tik jūsų kainos stogas. Vis dėlto, jei norite investuoti į ateitį ir į aukštos kokybės kompiuteriją, įsigykite „RTX 8000“. Kas žino, galite vadovauti dirbtinio intelekto tyrimams. „Tesla V100“ yra paremta Tiuringo architektūra, kur „V100“ remiasi „Volta“ architektūra, todėl „Nvidia Quadro RTX 8000“ galima laikyti šiek tiek modernesniu ir šiek tiek galingesniu nei „V100“.

„Nvidia Quadro RTX 8000“ informacija: „Amazon“

„GeForce RTX 2080 Ti“

„Geforce RTX 2080 Founders Edition“

Funkcijos:

Išleidimo data: 2018 m. Rugsėjo 20 d
Turingo GPU architektūra ir RTX platforma
Laikrodžio greitis: 1350 MHz
CUDA šerdys: 4352
11 GB naujos kartos itin greita GDDR6 atmintis
Atminties pralaidumas: 616 GB / s
Galia: 260W

Apžvalga:

„GeForce RTX 2080 Ti“ yra biudžeto pasirinkimas, idealiai tinkantis nedidelio masto modeliavimo darbo krūviui, o ne didelio masto mokymo plėtrai. Taip yra todėl, kad kortelėje yra mažesnė GPU atmintis (tik 11 GB). Šio modelio apribojimai tampa akivaizdesni mokant kai kuriuos šiuolaikinius NLP modelius. Tačiau tai nereiškia, kad ši korta negali konkuruoti. „RTX 2080“ orapūtės konstrukcija leidžia atlikti daug tankesnes sistemos konfigūracijas - iki keturių GPU vienoje darbo vietoje. Be to, šis modelis nervinius tinklus treniruoja 80 procentų „Tesla V100“ greičiu. Remiantis giliais „LambdaLabs“ mokymosi rezultatų rodikliais, palyginti su „Tesla V100“, „RTX 2080“ yra 73% 2-osios ir 55% 16-osios.

Tuo tarpu šis modelis kainuoja beveik 7 kartus pigiau nei „Tesla V100“. Kainos ir našumo požiūriu, „GeForce RTX 2080 Ti“ yra puikus GPU giliam mokymuisi ir dirbtinio intelekto vystymui.

„GeForce RTX 2080 Ti“ informacija: „Amazon“

„NVIDIA Titan RTX“

„NVIDIA Titan RTX Graphics“

Funkcijos:

Išleidimo data: 2018 m. Gruodžio 18 d
Palaiko „NVIDIA Turing ™“ architektūra, skirta dirbtiniam intelektui
576 „Tensor“ branduoliai, skirti AI pagreitinti
130 teraFLOPS (TFLOPS) - gilaus mokymosi mokymai
CUDA šerdys: 4608
VRAM: 24 GB
Atminties pralaidumas: 672 GB / s
Rekomenduojamas maitinimo šaltinis 650 vatų

Apžvalga:

„NVIDIA Titan RTX“ yra dar vienas vidutinės klasės GPU, naudojamas sudėtingoms gilaus mokymosi operacijoms. Šio modelio 24 GB VRAM pakanka dirbti su daugeliu partijų dydžių. Tačiau jei norite mokyti didesnių modelių, suporuokite šią kortelę su „NVLink“ tiltu, kad iš tikrųjų būtų 48 GB VRAM. Šios sumos pakaktų net didelių transformatorių NLP modeliams. Be to, „Titan RTX“ leidžia atlikti visavertį mišraus tikslumo modelių mokymą (t.e., FP 16 kartu su FP32 kaupimu). Todėl šis modelis veikia maždaug 15–20 procentų greičiau operacijose, kuriose naudojamos „Tensor“ šerdys.

Vienas iš „NVIDIA Titan RTX“ apribojimų yra dviejų ventiliatorių dizainas. Tai trukdo sudėtingesnėms sistemos konfigūracijoms, nes jos negalima pakuoti į darbo vietą be esminių aušinimo mechanizmo pakeitimų, o tai nerekomenduojama.

Apskritai „Titan“ yra puikus, universalus GPU, skirtas beveik bet kokiai gilaus mokymosi užduočiai. Palyginti su kitomis bendrosios paskirties grafikos plokštėmis, tai tikrai brangu. Štai kodėl šis modelis nerekomenduojamas žaidėjams. Nepaisant to, mokslininkai, naudodami sudėtingus gilaus mokymosi modelius, greičiausiai įvertins papildomą VRAM ir našumo padidėjimą. „Titan RTX“ kaina yra prasmingai mažesnė už aukščiau pateiktą V100 ir būtų geras pasirinkimas, jei jūsų biudžetas neleidžia V100 kainodarai atlikti gilaus mokymosi arba jūsų darbo krūviui nereikia daugiau nei „Titan RTX“ (žr. Įdomius etalonus)

„NVIDIA Titan RTX“ išsami informacija: „Amazon“

Geriausios grafikos plokštės pasirinkimas dirbtiniam intelektui, mašininiam mokymuisi ir giliam mokymuisi

Dirbtinis intelektas, mašininis mokymasis ir gilaus mokymosi užduotys apdoroja daugybę duomenų. Šios užduotys gali būti labai sudėtingos jūsų aparatinei įrangai. Toliau pateikiamos funkcijos, kurias reikia atsiminti prieš įsigyjant GPU.

Šerdys

Paprastai tariant, kuo didesnis branduolių skaičius, tuo didesnis bus jūsų sistemos našumas. Taip pat reikėtų atsižvelgti į branduolių skaičių, ypač jei turite daug duomenų. NVIDIA savo branduolius pavadino CUDA, o AMD jų branduolius vadina srauto procesoriais. Pasirinkite didžiausią apdorojimo branduolių skaičių, kurį leis jūsų biudžetas.

Apdorojimo galia

GPU apdorojimo galia priklauso nuo branduolių skaičiaus sistemoje, padauginto iš laikrodžio greičio, kuriuo naudojate branduolius. Kuo didesnis greitis ir didesnis branduolių skaičius, tuo didesnė bus apdorojimo galia, kuria GPU gali apskaičiuoti duomenis. Tai taip pat lemia, kaip greitai jūsų sistema atliks užduotį.

VRAM

Vaizdo atmintis arba VRAM yra duomenų, kuriuos jūsų sistema gali apdoroti vienu metu, kiekio matavimas. Aukštesnis VRAM yra gyvybiškai svarbus, jei dirbate su įvairiais „Computer Vision“ modeliais arba atliekate bet kokias „CV Kaggle“ varžybas. VRAM nėra toks svarbus nei NLP, nei darbui su kitais kategoriniais duomenimis.

Atminties pralaidumas

Atminties pralaidumas yra duomenų nuskaitymo ar išsaugojimo atmintyje greitis. Paprasčiau tariant, tai yra VRAM greitis. Išmatuojant GB / s, didesnis atminties pralaidumas reiškia, kad kortelė per mažiau laiko gali atgauti daugiau duomenų, o tai reiškia greitesnį veikimą.

Aušinimas

GPU temperatūra gali būti reikšminga kliūtis, kai kalbama apie našumą. Šiuolaikiniai GPU paleidžia algoritmą maksimaliai padidina savo greitį. Bet kai tik pasiekiama tam tikra temperatūros riba, GPU sumažina apdorojimo greitį, kad apsaugotų nuo perkaitimo.

Oro aušintuvų ventiliatorių dizainas išstumia orą už sistemos ribų, o ne ventiliatoriai siurbia orą. Architektūroje, kur keli GPU dedami vienas šalia kito, ventiliatoriai be pūtimo įkais daugiau. Jei oro aušinimą naudojate nustatydami 3–4 GPU, venkite ventiliatorių be ventiliatorių.

Vandens aušinimas yra dar viena galimybė. Nors šis metodas yra brangus, jis yra daug tylesnis ir užtikrina, kad net ir patys geriausi GPU nustatymai išliks vėsūs viso veikimo metu.

Išvada

Daugumai naudotojų, besimokančių giluminio mokymosi, „RTX 2080 Ti“ arba „Titan RTX“ suteiks didžiausią sprogimą. Vienintelis „RTX 2080 Ti“ trūkumas yra ribotas 11 GB VRAM dydis. Treniruotės su didesniais partijų dydžiais leidžia modeliams treniruotis greičiau ir daug tiksliau, taip sutaupant daug vartotojo laiko. Tai įmanoma tik turint „Quadro“ GPU arba „TITAN RTX“. Naudojant pusiau tikslumą (FP16), modeliai gali tilpti į GPU su nepakankamu VRAM dydžiu [2]. Tačiau labiau pažengusiems vartotojams turėtumėte investuoti į „Tesla V100“. Tai yra mūsų geriausias pasirinkimas dėl geriausios dirbtinio intelekto, mašininio mokymosi ir gilaus mokymosi grafikos plokštės. Viskas šiam straipsniui. Tikimės, kad jums patiko. Iki kito karto!

Literatūra

Geriausi dirbtinio intelekto, mašininio mokymosi ir giluminio mokymosi GPU 2020 m
Geriausias giluminio mokymosi GPU 2020 m
„NVIDIA AI INFERENCE PLATFORM“: milžiniški AI paslaugų našumo ir efektyvumo šuoliai - nuo duomenų centro iki tinklo krašto
„NVIDIA V100 TENSOR CORE GPU“
„Titan RTX“ gilaus mokymosi gairės