Nvidia a dezvăluit arhitecturile GPU și CPU planificate pentru următorii ani

NVIDIA A DEZVĂLUIT ARHITECTURILE GPU ȘI CPU PLANIFICATE PENTRU URMĂTORII ANI

După Ruby și Ruby Ultra, ar putea urma Feynman, care probabil o să fie o ediție Ultra.

J.o.k.e.r

Pe lângă seria Blackwell Ultra, NVIDIA a dezvăluit la GTC și o serie de alte produse, inclusiv ce arhitecturi GPU și CPU viitoare pentru piețele AI și HPC.

Compania a pregătit câteva surprize pentru anii 2026 și 2027, cu sosirea arhitecturilor Vera și Ruby - prima pentru procesorul ARM, iar a doua pentru noua arhitectură GPU. S-a sugerat că a existat o greșeală în denumirea arhitecturii Blackwell pentru platforma de pe piața serverelor, deoarece GPU-ul B200 este una dublă, astfel încât în loc de Blackwell B200 NVL72 ar fi mai potrivit să se utilizeze NVL144, deoarece constă fizic din 144 GPU-uri, astfel încât această denumire ar fi mai potrivită.

În cazul Rubin, denumirea corectă va fi utilizată. După cum s-a menționat în prezentare, în timp ce performanța de calcul Dense FP4 pentru B300 NVL72 va fi de 1,1 ExaFLOP/s, aceasta va crește la 3,6 ExaFLOP/s odată cu sosirea lui Rubin NVL144.

Noua arhitectură GPU va fi însoțită și de un nou subsistem de memorie, și anume sandvișurile HBM3/HBM3E vor fi înlocuite cu soluții HBM4, iar HBM4E va fi utilizat pentru Rubin Ultra. Capacitatea de memorie va rămâne la același nivel ca cel văzut pe B300, adică 288 GB, dar lățimea de bandă a memoriei va crește de la 8 TB/s la 13 TB/s. NVLink va fi actualizat și el, dublând lățimea de bandă de date la 260 TB/s, iar conexiunea dintre fiecare rack este acum CX9, care dublează transferul la 28,8 TB/s.

Arhitectura Rubin va primi și un procesor Vera, înlocuind actualele modele Grace. Se așteaptă ca noul design compact să aibă 88 nuclee de procesare bazate pe ARM și 176 fire - toate acestea vor fi nuclee modificate individual. Noul procesor va avea o conexiune NVLink de 1,8 TB.

Următorul pas va fi Rubin Ultra, care ar putea debuta cândva în cursul anului 2027. Procesorul Vera va face încă parte din ofertă, dar departamentul GPU va fi mult mai rapidă. Rack-ul va suferi o revizuire completă, rezultând un design NVL576, care va suporta 576 de GPU-uri. Performanța FP4 va fi de 15 ExaFLOP/s, iar performanța FP8 va fi de 5 ExaFLOP/s, ceea ce înseamnă că sistemul NVL576 va fi de patru ori mai rapid decât NVL144 anterior.

În timp ce serverele Rubin bazate pe NVL144 vin cu 75 TB "memorie rapidă", Rubin Ultra va avea 365 TB memorie disponibilă datorită designului NVL576. Aceasta din urmă este datorită memoriei HBM4E, despre care Nvidia susține că are o lățime de bandă de 4,6 PB/s, ceea ce înseamnă că un GPU va avea un segment de 8 TB/s, mai puțin decât arhitecturaa Rubin. Acest lucru poate fi rezultatul faptului că noua dezvoltare are patru GPU într-un singur cip. Un GPU cu patru cipuri poate aloca până la 1 TB memorie HBM4E, iar performanța FP4 poate fi de până la 100 PetaFLOP/s.

Noul sistem va utiliza conectivitatea NVLink 7, care va fi de șase ori mai rapidă decât cea pe care o pot utiliza produsele standard bazate pe Ruby, permițând o lățime de bandă de transfer de date de 1,5 PB/s. Legăturile CX9 vor fi de patru ori mai rapide, rezultând o lățime de bandă de date de 115,2 TB/s - probabil pentru că numărul de legături va fi cvadruplat.

În timp ce echipa Nvidia a fost foarte discretă cu privire la evoluțiile din jurul arhitecturilor Ruby și Ruby Ultra, a dezvăluit ce arhitecturi noi vor apărea mai târziu. Aparent, următoarea tehnologie după Rubin va fi numit Feynman, după fizicianul teoretician Richard Feynman - iar arhitectura CPU ar putea fi numită Richard, dacă Nvidia continuă cu practica sa actuală de nomenclatură.

nu e disponibil

Coşul e gol!

Produs

nu e disponibil

NVIDIA A DEZVĂLUIT ARHITECTURILE GPU ȘI CPU PLANIFICATE PENTRU URMĂTORII ANI

TOP 5 PE IPON