Multe subiecte interesante au fost discutate la evenimentul Nvidia GTC Washington, D.C. Printre altele, Jensen Huang a dezvăluit următoarea generație de Superchip, de data aceasta construită în jurul arhitecturii Vera și GPU Ruby, care va aduce progrese majore în mai multe domenii de care vor beneficia operatorii de centre de date AI.
Platforma, care va veni ca o singură placă de bază mare, și se va baza pe un total de trei cipuri: două GPU Vera, fiecare constând din două unități; și un procesor din seria Rubin construit în jurul arhitecturii ARM pentru a le deservi. GPU-urile utilizează memorii HBM4, iar memoria principală este construită din cipuri de memorie standard LPDDR. Potrivit Nvidia, noua platformă este deja testată de echipa de dezvoltare, dar producția de volum nu va începe până anul viitor.
Practic, ne putem aștepta la două cipuri grafice utilizate ca și una singură, capabile de o performanță de calcul de până la 50 PFLOP/s pentru sarcini FP4, și 288 GB RAM HBM4, care va fi disponibilă sub forma a opt sandwich-uri. Aceste GPU-uri vor fi deservite de un CPU Vera cu un total de 88 nuclee și 176 fire, bazat pe ARM, care va comunica cu fiecare GPU prin legături NVLINK-C2C la o lățime de bandă de 1,8 TB/s.
Această placă de bază, care are aproximativ dimensiunea unei plăci de bază pentru PC cu factor de formă ATX, poate atinge o performanță maximă de calcul de până la 3,6 ExaFLOP/s pentru sarcinile FP4 - deducere - în format rack NVL144, iar operațiunile FP8 - formare - pot fi deservite cu o performanță de calcul de 1,2 ExaFLOP/s. Pe baza acestei performanțe, noua configurație NVL144 poate fi de până la 3,3 ori mai rapidă decât NVL72 bazat pe GB300, o îmbunătățire semnificativă. Noul sistem va fi capabil să lucreze la 13 TB/s, și va include 75 TB RAM rapid. Legăturile NVLINK și CX9 vor dubla lățimea de bandă maximă disponibilă, cu 260 TB/s, și respectiv, 28,8 TB/s.
Sistemul va debuta în 2026, și va fi urmat în 2027 de NVL576 bazat pe Rubin Ultra, care va utiliza același procesor cu GPU capabil să atingă o performanță maximă de calcul FP4 de aproximativ 100 PFLOP/s. Numărul GPU-urilor se va mări la 4 patru și vor fi însoțite de 1 TB RAM HBM4e, care va fi disponibilă sub formă de sandvișuri cu 16 cipuri. Sistemul NVL576 este planificat să fie capabil de o performanță maximă de calcul FP4 de 15 ExaFLOP/s și o performanță maximă de calcul FP8 de 5 ExaFLOP/s, cu 365 TB de memorie rapidă, și comunicare asigurată de o conexiune NVLINK cu o lățime de bandă de 1,5 PB/s.
Următorul pas va fi Vera Feynman Superchip, care ar debuta undeva în jurul anului 2028: această dezvoltare ar putea include un GPU bazat pe Feynman alături de CPU Vera, cu sandwich de cipuri HBM de generație următoare.