Acceleratoarele AI de nouă generație ale Nvidia pentru AI și HPC, seria Blackwell, au fost deja prezentate, cu eșantioane de teste cu exemplare de inginerie ale modelelor B100 și B200 deja finalizate și expediate către diverși parteneri importanți. Din păcate, a reieșit acum că nu totul este în regulă cu produsele construite în jurul arhitecturii Blackwell: conform informațiilor de la Nvidia și Microsoft, se pare că ar putea exista un defect de proiectare care va întârzia lansarea cardurilor acceleratoare.
Potrivit unor surse din industrie, care au cerut să nu fie numite, echipa Nvidia plănuise inițial să lanseze noile plăci rapide în trimestrul al patrulea, dar acum se pare că lansarea ar putea fi amânată cu trei sau mai multe luni, iar în cel mai bun caz, noile plăci ar putea fi disponibile abia în primul trimestru al anului viitor. Rapoarete din industrie se ridică la 3. Până în prezent însă nu există o declarație oficială pe această temă, ceea ce înseamnă că rapoartele actuale ar trebui tratate cu prudență.
Se spune că defectul este legat de cipul GB200 care conține două GPU-uri Blackwell, și afectează cipul care asigură conexiunea dintre cele două. Problema ar fi fost descoperită de inginerii TSMC, potrivit unor informații neconfirmate. Nu se știe dacă și la alte modele au fost descoperite probleme. și dacă da, care sunt acestea. În timp, sperăm că toate detaliile vor ieși la iveală.
Întârzierea a dat peste cap și planurile unor clienți importanți precum Microsoft, Meta și XAI, care comandaseră în total aproximativ 300 000 exemplare GPU B200. În cel mai bun caz, Nvidia nu va fi în măsură să onoreze comenzile de volum mai mare până în al doilea trimestru al anului viitor. Oricare ar fi defectul specific, din moment ce un defect de proiectare a fost raportat de informatori din industrie, adică designul cipurilor este afectat, este un caz care trebuie investigat în profunzime și rezolvat în mod corespunzător pentru a evita o problemă precum cea care a afectat procesoarele Intel din seriile Core de generația a 13-a și a 14-a, și a provocat probleme majore pe piață. AMD a avut și el un grăunte de nisip în mașinăria sa, ceea ce a cauzat amânarea lansării procesoarelor RYZEN 9000 și retragerea tuturor produselor livrate la furnizori.
Pentru Nvidia, este și mai important ca cipurile să fie perfecte, deoarece noua generație de acceleratoare AI sunt foarte scumpe, în special cele din categoria AI Superchip, care pot costa până la 70.000 de dolari bucata, iar prețul unui rack de server complet poate ajunge până la 3 milioane de dolari, sau chiar a depăși această sumă în funcție de cerere și contracte. Producătorul nu își poate permite să facă o greșeală majoră în acest domeniu, deoarece aceasta ar submina încrederea clienților și ar putea duce la procese masive.
Între timp, o transformare minoră este în curs de desfășurare, cei mai mari clienți ai Nvidia lucrând deja la propriile acceleratoare AI dezvoltate, care nu numai că se potrivesc mai bine fluxurilor de lucru pe care le execută, dar pot să depășească produsele Nvidia în ceea ce privește costurile și eficiența energetică, fiind în același timp mai versatilă.
Rezolvarea rapidă și eficientă a problemei actuale este o sarcină foarte importantă, deoarece clienții se bazează pe seria Blackwell și doresc să primească produsele la timp.