Nvidia a fost lovită puternic de cea mai recentă restricție de export, ceea ce înseamnă că acceleratoarele speciale ale companiei, modelele H20, o versiune mai slabă al H100, nu mai poate fi expediat în China, pentru a respecta reglementările anterioare privind exporturile de acceleratoare AI și HPC al SUA. Omul de top al Nvidia a participat recent la o cină cu Donald Trump care l-a costat 1 milion dolari și a reușit să obțină ridicarea restricției pentru doar câteva zile.
Aceasta este o veste proastă pentru conducerea Nvidia, care a obținut vânzări și profituri uriașe de pe urma acestor acceleratoare, dar este o veste bună pentru Huawei, care stă în fruntea producerii acceleratoarelor alternative. Acest efort ar putea primi acum un nou impuls, deoarece la scurt timp după ce guvernul american a înăsprit și mai mult restricțiile, Huawei a anunțat că va încerca să umple golul lăsat cu seria Ascend 920. Aceasta va include două modele, Ascend 920 de bază și Ascend 920C, care este conceput pentru sarcini speciale și oferă o eficiență energetică excelentă.
Ascend 920 a fost prezentată în cadrul unei conferințe speciale destinate în special partenerilor companiei, la exact o zi după ce guvernul SUA a anunțat restricții mai stricte privind exportul de acceleratoare pentru piețele AI și HPC. Ascend 920 este planificat să fie construit folosind tehnologia de fabricație pe 6nm, dar producția de serie nu va începe până în a doua jumătate a anului. Se așteaptă ca noul accelerator să ofere până la 900 TLFOP/s performanță de calcul, și până la 4 TB/s lățime de bandă, datorită utilizării sandwich-urilor de cipuri HBM3.
Ascend 920 va fi însoțit de Ascend 920C, optimizat pentru a rula modele Tranformer și Mixture of Experts la cea mai mare eficiență posibilă, rezultând o creștere a eficienței între 30% și 40% față de predecesorul său Ascend 910C, o îmbunătățire uriașă. Interesant este faptul că Ascend 910C s-a descurcat destul de bine în testele anterioare în comparație cu acceleratorul H100 de la Nvidia, oferind aproximativ 60% din performanța acestuia, astfel încât Ascend 920C ar putea fi și mai competitiv, eliminând scopul interzicerii produselor NVIDIA.
Dezvoltarea Ascend 920 a fost în lucru de mult timp, dar anunțul a fost făcut aproape în paralel cu restricțiile de lungă durată. Se așteaptă ca noile acceleratoare AI să fie populare, fie și numai pentru că le este din ce în ce mai dificil să aibă acces la produsele Nvidia, deși cu siguranță vor găsi breșe să le acapareze.
Față de modelele Ascend 920, Huawei a introdus și un server special numit AI Cloud Matrix 384, o soluție rack despre care furnizorul susține că oferă performanțe mai bune decât soluțiile Nvidia bazate pe GB200, dar nu este la fel de eficient din punct de vedere energetic.
Este probabil ca partenerii chinezi să se orienteze din ce în ce mai mult către acceleratoare dezvoltate intern, care sunt din ce în ce mai competente, tocmai pentru că nu au de ales, ceea ce pune la întrebarea eficacitatea reglementărilor SUA.