Arhitectura Blackwell de la Nvidia se regăsește atât la bordul acceleratoarelor pentru piețele de inteligență artificială și HPC, cât și la plăcile grafice din seria GeForce pentru gameri. Compania a prezentat deja acceleratoare AI, iar primii membri ai seriei GeForce RTX 50 sunt așteptați să debuteze în trimestrul patru al acestui an, dar există o oarecare incertitudine cu privire la numărul exact de plăci grafice noi care vor fi lansate în acest an.
În timp ce acest lucru se rezolvă, merită să aruncăm o privire la unele dintre cele mai recente informații venite de la un leaker de încredere până acum, kopite7kimi. Datele de mai jos enumeră parametrii disponibili pentru GPU-urile Blackwell destinate fiecărei plăci video la nivelul maxim de construcție, astfel încât fiecare placă video ar putea ajunge să aibă mai puține resurse decât atât în ceea ce privește nucleele CUDA, ceilalți parametri urmând să rămână neschimbate față de cele de mai jos.
Vârful de gamă ar putea fi reprezentat de procesorul grafic GB202, care ar putea fi la bordul succesorului vârfului de gamă al GeForce RTX 4090 - denumit GeForce RTX 5090. GPU-ul va avea la bord un total de 192 de matrici SM, grupate în 96 cipuri de procesare a texturilor (TPC), care la rândul lor vor forma 12 de cipuri de procesare grafică (GPC). Dacă numărul de nuclee CUDA per TPC rămâne neschimbat pentru Blackwell, adică 256 ca și până acum, GB203 va avea 24576 nuclee CUDA atunci când va fi complet implementat. Este puțin probabil ca GeForce RTX 5090 să poată pune în funcțiune toate acestea, poate că dezvoltarea completă va fi rezervată pentru un GeForce RTX 5090 Ti, dacă va putea fi adunat un număr suficient de cipuri fără defecte. Mai mult decât o treaptă mai sus, este mai probabil ca placa de top pentru piața ProViz să primească GPU-urile complete, deoarece au o marjă de profit preconizată mai mare. GPU-ul GB202 poate fi conectat la memorii GDDR7 prin intermediul unei magistrale de memorie foarte masive de 512 biți, care poate funcționa la 28 GHz. În acest caz, subsistemul de memorie poate aloca o lățime de bandă de memorie de 1792 GB/s.
[table position="center" subtitle="Az információ nem hivatalos forrásból származik" title="Az Nvidia Blackwell sorozatú gamer GPU-inak várható paraméterei"]
[tr]
[td]Cip GPU
Parametru
[/td]
[td]Număr GPC[/td]
[td]Număr TPC per bloc GPC[/td]
[td]Numărul de rețele SM[/td]
[td]Nuclee CUDA[/td]
[td]Magistrală[/td]
[td]Tip memorie[/td]
[td]Lățime de bandă memoriei[/td]
[td]Capacitatea de memorie[/td]
[/tr]
[tr]
[td]GB202[/td]
[td]12[/td]
[td]8[/td]
[td]192[/td]
[td]24576[/td]
[td]512 biți[/td]
[td]GDDR7[/td]
[td]1792 GB/s
(28 GHz)
[/td]
[td]32 GB, 64 GB[/td]
[/tr]
[tr]
[td]GB203[/td]
[td]7[/td]
[td]6[/td]
[td]84[/td]
[td]10752[/td]
[td]256 biți[/td]
[td]GDDR7[/td]
[td]896 GB/s
(28 GHz)
[/td]
[td]16 GB, 32 GB[/td]
[/tr]
[tr]
[td]GB205[/td]
[td]5[/td]
[td]5[/td]
[td]50[/td]
[td]6400[/td]
[td]192 biți[/td]
[td]GDDR7[/td]
[td]672 GB/s
(28 GHz)
[/td]
[td]12 GB, 24 GB[/td]
[/tr]
[tr]
[td]GB206[/td]
[td]3[/td]
[td]6[/td]
[td]36[/td]
[td]6144[/td]
[td]128 biți[/td]
[td]GDDR7[/td]
[td]448 GB/s
(28 GHz)
[/td]
[td]8 GB, 16 GB[/td]
[/tr]
[tr]
[td]GB207[/td]
[td]2[/td]
[td]5[/td]
[td]10[/td]
[td]2560[/td]
[td]128 biți[/td]
[td]GDDR6[/td]
[td]288 GB/s
(18 GHz)
[/td]
[td]8 GB, 16 GB[/td]
[/tr]
[/table]
Cu un nivel mai jos se află GB203, care este succesorul lui AD103. Acest GPU are o arhitectură semnificativ mai simplă, cu doar 84 de blocuri SM disponibile în 42 de TPC-uri, ceea ce oferă un maxim de 10752 de nuclee CUDA. În această versiune, subsistemul de memorie poate gestiona date pe 256 biți, ceea ce duce la o lățime de bandă de memorie de 896 GB/s la o viteză de ceas efectivă de 28 GHz.
Interesant este faptul că nu există nici un cip GB204 anunțat, astfel că succesorul lui AD104 va fi GB206, care vine cu 50 de blocuri SM, împărțite în 25 de TPC-uri, și un maxim de 6400 de nuclee CUDA, ceea ce este puțin surprinzător. GPU-ul de aici poate lucra cu date pe numai 192 biți, ceea ce împreună cu cipurile de memorie de 28 GHz care folosesc GDDR7, rezultă o lățime de bandă de memorie de 672 GB/s.
Următorul în gamă este modelul GB206, de nivel mediu, care vine cu 36 de blocuri SM și 16 TPC-uri, cu un maxim de 6144 nuclee CUDA, deci nu va fi prea departe de GB205 din acest punct de vedere. Cu toate acestea, datele sunt transferate la 128 de biți, iar atunci când îi sunt folosite memorii GDDR7 de 28GHz, este posibilă o lățime de bandă de memorie de 448 GB/s.
Nivelul de intrare poate fi deservit de GB207, care are semnificativ mai puține resurse. Acest GPU conține doar 10 matrici SM, rezultând 2560 de nuclee CUDA. Busul de date va fi tot pe 128 de biți, dar nu va mai fi echipat cu GDDR7 de 28 GHz, ci doar GDDR6 de 18 GHz, ceea ce duce la o lățime de bandă de memorie de 288 GB/s.
Se așteaptă ca noile GPU-uri să vină cu memorii cache mai mari decât versiunile actuale, ceea ce ar trebui să îmbunătățească performanța subsistemului de memorie. În plus, sunt așteptate îmbunătățiri în zona de ray-tracing și a nucleelor Tensor, plus alte domenii în care noile GPU-uri ar putea fi îmbunătățite datorită avantajelor oferite de noua arhitectură. Se zvonește că primii membri ai seriei Blackwell vor debuta în al patrulea trimestru al acestui an.