Jen-Hsun Huang, omul de top al Nvidia, a ținut zilele trecute o prezentare interesantă și lungă, care are de fapt legătură cu Computex 2024, dar care a avut loc cu o zi mai devreme decât alte companii. Inteligența artificială a fost principalul punct de interes al prezentării, dar și un nou standard, sau mai degrabă o directivă, numită "SFF-Ready Enthusiast GeForce Cards and Cases", care reunește plăcile video și carcasele de calculator ce pot fi folosite pentru a construi sisteme de jocuri compacte, dar performante. În paralel, s-a vorbit despre arhitecturi GPU de ultimă generație și despre faptul că categoria de PC-uri Copilot+ de la Microsoft ar putea fi extinsă în curând pentru a suporta plăci grafice Nvidia, categorie care este și va continua să fie denumită Nvidia RTX AI PC.
Haideți să ne scufundăm în numeroasele subiecte interesante și importante care au fost abordate în cadrul prezentării, care a durat mai bine de 2 ore!
Programul SFF-Ready Enthusiast GPU: o compilație de plăci grafice și carcase de calculator SFF
PC-urile de gaming compacte reprezintă o pasiune pentru mulți și nu este greu să găsești plăci grafice compatibile cu carcasele de calculator mai mici, atâta timp cât nu vrei să te aventurezi peste un anumit nivel de performanță. Printre plăcile grafice mai ieftine și mai puțin performante, există un număr destul de mare de plăci compatibile Mini-ITX, de obicei cu o lățime de cel mult două sloturi și o lungime nu mai mare de 170-180 mm. Desigur, o placă grafică high-end, cum ar fi GeFocre RTX 4080 Super, nu se potrivește în acest interval, dar Nvidia a considerat că există o cerere pentru modele mai mici și a dorit să ajute clienții să le găsească. În plus, aceștia ar încuraja partenerii să creeze pe viitor plăci grafice care să respecte noile orientări.
Categoria "SFF-Ready Enthusiast GeForce Cards and Cases" grupează plăci grafice de nivel entuziast, ceea ce înseamnă că acestea variază de la GeForce RTX 4070 până la GeForce RTX 4080 Super. La capătul inferior al gamei, adică seria GeForce RTX 4070, este destul de ușor să găsești modele compatibile cu carcasele mai spațioase pentru calculatoare Mini-ITX, GeForce RTX 4070 Founders Edition și GeForce RTX 4070 Super Founders Edition fiind exemple excelente, dar modelele mai rapide decât acestea sunt de obicei mai mari. Un GeForce RTX 4070 Ti Super și un GeForce RTX 4080 Super necesită adesea trei sloturi sau mai mult de spațiu în interiorul carcasei, și pot fi destul de lungi.
Noul "standard" al Nvidia specifică exact cât de mare trebuie să fie o placă video GeForce SFF-Ready Enthusiast GeForce pentru a primi "certificarea" asociată cu standardul, fie că este vorba de un autocolant sau doar a fi adăugată pe lista de plăci video compatibile. Plăcile video în cauză nu trebuie să fie mai late de 2,5 sloturi și nu mai lungi de 304 mm , cu o înălțime de 151 mm. Deși aceste cifre sunt foarte departe de clasicele plăci grafice compatibile Mini-ITX, este furnizată și o listă de carcase de calculator care pot găzdui aceste plăci grafice GeForce SFF-Ready Enthusiast GeForce.
Designul ușor mai "aerisit" este menit să faciliteze instalarea. În același timp, există și cerințe privind cablul de alimentare, dar acestea nu sunt incluse în informațiile actuale, ci doar că înălțimea de 151 mm a plăcii video include deja spațiul necesar pentru cablul de alimentare. Având în vedere că plăcile video în cauză folosesc în cea mai mare parte un conector de alimentare de 12v-2x6, care în multe cazuri necesită un convertor dacă nu aveți o sursă de alimentare standard ATX 3.0, cerința este puțin ciudată.
Oricum ar fi, lista actuală a plăcilor grafice compatibile din seria GeForce RTX 40 include 33 de modele în total, cu 18 carcase de calculator care îndeplinesc cerințele SFF-Ready. În mod nesurprinzător, majoritatea plăcilor sunt din seria GeForce RTX 4070, cu 13 modele, în timp ce seria GeForce RTX 4070 Super are 11 membri. Linia GeForce RTX 4070 Ti Super se reduce la doar 7 plăci grafice, iar lista GeForce RTX 4080 Super este și mai modestă, pe ea figurând doar ASUS ProArt și seria Infinity 3 de la Palit.
Are sens noua schemă din perspectiva unui cumpărător? Ajută la construirea unei configurații mai compacte, ceea ce este o veste bună, deoarece mulți își doresc un PC de gaming care să economisească spațiu, dar asamblarea poate fi adesea o bătaie de cap, deoarece există oferta este mică și necesită o oarecare expertiză tehnică adițională. Acest proces va fi semnificativ scurtat de "recomandarea" GPU-ului SFF-Ready Ethusiast de la Nvidia, care probabil va fi extinsă și la plăcile grafice din seria GeForce RTX 50 care vor fi lansate în viitor.
Project G-Assist: un asistent bazat pe inteligență artificială care te ajută să te joci mai eficient
Jocurile din ziua de azi sunt din ce în ce mai complexe, cu sarcini din ce în ce mai complexe de rezolvat și strategii din ce în ce mai dificile de dezvoltat, ceea ce face ca jocul să fie mai greu de parcurs. Cel puțin așa consideră Nvidia, motiv pentru care a creat un add-on util pentru cei care doresc să se joace mai eficient și mai eficace pe sistemele lor echipate cu GPU GeForce în cadrul diverselor titluri moderne.
Aceștia vor fi asistați de Project G-Assist, care le oferă un asistent personal legat de un model lingvistic de mari dimensiuni. Asistentul are acces la o cantitate uriașă de date, și prin urmare, poate răspunde de obicei în mod eficient la întrebările jucătorilor, facilitând pasul următor într-un anumit titlu și îmbunătățind experiența de joc.
Potrivit Nvidia, mulți aleg să nu joace un titlu pentru că este prea complicat și necesită prea mult timp, deoarece curba de învățare și investiția de timp necesară pentru a juca cu succes nu este proporțională cu valoarea experienței. Aici poate ajuta Project G-Assist, cu un asistent bazat pe inteligență artificială care poate răspunde la întrebările jucătorului, fie că este vorba de chat sau de voce.
Prin accesarea jocului, se poate oferi un răspuns contextual, datorită utilizării modelelor AI Vision, care permit asistentului AI să "vadă" ceea ce se află pe ecran și să consilieze eficient cu privire la următorul pas. Acesta poate chiar să vă ajute să vă spună care este cea mai eficientă armă din joc, puterea lui de distrugere, care sunt punctele slabe ale acesteia și cum să o obțineți sau să o fabricați în joc. Desigur, acest lucru necesită și integrarea funcționalității Project G-Assist în joc, care poate fi făcută prin intermediul kitului de dezvoltare RTX AI, pe care îl vom aborda mai jos.
Asistentul poate ajuta nu numai la gameplay, ci și la obținerea unei performanțe optime. Acesta poate sugera setări grafice optime și chiar le poate seta automat, dacă o cereți. Dacă este importantă o funcționare mai eficientă din punct de vedere energetic, acesta poate să reducă în mod inteligent consumul de energie, menținând în același timp o performanță suficientă pentru a vă menține în joc.
Încă nu se știe când anume va debuta Project G-Assist, dar este clar că dezvoltatorii de jocuri vor avea nevoie de timp pentru a-l integra, dacă vor vedea ceva imaginație în această inovație. Dacă caracteristica contribuie la popularitatea unui joc, dezvoltatorii vor fi motivați să integreze Project G-Assist, dar va fi nevoie de timp, și printre altele, să vadă dacă jucătorii își doresc acest tip de inovație într-un titlu...
Windows Copilot va suporta în curând GPU-urile Nvidia
Atunci când Microsoft a anunțat categoria de PC-uri Copilot+, s-a dezvăluit că aceasta va include doar și exclusiv unități SoC Qualcomm Snapdragon din seria X, și notebook-uri construite în jurul acestora, deoarece doar aceste unități de bază includ NPU-uri care oferă performanțe de cel puțin 40 de TOP-uri în cadrul sarcinilor AI. Nvidia și-a exprimat deja dezaprobarea, deoarece GPU-urile sunt capabile de performanțe mult mai mari în sarcinile AI datorită nucleelor Tensor de la bord, deși nu sunt neapărat la fel de eficiente din punct de vedere energetic ca un NPU, ceea ce reprezintă o mare problemă în segmentul notebook-urilor unde capacitatea bateriei este limitată, dar asta este o altă poveste.
În afară de plăcile video de la Nvidia, plăcile video și SoC-urile de la Intel și AMD nu se încadrează în prezent în categoria PC-urilor Copilot+, dar acest lucru se va schimba pentru următoarea generație de soluții. Între timp, PC-urile notebook care includ plăci grafice din seria GeForce RTX 40 ar putea fi incluse în curând în categoria Copilot+ PC, grație unei colaborări între Microsoft și Nvidia, în mod ironic cu procesoare Intel sau AMD la bord. În fundal se află în pregătire unități SoC ARM cu GPU Nvidia, care ar putea debuta anul viitor. De asemenea, este foarte probabil ca Intel și AMD să nu lase această "excepție" să treacă fără să spună nimic, ceea ce înseamnă că și plăcile lor grafice actuale ar putea fi incluse în această categorie mai devreme sau mai târziu.
Grație celor de mai sus, pe piață există deja peste 200 de notebook-uri care pot fi folosite de producători pentru a se încadra în categoria PC-urilor Copilot+, așa cum este listată de Microsoft, iar printre opțiunile care pot fi folosite se vor număra și GPU-urile Nvidia. Nvidia a împărtășit și imagini cu un total de 5 notebook-uri care se încadrează în categoria RTX AI PC - inclusiv 4 notebook-uri ASUS și 1 notebook MSI, după cum puteți vedea în galeria de mai jos.
Este interesant faptul că Nvidia nu numește produsele Copilot+ PC, ci mai degrabă RTX AI Laptop, pe care l-a creat chiar ea, dar cele două categorii vor fi defapt aceleași. O altă completare interesantă este că, în ceea ce privește performanța brută AI, chiar și un GPU GeForce RTX 4050 Laptop poate depăși cu ușurință nivelul de 45 TOPs cerut de Microsoft, oferind în jur de 200 TOPs, în timp ce un GPU GeForce RTX din seria 4090 pentru desktop poate ajunge la 1300 TOPs - eficiența energetică este o altă problemă, dar performanța este disponibilă. De fapt, o placă grafică mobilă din seria GeForce RTX 2060 Laptop GPU oferă deja o performanță de 59 TOPs, ajungând până la 215 TOPs pentru GeForce RTX 2080 Ti, ceea ce înseamnă că GPU-urile Nvidia oferă de mult timp performanțe AI mai mari decât cele cerute de Microsoft.
Așadar, nivelul potrivit de performanță există de ceva vreme, dar nu a fost exploatat la potențialul său maxim, cel puțin nu atât de mult pe cât o va face categoria Copilot+ PC. Nucleele Tensor au făcut o treabă bună cu funcția DLSS și au oferit o îmbunătățire utilă pentru curățarea conținutului video și audio, dar ne putem aștepta să le vedem în curând în mai multe domenii. Care va fi soarta funcției Recall, devenită acum un coșmar pentru protecția datelor ? Timpul ne va spune.
RTX AI Toolkit
Principalul obiectiv al setului de instrumente menționat mai sus este de a ajuta dezvoltatorii să seteze și să personalizeze modelele de inteligență artificială pentru a se potrivi cel mai bine nevoilor lor. Setul de instrumente va fi folosit pentru a crea NPC-uri inteligente cu care să interacționeze în diferite jocuri, dar va fi folosit și în alte domenii.
Optimizarea poate fi foarte eficientă, cel puțin așa cum arată un exemplu. Acesta se baza pe un LLM (model de limbaj mare) cu 7 miliarde de parametri, care era folosit pentru NPC-ul din demo, dar pentru a rula LLM, era necesară o placă video GeForce RTX 4090 și 17 GB de VRAM în mod implicit, în schimbul a 48 de jetoane pe secundă. Acest LLM a fost gestionat cu ajutorul setului de instrumente RTX AI, a fost creat un model optimizat care putea rula cu 5 GB de VRAM, dar care producea 187 de jetoane pe secundă. Viteza a crescut vizibil de aproape patru ori, iar necesarul de VRAM a fost redus cu o treime, ceea ce înseamnă că teoretic, modelul ar putea fi utilizat cu un GPU GeForce RTX 4050 Laptop de 6 GB.
În cadrul evenimentului, au demonstrat și modul în care tehnologiile de inteligență artificială menționate mai sus lucrează împreună pentru a duce experiența de joc la un nou nivel. Acest lucru poate fi văzut în videoclipul de mai jos. De asemenea, o noutate este faptul că accelerarea RTX TensorRT este acum disponibilă în cadrul ComfyUI, un instrument popular de generare a imaginilor bazat pe Stable Diffusion. Integrarea ComfyUI este planificată să fie disponibilă și la bordul RTX Remix în viitorul apropiat, ceea ce este bine, deoarece va accelera semnificativ redarea texturilor în jocurile vechi.
Au fost discutate și acceleratoarele AI pentru centrele de date, deoarece acestea sunt extrem de importante în zilele noastre
De ceva timp, partea mare din veniturile totale ale Nvidia nu mai este generată de divizia care deservește gamerii, ci de soluțiile de piață AI și HPC pentru centrele de date, așa cum se arată clar în ultimul raport financiar . În prezent, compania este în curs de lansare a acceleratoarelor B100 și B200 construite în jurul arhitecturii Blackwell, precum și a SuperChip-ului GB200, care va oferi capabilități suplimentare și performanțe extraordinare atunci când este combinat cu un procesor ARM. Arhitectura Blackwell este pe cale să primească un upgrade, deoarece primele soluții bazate pe Blackwell vor fi urmate de seria Blackwell Ultra, care se vor deosebi în esență de omologii lor obișnuiți prin faptul că vor folosi un sandwich de 12 cipuri de memorie, bazat pe HBM3E.
După Blackwell, va urma arhitectura Ruby, care este programată să debuteze sub forma modelului R100, echipat cu memorie HBM4 la bord, constând în 8 straturi de chip-uri de memorie HBM4 în formă de sandwich de chip-uri de memorie. Potrivit informațiilor oficiale, primele acceleratoare de pe piața AI și HPC construite în jurul arhitecturii Ruby ar putea apărea la începutul anului 2026, ceea ce înseamnă că zvonurile care susțin că producția de masă a produselor ar putea începe încă de la sfârșitul anului 2025 par să fie corecte.
Va exista o versiune actualizată a arhitecturii Rubin, ceea ce va duce la apariția acceleratoarelor Rubin Ultra. Aceștia vor fi disponibili în 2027, iar denumirea "Ultra" este câștigată prin faptul că vor putea utiliza sandvișuri de cipuri de memorie HBM4 12 die-carriers.
Alături de Ruby, va debuta și procesorul Vera CPU, la bordul plăcii de accelerare Vera Ruby, înlocuind acceleratoare precum Grace Hopper Superchip. În acest caz, Vera CPU va fi o soluție bazată pe ARM, care probabil va fi construită în jurul celei mai recente arhitecturi de procesoare ARM și ne putem aștepta să reprezinte un nou nivel de procesare, deși Nvidia nu a oferit încă în mod oficial detalii despre ceea ce ne putem aștepta de la această nouă dezvoltare. Platforma Ruby este planificată să fie construită în jurul switch-ului NVLink 6, care va permite lățimi de bandă de date de până la 3600 GB/s, iar o componentă CX9 SuperNIC va fi disponibilă pentru a oferi lățimi de bandă de date de până la 1600 GB/s.
Urmăriți prezentarea completă!
Puteâț urmări prezentarea Nvidia înainte de Computex 2024, prin intermediul api-ului YouTube încorporate de mai jos.