Echipa AMD a anunțat anterior cât de performant va fi noul APU mobil, RYZEN AI MAX+ 395, care se află la vârful seriei Strix Halo în sarcini AI. Recent, au fost publicate și măsurători, care indică arată că noul APU AMD poate fi de până la 12,2 ori mai rapid în anumite rezultat, decât cel mai rapid membru al Intel Lunar Lake, Core Ultra 258V.
APU-ul AMD în sine are 16 nuclee, 32 de fire, un iGPU RDNA 3.5 cu 40 CU și un NPU XDNA2 capabil de 50 TOP-uri, iar Intel Core Ultra 7 258V are 8 nuclee și 8 fire, un iGPU Arc Graphics 140V cu 64 EU și un NPU capabil de 47 TOP.
Conform măsurătorilor interne ale AMD, RYZEN AI Max+ 395 oferă o performanță de până la 12,2 ori mai bună decât Core Ultra 7 258V în anumite fluxuri de lucru, ceea ce pare o diferență uriașă. Diferența este destul de impresionantă în cazurile în care complexitatea modelelor lingvistice mari sunt aproape să depășească limitele notebook-urile normale cu 32 GB RAM.
Notebook-ul ASUS RoG Flow Z13 cu 64 GB RAm și un iGPU Radeon RX 8060S a produs o performanță de 2,2 ori mai mare în procesarea jetoanelor decât SoC-ul Lunar Lake bazat pe Intel Arc 140V. Pentru primul jeton, mașina AMD a avut nevoie de 4 ori mai puțin timp pentru a construi LLM-urile mai mici, decât Llama 3.2 cu 3 miliarde de parametri, dar această diferență a crescut până la 9,1 ori pentru DeepSeek R1 Distill cu 7-8 miliarde parametrii.
Arhitectura AMD a avut performanțe excepționale și pentru sarcinile de procesare vizuală multimodală, procesând date de intrare vizuale complexe de până la 7 ori mai rapid sub IBM Granite Vision 2.3 3B, iar pe Google Gemma 3 12B a fost de 6 ori mai rapid.
Printre avantajele platformei se numără capacitatea de a aloca până la 96 GB de memorie pentru iGPU, prin intermediul suportului VGM (Variable Graphics Memory), permițând utilizarea chiar și a Google Gemma 3 27B Vision, care este deja un model complex. Beneficiile acestei platforme pot fi exploatate într-o serie de domenii, inclusiv imagistica medicală, datorită performanței crescute și a avantajelor oferite de capacitatea maximă de memorie mai mare, care permite și gestionarea unor modele mai complexe de limbaj mare.