Echipa AMD a stabilit un obiectiv foarte ambițios pentru 2021 sub forma proiectului 30x25, care trebuia să obțină nu mai puțin de o creștere de 30 de ori a eficienței energetice până în 2025, în segmentele procesoarelor pentru servere EPYC și acceleratoarelor AI din seria Instinct. Conform celui mai recent raport al companiei, se pare că reprezentanții generației actuale de hardware sunt foarte aproape de acest obiectiv, chiar dacă nu a fost atins în termeni concreți.
Îmbunătățirea de 30x nu este încă atinsă cu hardware-ul actual, dar măsurătorile și benchmark-urile interne al AMD sugerează că este aproape, la 28,3x.
Testele s-au bazat pe un server din 2020, a cărui arhitectură exactă nu a fost dezvăluită, dar având în vedere că acceleratoarele AI Instinct MI 100 construite în jurul arhitecturii CDNA 1 și procesoarele din seria EPYC 7002 care utilizează arhitectura ZEN 2 constituiau coloana vertebrală a ofertei de servere a companiei la momentul respectiv, este puțin probabil ca acestea să fi fost utilizate ca bază. De asemenea, poate fi interesant de observat că seria EPYC 7002 a fost completată de un model cu 64 nuclee.
În cazul MI100, merită subliniat faptul că acesta a oferit doar suport INT8, suportul FP8 a fost introdus ulterior, dar acesta este deja disponibil în MI300X, iar aceeași performanță este disponibilă în FP8 și INT8. Prin urmare, performanța de calcul INT8 este de 184,6 TOPS, iar MI300X are 2615 TOPS și 5230 TOPS, în funcție de sparsity. Diferența este aproximativ aceeași sub FP16, adică îmbunătățirea este de 14x și, respectiv, 28x.
Ecuația poate fi îmbunătățită și prin faptul că a existat o îmbunătățire semnificativă a arhitecturii memoriei, deoarece în timp ce subsistemul de memorie HBM2 de 32 GB din M100 oferea o lățime de bandă de memorie de 1,20 GB/s, MI300X poate oferi acum 5,3 GB/s cu 192 GB HBM3. În același timp, a existat o mulțime de progrese în tehnologia procesoarelor, compania utilizând arhitectura ZEN 5, ceea ce înseamnă că atât performanța, cât și eficiența energetică s-au îmbunătățit concret.
Desigur progresul continuă neîncetat, cum ar fi introducerea recentă a acceleratorului AI Instinct MI325X care poate avea 288 GB RAM HBM3E și este construit în jurul arhitecturii CDNA 3. Anul viitor vom vedea sosirea Instinct MI355X, care va profita de arhitectura CDNA4 și va oferi o performanță cu aproximativ 80% mai bună în FP8 și FP16 decât MI325X. Acest lucru ar trebui să permită companiei să își mențină obiectivul stabilit anterior de 30x.
Următorul obiectiv este de a obține o îmbunătățire de 100x în același domeniu până în 2027 cu îmbunătățiri suplimentare.