Amazon este o companie incredibil de diversă și, în calitate de cel mai mare furnizor de servicii web din lume, proiectează de ceva timp cipuri personalizate pentru a-și servi mai bine utilizatorii. Compania a vorbit acum, în cadrul evenimentului AWS re:Invent, despre modul în care începe să implementeze două noi modele de cipuri, unul pentru a ajuta centrele de date, iar celălalt pentru a fi utilizat în inteligența artificială.
"AWS Graviton4 și AWS Trainium2 aduc îmbunătățiri semnificative în ceea ce privește raportul calitate-preț, precum și eficiența. Acestea sunt excelente pentru accelerarea multor fluxuri de lucru cu sarcină mare ale clienților noștri, cum ar fi învățarea automată și inteligența artificială generativă", a subliniat Amazon.
E vorba despre cele mai noi modele de AWS, care au fost create de experți pentru a se potrivi serviciului Amazon. Deja ambele plăci au fost perfecționate pe baza experienței anterioare. Acestea au fost concepute de către designerii de cipuri pentru a fi perfect compatibile cu componentele hardware de la terți, creând astfel un mediu și mai bun.
Graviton4 va oferi o putere de calcul cu 30% mai mare decât soluția anterioară, în timp ce designerii au mărit numărul de nuclee de procesare de un factor de unu și jumătate. Acest lucru arată în mod clar că obiectivul designerilor cu AWS nu a fost acela de a crește viteza, ci mai degrabă de a crește eficiența. În comparație cu Graviton3, noul venit poate fi deservit acum de o lățime de bandă cu 75% mai mare. Sub marca Amazon EC2 (Elastic Compute Cloud), acesta va fi cea mai eficientă placă de calcul de largă folosință.
Dacă vă interesează mai multe detalii, Graviton4 are 96 de nuclee ARM Neoverse V2, față de cele 64 de nuclee utilizate anterior. Iar controlerul de memorie este cu 12 canale și permite memorie RAM DDR5 la o frecvență de până la 5600 MHz. La acest capitol, scopul a fost mai degrabă eficiența decât mai multă viteză. Este probabil ca procesul de 4 nm al TSMC să fie deja utilizat pentru Gravion4, dar acest nu a fost încă clarificat de Amazon (Graviton3 era deja de 5 nm).
Trainium2 va fi deja de patru ori mai bun la accelerarea sarcinilor de inteligență artificială decât a fost cipul de primă generație. Capacitatea sa de învățare de 4 ori mai rapidă va fi valorificată în cadrul EC2 UltraClusters, unde până la 100.000 de cipuri pot fi interconectate în același timp, permițând învățarea extrem de rapidă a modelelor de bază și a modelelor lingvistice mari. O îmbunătățire uriașă față de ceea ce a fost posibil până acum. În plus, eficiența poate fi dublată, economisind atât timp, cât și bani cu ajutorul Trainium2.
Cu această nouă soluție, Amazon va atrage atenția mai multor startup-uri interesate de inteligența artificială. Printre marii jucători care folosesc în prezent AWS se numără Anthropic, dezvoltatorul chatbotului Claude, și Databricks. În viitor vor apărea probabil tot mai multe servicii de inteligență artificială generativă, iar Amazon își deschide larg ușile pentru noii veniți.
În cadrul evenimentului s-a dezvăluit că Amazon și-a aprofundat relația cu Nvidia și că firma va implementa noile plăci de accelerare H200 în cantități mari. Acest detaliu a fost raportat cu doar câteva zile în urmă mai detaliat în urma anunțurilor recente de la Nvidia . H200 va aduce o accelerare semnificativă, are o serie de caracteristici interesante în designul său, iar Amazon va căuta să profite la maximum de dezvoltarea sa în viitor. De asemenea, a fost dezvăluit faptul că peste 16.000 de GH200 superchipuri vor fi implementate de AWS.
Amazon va profita de orice oportunitate pentru a îmbunătăți continuu competitivitatea AWS. Anunțurile recente sugerează că serviciul web, deja lider de piață, va prinde rădăcini mai adânci. Acesta ar putea contribui în viitor la o serie de proiecte care sunt deja legate de inteligența artificială și care vor profita de evoluțiile recente.