Datorită colaborării dintre Kioxia și Nvidia, se vor naște primele SSD-uri cu capabilitatea de a atinge 100 milioane IOPS până în 2027, o îmbunătățire semnificativă față de ce este posibil curent, benefic în special segmentului AI.
Colaborarea a fost anunțată de oficialii Kioxia, și au adăugat că lucrările de dezvoltare vor începe în scurt timp, în funcție de obiectivele Nvidia privind capacitățile produsului final. Potrivit informațiilor, Nvidia se așteaptă să utilizeze două SSD-uri proiectate să fie conectate direct la procesoarele grafice ale acceleratoarelor AI, cu care poate opera la o performanță combinată de 200 milioane IOPS.
Vor lucra cu interconexiune PCI Express 7.0, și să se conecteze direct la GPU prin P2P (Peer-to-Peer), și va fi cu 33% mai rapid decât soluțiile curente de vârf. Tehnologia curentă nu este suficient pentru a îndeplini obiectivele Nvidia, sunt necesare soluții noi.
Deoarece se preconizează că fluxurile de lucru AI vor funcționa pe baza unor sarcini de citire aleatorie mici dar foarte frecvente, viitoarele SSD-uri vor trebui să fie optimizate pentru accesarea diverselor date, rapid. În consecință, vor folosi blocuri de 512 octeți în loc de 4 KB, ceea ce poate afecta lățimea de bandă brută, dar facilitează creșterea vitezelor de citire și scriere dacă sunt utilizate mai multe exemplare, similar cu sistemele raid.
Cipul XL-Flash, creat de Kioxia, care o memorie SLC de durabilitate ridicată, cu latență foarte scăzută și viteză relativ mare. Acestea au 16 straturi, cele tipice având doar 3-6, facilitând acces mai rapid al date, chiar și aleatoare. Deoarece acest tip de memorie este încă doar în faza de proiectare nu sunt disponibile specificații concrete sau viteze.
Pe baza faptului că SSD-ul Innogrit Tacoma 400GB XL-Flash, care este alcătuit din 32 de cipuri, dintre care 7 suportă over-provisioning, poate atinge 3,5 milioane IOPS la citire aleatorie și 0,5 milioane IOPS la scriere aleatorie printr-o interfață PCI Express 5.0 x4, ne putem aștepta să vedem aproximativ 110.000 IOPS la citire aleatorie și 15.600 IOPS la scriere aleatorie de la una dintre aceste cipuri. Dacă scalarea este aproape liniară, rata de citire aleatorie de 512B la 100 de milioane IOPS poate fi obținută cu 915 astfel de cipuri.
Numărul este uriaș, dar Kioxia este capabil să stivuiască până la 32 pe un superchip, astfel încât numărul devine mult mai prietenos, de 28. Servirea unei astfel de unități va necesita cel puțin o interfață PCI Express 5.0 x16 sau una PCI Express 7.0 x4 sau mai performantă. Desigur, realitatea este că tehnologia nu este lineară deoarece ca și orice altceva, lucrurile fizice sunt afectate de factori externi. Cea mai bună șansă de a construi eficient un astfel de SSD ar fi să se utilizeze zeci de controlere și un comutator logic pentru a elimina o bună parte din dificultăți, ceea ce nu este o sarcină ușoară la aceste viteze de transfer și cereri, iar rezultatul final este discutabil.
O altă posibilitate ar fi utilizarea tehnologiei HBF (High Bandwidth Flash), o metodă de a comasa 16 cipuri într-una, cu un cip logic dedesubt, funcționând ca un controller. Acestea le pot folosi în matrici, accesându-le aproape simultan, obținând performanțe paralele foarte ridicate, dar și cantitate de transfer.
Încă nu este clar în ce direcție se va îndrepta echipa Kioxia, dar este probabil ca experiența pe terenulHBF să fie utilizată pentru proiectarea noii arhitecturi.