Microsoft este destul de dificil de plasat în segmentul AI. Compania a investit miliarde dolari în modele lingvistice și instrumente de inteligență artificială, dar majoritatea a ajuns în buzunarul lui OpenAI. Însă compania a lucrat la propria sa soluție în fundal, și ca urmare, a lansat două modele lingvistice.
Redmond își dezvoltă propriile soluții LLM, iar acestea au primit numele MAI, mai precis MAI-1-preview și MAI-Voice-1.
MAI-Voice-1 poate produce până la câteva minute audio, poate funcționa pe un singur GPU Nvidia. Microsoft nu a dezvăluit ce fel de GPU, dar se pare că eficiența acestuia este bună. MAI-1-preview este primul model dezvoltat intern, oferind o clipire despre ce va putea face Copilot în viitor.
Microsoft este foarte ambițioasă cu privire la ce va putea oferi utilizatorilor în viitor. "Lucrăm în mod activ pentru a oferi modele din ce în ce mai avansate. Vom avea mult mai multe informații de împărtășit în lunile următoare" - a declarat compania.
Se spune că pe lângă modelele lingvistice generale, compania lucrează la mai multe proiecte speciale. Nevoile specifice ale utilizatorilor sunt satisfăcute de modele dedicate. Este implicat în dezvoltări pe termen scurt, cât și pe termen lung, însă va oferi mai multe detalii cu privire la acestea într-o etapă ulterioară.
MAI-Voice-1
Vreți să vedeți ce poate face MAI-Voice-1? Nu trebuie să căutați mul, pentru că se poate încerca. Tot ce vă trebuie este un cont Microsoft. Acesta rulează sub Copilot Labs sub numele Copilot Audio Expressions. Desigur, este doar o demonstrație preliminară cu șanse să abereze din abundență.
Se poate configura destul de bine. Există nouă tonuri din care puteți alege, sunt disponibile voci ale ambelor sexe, și puteți specifica stilul în care rostește cuvintele. Există sute de combinații ca să vă găsiți cea potrivită. Are și un mod de poveste, în care le generează și le citește automat. Răspunsurile pot fi descărcate și partajate la cerere.
MAI-Voice-1 își face treaba rapid, dar nu poate răspunde întrebărilor și solicitărilor în timp real.
MAI-1-preview
Microsoft a declarat că acest model utilizează arhitectura MoE (Mixture-of-Experts), recent devenit cel mai popular model, și că au fost utilizate mai multe metode în formare. Au fost utilizate peste 15.000 acceleratoare Nvidia H100 pentru a antrena modelul.
Este un model lingvistic de uz general care va fi deosebit de bun, și poate oferi răspunsuri foarte utile și precise în conversațiile de zi cu zi. MAI-1-preview va apărea treptat în Copilot, la început fiid folosit doar pentru sarcini mici, dar elevând prezența acestuia în funcție de performanță, posibil înlocuind Chat GPT 5 curent.