Google și OpenAI sunt într-o luptă acerbă în domeniul inteligenței artificiale generative. Deobicei, gigantul de căutare ajunge să fie dezavantajat, dar acum reacționează la o inovație anterioară a rivalului său, încercând să țină pasul destul de bine, datorită Gemini 2.0 Flash Thinking tocmai lansat.
Unul dintre liderii OpenAI a vorbit recent despre faptul că creșterea puterii de calcul nu prea mai contează pentru dezvoltarea modelelor lingvistice și a AI de dimensiuni mari. Trebuie să se înceapă să se pună un accent mai mare pe abordări radicale și noi pentru a se putea face progrese majore. Modelul o1 anunțat în Septembrie este o soluție de genul, iar Google a evoluat în aceeași direcție cu modelul Gemini 2.0 Flash Thinking.
În cazul o1, OpenAI a adoptat o abordare foarte diferită față de dezvoltarea modelelor GPT anterioare în timpul fazei de formare, iar cel mai mare punct forte al acestui model a fost faptul că "gândește" diferit de GPT-4o din spatele ChatGPT. Google a făcut declarații similare despre Gemini 2.0 Flash Thinking. Această inovație va fi capabilă să arate ce poate face cu adevărat atunci când i se dau sarcini complexe având nevoie să decidă anumite elemente pe cont propriu.
Jeff Dean, cercetător senior la DeepMind, a vorbit despre noua dezvoltare. Potrivit acestuia, Gemini 2.0 Flash Thinking a fost antrenat ca să folosească gândurile propriie pentru a face argumente puternice. În plus, este foarte rapid rapid, deoarece se bazează pe Gemini 2.0 Flash, care a fost optimizat pentru viteză și eficiență. Cu ajutorul noului model experimental, inteligența artificială generativă va fi capabil să ofere răspunsuri pertinente și exacte la întrebări destul de complexe.
Se susține că virtutea modelului Gemini 2.0 Flash Thinking provine în parte din faptul că înainte de a veni cu o soluție, acesta își "gândește" răspunsul la diferite probleme în mai multe etape, în fundal. Inteligența artificială nu poate raționa exact așa cum ar face o persoană. Ea poate analiza problemele în detaliu, și pentru fiecare detaliu mic, izolează o serie de rezultate posibile, apoi le rezumă pentru a forma răspunsul pe care îl consideră cel mai bun. Deși este o sarcină complexă, deoarece modelul de bază relativ compact, acesta poate totuși menține o rapiditate rezonabilă în ciuda complexității.
Gemini 2.0 Flash Thinking este capabil de operare multimodală. Modelul de limbaj experimental poate fi utilizat și pentru a introduce date vizuale, pe lângă utilizarea unui format textual. Acesta poate procesa mai multe surse diferite și alternative, cum ar fi graficele, diagrame, etc. Dacă are acces la acestea, poate furniza și mai multe informații, sau exacte, și își poate "imagina" datele vizuale în timpul procesării. Logan Kilpatrick, responsabilul de produs la Google, a declarat că Gemini 2.0 Flash Thinking este primul pas către inteligența artificială rațională, și va reprezenta viitorul.
Gemini 2.0 este ultimul anunț al Google pe acest an, în ceea ce privește anunțurile majore, anul viitor fiind cel în care o va implementa pe scară largă. Devreme ce acest model este mic, cele mari ar putea fi foarte impresionante. Abia așteptăm să vă scriem despre ele.