Meniu Shop

GOOGLE DEZVOLTĂ GEMINI ÎNTR-UN RITM AMEȚITOR, LANSEAZĂ O NOUĂ VERSIUNE ÎN CURÂND

Google semnalează o îmbunătățire dramatică în următoarea generație a Gemini, care defapt va avansa doar cu o jumătate de versiune.
DemonDani
DemonDani
Google dezvoltă Gemini într-un ritm amețitor, lansează o nouă versiune în curând

Google a apăsat pe accelerator în domeniul inteligenței artificiale, vrând să depășească Microsoft și OpenAI, și face tot ce-i stă în putință pentru a face acest lucru. Abia în Decembrie a fost dezvăluit modelul de limbaj mare Gemini, dar deja și Bard a fost renumit Gemini și îl folosește aproape peste tot, la nivel global.

Iar acum, anunță Gemini 1.5. Actualizarea va aduce "îmbunătățiri dramatice ale performanței".

Una dintre îmbunătățirile relativ simple aduse modelelor lingvistice este o creștere a lungimii contextului. Acest lucru a fost făcut recent de OpenAI, cu varianta sa Turbo a ChatGPT, iar Anthropic a mers și ea pe această cale, cu Claude. Google a cvadruplat fereastra de context de 32.000 de simboluri folosită anterior , la 128 de tokenuri.

Aceasta pare a fi o mare îmbunătățire, dar merită să ne uităm la concurență. La urma urmei, ChatGPT-4 Turbo folosește deja o limită de 128.000, iar Claude 2.1 se laudă cu un context de 200.000. Așadar, în acest moment este vorba mai degrabă de a recupera terenul pierdut. În practică, acest lucru va însemna că AI generativ va putea procesa semnificativ mai multe informații în contextul diferitelor servicii. Aproximativ 700.000 de cuvinte, 30.000 de linii de cod, 11 ore de audio și 1 oră de video se pot încadra în această categorie.

De asemenea, Gemini 1.5 va fi disponibil în mai multe dimensiuni. În acest sens, a dezvăluit că aceasta va putea oferi performanțe similare cu modelul Ultra LLM al Gemini 1.0.

Gemini 1.5 Pro va putea deja să analizeze, să clasifice și să rezume cantități mari de date, cum ar fi transcrierea misiunii Apollo 11, care are 402 pagini. Pornind de la acestea, utilizatorul poate cere chatbotului orice informație, iar chatbotul va răspunde cu exactitate. Gemini 1.5 Pro va putea să folosească date din videoclipuri, alături de imagini, text și sunet, și poate să proceseze înregistrări mai lungi. Deși un film de lung metraj îi va da o lecție, acesta poate răspunde la orice întrebare din scenele dintr-un film mut de 44 de minute al lui Buster Keaton.

Deschide galerie

Versiunea 1.5 a Gemini se poate dovedi un ajutor mai bun în sarcinile de programare, deoarece are acces la mai mult cod exemplu, oferind răspunsuri și orientări mai bune.

Google este hotărâtă să continue să crească fereastra de context, compania a declarat în anunțul său recent că este deja în curs de extindere pentru a gestiona 1 milion de tokenuri. Mai mult, au implementat deja cu succes un test de 10 milioane de tokenuri. Au procesat 3 ore de video cu un model Gemini în curs de dezvoltare, și au fost introduse 7 milioane de cuvinte cu erori minime. Dar 7 milioane de cuvinte reprezintă aproximativ echivalentul a 80 de novele scurte sau medii.

Deschide galerie

Fereastra contextuală de 1 milion este disponibilă pentru testare live de către un mic grup de dezvoltatori prin AI Studio și Vertex AI. În Gemini 1.5, Google folosește acum arhitectura Mixture of Experts (MoE), ceea ce înseamnă că modelul poate împărți setul de date în bucăți mai mici, "Experți", și poate lucra cu acestea în rețele neuronale. Utilizatorul nu va observa nimic din toate acestea, dar eficiența capătă o altă dimensiune.

Deschide galerie

Google este unul dintre primii care a adoptat arhitectura MoE și mai sunt multe de descoperit pentru a o utiliza cât mai bine. Dacă totul merge bine, compania va introduce în acest an fereastra de context de 1 milion de token-uri Google, pentru care optimizarea este în curs de desfășurare. Timpii de răspuns mai trebuie să fie reduși, precum și cerințele de putere de calcul, pentru a o face mai ieftină de utilizat. Acestea vor îmbunătăți experiența de utilizare a următoarei generații a Gemini. Compania va împărtăși mai multe detalii despre aceste îmbunătățiri în viitor.

Noile caracteristici din Gemini 1.5 vor contribui la eficientizarea inteligenței artificiale generative în rezolvarea problemelor complexe și la menținerea unei calități mai ridicate de utilizare. De asemenea, va avea performanțe mai bune în formare și va fi mai sustenabilă în general. Acestea vor permite echipei Google să obțină și mai mult de la Gemini în serviciile sale din viitor.

Într-un test de căutare a unei bucăți de informații într-un bloc de date uriaș de 1 milion de jetoane, Gemini 1.5 poate atinge deja o performanță de 99%. iar capacitatea sa de învățare în context este de neegalat, învățând aproape orice dintr-o carte care conține informații complet noi pentru el în câteva secunde. Google a testat capacitatea de învățare a Gemini cu o carte de limbi străine Kalamang. Această limbă este vorbită doar de aproximativ 200 de persoane din Noua Guinee, iar din carte, Gemini a învățat să traducă la un nivel la care un om ar putea învăța din același material.

De asemenea, Google a precizat că toate versiunile Gemini sunt supuse unor teste de securitate complexe și trebuie să respecte reguli stricte. O serie de măsuri de protecție sunt încorporate pentru a preveni utilizarea abuzivă, iar noul sistem LLM va fi mai bun și din acest punct de vedere.

În cele din urmă, Sundar Pichai a mai precizat că utilizatorilor nu le pasă cu adevărat ce versiune de Gemini, 1.0 sau 1.5, Pro sau Ultra, lucrează în spatele scenei, ei vor doar să vadă cum evoluează cu adevărat inteligența artificială generativă.

Îţi recomand

    Teste

      Articole similare

      Înapoi la început