Meniu Shop

XAI A DEZVĂLUIT CEL MAI NOU MODEL GROK, DOBORÂND RECORDURI

Nu demult a sosit Gemini 3, iar Grok 4.1 este răspunsul imediat al lui Musk.
DemonDani
DemonDani
xAI a dezvăluit cel mai nou model Grok, doborând recorduri

xAI se află în mod clar în fruntea dezvoltatorilor de instrumente de modelare lingvistică și de inteligență artificială generativă, iar acum își consolidează și mai mult poziția cu Grok 4.1. Este foarte puternic în aplicație.

Grok 4.1 a devenit unul dintre cele mai performante modele lingvistice, evoluează forte rapid și tinde să fie predispus să halucineze mai puțin decât competiția. Feedback-ul testerilor arată că noul instrument oferă cele mai bune răspunsuri în majoritatea cazurilor (64,8 %). Însă putem doar spera că nu o ia razna în unele discuții ca în trecut, mai ales că este cel mai puțin limitat sistem AI.

"Modelul 4.1 are capacități excepționale în interacțiunile creative, emoționale și de colaborare", a declarat xAI. "Este mai sensibil la nuanțele subtile de intenție, este mai plăcut să vorbești cu el, și are o personalitate mai coerentă, însă își va păstra spiritul și practicalitatea predecesorilor săi."

Cercetătorii xAI au obținut îmbunătățirea dorită prin optimizarea tehnicii de învățare. Compania a furnizat deja Grok 4.1 unui subset de utilizatori din Noiembrie, iar feedback-ul este pozitiv. Are două versiuni, modelul de bază Grok 4.1 și Grok 4.1 Thinking axată pe raționament pentru sarcini mai dificile și mai complexe.

Conform EQ-Bench, Grok 4 a obținut 1206 puncte, iar Grok 4.1 1585-1586 puncte. Modelul s-a îmbunătățit și în sarcinile creative de procesare a cuvintelor, măsurate de testul Creative Writing v3.

Deschide galerie

Unul dintre obiectivele cheie ale cercetării a fost reducerea tendinței de halucinație, un aspect care a fost redus de la 12,1% pentru Grok 4 cu 4,22%, ceea ce sună excelent. A obținut un FActScore de 2,97% față de precedentul 9,89%, un test de corectitudine a răspunsurilor care încearcă să determine cât "minte" un anumit model.

Deschide galerie

Modelul Grok 4.1 Thinking a ocupat locul al doilea în clasamentul LMArena, doar pentru a fi de Gemini 3 Pro, lansat recent, dar la un fir de păr 1484 față de 1501.

Grok 4.1 este imediat implementat în chatbot, astfel încât chiar și acum puteți comunica cu ea, atât pe web, cât și pe ambele platforme mobile majore, fără cost adițional.

Funcționează în modul "Auto", ceea ce înseamnă că sistemul o va selecta automat dacă consideră că utilizatorul are nevoie de ea, mai mult pentru întrebările mai dificile, iar cele mult mai grele vor fi deservite de Grok 4.1 Thinking.

Abonament la newsletter

Îţi recomand

    Teste

      Articole similare

      Înapoi la început