Social media este o mină de aur pentru instruire sistemelor de inteligență artificială. Oceanul de informații poate fi absorbit fără restricții de aceștia, iar imensitatea acestora ascunde și faptul că sistemele AI pot deveni mai precise având posibilitatea de a le compara și a reține doar cele cu precizie mai mare. Mai nou însă aceste platforme încearcă să împiedice accesarea acestor date ... cel puțin gratuit, potențialul de profit fiind enormă.
Nu mai există nici o platformă de social media care să nu aibă un set de reguli în ghidurile sale de utilizare cu privire la modul în care AI poate accesa datele lor. Cei care le folosesc ilegal, au șansa să fie radiate.
Conducerea Reddit a decis recent să dea în judecată Anthropic pentru că a extras ilegal date. Rivalul său OpenAI este acuzat că a "însușit" informații din Reddit de peste 100 000 ori în Iulie anul trecut. Reddit impunând cu câteva săptămâni înainte reguli cu privire la această practică în scopul formării AI. Se spune că societatea are dovezi clare ale activității ilicite a Anthropic, ceea ce nu este o veste bună pentru ea.
Cu toate acestea, nu ne vom concentra pe cazul Reddit în acest moment, deoarece nu se știu prea multe detalii în acest stadiu. Însă u ltimele știri sunt că X are implementat ceva similar cu Reddit.
Microblogul și-a actualizat politica de confidențialitate, și acum interzice în mod explicit orice achiziție neautorizată de date de pe platforma X și/sau API-urile aferente în scopul instruirii sau formării modelelor lingvistice sau a instrumentelor AI.
X este o sursă populară de informații, în special în SUA, dar este utilizată și pentru anunțuri și știri de către diverse platforme mass-media, actori politici și organizații din întreaga lume. Prin urmare, platforma încearcă să se protejeze, extragerea în acest fel al datelor fiind extrem de rău privit, intră în teritoriul criminalității. Nu este un secret faptul că aproape toate serviciile de inteligență artificială generativă au utilizat informații de pe microbloguri, iar X dorește să pună capăt acestei situații.
Dar trebuie subliniat faptul că acest lucru nu înseamnă că datele nu vor fi furate în acest fel. X este foarte strâns legat de xAI, încorporată în microblog, iar termenii sunt clari. pot folosi postările pentru instruirea Grok - dar nu date personale. Datele de pe X sunt analizate în timp real de Grok, un detaliu care este foarte evident, sistemul a devenind foarte precis și eficient.
Noile reguli însă sunt selective. Companiile pot accesa X în acest scop, dar au nevoie de un acord special. Acest lucru ar putea fi foarte profitabil pentru X, și având în vedere că datele de pe microblog sunt foarte valoroase, suntem siguri că există o coadă deja pentru a obține acest acord, deși aceste date vor fi limitate, ca să nu se creeze ceva ce surclasează Grok.
Revenind la Reddit, are acord cu Google. Nu se știu prea multe despre ce conține contractul, dar se spune că Reddit va primi 60 milioane dolari pe an în schimbul accesului în timp real al Google, la datele sale.