Ascensiunea inteligenței artificiale generative ridică semne de întrebare în multe privințe. În general, astfel de servicii sunt vizate pentru că sunt folosite pentru a se identifica drept alte persoane, dar dezvoltatorii sunt adesea considerați responsabili în spatele scenei pentru că folosesc instrumente dubioase pentru a instrui modele lingvistice mari. Atenția YouTube tocmai vizat OpenAI.
OpenAI este unul dintre cei mai mediatizați jucători de pe piața de inteligență artificială, iar în ultimii ani au existat mai multe investigații în care compania a fost trasă la răspundere pentru sursa datelor utilizate pentru instruire. Se pare că este foarte probabil ca recent anunțata Sora să nu fie diferită.
Sora va fi un serviciu de inteligență artificială generativă care le va permite utilizatorilor să creeze videoclipuri pe care și le doresc prin scrierea unor comenzi simple. Așa-numitul model text-to-video va reprezenta un nou nivel pe acest front, deoarece aceste operațiuni sunt foarte complexe, foarte sofisticate și necesită o putere de calcul uriașă. Iar pentru a funcționa în mod eficient, trebuie să utilizeze datele potrivite pentru procesul de învățare.
În timpul antrenamentului lui Sora, OpenAI a procesat probabil o cantitate impresionantă de înregistrări video, dar nu se știe de unde provin acestea. Mira Murati, directorul de tehnologie al OpenAI, a fost întrebată anterior de un reporter de la The Wall Street Journal ce date au fost folosite, dar nu a primit un răspuns satisfăcător la întrebarea sa și nici nu a fost dezvăluit ce materiale ar fi putut fi folosite ca bază pentru antrenament.
Acum, în mod interesant, directorul general al YouTube, Neal Mohan, a vorbit cu o încredere surprinzătoare despre încălcarea de către OpenAI a termenilor de utilizare a platformei. Într-un interviu recent acordat Bloomberg, acesta a declarat că nu există nici o îndoială că rivalul Google a comis o încălcare.
"Când un creator își încarcă munca sa pe platforma noastră, are anumite așteptări. Una dintre aceste așteptări este ca Termenii de Utilizare să fie respectați. Iar acest lucru înseamnă că lucruri precum transcrierile sau segmente video nu pot fi descărcate". - a precizat Neal Mohan în interviu. Iar OpenAI se pare că nu a respectat acest lucru și a folosit abuziv serviciul.
În urma declarației lui Mohan, mai multe publicații de specialitate au trimis întrebări către OpenAI cu privire la acest caz, dar compania a refuzat să comenteze. Desigur, trebuie văzut și faptul că căma șa lui Google, compania din spatele YouTube, nu este în totalitate curată, dar în cadrul propriilor sale rânduri, compania este capabilă să modeleze contractele în avantajul propriu.
"Mulți creatori au diferite contracte de licență pentru conținutul de pe platforma noastră", a declarat Mohan. "Este posibil să putem folosi unele dintre ofertele YouTube pentru a antrena modele precum Gemini." În același timp, el a ținut să adauge că Google și YouTube se vor asigura că utilizarea videoclipurilor pentru antrenarea inteligenței artificiale a Google se va face în conformitate cu Termenii de Utilizare și de serviciu și cu contractele individuale semnate de creatori.