Meniu Shop

MICROSOFT POSIBIL FOLOSEȘTE CONȚINUT EXCEL ȘI WORD PENTRU A INSTRUI AI, COMPANIA ÎNSĂ NEAGĂ

Un administrator de sistem a semnalat informația, dar dacă vă uitați mai atent, puteți găsi unele lucruri interesante.
J.o.k.e.r
J.o.k.e.r
Microsoft posibil folosește conținut Excel și Word pentru a instrui AI, compania însă neagă

Recent, a apărut o informație interesantă despre suita de programe Office a Microsoft, care părea să sugereze că societatea ar putea utiliza o setare care este activată implicit, și aprobă utilizarea conținutului Word și Excel pentru a-și antrena soluția AI. Microsoft a răspuns între timp la această știre, însă este indicat a analiza problema.

Istoricul

Un utilizator "X" postat sub pseudonimul @nixCraft, care este și autorul site-ului cyberciti.biz, a semnalat recent faptul că Microsoft utilizează o opțiune preactivată în unele aplicații Microsoft Office pentru a-și antrena LLM-ul, folosind datele prelucrate cu acestea pentru a furniza diverse servicii bazate pe inteligență artificială. În esență, folosirea acestor date a fost semnalată de un administrator, care a declarat că datele sunt colectate prin intermediul opțiunii "Connected Experiences", care este activat automat după instalarea pachetului software Microsoft Office. Aceasta din urmă poate fi problematică, deoarece în conformitate cu GDPR al UE, astfel de funcții nu pot fi activate în mod implicit, ci trebuie să fie solicitate explicit de utilizator.

Prin utilizarea datelor utilizatorilor pentru orice scop, pot obține un avantaj uriaș față de concurenții care nu utilizează astfel de practici. Seturile de date de calitate sunt extrem de valoroase, deoarece pot ajuta un anumit LLM să funcționeze mai eficient și mai precis, cât și să fie abil să facă mai multe lucruri.

În caz că datele respective conțin informații private al firmelor sau a unor organizații guvernamentale, creează o problemă imediată. Aceste date se pot filtra, dar unii analiști profesioniști o pot extrage, LLM-urile oferindu-le fără limite dacă se fac cereri țintite spre acestea.

Reacția oficială a Microsoft

La scurt timp după ce reprezentanții mass-media au început să critice problema, un purtător de cuvânt al Microsoft a emis o declarație pentru a face cunoscută poziția companiei. Microsoft nu va utiliza datele utilizatorilor din aplicațiile de consum și de afaceri ale suitei software Microsoft 365 pentru a antrena modele lingvistice mari. De asemenea, a adăugat că setarea Connected Services nu are nimic de-a face cu modul în care Microsoft își antrenează modelele lingvistice mari.

Serviciul Connected Experience al companiei ajută utilizatorii să caute și să descarce conținut online pentru a-și completa documentele. Elementele care pot fi descărcate includ șabloane, imagini, modele 3D, videoclipuri și materiale de referință. Compania a creat și un tabel cu ceea ce este inclus în descărcările pentru serviciul Connected Experience.

Oricine dorește să dezactiveze funcția, care chiar și pentru noi a fost activă în mod implicit la sfârșitul instalării Office 2019, poate face acest lucru în șapte pași. În primul rând, trebuie să accesați meniul Setări, unde trebuie să accesați Centrul de confidențialitate. Aici, faceți clic pe Privacy Settings, și veți găsi meniul Switch Functions, unde puteți dezactiva opțiunile de care nu aveți nevoie.

Pentru Office 2019 Word, acest meniu indică că serviciul are acces la conținutul utilizatorului, ceea ce nu este acceptabil pentru toată lumea. Desigur, nu veți putea să mai faceți analiza automată a documentului...

Ce dezvăluie documentația oficială

Este interesant de observat că există o mulțime de informații utile disponibile prin intermediul descrierii fiecărei funcții, dacă vă faceți timp să parcurgeți conținutul. Acestea includ următoarea descriere a practicilor privind utilizarea datelor cu caracter personal.

" Microsoft utilizează date pentru a vă oferi informații relevante și valoroase despre produsele noastre. Utilizăm datele în principal în următoarele domenii:

  • Furnizarea produselor noastre, care include actualizarea, protejarea și depanarea, precum și furnizarea de asistență. Aceasta include și partajarea datelor atunci când este necesar, pentru a furniza servicii sau pentru a finaliza tranzacțiile pe care le solicitați.
  • Îmbunătățirea și dezvoltarea produselor noastre.
  • Personalizarea produselor noastre și furnizarea de sugestii.
  • afișarea de reclame și materiale de marketing pentru dvs., ceea ce include trimiterea de broșuri promoționale și afișarea de reclame direcționate și oferte relevante.

Deasemenea, utilizăm datele pentru a ne desfășura activitatea, cum ar fi pentru a ne analiza performanța, a ne îndeplini obligațiile legale, a ne dezvolta personalul și a efectua cercetări.

Pentru a atinge aceste scopuri, combinăm informațiile colectate în scopuri diferite (cum ar fi utilizarea de către dvs. a două produse Microsoft) sau obținute de la terți pentru a vă oferi o experiență de utilizare mai fluentă, mai consecventă și mai personalizată, pentru a lua decizii de afaceri mai informate și în alte scopuri legitime.

Prelucrarea de către noi a informațiilor personale în aceste scopuri include atât metode de prelucrare automată, cât și manuale (umane). Metodele noastre automate sunt adesea legate de metodele noastre manuale și se bazează pe acestea. De exemplu, pentru a construi, antrena și îmbunătăți acuratețea metodelor de prelucrare automată (inclusiv inteligența artificială sau AI), verificăm manual rezultatele metodelor automate în raport cu datele de bază.

Ca parte a eforturilor noastre de îmbunătățire și dezvoltare a produselor noastre, putem utiliza datele dvs. pentru a dezvolta și a antrena modele de inteligență artificială. Pentru mai multe informații, vizitați acest link."

Cele de mai sus nu detaliază exact ce date sunt implicate și cum sunt prelucrate, din păcate, link-ul pentru mai multe informații vă duce doar la site-ul Copilot, o metodă destul de ambiguă pentru a detalia problema.

Anton Shilov de la Tom's Hardware a subliniat, că acordul de servicii Microsoft, Microsoft Services Agreement, prevede că prin acceptarea acestuia, utilizatorul acordă Microsoft un drept de proprietate intelectuală globală și fără restricții pentru utilizarea conținutului său, inclusiv dreptul de a face copii, de a păstra, transmite, reformata, afișa și distribui conținutul prin intermediul serviciilor sale.

În teorie, acest lucru ar putea include și posibilitatea de a utiliza conținutul pentru instruirea AI, astfel încât devine foarte clar că datele sunt folosite în acest scop: dacă acceptați acordul, acceptați cele de mai sus. Însă acest detaliu este valabil doar pentru Termenii SUA.

Termenii UE sunt puțin mai diferiți dar nu indică clar că datele nu sunt folosite în acest scop. Să sperăm că incidentul va aduce o anumită ordine în acest sens, sau să facă posibilă o anchetă UE.

Microsoft nu este singurul

Au ieșit la iveală mai multe cazuri privind modul în care marile companii obțin cantitatea și calitatea corespunzătoare de date pentru a antrena modele lingvistice individuale. Aceste modele lingvistice de mari dimensiuni oferă funcționalități moderne de inteligență artificială, ceea ce înseamnă că este esențial ca acestea să fie formate cu informații care nu pot provine din unele generate automat. Provin din surse care în mod normal nu ar trebuie să fie accesibile fără acord.

De exemplu, Meta utilizează postările publice, comentariile și fotografiile de pe Facebook, Instagram, Threads și WhatsApp, precum și interacțiunile utilizatorilor cu AI pentru a îmbunătăți LLM. În SUA, utilizatorii nu pot face prea multe în această privință, deoarece nu au nici o posibilitate de a bloca colectarea de date, față de UE sau Regatul Unit, cel mult își pot seta contul privat, dar nu au certitudinea că datele lor nu sunt folosite.

Deschide galerie

Anterior, Adobe s-a aflat într-o situație similară cu cea a Microsoft, când a introdus o clauză care a sugerat că datele lor vor deveni proprietatea firmei și pot fi folosite pentru antrenaj, însă din cauza agitației cauzate au fost nevoiți să se explice. Nu este exclus ca același lucru să se întâmple și în cazul Microsoft.

Deasemenea, este interesant de notat că și Nvidia obișnuia să descarce ilegal conținut video YouTube, Netflix și alte platforme pentru a-și antrena propriile modele AI. Practici similare sunt utilizate de multe alte companii, care trebuie abordate pentru a se asigura că metodele utilizate pentru a antrena inteligența artificială nu reprezintă o încălcare a drepturilor.

Abonament la newsletter

Îţi recomand

    Teste

      Articole similare

      Înapoi la început