Pentru Google, dezvoltarea Traducătorului a fost o sarcină primară. Compania dorește să fie capabilă să servească și limbi exotice în viitorul apropiat. Acum a făcut un pas important în această direcție prin aproape dublarea suportului lingvistic.
Mai mult de 1 miliard de persoane utilizează Translator la nivel global, și puțini știu că serviciul a fost lansat în urmă cu mai bine de 18 ani. Gigantul de căutare a adăugat până acum suport pentru 133 de limbi. Ultima dată când am raportat despre extinderea suportului lingvistic a fost în mai 2022, când au fost introduse 24 de limbi noi. De data aceasta, extinderea este mult mai mare, dar limbile acoperite sunt pentru comunități mai mici.
De data aceasta au fost adăugate 110 limbi, numărul total de limbi acceptate de platformă ajungând la 243.
De mulți ani, Google se străduiește să utilizeze inteligența artificială și modele lingvistice mari, pentru a ridica standardul tehnologiilor de traducere. Chiar înainte de actuala febră a inteligenței artificiale de acum câțiva ani, compania se îndrepta deja în această direcție. Succesul actual în ceea ce privește suportul lingvistic, a fost posibilă prin implementarea modelului lingvistic PaLM 2. Google a prezentat PaLM 2 în luna Mai a anului trecut, iar la momentul respectiv se spunea că a fost învățat în peste 100 limbi, iar acest număr nu a făcut decât să crească de atunci.
PaLM 2 este utilizat în spatele multor servicii Google cu necesități lingvistice. Din rapoartele anterioare, acesta este un sistem LLM extrem de scalabil, care poate funcționa cu un set brutal de parametrii, și ca urmare, poate fi utilizat foarte eficient pentru învățarea limbilor străine. Conform rapoartelor anterioare, PaLM a lucrat cu 2 340 miliarde de parametri și 3,6 trilioane de token-uriîn învățarea sa inițială.
PaLM2 a ușurat mult munca echipei Google Translator, în special în cazurile în care a trebuit să învețe limbi similare. În sprijinul limbilor Awadhi și Marwadi legate de hindi, AI s-a dovedit foarte util. Iar creola franceză este atât de strâns legată de creola mauritiană și creola din Seychelles, încât doar cu PaLM 2 s-a putut face extinderea suportului.
Limba cantoneză este acum, deasemenea suportată, ceea ce Google spune că utilizatorii au cerut de mult timp și mulți l-au așteptat. De asemenea, am aflat că aproximativ un sfert din noile limbi sunt folosite pe continentul african, unde există multe limbi mai mici, și unde baza de utilizatori încă crește dinamic pentru a face față potențialului. Unele limbi sunt cunoscute de mai mult de 100 de milioane de persoane, potrivit Google, dar majoritatea se situează mai degrabă în intervalul 1-100 de milioane.
În Martie anul trecut, Google a vorbit despre ambiția sa de a crea un traducător care să suporte până la 1.000 limbi la nivel global. Acest lucru ar include limbi din comunități foarte restrânse, astfel încât la acest nivel, este o concluzie inevitabilă. Instrumentul de traducere se va numi Universal Speech Model sau, pe scurt, USM, însă până în acest an nu a fost publicată nici o informație nouă în acest sens. Este de presupus că se lucrează la acest lucru, deoarece ar putea exista o suprapunere cu echipa Google Translate.