Nu mai este un secret de ceva timp că Apple lucrează la dezvoltări legate de inteligența artificială, dar compania nu a dezvăluit nici un detaliu specific. Între timp însă, primul instrument de editare a imaginilor cu AI generativ al companiei a fost lansat în liniște.
Serviciul MLLM-Guided Image Editing, sau MGIE pe scurt, nu este un generator de imagini precum DALL-E sau Midjourney, ci o soluție de editare a imaginilor care trebuie să primească o imagine de intrare pe care o poate transforma. Utilizatorii nu trebuie să atingă deloc imaginile în mod clasic, ci doar să îi spună inteligenței artificiale direcția modificării.
MGIE nu este doar o dezvoltare a Apple, după cum am aflat, ci a fost creat în colaborare cu cercetători de la Universitatea din California. Serviciul poate tăia, redimensiona, roti sau oglindi imaginile pe care i le oferiți și așa mai departe. Dacă utilizatorul o solicită, poate să lumineze sau să întunece părți ale imaginii sau chiar să adauge filtre.
Instrucțiunile introduse de utilizator vor fi întotdeauna completate de sistem în așa fel încât, odată ce imaginea este gata, AI-ul generativ va descrie exact ce a făcut cu imaginea încărcată. În acest fel, MGIE va da oamenilor indicații, aceștia putând învăța din propria descriere ce fel de comenzi pot cere. Desigur, aceasta este doar versiunea demo, nu se știe cum va arăta produsul final.
Dezvoltatorii au pus la dispoziție în mod gratuit manipulatorul de imagini MGIE pe GitHub și au pus la dispoziție interfața sa rudimentară pentru a fi testată ca parte a programului Hugging Face Spaces. Cu toate acestea, nu sunt încă disponibile detalii despre care sunt planurile Apple pentru acest model. Deocamdată este doar un proiect de cercetare, dar nu ar fi surprinzător dacă acesta ar reapărea într-o altă formă pe iPhone la un moment dat în viitor.
În imaginea mai simplă pe care am testat-o, s-a dovedit a recunoaște și a identifica telefonul mobil. Ceea ce este ciudat este faptul că a făcut modificarea fără să se ceară și nu a oferit niciun feedback despre decizie. O altă încercare în acest sens a eșuat complet, chiar dacă s-a bazat parțial pe un exemplu oferit de MGIE. Acesta este capabil să ofere exemple dacă utilizatorul nu se știe cum să înceapă să îl folosească.
Imaginile nu sunt de fapt editate de MGIE, ele sunt regenerate. Așa că i-am oferit opțiunea de a schimba culoarea de fundal într-un caz, ceea ce a fost o sarcină simplă. Cu toate acestea, la ieșire, nu numai că fundalul a fost schimbat, dar și telefonul mobil a apărut ca și cum ar fi fost regândit de AI. Deoarece nu trebuia să schimbe acest lucru, pur și simplu a creat o copie diferită dar foarte similară.
În prezent, există multe servicii care pot crea imagini de la zero la comandă, iar o parte din motivul pentru care MGIE poate face acest lucru este că poate efectua și astfel de sarcini. În timp, este posibil ca Apple să vină și ea cu un serviciu care va fi un concurent direct al generatoarelor de imagini de ultimă generație.
Gemini (Bard) al Google poate deja să genereze imagini, dar și Copilot poate face același lucru, iar lista de exemple poate continua. Din punctul de vedere al Apple, MGIE pare a fi un prim pas, dar este important pentru că este un semn clar că inginerii săi lucrează la el.