Google marchează cea mai importantă victorie din ultimii ani în competiția pentru dezvoltarea inteligenței artificiale, odată cu lansarea celei de-a treia versiuni a modelului său Gemini. Acesta a fost evaluat drept cel mai capabil chatbot AI de pe piață, potrivit testelor de referință utilizate pe scară largă în industrie, după ce a depășit atât ChatGPT, cât și modelele dezvoltate de Anthropic și alți competitori, informează The Wall Street Journal.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Lansarea reprezintă o confirmare a încrederii interne pe care angajații Google au acumulat-o în ultimele luni. Aceștia eu testat modelul în scenarii informale, de la cereri creative și glume, până la probleme matematice complexe.
Rezultatele au indicat constant un progres semnificativ. Tulsee Doshi, director senior de management de produs pentru Gemini, relatează că unul dintre momentele revelatoare a apărut atunci când a cerut modelului să scrie în limba gujarati, vorbită pe scară largă în India, dar slab reprezentată online. Performanța a depășit considerabil versiunile anterioare. „O numesc un semn de viață. Oamenii reveneau spunând: Simt că am descoperit ceva important”, afirmă Doshi.
Accesul anticipat oferit unor parteneri externi a consolidat aceste impresii. Aaron Levie, directorul executiv al companiei Box, spune că testele interne realizate în weekendul premergător lansării au oferit rezultate surprinzătoare. „Ne-am întrebat dacă nu am greșit noi ceva în evaluare, pentru că saltul era atât de mare. Dar de fiecare dată când testam, modelul era cu zeci de puncte peste celelalte”, a declarat el.
Un avans mult așteptat în cursa AI
Gemini 3 este, potrivit analiștilor, primul model AI care oferă Google un avantaj răsunător după lansarea ChatGPT în 2022, moment care a alimentat îngrijorări privind pierderea traficului din motorul de căutare în favoarea chatboturilor conversaționale. De atunci, compania a încercat să recupereze diferența, în timp ce investitorii se întrebau dacă Google mai poate ține ritmul.
În ultimele luni, Google a implementat o restructurare internă amplă. Este vorba despre reducerea compartimentării dintre echipe, reorganizarea conducerii și consolidarea eforturilor pe linia principală de dezvoltare AI. Sergey Brin, cofondatorul companiei, a revenit la un rol operațional pentru a sprijini progresul tehnic. În cadrul conferinței pentru dezvoltatori din luna mai, Google a prezentat o serie de produse avansate și o versiune redesenată a motorului de căutare, cu un nou „AI Mode” capabil să răspundă la întrebări într-un stil conversațional.
Totuși, rezultatele financiare au continuat să fie urmărite cu scepticism până în vară. „Wall Street dezbătea dacă nu cumva vor ajunge victime colaterale în revoluția AI”, spune analistul Michael Nathanson de la MoffettNathanson.
Ascensiunea accelerată a Gemini
Impulsul decisiv a venit în august, odată cu lansarea Nano Banana, un generator de imagini bazat pe Gemini, care a determinat cea mai rapidă creștere a utilizării de până acum, de la 450 de milioane de utilizatori lunari în iulie la 650 de milioane în august. O altă victorie importantă a fost obținută în septembrie, când un judecător federal a refuzat impunerea unor sancțiuni severe în procesul privind monopolul pe piața căutărilor, fapt care a arătat că dinamica pieței se schimbă deja ca urmare a revoluției AI.
Alphabet, compania-mamă Google, a raportat recent venituri trimestriale record, datorate în principal creșterii serviciilor cloud și publicității. Acțiunile companiei au crescut cu peste 50% de la începutul anului și cu peste 60% din vară, iar capitalizarea bursieră a atins 3,6 trilioane de dolari, depășind Microsoft pentru prima dată în șapte ani.
Un model conceput să exceleze la toate nivelurile
Inginerii Google au proiectat Gemini 3 pentru a aborda unele dintre cele mai dificile provocări din domeniul AI. Noul model este capabil să „vadă”, să analizeze și să genereze conținut multimodal, text, imagini, audio, video și cod, și să ofere un nivel mai avansat de raționament. Scopul declarant… dezvoltarea unui asistent personal mult mai eficient.
După lansare, rezultatele obținute de Gemini 3 la 20 de teste de referință au circulat intens online. Modelul a obținut scoruri superioare celor mai recente versiuni ChatGPT și Anthropic în domenii precum cunoștințe la nivel de expert, puzzle-uri logice, probleme matematice și recunoaștere vizuală. Singura excepție a fost un test dedicat programării, unde a ocupat locul al doilea, după Claude Sonnet 4.5.
O surpriză notabilă a fost performanța ridicată la testul Vending Bench, care evaluează capacitatea unui model de a planifica și a acționa pe termen lung, simulând gestionarea unui aparat de vending, de la inventar și comenzi, până la stabilirea prețurilor. „Acest test reflectă exact direcția în care am vrut să împingem modelul: o utilizare mai eficientă a instrumentelor și o planificare mai bună”, spune Doshi.
Gemini intră în motorul de căutare din prima zi
Ca parte a lansării, Google le-a oferit abonaților posibilitatea de a utiliza Gemini 3 în AI Mode, ceea ce a marcat prima integrare a unui model nou în motorul de căutare chiar din ziua lansării. Compania intenționează să extindă disponibilitatea funcției pentru toți utilizatorii din Statele Unite.
Robby Stein, vicepreședinte de produs pentru căutare, povestește că a lucrat luni întregi cu echipa Gemini pentru a identifica modalități prin care modelul poate îmbunătăți modul în care sunt livrate rezultatele căutării. Într-un test personal, el a folosit AI Mode pentru a-i explica fiului său de 7 ani conceptul de forță de portanță a unui avion. Se aștepta la un text simplu. În schimb, modelul a generat o simulare interactivă, cu curenți de aer care circulau peste o aripă și un slider care permitea modificarea poziției aripii și observarea efectului asupra portanței.
„M-am gândit: Uau, chiar poate prezenta informațiile într-un mod optim, în funcție de întrebare”, povestește Stein.