Google lansează o versiune extinsă a Gemini Deep Research, în aceeași zi cu debutul GPT-5.2 de la OpenAI

google ai logo pe un telefon
Sursa foto: Dreamstime

Google a anunțat lansarea unei versiuni „reimaginate” a agentului său de cercetare Gemini Deep Research, construită pe baza modelului fundamental Gemini 3 Pro, considerat de companie cel mai avansat și mai factual model AI dezvoltat până acum. Anunțul a fost făcut în aceeași zi în care OpenAI a prezentat GPT-5.2, un moment care a atras atenția industriei, potrivit TechCrunch.

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Integrare în aplicații prin Interactions API

Noua versiune Gemini Deep Research nu este limitată la generarea de rapoarte de cercetare. Google spune că agentul poate fi acum integrat direct în aplicațiile dezvoltatorilor, prin intermediul noului Interactions API. Această interfață le oferă dezvoltatorilor un control mai mare asupra modului în care agenții AI interacționează, într-un context în care sistemele agentice devin tot mai autonome.

Aplicații practice și planuri de integrare

Potrivit Google, Gemini Deep Research este conceput pentru a analiza și sintetiza volume foarte mari de informații, gestionând prompturi cu un context extins. Compania afirmă că soluția este deja utilizată de clienți pentru activități precum due diligence, analiză de date complexe sau cercetări legate de siguranța toxicologică a medicamentelor.

Google a mai precizat că intenționează să integreze acest agent de cercetare în mai multe servicii proprii. Printre acestea se numără Google Search, Google Finance, aplicația Gemini și NotebookLM. Integrarea este prezentată ca un pas spre un scenariu în care utilizatorii nu mai caută informații direct, ci deleagă această sarcină agenților AI.

Accent pe reducerea halucinațiilor

Un element central al anunțului este accentul pus pe reducerea halucinațiilor AI. Google susține că Gemini Deep Research beneficiază de capacitățile lui Gemini 3 Pro, descris ca fiind „cel mai factual” model al companiei, antrenat special pentru a limita erorile de tip halucinație în sarcini complexe.

Halucinațiile, situațiile în care un model AI generează informații incorecte sau inventate, sunt considerate o problemă majoră în cazul agenților care execută sarcini de durată și iau decizii autonome în mai mulți pași. Google subliniază că, pe măsură ce un agent trebuie să ia mai multe decizii succesive, crește riscul ca o singură eroare să compromită întregul rezultat.

Benchmark-uri și rezultate comparative

Pentru a demonstra progresul realizat, Google a prezentat și un nou benchmark, denumit DeepSearchQA. Acesta este conceput pentru a evalua performanța agenților AI în sarcini complexe de căutare a informațiilor, care implică mai multe etape de raționament. Compania a anunțat că benchmark-ul a fost publicat ca open source.

Gemini Deep Research a fost testat și pe alte benchmark-uri independente. Printre acestea se află Humanity’s Last Exam, un test de cunoștințe generale cunoscut pentru nivelul său ridicat de dificultate și pentru sarcinile extrem de nișate, precum și BrowserComp, un benchmark axat pe sarcini agentice desfășurate în browser.

Conform rezultatelor prezentate de Google, noul agent a obținut cele mai bune scoruri pe propriul benchmark și pe Humanity’s Last Exam. În schimb, pe BrowserComp, ChatGPT 5 Pro de la OpenAI a înregistrat un scor ușor mai bun. Google a menționat că, per ansamblu, diferențele dintre cele două sisteme au fost reduse.

Competiția cu OpenAI se intensifică

Aceste comparații au fost însă rapid depășite de un alt anunț major. În aceeași zi, OpenAI a lansat GPT-5.2, cunoscut sub numele de cod Garlic. OpenAI susține că noul său model depășește rivalii, inclusiv Google, pe o serie de benchmark-uri standard, precum și pe testele dezvoltate intern de companie.

Momentul ales pentru lansarea Gemini Deep Research a fost remarcat ca fiind semnificativ. Într-un context în care industria aștepta prezentarea GPT-5.2, Google a ales să publice propriile noutăți din domeniul AI, consolidând competiția directă dintre cei doi mari jucători în zona agenților de cercetare și a modelelor avansate de inteligență artificială.

Total
0
Shares
Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Citește si...