Google lansează Gemini Deep Think AI, un model de raționament care testează mai multe idei în paralel / Gigantul tech susține că noul sistem e mai puternic decât orice variantă de ChatGPT sau Grok

Modelul AI Gemini de la Google
Sursa foto: Didem Mente / AFP / Profimedia

Google DeepMind lansează Gemini 2.5 Deep Think, care, potrivit companiei, este cel mai avansat model de raționament AI, capabil să răspundă la întrebări explorând și luând în considerare mai multe idei simultan și apoi utilizând aceste rezultate pentru a alege cel mai bun răspuns, relatează TechCrunch.

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Abonații la serviciul Google Ultra, în valoare de 250 de dolari pe lună, au deja acces la Gemini 2.5 Deep Think în aplicația Gemini.

Prezentat pentru prima dată în mai, la Google I/O 2025, Gemini 2.5 Deep Think este primul model multi-agent disponibil public al Google. Aceste sisteme generează mai mulți agenți AI pentru a aborda o întrebare în paralel, un proces care utilizează resurse de calcul semnificativ mai mari decât un singur agent, dar care tinde să ofere răspunsuri mai bune.

Google a utilizat o variantă a Gemini 2.5 Deep Think pentru a câștiga medalia de aur la Olimpiada Internațională de Matematică (IMO) din acest an.

Pe lângă Gemini 2.5 Deep Think, compania afirmă că va lansa modelul utilizat la IMO unui grup select de matematicieni și academicieni. Google afirmă că acest model de IA „are nevoie de ore pentru a raționa”, în loc de secunde sau minute, ca majoritatea modelelor de IA destinate consumatorilor. Compania speră că modelul IMO va îmbunătăți eforturile de cercetare și își propune să obțină feedback cu privire la modul de îmbunătățire a sistemului multi-agent pentru cazuri de utilizare academică.

Google menționează că modelul Gemini 2.5 Deep Think reprezintă o îmbunătățire semnificativă față de ceea ce a anunțat la I/O. Compania susține, de asemenea, că a dezvoltat „tehnici noi de învățare prin consolidare” pentru a încuraja Gemini 2.5 Deep Think să utilizeze mai bine căile sale de raționament.

„Deep Think poate ajuta oamenii să abordeze probleme care necesită creativitate, planificare strategică și îmbunătățiri pas cu pas”, a declarat Google într-o postare pe blog împărtășită cu TechCrunch.

Compania afirmă că Gemini 2.5 Deep Think atinge performanțe de ultimă generație la Humanity’s Last Exam (HLE) — un test provocator care măsoară capacitatea AI de a răspunde la mii de întrebări crowdsourced din matematică, științe umaniste și științe exacte. Google susține că modelul său a obținut un scor de 34,8% la HLE (fără instrumente), comparativ cu Grok 4 de la xAI, care a obținut 25,4%, și o3 de la OpenAI, care a obținut 20,3%.

Google afirmă, de asemenea, că Gemini 2.5 Deep Think depășește modelele de IA de la OpenAI, xAI și Anthropic pe LiveCodeBench 6, un test provocator de sarcini competitive de codare. Modelul Google a obținut un scor de 87,6%, în timp ce Grok 4 a obținut 79%, iar o3 de la OpenAI a obținut 72%.

Gemini 2.5 Deep Think funcționează automat cu instrumente precum execuția de cod și Google Search, iar compania afirmă că este capabil să producă „răspunsuri mult mai lungi” decât modelele AI tradiționale.

În testele Google, modelul a produs sarcini de dezvoltare web mai detaliate și mai plăcute din punct de vedere estetic în comparație cu alte modele AI. Compania susține că modelul ar putea ajuta cercetătorii și „ar putea accelera potențial calea către descoperiri”.

Se pare că mai multe laboratoare de IA de top se îndreaptă către abordarea multi-agent.

xAI, compania lui Elon Musk, a lansat recent un sistem multi-agent propriu, Grok 4 Heavy, despre care afirmă că a reușit să obțină performanțe de top în industrie în mai multe teste de referință. Cercetătorul OpenAI Noam Brown a declarat într-un podcast că modelul de IA nepublicat pe care compania l-a utilizat pentru a obține medalia de aur la Olimpiada Internațională de Matematică din acest an era, de asemenea, un sistem multi-agent. Între timp, agentul de cercetare al Anthropic, care generează rapoarte de cercetare detaliate, este, de asemenea, alimentat de un sistem multi-agent.

În ciuda performanțelor puternice, se pare că sistemele multi-agent sunt chiar mai costisitoare decât modelele tradiționale de IA. Asta înseamnă că companiile de tehnologie ar putea păstra aceste sisteme accesibile doar prin abonamente foarte scumpe, așa cum au ales să facă xAI și, acum, Google.

În următoarele săptămâni, Google spune că intenționează să împărtășească Gemini 2.5 Deep Think cu un grup select de testeri prin intermediul API-ului Gemini. Compania spune că dorește să înțeleagă mai bine modul în care dezvoltatorii și întreprinderile pot utiliza sistemul său multi-agent.

  • George Radu este un autor care abordează subiecte variate din domeniul tehnologiei, apărării și viitorului. Domeniile sale de expertiză includ inteligența artificială etică, interfețele om-mașină (HMI), realitatea augmentată și virtuală aplicată (XR), precum și impactul social și cultural al noilor tehnologii. Nu se teme să pună întrebări dificile și să exploreze implicațiile filozofice ale inovațiilor tehnologice.

Total
0
Shares
Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Citește si...