Joi, Google a anunțat o actualizare majoră a modelului Gemini 2.5 Pro versiunea 06-05, despre care compania susține că este mai performant în anumite sarcini de programare, potrivit ArsTechnica.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Această actualizare a modelului se bazează pe versiunea I/O Edition (05-06) a modelului 2.5 Pro lansată luna trecută, care a adus îmbunătățiri în ceea ce privește programarea. Avantajul în materie de generare de cod continuă și astăzi cu versiunea 06-05 în benchmark-uri precum AIDER Polyglot, în timp ce „performanța de top este atinsă în GPQA și Humanity’s Last Exam (HLE), benchmark-uri care evaluează capacitățile matematice, științifice, de cunoaștere și de raționament ale unui model”.
În anunțul postat pe blog Google remarcă faptul că versiunea 06-05 are astăzi „un salt de 24 de puncte în scorul Elo pe LMArena”, ajungând la 1470, în timp ce „a înregistrat un salt de 35 de puncte în scorul Elo, ajungând în fruntea WebDevArena cu 1443”.
Compania numește acest lucru o „previzualizare actualizată”, bazată pe upgrade-ul la Gemini 2.5 Pro pe care Google l-a anunțat în urmă cu aproximativ o lună. Google spune că modelul va fi disponibil în general în „câteva săptămâni” și este disponibil începând de astăzi pe platformele sale pentru dezvoltatori AI, AI Studio și Vertex AI, precum și în aplicația Gemini.
Noua versiune Gemini 2.5 Pro de la Google are ca scop remedierea „regresiilor” anterioare ale modelului
În timp ce versiunea generală Gemini 2.5 Flash a ieșit din faza de previzualizare, versiunea Pro rămâne în acest stadiu. De fapt, ultimele câteva actualizări au atras critici valide cu privire la performanța versiunii 2.5 Pro în afara sarcinilor de codare, de la ultima mare actualizare 03-25 din luna martie. Logan Kilpatrick de la Google spune că echipa a luat în serios feedback-ul și că noul model „elimină regresia din 03-25”. De exemplu, utilizatorii vor observa probabil mai multă creativitate și o formatare mai bună a răspunsurilor.
Această versiune are scopul de a remedia unele probleme apărute într-o actualizare anterioară a Gemini Pro și se spune că această versiune va deveni o versiune stabilă care va fi disponibilă în aplicația Gemini pentru ca toată lumea să o poată utiliza.
Versiunea anterioară Gemini 2.5 Pro, cunoscută sub numele de I/O Edition sau pur și simplu 05-06, s-a concentrat pe îmbunătățiri de codare. Google susține că noua versiune este și mai bună la generarea de cod, cu un nou scor maxim de 82,2% în testul Aider Polyglot. Acest scor depășește rezultatele obținute de OpenAI, Anthropic și DeepSeek.
Kilpatrick menționează, de asemenea, că versiunea 06-05 acceptă acum bugete de gândire configurabile pentru dezvoltatori, iar echipa se așteaptă ca această versiune să devină o „versiune stabilă pe termen lung”. Așadar, Gemini 2.5 Pro ar trebui să renunțe în sfârșit la mențiunea „Preview” atunci când această versiune va fi lansată în aplicația destinată consumatorilor și în interfața web în următoarele săptămâni.
Google este foarte interesat de primirea modelelor sale de către utilizatori, așa că se bazează adesea pe evaluările de la LMArena și WebDevArena. Aceste platforme permit utilizatorilor să compare rezultatele modelelor pentru a le evalua înainte de a le dezvălui. Gemini 2.5 a debutat la începutul acestui an cu un scor maxim pe LMArena, ceea ce sugerează că oamenii apreciază rezultatele sale mai mult decât orice alt model AI de mari dimensiuni.
Echipa de AI a Google a remarcat în mai multe rânduri că elemente precum anteturile, marcatorii și textul îngroșat sunt surprinzător de utile, pe baza testelor efectuate de companie pe utilizatori.
Dacă doriți să testați noul Gemini Pro înainte de lansarea finală, poate pentru a-i pune alte întrebări obscure despre culori, acesta este disponibil astăzi în Vertex AI și AI Studio. De
Această actualizare a modelului Gemini 2.5 Pro este încă în versiune preliminară, dar vă puteți aștepta la disponibilitate generală și la o versiune stabilă „în câteva săptămâni”. Aceasta este lansată acum în API-ul Gemini prin Google AI Studio și Vertex AI, dezvoltatorii putând controla costurile și latența cu bugete de gândire (așa cum a fost introdus cu 2.5 Flash). Aplicația Gemini primește astăzi și această actualizare preliminară 2.5 Pro.
