Joi, OpenAI a anunțat GPT-5 și alte trei variante: GPT-5 Pro, GPT-5 mini și GPT-5 nano — pe care compania le numește „cel mai bun sistem de inteligență artificială-IA de până acum”, unele dintre modele fiind disponibile pentru toate nivelurile ChatGPT, inclusiv pentru varianta gratuită. Noua familie de modele vine cu promisiuni de reducere a halucinațiilor, îmbunătățirea capacităților de programare și o nouă abordare a gestionării cererilor sensibile, pe care OpenAI o numește „completări sigure” („safe completions”).
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Îmbunătățiri tehnice, funcții noi și o actualizare incrementală
Este, de asemenea, prima dată când OpenAI oferă la varianta gratuită acces la un model de IA bazat pe raționament, care descompune problemele în mai mulți pași folosind o tehnică care tinde să îmbunătățească acuratețea răspunsurilor la întrebări logice sau analitice.
GPT-5 reprezintă cea mai recentă încercare a OpenAI de a unifica diversele sale capacități de IA într-un singur sistem. Compania afirmă că familia GPT-5 acționează ca un „sistem unificat” cu un model inteligent și eficient care răspunde la majoritatea întrebărilor și un model de raționament mai profund numit „GPT-5 thinking” pentru probleme mai dificile.
Un router în timp real va decide ce abordare să utilizeze în funcție de tipul conversației, complexitate, necesități de apelare de instrumente și intenția utilizatorului, eliminând astfel necesitatea selectării unui model anume care să se potrivească solicitării. Faptul că modelul, și nu utilizatorul, poate alege dacă să aplice raționamentul la fiecare interogare elimină un punct sensibil major, în special pentru utilizatorii care nu urmăresc îndeaproape progresele LLM.
La fel ca GPT-4o, GPT-5 este un sistem multimodal care poate interacționa prin imagini, voce și text.
Odată cu lansarea GPT-5, mai multe modele mai vechi vor fi retrase, printre care: GPT-4o, GPT-4.1, GPT-4.5, GPT-4.1-mini, o4-mini, o4-mini-high, o3 și o3-pro.
Dacă deschizi o conversație care a utilizat unul dintre aceste modele, ChatGPT o va comuta automat la cel mai apropiat echivalent GPT-5. Conversațiile cu 4o, 4.1, 4.5, 4.1-mini, o4-mini sau o4-mini-high se vor deschide în GPT-5, conversațiile cu o3 se vor deschide în GPT-5-Thinking, iar conversațiile cu o3-Pro se vor deschide în GPT-5-Pro (disponibil numai pentru abonamentele Pro și Team).
De reținut este că modul Voice este încă alimentat de GPT-4o. Pentru a simplifica lucrurile, vechiul mod Standard Voice va fi eliminat treptat, în termen de 30 de zile.
Teste preliminare efectuate de OpenAI
Saltul dintre GPT-4, dacă luăm în considerare versiunea originală din 2023, și GPT-5 este încă semnificativ, dar dacă luăm în considerare versiunile intermediare precum GPT-4o, GPT-4.5, GPT-4.1 și o3-pro, GPT-5 pare o actualizare incrementală care nu va surprinde pe nimeni.
OpenAI a avut intenția de a utiliza numele „GPT-5” pentru modele precum o1 anul trecut, dar a decis să îl păstreze pentru o versiune viitoare. Nu este clar de ce aceste noi modele au îndeplinit pragul de branding, dar recunoașterea mărcii „GPT-5” va oferi probabil OpenAI un impuls în ochii publicului, într-o industrie extrem de competitivă.
În ceea ce privește indicatori de performanță, GPT-5 ar atinge 94,6% la AIME 2025 pentru matematică fără instrumente și 84,2% la MMMU pentru înțelegere multimodală. Și cu raționamentul extins al GPT-5 Pro, acesta stabilește un nou standard de referință pentru GPQA, cu 88,4% fără instrumente. OpenAI susține că GPT-5 cu „raționament” are performanțe mai bune decât OpenAI o3, folosind cu 50 până la 80% mai puține tokenuri de ieșire în diverse capacități.
La Humanity’s Last Exam, un test care măsoară performanța modelelor de IA în matematică, științe umaniste și științe naturale, o versiune a GPT-5 cu raționament extins (GPT-5 Pro) a obținut un scor de 42% atunci când a utilizat instrumente. Acest scor este puțin mai mic decât cel obținut de xAI cu Grok 4 Heavy, care a obținut 44,4% la test.
La GPQA Diamond, un test cu întrebări științifice la nivel de doctorat, GPT-5 pro a obținut 89,4% la prima încercare, depășind Claude Opus 4.1, care a obținut 80,9%, și Grok 4 Heavy, care a obținut 88,9%.
GPT-5 încă nu poate înlocui doctorii, dar poate ajuta la înțelegerea actului medical
Pentru întrebări legate de sănătate, OpenAI poziționează, încă o dată, GPT-5 ca „cel mai bun model de până acum”, obținând 46,2% pe HealthBench Hard (un benchmark inventat de OpenAI), deși compania include o mențiune că „ChatGPT nu înlocuiește un profesionist din domeniul medical”. Compania a promovat faptul ca GPT poate ajuta utilizatorii să înțeleagă rezultatele medicale și să pregătească întrebări pentru furnizorii de servicii medicale. Dar este mai bine să nu aveți încredere oarbă în rezultatele unui model de IA, deoarece toate modelele lingvistice de IA, fiind modele predictive adaptate pentru interacțiunea cu utilizatorii, tind să spună oamenilor ceea ce vor să audă și halucinațiile IA încă sunt o problemă importantă. GPT-5 nu va înlocui doctorul dar va putea ajuta utilizatorii sa înțeleagă procedurile medicale.
OpenAI afirmă că GPT-5 este mai bun pentru a răspunde la întrebări legate de sănătate. Într-un test care măsoară acuratețea răspunsurilor modelelor de IA pe teme de sănătate, HealthBench Hard Hallucinations, OpenAI afirmă că GPT-5 (cu raționament) halucinează doar 1,6% din timp. Acest procent este mult mai mic decât cel al modelelor anterioare ale companiei, GPT-4o și o3, care au obținut 12,9% și, respectiv, 15,8%.
OpenAI a pus accentul pe vibe coding si programarea asistată de IA
Compania afirmă că GPT-5 oferă performanțe de nivel avansat în domeniul codării; Altman a spus că modelul excelează în special în rularea la cerere a aplicațiilor software complete, în ceea ce a devenit cunoscut sub numele de „vibe coding”.
Printre îmbunătățirile revendicate, OpenAI afirmă că GPT-5 oferă „cel mai puternic model de codare de până acum”, obținând 74,9% la testul SWE-bench Verified și 88% la testul Aider Polyglot. Pentru comparație GPT-5 depășește doar marginal cel mai recent model Claude Opus 4.1 al Anthropic, care a obținut un scor de 74,5%, și Gemini 2.5 Pro al Google DeepMind, care a obținut un scor de 59,6%.
GPT-5 poate, potrivit rapoartelor, să finalizeze „sarcini complexe de codificare de la cap la coadă cu un minim de instrucțiuni” și să creeze un design de interfață software pentru utilizatori fără experiență în codificare.
Apelarea instrumentelor
Apelarea instrumentelor, tool calling-ul este un atu important pentru IA în procesul de programare asistată de IA și pentru vibe coding, modelele de la Anthropic dominând preferințele dezvoltatorilor software tocmai datorita performanțelor ridicate ale modelelor sale Claude Sonnet și Opus în tool calling.
OpenAI afirmă că a îmbunătățit apelarea instrumentelor în moduri importante pentru dezvoltatori. GPT‑5 este mai bun la urmarea instrucțiunilor instrumentelor, la gestionarea erorilor instrumentelor și la efectuarea proactivă a mai multor apeluri de instrumente în secvență sau în paralel. La cerere, GPT‑5 poate afișa mesaje introductive înainte și între apelurile de instrumente pentru a informa utilizatorii cu privire la progresul înregistrat în timpul sarcinilor agentice mai lungi.
În urmă cu două luni, τ2-bench telecom a fost publicat de Sierra.ai ca un benchmark pentru utilizarea instrumentelor, care a evidențiat modul în care performanța modelului lingvistic scade semnificativ atunci când interacționează cu o stare a mediului care poate fi modificată de utilizatori. În publicația lor, niciun model nu a obținut un scor mai mare de 49%. GPT‑5 a obținut un scor de aproximativ 97%.

OpenAi a redus nivelul de halucinații comparativ cu modelele anterioare
GPT-5 arată, potrivit rapoartelor, îmbunătățiri semnificative în ceea ce privește acuratețea. Cu căutarea pe web activată, răspunsurile GPT-5 par să conțină cu aproximativ 45% mai puține erori (confabulații) decât GPT-4o, iar atunci când „raționează”, cu aproximativ 80% mai puține erori decât o3. Desigur, modelele de IA vor completa lacunele din „cunoștințele” lor folosind informații care doar „sună” plauzibil, așa că este mai bine să nu vă bazați pe rezultatele lor dacă nu le puteți verifica singuri.
În răspunsurile la solicitările ChatGPT, OpenAI a constatat că GPT-5 (cu raționament) halucinează și răspunde cu informații incorecte în 4,8% din cazuri. Aceasta reprezintă o reducere semnificativă față de o3 și GPT-4o, care au înregistrat rate de halucinații de 22% și, respectiv, 20,6% în cadrul testului.
Utilizarea agentică a GPT-5
În cadrul unui test de referință care măsoară capacitatea agentică a unui model de IA de a finaliza sarcini online simulate, Tau-bench, GPT-5 oferă performanțe mixte. În partea testului care măsoară capacitatea unei IA de a naviga pe site-ul unei companii aeriene, GPT-5 obține un scor de 63,5%, ușor sub performanța modelului o3, care a obținut 64,8%. În altă parte a testului care măsoară capacitatea IA de a naviga pe site-uri de retail, GPT-5 obține un scor de 81,1%, sub performanța modelului Claude Opus 4.1, care a obținut 82,4%.
Îmbunătățiri cosmetice și preocuparea fata de siguranță
ChatGPT beneficiază, de asemenea, de actualizări ale interfeței, inclusiv culori personalizabile pentru chat, „personalități” prestabilite pentru conversații (cu opțiuni precum „Cynic”, „Robot”, „Listener” și „Nerd”) care modifică promptul sistemului, precum și integrarea cu Gmail, Google Calendar și Google Contacts pentru utilizatorii Pro. Modul vocal este unificat într-un singur sistem „Advanced Voice” (Voce avansată) care, potrivit OpenAI, înțelege mai bine instrucțiunile utilizatorului și își adaptează stilul de vorbire.
Integrarea cu Google este o funcție puternică, dar care poate cauza probleme de confidențialitate dacă permisiunile nu sunt strict controlate. La începutul acestei săptămâni, a fost raportat cum un singur document „otrăvit” încărcat pe ChatGPT putea fi exploatat pentru a fura chei API și alte date sensibile stocate pe platforme cloud populare.
Între timp, abordarea companiei față de cenzura răspunsurilor s-a schimbat cu ceea ce numește „completări sigure”. În loc să refuze cererile în mod direct, GPT-5 încearcă să ofere „cel mai util răspuns posibil în limitele de siguranță”, potrivit anunțului OpenAI. Când modelul nu poate răspunde unei cereri, oferă explicații pentru limitările sale.
OpenAI a abordat și problemele anterioare legate de lingușire. La începutul acestui an, o actualizare a GPT-4o a făcut ca modelul să devină involuntar excesiv de flatant sau agreabil, deseori în detrimentul siguranței utilizatorului. Prin noi evaluări și îmbunătățirea antrenamentului, GPT-5 a redus, potrivit rapoartelor, răspunsurile lingușitoare de la 14,5% la mai puțin de 6% în evaluările țintite. Timpul va arăta dacă acest lucru va contribui la reducerea recentei serii de comportamente delirante și maniacale la unele persoane.
GPT-5 a trecut prin 5.000 de ore de testare de siguranță condusă de experți, potrivit șefului departamentului de cercetare în domeniul siguranței al companiei, Alex Beutel. Beutel a adăugat că modelul va fi mai puțin înșelător decât versiunile anterioare, ceea ce înseamnă că ar trebui să fie mai puțin probabil să mintă utilizatorii cu privire la lucruri precum finalizarea unei sarcini pe care nu a finalizat-o de fapt.
Accesul dezvoltatorilor și prețuri
Pentru dezvoltatori, GPT-5 este disponibil în trei versiuni API: gpt-5, gpt-5-mini și gpt-5-nano, fiecare oferind compromisuri diferite în ceea ce privește latența și costurile. Fereastra de context s-a extins la 256.000 de tokenuri, față de 200.000 în modelul anterior o3 al OpenAI. Dezvoltatorii care au nevoie de ferestre de context mai mari pot utiliza în continuare GPT-4.1 cu o capacitate de 1 milion de tokenuri.
Prețul API pentru GPT-5 este de 1,25 USD per milion de tokenuri de intrare, cu o reducere de 90% pentru cache și 10 USD per milion de tokenuri de ieșire. Este oarecum comparabil cu GPT-4.1 (2 USD intrare/8 USD ieșire per milion de tokenuri) și o3 (2 USD intrare/8 USD ieșire per milion de tokenuri). GPT-5 Mini oferă o opțiune mai economică, la 0,25 USD pe milion de tokenuri de intrare și 2 USD pentru un milion de tokenuri de ieșire, în timp ce GPT-5 Nano oferă cel mai rentabil nivel, dar și cel mai puțin performant, la doar 0,05 USD pe milion de tokenuri de intrare și 0,40 USD pe milion de tokenuri de ieșire. Prețul GPT-5 Pro pentru accesul la API nu a fost încă anunțat.
Noile funcții pentru dezvoltatori includ „apelarea funcțiilor în format liber”, care permite trimiterea de șiruri de caractere brute, cum ar fi comenzile SQL, direct către instrumente fără formatare JSON, controale de verbiaj (verbosity controls) pentru cantitatea detaliilor răspunsurilor, adică pot decide cât de lungi sau scurte trebuie să fie răspunsurile, precum și „controlul efortului de raționament”, care permite dezvoltatorilor să alterneze între răspunsuri rapide și analize mai aprofundate.
Detalii despre derularea lansării GPT-5
Lansarea GPT-5 vine în contextul în care OpenAI se confruntă cu o concurență din ce în ce mai mare din partea modelelor Gemini de la Google, a familiei Claude de la Anthropic și a modelelor Llama cu ponderi deschise de la Meta. OpenAI raportează că are 5 milioane de utilizatori business plătitori și 4 milioane de dezvoltatori care folosesc platforma sa API.
GPT-5 înlocuiește GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1 și GPT-4.5 ca model implicit pentru utilizatorii ChatGPT conectați. Sistemul aplică automat „raționamentul” prin intermediul routerului implementat atunci când răspunsurile ar beneficia de acesta, deși utilizatorii plătitori încă pot selecta în continuare „GPT-5 Thinking” din selectorul de modele sau pot adăuga fraze precum „think hard about this” (gândește-te bine la asta) pentru a se asigura că se utilizează raționamentul.
OpenAI a început de joi implementarea noului model pentru toate nivelurile de utilizatori, clienții din sectorul întreprinderilor și al educației urmând să aibă acces săptămâna viitoare. OpenAI intenționează să retragă modul Standard Voice în termen de 30 de zile, ca parte a tranziției către sistemul unificat Advanced Voice. Odată ce utilizatorii gratuiți ating limitele de utilizare GPT-5, aceștia trec la GPT-5 mini, un model mai mic și mai rapid.
Cu toate acestea, GPT-5 pare să fie aproximativ la egalitate cu alte modele AI de ultimă generație în mai multe domenii. Desigur, benchmark-urile spun doar o parte a poveștii pentru orice model AI și rămâne de văzut cum vor utiliza dezvoltatorii GPT-5 în lumea reală și dacă modelul este cu adevărat un pas înaintea concurenței. În unele teste de performanță, este doar competitiv, nu dominant. Și, deși CEO-ul Sam Altman spune că „este prima dată când pare că vorbești cu un expert cu doctorat”, aceasta este mai degrabă o strategie de vânzare decât o evaluare tehnică.
Mai jos sunt câteva rezultate ale testelor efectuate de evaluatorul independent ArtificialAnalysis.ai comparativ cu ultimele modele ale competitorilor.


