OpenAI a lansat marți GPT-Image 1.5, cel mai nou model de generare de imagini al companiei, într-un moment de competiție acerbă pe piața inteligenței artificiale, dominată tot mai puternic de modelele Google. Noul instrument promite editări mai rapide, un control mai fin asupra imaginilor și o experiență de lucru orientată clar spre producție, nu doar spre experiment, anunță Interesting Engineering.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
GPT-Image 1.5 este disponibil imediat pentru toți utilizatorii ChatGPT din întreaga lume, precum și prin API-ul OpenAI, și rulează, potrivit companiei, de până la patru ori mai rapid decât versiunea anterioară. Modelul vine cu îmbunătățiri semnificative în ceea ce privește respectarea instrucțiunilor, mai ales în cazul editărilor succesive ale aceleiași imagini.
Utilizatorii pot acum modifica elemente punctuale fără a fi nevoie să regenereze întreaga scenă
Spre deosebire de generațiile anterioare, utilizatorii pot acum modifica elemente punctuale dintr-o imagine (adăugarea sau eliminarea de obiecte, schimbarea stilului vizual, ajustarea hainelor sau rafinarea unor zone specifice) fără a fi nevoie să regenereze întreaga scenă. Această funcționalitate răspunde uneia dintre cele mai frecvente critici aduse generatoarelor de imagini AI, care aveau tendința de a altera imaginea în ansamblu, chiar și pentru schimbări minore.
Odată cu lansarea noului model, OpenAI a introdus și un spațiu dedicat creării de imagini în bara laterală a ChatGPT. Acesta funcționează ca un veritabil studio creativ, cu stiluri prestabilite, filtre și prompturi aflate în tendințe, marcând o tranziție de la interacțiunea exclusiv bazată pe chat la un flux de lucru centrat pe vizual.
Interfața de chat nu a fost concepută inițial pentru acest tip de creație
„Pentru mulți oameni, prima experiență cu ChatGPT înseamnă transformarea unui text într-o imagine. Este o experiență aproape magică, dar interfața de chat nu a fost concepută inițial pentru acest tip de creație”, a explicat Fidji Simo, CEO pentru aplicații la OpenAI.
Un alt progres important vizează redarea textului în interiorul imaginilor, o problemă notorie pentru modelele de generare vizuală. OpenAI susține că GPT-Image 1.5 produce texte mai lizibile și mai coerente, deși consistența acestor rezultate va fi evaluată pe scară largă în utilizarea reală.
Lansarea vine pe fondul intensificării competiției cu Google
Lansarea vine pe fondul intensificării competiției cu Google, ale cărui modele Gemini 3 și Nano Banana Pro au ajuns recent în fruntea clasamentelor de performanță din domeniu. Potrivit presei internaționale, CEO-ul OpenAI, Sam Altman, ar fi declarat chiar un „cod roșu” intern după aceste evoluții, în ciuda faptului că OpenAI a lansat recent GPT-5.2, destinat în special dezvoltatorilor și utilizatorilor profesioniști.
GPT-Image 1.5 apare și la scurt timp după ce OpenAI a anunțat un parteneriat cu Disney, care va permite integrarea a peste 200 de personaje celebre în imaginile ChatGPT și în videoclipurile generate cu Sora. Această funcționalitate nu este încă activă în noul model de imagini și este așteptată la începutul anului 2026.