OpenAI a lansat un nou upgrade important pentru ChatGPT, care permite automatizarea completă a sarcinilor, de la inițiere până la livrare. Noul „mod agent” este disponibil pentru utilizatorii Pro, Plus și Team și oferă capabilități extinse de navigare, analiză, execuție de cod și interacțiune cu aplicații externe, fără intervenție pas cu pas din partea utilizatorului, transmite InterestingEngineering.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Acest nou sistem permite ChatGPT să execute sarcini complexe precum crearea unui plan de brunch sau realizarea unui set de slide-uri pentru analiza competiției. Potrivit OpenAI, modelul este capabil să „interacționeze activ cu site-urile web – dând click, filtrând și colectând rezultate mai precise și mai eficiente”.
Modul agent funcționează printr-un „calculator virtual” care combină navigarea pe internet, utilizarea de instrumente software și raționamentul logic, permițând AI-ului să desfășoare activități complete, cum ar fi accesarea de informații online, descărcarea de fișiere, rularea de cod în terminal și generarea de rezultate finale într-un singur flux continuu.
Un avantaj important este păstrarea contextului între pași. Utilizatorii pot interveni în orice moment pentru a modifica instrucțiunile, iar agentul va ajusta sarcina fără a fi nevoie să reia procesul de la zero. OpenAI descrie acest comportament ca fiind „mult mai interactiv și flexibil decât modelele anterioare”.
Sistemul permite și integrarea cu aplicații externe, precum Gmail sau GitHub, prin intermediul conectorilor. În situațiile în care este necesară autentificarea, utilizatorul poate interveni direct pentru logare, iar ChatGPT își reia ulterior activitatea.
OpenAI susține că noua funcționalitate combină două capabilități anterioare – modul de operator (pentru navigare) și cercetarea profundă (pentru analiză de date) – într-un instrument unificat, capabil să acopere o gamă largă de sarcini care până acum nu puteau fi automatizate complet.
Performanțele modelului au fost evaluate pe benchmarkuri de referință. ChatGPT a obținut un scor de 41,6 la Humanity’s Last Exam, depășind modelele anterioare, și o acuratețe de 27,4% la FrontierMath, unul dintre cele mai dificile teste matematice disponibile.
Odată cu extinderea funcționalităților, OpenAI a implementat o serie de măsuri de siguranță. Sarcinile cu consecințe importante, cum ar fi efectuarea de plăți sau trimiterea de emailuri, necesită confirmarea expresă a utilizatorului. În plus, sistemul este antrenat să refuze automat acțiunile cu risc ridicat, precum transferurile financiare.
Un risc major identificat de OpenAI este reprezentat de atacurile de tip prompt injection, în care comenzi ascunse în codul unei pagini web pot influența comportamentul AI-ului. Pentru prevenirea acestora, agentul a fost antrenat să recunoască și să reziste la astfel de atacuri, fiind implementate și sisteme de monitorizare dedicate.
OpenAI precizează că sesiunile de navigare rămân private și că „ChatGPT nu colectează sau stochează datele introduse de utilizatori în timpul acestor sesiuni, cum ar fi parolele, deoarece modelul nu are nevoie de ele și este mai sigur să nu le vadă deloc”.
Deși unele funcții, precum formatarea automată a prezentărilor sau editarea foilor de calcul, sunt în prezent în stadiu beta, lansarea noului mod agent marchează un pas important în direcția unui asistent digital complet, capabil să preia sarcini complexe și să le ducă la capăt cu un minim de intervenție din partea utilizatorului.