OpenAI lansează un nou agent AI cu scop general în ChatGPT, care, potrivit companiei, poate îndeplini o gamă variată de sarcini informatice în numele utilizatorilor. Agentul ar putea naviga automat în calendarul unui utilizator, genera prezentări editabile și rula cod, anunță TechCrunch.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Instrumentul, numit ChatGPT agent, reunește mai multe capabilități din instrumentele anterioare dezvoltate de OpenAI, inclusiv abilitatea Operator-ului de a face clic pe site-uri web, dar și capacitatea Deep Research de a sintetiza informații din zeci de surse într-un raport concis. OpenAI spune că utilizatorii pot interacționa cu agentul pur și simplu formulând solicitări în limbaj natural, direct în ChatGPT.
Agentul este disponibil pentru abonații planurilor Pro, Plus și Team. Utilizatorii pot activa noul instrument selectând opțiunea „agent mode” din meniul derulant al ChatGPT.
ChatGPT agent: un pas important spre automatizarea reală a sarcinilor
Lansarea acestui nou agent marchează cel mai îndrăzneț efort al OpenAI de a transforma ChatGPT într-un produs capabil să acționeze și să preia efectiv sarcini în locul utilizatorilor, nu doar să răspundă la întrebări. În ultimii ani, companii din Silicon Valley, inclusiv OpenAI, Google și Perplexity, au prezentat zeci de agenți AI care promiteau acest lucru. Totuși, versiunile timpurii ale acestor agenți s-au dovedit fragile în fața sarcinilor complexe și nu au fost percepute ca produse cu adevărat utile, în ciuda promisiunilor făcute de liderii din industrie.
OpenAI susține, însă, că ChatGPT agent este semnificativ mai capabil decât versiunile anterioare.
Poate folosi aplicații externe și scrie cod
Noul agent are acces la conectorii ChatGPT, permițând conectarea aplicațiilor precum Gmail sau GitHub pentru a găsi informații relevante în funcție de solicitări. De asemenea, agentul poate accesa un terminal pentru execuție de cod și poate folosi API-uri pentru a interacționa cu anumite aplicații.
Printre exemplele de utilizare oferite de OpenAI se numără: „planificarea și cumpărarea ingredientelor pentru un mic dejun japonez pentru patru persoane” sau „analiza a trei competitori și crearea unei prezentări PowerPoint”. Aceste funcții implică parcurgerea de site-uri, planificarea acțiunilor și utilizarea unor unelte, sarcini mult mai complexe decât cele abordate de agenții anteriori.
Modelul de bază care alimentează ChatGPT agent oferă performanțe de ultimă generație, potrivit OpenAI.
Performanță de top la teste academice
OpenAI afirmă că modelul agentului obține un scor de 41,6% la testul Humanity’s Last Exam (pass@1), o evaluare extrem de dificilă compusă din mii de întrebări din peste o sută de domenii. Este aproape dublu față de scorurile obținute de modelele OpenAI o3 și o4-mini.
La FrontierMath, unul dintre cele mai dificile teste matematice existente, agentul atinge un scor de 27,4% când are acces la unelte precum terminalul. Prin comparație, scorul anterior de referință era de doar 6,3%, obținut de modelul o4-mini.
Măsuri suplimentare de siguranță
OpenAI subliniază că a dezvoltat acest agent cu o atenție deosebită pentru siguranță, dat fiind că noile sale capabilități îl pot face mai periculos în mâinile unui actor rău intenționat. Compania avertizase anterior că modelele agentice pot avea un potențial mai mare pentru acțiuni dăunătoare.
Într-un raport de siguranță dedicat, OpenAI afirmă că a clasificat modelul ca având „capabilități ridicate” în domeniile armelor biologice și chimice, conform propriului cadru de evaluare a pregătirii. Această clasificare presupune că modelul poate „amplifica trasee existente către daune severe”. Totuși, compania menționează că nu deține dovezi directe în acest sens, dar a adoptat o abordare preventivă și a activat măsuri suplimentare de protecție.
Printre acestea se numără un sistem de monitorizare în timp real care analizează fiecare solicitare introdusă în ChatGPT agent, determinând dacă aceasta are legătură cu biologia. Dacă da, răspunsul este analizat de un al doilea filtru pentru a evalua dacă ar putea genera un risc biologic.
OpenAI mai precizează că a dezactivat funcția de memorie a ChatGPT în cazul acestui agent, pentru a preveni abuzurile. În mod normal, memoria permite chatbotului să rețină informații din conversații anterioare. Însă, în cazul agentului, această funcționalitate ar putea fi exploatată pentru extragerea datelor sensibile prin atacuri de tip prompt injection. Compania spune că ar putea reconsidera includerea memoriei în viitor.
Rămâne de văzut cum va performa în lumea reală
Chiar dacă ChatGPT agent pare impresionant în teorie, rămâne de văzut cât de bine va funcționa în practică. Tehnologia agenților AI a demonstrat până acum o fragilitate notabilă în interacțiunea cu lumea reală. Totuși, OpenAI afirmă că a creat un model cu adevărat capabil, care poate duce la îndeplinire promisiunile ambițioase ale inteligenței artificiale agentice.