GPT-5 de la OpenAI, cea mai recentă versiune a tehnologiei AI care a alimentat gigantul ChatGPT în 2022, este gata să fie lansat în curând, iar utilizatorii vor analiza dacă acest pas înainte față de GPT-4 este la fel de important ca îmbunătățirile anterioare ale laboratorului de cercetare, scrie Reuters.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Doi dintre primii testeri ai noului model au declarat pentru Reuters că au fost impresionați de capacitatea acestuia de a codifica și rezolva probleme de știință și matematică, dar consideră că saltul de la GPT-4 la GPT-5 nu este la fel de mare ca cel de la GPT-3 la GPT-4. Testerii, care au semnat acorduri de confidențialitate, au refuzat să fie numiți în acest articol.
Saltul GPT-4 s-a bazat pe o putere de calcul și date mai mari, iar compania spera că „scalarea” într-un mod similar va duce în mod constant la îmbunătățirea modelelor de IA.
Dar OpenAI, care este susținută de Microsoft și este evaluată în prezent la 300 de miliarde de dolari, s-a confruntat cu probleme de scalare. Una dintre probleme a fost bariera de date cu care s-a confruntat compania, iar fostul șef științific al OpenAI, Ilya Sutskever, a declarat anul trecut că, în timp ce puterea de procesare era mai ridicată, cantitatea de date nu creștea.
El se referea la faptul că modelele lingvistice de mari dimensiuni sunt antrenate pe seturi de date masive care colectează informații de pe întreg internetul, iar laboratoarele de IA nu au alte opțiuni pentru cantități mari de date textuale generate de oameni.
Pe lângă lipsa datelor, o altă problemă era că „rulările de antrenament” pentru modelele de mari dimensiuni sunt mai susceptibile de a avea defecțiuni cauzate de hardware, având în vedere complexitatea sistemului, iar cercetătorii pot să nu cunoască performanța finală a modelelor până la sfârșitul rulării, care poate dura luni de zile.
OpenAI nu a precizat când va fi lansat GPT-5, dar industria se așteaptă ca acest lucru să se întâmple în orice moment, potrivit relatărilor din mass-media. Boris Power, șeful departamentului de cercetare aplicată la OpenAI, a declarat luni într-o postare pe X: „Suntem entuziasmați să vedem cum va fi primit GPT-5 de către public”.
„OpenAI a făcut un salt atât de mare de la GPT-3 la GPT-4, încât de atunci există o așteptare enormă pentru GPT-5”, a declarat Navin Chaddha, partener de conducere la fondul de capital de risc Mayfield, care investește în companii de IA, dar nu este investitor OpenAI. „Speranța este că GPT-5 va deschide calea către aplicații de IA care vor depăși chat-ul și vor ajunge la executarea complet autonomă a sarcinilor.”
„Test-time compute”
În urmă cu aproape trei ani, ChatGPT a introdus lumii IA generativă, uimind utilizatorii cu capacitatea sa de a scrie proză și poezie asemănătoare celor scrise de oameni, devenind rapid una dintre cele mai rapid crescânde aplicații din toate timpurile.
În martie 2023, OpenAI a continuat seria ChatGPT cu lansarea GPT-4, un model lingvistic de mari dimensiuni care a făcut pași uriași în domeniul inteligenței. În timp ce GPT-3.5, o versiune anterioară a modelului, a obținut un scor în examenul de barou în ultimii 10%, GPT-4 a promovat, același examen simulat în primii 10%.
GPT-4 a devenit apoi modelul de referință, iar lumea a acceptat faptul că modelele de IA pot depăși performanțele umane în multe sarcini.
În scurt timp, alte companii au urmat exemplul. În același an, Google și Anthropic, susținută de Amazon, au lansat modele competitive pentru GPT-4. În decurs de un an, au fost lansate modele open-source la fel de performante ca GPT-4, cum ar fi Llama 3 al Meta Platforms.
Pe lângă antrenarea modelelor de mari dimensiuni, OpenAI a investit acum într-o altă direcție, numită „test-time compute”, care canalizează mai multă putere de procesare pentru a rezolva sarcini dificile, cum ar fi operații matematice sau complexe, care necesită raționament și luare de decizii similare celor umane.
CEO-ul companiei, Sam Altman, a declarat la începutul acestui an că GPT-5 va combina atât „test-time compute”, cât și modelele sale de mari dimensiuni. El a mai spus că modelul și oferta de produse ale OpenAI au devenit „complicate”.