Modelul o3 de la OpenAI a fost desemnat cel mai performant instrument AI în răspunsurile la întrebări științifice

Chatbot-ul cu inteligență artificială ChatGPT, produs de OpenAI
Photo by Levart_Photographer on Unsplash

Modelul de inteligență artificială o3, dezvoltat de echipa din spatele ChatGPT, a fost clasat ca fiind cel mai performant instrument AI pentru a răspunde la întrebări din domeniul științei, conform SciArne, o nouă platformă de evaluare lansată în urmă cu doar o săptămână, informează Nature.

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

SciArena a evaluat 23 de modele lingvistice mari (LLM) în funcție de calitatea răspunsurilor oferite la întrebări formulate de cercetători din diverse domenii. După peste 13.000 de voturi exprimate de 102 specialiști, modelul o3 s-a detașat ca lider absolut, oferind cele mai bune răspunsuri în științele naturale, sănătate, inginerie, științe umaniste și sociale.

Modelul DeepSeek-R1, creat în China, a obținut locul al doilea. Gemini pe locul trei

Modelul DeepSeek-R1, creat în China, a obținut locul al doilea în domeniul științelor naturale, iar Gemini 2.5 Pro, dezvoltat de Google, a completat podiumul în această categorie.

Ce face o3 atât de convingător? Potrivit cercetătorilor, modelul se remarcă prin răspunsuri detaliate, bine argumentate și printr-o capacitate superioară de a cita surse din literatura de specialitate. Deși majoritatea modelelor sunt opace în ceea ce privește datele de antrenament și metodele de optimizare, experții cred că aceste diferențe ar putea explica variațiile de performanță.

Lansarea SciArena marchează o premieră: este prima platformă care clasifică modele AI în funcție de capacitatea lor de a răspunde la întrebări științifice, folosind voturi ale cercetătorilor. Mecanismul e simplu: o întrebare este trimisă către două modele selectate aleatoriu, care oferă răspunsuri susținute de referințe din baza Semantic Scholar. Utilizatorii decid apoi care model s-a descurcat mai bine, sau dacă niciunul nu a oferit un răspuns satisfăcător.

Platforma are potențialul de a deveni un instrument esențial pentru cercetători

Platforma este acum accesibilă publicului larg, gratuit. Oricine poate adresa întrebări și primi răspunsuri de la două modele AI, iar cei care își dau acordul pot contribui la clasamentul general cu voturile lor. SciArena promite actualizări frecvente, în funcție de performanțele modelelor.

Jonathan Kummerfeld, cercetător în inteligență artificială la Universitatea din Sydney, consideră că platforma are potențialul de a deveni un instrument esențial pentru cercetători, ajutându-i să descopere lucrări recente pe care altfel le-ar fi putut rata. În plus, clasamentele oferă o modalitate transparentă de a urmări progresul modelelor AI în domeniul științific.

SciArena oferă acces gratuit și utilizează cele mai actualizate modele AI

Totuși, succesul proiectului depinde de implicarea comunității. Dacă utilizatorii nu vor considera că efortul lor este răsplătit prin valoarea răspunsurilor, platforma riscă să piardă din avânt. Pentru moment, SciArena oferă acces gratuit și utilizează cele mai actualizate modele AI, o combinație menită să încurajeze participarea.

Cercetătorii atrag însă atenția: modelele AI pot greși, pot interpreta greșit concepte sau pot chiar contrazice sursele citate. Rezumatele generate automat nu înlocuiesc lectura atentă a lucrărilor științifice. Dar, folosită cu discernământ, inteligența artificială promite să devină un aliat de nădejde în explorarea vastului univers al cunoașterii științifice.

Total
0
Shares
Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Citește si...