Prima pagină Articole Modelele AI încă se împiedică de bug-uri software pe care programatorii cu experiență le-ar rezolva cu ușurință, arată un studiu Microsoft

3,1K vizualizări

3 minute de citit

Modelele AI încă se împiedică de bug-uri software pe care programatorii cu experiență le-ar rezolva cu ușurință, arată un studiu Microsoft

Redacția TechRider

13 aprilie 2025

Credit foto. trazika / Pixabay

Modelele IA dezvoltate de OpenAI, Anthropic și alte laboratoare de inteligență artificială de top sunt din ce în ce mai des folosite pentru a asista la sarcini de programare. În octombrie, CEO-ul Google, Sundar Pichai, declara că 25% din noul cod produs în cadrul companiei este generat de AI, iar Mark Zuckerberg, CEO-ul Meta, și-a exprimat ambiția de a implementa pe scară largă modele AI pentru programare în cadrul gigantului social media, relatează TechCrunch.

Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -

Totuși, chiar și unele dintre cele mai avansate modele actuale se împiedică de bug-uri software pe care programatorii cu experiență le-ar rezolva cu ușurință.

Un nou studiu realizat de Microsoft Research, divizia de cercetare și dezvoltare a Microsoft, arată că modelele IA – inclusiv Claude 3.7 Sonnet de la Anthropic și o3-mini de la OpenAI – nu reușesc să rezolve multe dintre problemele dintr-un set de teste de depanare numit SWE-bench Lite.

Rezultatele reprezintă un avertisment sobru: în ciuda promisiunilor grandioase ale unor companii precum OpenAI, IA-ul este încă departe de a egala expertiza umană în domenii precum programarea.

Studiul Microsoft: ce arată testele

Autorii studiului au testat nouă modele diferite, folosite ca „agenți cu prompt unic”, fiecare având acces la un set de instrumente de depanare, inclusiv un debugger Python. Agenții au primit sarcina de a rezolva 300 de probleme de depanare selectate din benchmark-ul SWE-bench Lite.

Chiar și cu modele mai performante și mai recente, agenții au reușit rareori să rezolve mai mult de jumătate dintre problemele propuse. Cele mai bune rezultate:

Claude 3.7 Sonnet – rată medie de succes: 48,4%
OpenAI o1 – 30,2%
OpenAI o3-mini – 22,1%

De ce performanțe atât de slabe?

Un motiv este incapacitatea unor modele de a folosi eficient instrumentele de depanare disponibile sau de a înțelege cum diferite instrumente se potrivesc pentru diferite tipuri de probleme.

Însă problema principală, spun cercetătorii, este lipsa de date specifice în procesul de antrenare al modelelor. Mai exact, nu există suficiente date care să reflecte „procesele de luare de decizii în secvență” – adică trasee umane de depanare (debugging), în care un programator analizează codul pas cu pas până la identificarea și remedierea unei erori.

Context și implicații

Rezultatele nu sunt neapărat surprinzătoare. Mai multe studii au arătat că modelele AI generatoare de cod tind să introducă erori și vulnerabilități de securitate, din cauza limitărilor în înțelegerea logicii programării. O evaluare recentă a lui Devin, un instrument AI de programare devenit popular, a arătat că acesta a reușit să finalizeze doar 3 din 20 de teste de programare.

Totuși, studiul Microsoft este printre cele mai detaliate analize de până acum asupra acestei slăbiciuni persistente a modelelor AI.

Deși aceste concluzii probabil nu vor diminua entuziasmul investitorilor pentru uneltele AI de asistare în programare, ele ar putea face ca dezvoltatorii – și managerii acestora – să regândească ideea de a lăsa IA-ul „la volan” în procesul de scriere a codului.

Programatorii nu dispar

Din fericire pentru dezvoltatorii umani, tot mai mulți lideri din industria tech resping ideea că IA-ul va înlocui complet programatorii. Bill Gates, cofondatorul Microsoft, a spus că profesia de programator va rămâne relevantă. La fel au susținut și Amjad Masad, CEO-ul Replit, Todd McKinnon, CEO Okta, Arvind Krishna, CEO IBM.

Viitorul codului pare să fie unul colaborativ: om și IA, nu unul înlocuindu-l pe celălalt.

Redacția TechRider

TechRider este o redacție dinamică, specializată în știri și analize despre tehnologie, gadgeturi și inovații. Echipa sa de jurnaliști pasionați oferă conținut relevant și actualizat, acoperind subiecte de la inteligența artificială la recenzii de produse, într-un stil accesibil și captivant pentru publicul român.

Hand-Picked Top-Read Stories

De ce să nu folosim inteligența artificială vineri după-amiaza? Avertismentul neobișnuit al unui analist Gartner

EXCLUSIV Antreprenorul român care promovează conceptul de „microfabrici” de drone pe Flancul Estic: „Fiecare țară vrea ceva local” / Unitățile, greu de scos din funcțiune simultan

Tranziția de la tratarea bolilor la identificarea timpurie a riscurilor. Care e rolul testării genomice în prevenția personalizată

Trending Tags

Modelele AI încă se împiedică de bug-uri software pe care programatorii cu experiență le-ar rezolva cu ușurință, arată un studiu Microsoft

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Studiul Microsoft: ce arată testele

De ce performanțe atât de slabe?

Context și implicații

Programatorii nu dispar

Lasă un răspuns Anulează răspunsul

De ce să nu folosim inteligența artificială vineri după-amiaza? Avertismentul neobișnuit al unui analist Gartner

EXCLUSIV Antreprenorul român care promovează conceptul de „microfabrici” de drone pe Flancul Estic: „Fiecare țară vrea ceva local” / Unitățile, greu de scos din funcțiune simultan

Tranziția de la tratarea bolilor la identificarea timpurie a riscurilor. Care e rolul testării genomice în prevenția personalizată

Modelele AI încă se împiedică de bug-uri software pe care programatorii cu experiență le-ar rezolva cu ușurință, arată un studiu Microsoft

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Studiul Microsoft: ce arată testele

De ce performanțe atât de slabe?

Context și implicații

Programatorii nu dispar

Lasă un răspuns Anulează răspunsul

Citește si...

Industria farmaceutică apelează la AI pentru a accelera studiile clinice și pregătirea documentației de reglementare

Cum vrea Albania să integreze AI în structurile guvernamentale: Ministrul virtual Diella și cei 83 de agenți digitali

Un cuplu din California a dat în judecată Open AI pe motiv că ChatGPT l-a încurajat pe fiul lor să se sinucidă/ Părinții acuză compania că a proiectat chatbotul „pentru a favoriza dependența psihologică a utilizatorilor”