Cât de precise sunt cele mai cunoscute chatboturi AI? Un studiu european relevă un grad de erori de aproape 50% pentru toate

inteligenta artificiala
Sursa foto: Jaque Silva/NurPhoto/Shutterstoc / Shutterstock Editorial / Profimedia

O analiză a gradului de erori în furnizarea informațiilor, care se constată la cele mai utilizate patru chatbot-uri la nivel european arată că nivelul de acuratețe s-a îmbunătățit semnificativ de la finalul anului trecut dar tot ajunge la aproape 50%, pentru toate cele patru instrumente, arată o analiză Statista care citează un studiu al European Broadcasting Union, conform G4Media.

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Acum trei ani, pe 30 noiembrie 2022, lansarea oficială a ChatGPT a marcat un punct de cotitură în domeniul inteligenței artificiale, propulsând chatboturile cu IA (sau modelele lingvistice de mari dimensiuni) în mainstream. De atunci, progresul a fost incontestabil: capacitatea LLM-urilor de a procesa interogări complexe, de a rezuma cantități mari de informații și chiar de a ajuta la codificare s-a îmbunătățit considerabil.

Cu toate acestea, informațiile inventate (așa numitele halucinații), interpretările eronate ale contextului și inexactitățile continuă să afecteze chiar și cele mai sofisticate modele disponibile în prezent. Un studiu realizat de Uniunea Europeană de Radiodifuziune și BBC relevă că, deși rata răspunsurilor inexacte a scăzut de la sfârșitul anului trecut, erorile continuă să fie răspândite, mai scrie sursa citată.

Datele colectate între mai și iunie 2025 și analizate de un grup de jurnaliști au arătat că aproape jumătate din răspunsurile (48%) ale chatbot-urilor populare – versiuni gratuite ale ChatGPT, Gemini, Copilot și Perplexity – conțineau probleme de acuratețe. 17% erau erori semnificative, în principal legate de surse și context lipsă. În decembrie 2024, rata răspunsurilor inexacte (observată folosind un eșantion mai mic de răspunsuri) era semnificativ mai mare: 72% pentru toate cele patru LLM-uri. 31% erau probleme majore în acest caz.

În ciuda îmbunătățirilor treptate, aceste deficiențe ridică întrebări critice cu privire la fiabilitate, în special în aplicații cu miză mare, cum ar fi sănătatea, consultanța juridică sau educația. În timp ce dezvoltatorii de IA continuă să împingă limitele, utilizatorii trebuie să rămână conștienți de limitările actuale ale tehnologiei.

  • TechRider este o redacție dinamică, specializată în știri și analize despre tehnologie, gadgeturi și inovații. Echipa sa de jurnaliști pasionați oferă conținut relevant și actualizat, acoperind subiecte de la inteligența artificială la recenzii de produse, într-un stil accesibil și captivant pentru publicul român.

Total
0
Shares
Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Citește si...