benchmark AI - TechRider.ro

dark

Hand-Picked Top-Read Stories

Urmă umană pe Lună

Apollo vs. Artemis: cum s-au schimbat misiunile lunare ale NASA după mai bine de jumătate de secol

13 vizualizări

Pentru prima dată, un articol științific generat integral de un sistem AI a trecut de procesul de peer review

12 vizualizări

xAI rămâne și fără ultimul cofondator / Mâna dreaptă a lui Musk a părăsit oficial compania

12 vizualizări

Trending Tags

Discuție cu un chatbot AI

285

3 min

AI

O nouă metodă de evaluare a inteligenței artificiale arată dacă chatboții protejează bunăstarea umană / Ce model AI protejează cel mai mult utilizatorii

Un nou instrument de evaluare, numit HumaneBench, încearcă să stabilească un standard privind modul în care chatboții AI…

Ionuț Tăpălagă

29 noiembrie 2025

Noul program OpenAI pentru țări va oferi ChatGPT un avantaj uriaș, dar acestea nu sunt vești bune

2,1K

2 min

AI

OpenAI afirmă că GPT-5 se ridică la nivelul oamenilor într-o gamă largă de profesii, însă doar în sarcini specifice

OpenAI a prezentat un nou benchmark (test de referință pentru evaluarea performanței), denumit GDPval, care evaluează performanța modelelor…

Ionuț Tăpălagă

27 septembrie 2025