Browsing Tag
benchmark AI
2 posturi
O nouă metodă de evaluare a inteligenței artificiale arată dacă chatboții protejează bunăstarea umană / Ce model AI protejează cel mai mult utilizatorii
Un nou instrument de evaluare, numit HumaneBench, încearcă să stabilească un standard privind modul în care chatboții AI…
OpenAI afirmă că GPT-5 se ridică la nivelul oamenilor într-o gamă largă de profesii, însă doar în sarcini specifice
OpenAI a prezentat un nou benchmark (test de referință pentru evaluarea performanței), denumit GDPval, care evaluează performanța modelelor…