Un nou instrument dezvoltat de cercetători din SUA în colaborare cu Google a reușit să identifice cu o acuratețe fără precedent videoclipurile manipulate sau complet generate de inteligența artificială. Sistemul, numit „detector universal”, poate recunoaște atât deepfake-uri clasice – precum înlocuiri de fețe – cât și conținuturi video complet sintetice, inclusiv cele fără prezență umană, transmite NewScientist.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Creșterea accelerată a numărului de videoclipuri generate cu ajutorul AI, disponibile prin instrumente ușor accesibile, a dus la o proliferare a materialelor deepfake în mediul online. Acestea sunt utilizate în special pentru generarea de pornografie neconsensuală, vizând în mod frecvent femei și fete minore, dar și pentru manipulare politică și escrocherii financiare.
Majoritatea metodelor actuale de detectare se concentrează pe identificarea modificărilor la nivelul fețelor. Acestea funcționează eficient pentru videoclipuri de tip face-swap, unde fața unei persoane reale este introdusă într-un material video existent. Însă această abordare este limitată în fața tehnologiilor emergente, care permit manipularea completă a fundalurilor sau generarea de la zero a întregului videoclip.
„Avem nevoie de un model care să poată detecta atât videoclipurile cu fețe manipulate, cât și cele în care sunt alterate fundalurile sau care sunt complet sintetice”, a declarat Rohit Kundu, cercetător la Universitatea din California, Riverside. „Modelul nostru pornește de la ipoteza că întregul videoclip poate fi generat de AI, și nu doar o porțiune a acestuia.”
Pentru a atinge acest obiectiv, echipa de cercetători a antrenat sistemul să analizeze nu doar chipurile umane, ci și fundalurile și detaliile spațiale și temporale ale fiecărui cadru. Detectorul poate identifica discrepanțe subtile, cum ar fi iluminarea incorectă pe fața unui personaj inserat artificial, incoerențe între cadre succesive sau fundaluri care nu respectă logica vizuală a unei scene reale. Sistemul poate de asemenea semnala secvențe din jocuri video precum Grand Theft Auto V, chiar dacă nu sunt produse cu AI, dar pot fi confundate cu materiale autentice.
„Majoritatea metodelor existente se concentrează pe fețele generate de AI – înlocuiri de fețe, sincronizare a buzelor sau animații create dintr-o singură imagine”, a explicat Siwei Lyu, profesor la Universitatea Buffalo din New York. „Noua metodă are o aplicabilitate mult mai extinsă.”
În testele efectuate, detectorul universal a atins o acuratețe între 95% și 99% în identificarea a patru seturi de videoclipuri deepfake cu fețe manipulate, depășind toate metodele anterioare. Performanțele sale au fost superioare și în cazul materialelor complet generate de AI, fără actori umani. Rezultatele au fost prezentate în luna iunie la conferința IEEE dedicată viziunii computerizate și recunoașterii imaginilor, desfășurată în Nashville, Tennessee.
Chiar dacă Google a participat la dezvoltarea sistemului, compania nu a comentat dacă această tehnologie va fi implementată pe platformele sale, precum YouTube. În prezent, Google susține inițiative de marcare (watermarking) a conținutului generat de propriile modele AI.
Pentru viitor, cercetătorii vor să extindă capabilitățile detectorului la situațiile dinamicie, cum ar fi apelurile video live. „Cum știi dacă persoana de la celălalt capăt este reală sau este o creație AI? Putem determina asta în timp real, chiar și în condiții de rețea dificile?”, se întreabă Amit Roy-Chowdhury, tot de la Universitatea din California, Riverside. „Aceasta este o direcție importantă de cercetare în laboratorul nostru.”