Cercetători de la Universitatea Penn State au dezvoltat o metodă prin care apelurile telefonice pot fi interceptate de la distanță folosind o combinație de radar cu unde milimetrice și inteligență artificială, ridicând probleme serioase de securitate și confidențialitate, conform InterestingEngineering.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Metoda detectează vibrațiile extrem de fine produse de difuzorul telefonului în timpul unui apel și le transformă în text. În teste, sistemul a reușit să capteze și să transcrie conversații de la până la trei metri distanță, cu o acuratețe de aproximativ 60%, pe un vocabular de până la 10.000 de cuvinte.
„Când vorbim la telefon, ignorăm de obicei vibrațiile care vin prin difuzor și fac ca întregul dispozitiv să vibreze”, a explicat Suryoday Basak, doctorand și autor principal al studiului. „Dacă surprindem aceste vibrații cu radare și folosim învățarea automată pentru a interpreta contextul, putem determina conversațiile întregi. Înțelegând ce este posibil, putem ajuta publicul să fie conștient de potențialele riscuri.”
Tehnologia folosește un senzor radar cu unde milimetrice – același tip utilizat în mașinile autonome, detectoarele de mișcare sau rețelele 5G – pentru a măsura vibrațiile de suprafață generate de sunet. Datele colectate, zgomotoase și de calitate scăzută, au fost procesate cu Whisper, un model AI open-source pentru recunoașterea vorbirii, adaptat special pentru semnalele radar.
Cercetătorii au aplicat o tehnică de adaptare cu rang redus, reantrenând doar 1% din parametrii modelului. Această abordare a permis îmbunătățirea performanței fără a reconstrui sistemul de la zero.
Proiectul este o continuare a unei cercetări din 2022, când echipa a reușit să recunoască cu până la 83% acuratețe doar 10 cuvinte predefinite. De această dată, tehnologia poate transcrie vorbire continuă, chiar dacă precizia este mai scăzută din cauza complexității datelor radar.
„Chiar și captarea parțială a cuvintelor, precum cuvintele-cheie, este utilă într-un context de securitate”, a declarat Mahanth Gowda, profesor asociat și coautor al studiului. El a comparat metoda cu citirea de pe buze, unde doar o parte din cuvinte sunt înțelese, dar contextul poate dezvălui informații sensibile.
Basak a avertizat că metoda este „tehnic fezabilă în anumite condiții” și ar putea fi exploatată de actori rău-intenționați. „Similar cu citirea de pe buze, ieșirea modelului, combinată cu informații de context, poate permite deducerea unor părți dintr-o conversație telefonică de la distanță.”