Cercetători de la Universitatea Penn State au dezvoltat o metodă prin care apelurile telefonice pot fi interceptate de la distanță folosind o combinație de radar cu unde milimetrice și inteligență artificială, ridicând probleme serioase de securitate și confidențialitate, conform InterestingEngineering.

Metoda detectează vibrațiile extrem de fine produse de difuzorul telefonului în timpul unui apel și le transformă în text. În teste, sistemul a reușit să capteze și să transcrie conversații de la până la trei metri distanță, cu o acuratețe de aproximativ 60%, pe un vocabular de până la 10.000 de cuvinte.

„Când vorbim la telefon, ignorăm de obicei vibrațiile care vin prin difuzor și fac ca întregul dispozitiv să vibreze”, a explicat Suryoday Basak, doctorand și autor principal al studiului. „Dacă surprindem aceste vibrații cu radare și folosim învățarea automată pentru a interpreta contextul, putem determina conversațiile întregi. Înțelegând ce este posibil, putem ajuta publicul să fie conștient de potențialele riscuri.”

Tehnologia folosește un senzor radar cu unde milimetrice – același tip utilizat în mașinile autonome, detectoarele de mișcare sau rețelele 5G – pentru a măsura vibrațiile de suprafață generate de sunet. Datele colectate, zgomotoase și de calitate scăzută, au fost procesate cu Whisper, un model AI open-source pentru recunoașterea vorbirii, adaptat special pentru semnalele radar.

Cercetătorii au aplicat o tehnică de adaptare cu rang redus, reantrenând doar 1% din parametrii modelului. Această abordare a permis îmbunătățirea performanței fără a reconstrui sistemul de la zero.

Proiectul este o continuare a unei cercetări din 2022, când echipa a reușit să recunoască cu până la 83% acuratețe doar 10 cuvinte predefinite. De această dată, tehnologia poate transcrie vorbire continuă, chiar dacă precizia este mai scăzută din cauza complexității datelor radar.

„Chiar și captarea parțială a cuvintelor, precum cuvintele-cheie, este utilă într-un context de securitate”, a declarat Mahanth Gowda, profesor asociat și coautor al studiului. El a comparat metoda cu citirea de pe buze, unde doar o parte din cuvinte sunt înțelese, dar contextul poate dezvălui informații sensibile.

Basak a avertizat că metoda este „tehnic fezabilă în anumite condiții” și ar putea fi exploatată de actori rău-intenționați. „Similar cu citirea de pe buze, ieșirea modelului, combinată cu informații de context, poate permite deducerea unor părți dintr-o conversație telefonică de la distanță.”