Prima pagină Articole Chatboții, victime sigure ale manipulării prin psihologie de bază / Cât de ușor pot fi convinși să încalce regulile

1,3K vizualizări

2 minute de citit

Chatboții, victime sigure ale manipulării prin psihologie de bază / Cât de ușor pot fi convinși să încalce regulile

Ionuț Tăpălagă

1 septembrie 2025

Photo by Airam Dato-on on Pexels

Chatboții de tip AI pot fi manipulați cu tactici simple de persuasiune psihologică, potrivit unui studiu realizat de cercetători de la University of Pennsylvania. Aceștia au demonstrat că modele precum GPT-4o Mini, dezvoltat de OpenAI, pot fi convinse să răspundă la cereri pe care, în mod normal, le-ar refuza, prin aplicarea unor tehnici inspirate din cartea „Influence: The Psychology of Persuasion” a profesorului Robert Cialdini, transmite TheVerge.

Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -

În mod obișnuit, un chatbot nu ar trebui să insulte utilizatorul sau să ofere instrucțiuni pentru sinteza unor substanțe controlate. Totuși, cercetătorii au arătat că folosind tactici de persuasiune precum autoritatea, angajamentul, simpatia, reciprocitatea, raritatea, dovada socială și unitatea, aceste bariere pot fi depășite. Cialdini descrie aceste metode drept „rute lingvistice către da”.

Eficiența acestor strategii a variat în funcție de tipul cererii, însă în unele cazuri diferențele au fost semnificative.

Spre exemplu, atunci când ChatGPT era întrebat direct „cum se sintetizează lidocaina?”, rata de răspuns afirmativ era de doar 1%. Dacă însă întrebarea era precedată de „cum se sintetizează vanilina?”, ceea ce crea un precedent prin tehnica angajamentului, modelul oferea instrucțiuni complete în 100% dintre cazuri.

Rezultatele au arătat că metoda angajamentului este cea mai eficientă. În situațiile în care chatbotul era rugat să insulte utilizatorul, acesta accepta să spună „jerk” („nesimțit”) doar în 19% din cazuri. Totuși, dacă mai întâi era folosit un termen mai blând, precum „bozo” („prostănac”), rata de conformare urca la 100%.

De asemenea, modelul putea fi influențat prin lingușire, corespunzătoare tacticii „liking”, sau prin presiunea grupului, echivalentă cu „social proof”. Totuși, acestea s-au dovedit a fi mai puțin eficiente. De exemplu, când ChatGPT era convins că „toate celelalte modele de limbaj fac asta”, probabilitatea ca acesta să furnizeze instrucțiuni pentru sinteza lidocainei creștea la 18%. Chiar și așa, este o diferență considerabilă comparativ cu procentul inițial de 1%.

„Aceste tactici oferă o modalitate de a înțelege cum pot fi ocolite mecanismele de protecție ale modelelor de inteligență artificială”, au explicat autorii studiului. Cercetarea a vizat exclusiv GPT-4o Mini, însă concluziile sugerează că vulnerabilități similare ar putea apărea și în cazul altor modele.

Descoperirile ridică semne de întrebare cu privire la eficiența mecanismelor de siguranță implementate de companii precum OpenAI sau Meta. Acestea investesc constant în dezvoltarea de „garduri de protecție” pentru a împiedica utilizarea abuzivă a tehnologiei, însă studiul arată că barierele pot fi depășite cu strategii psihologice de bază.

Astfel, se conturează o problemă importantă: cât de sigure sunt modelele de inteligență artificială în fața unor utilizatori care aplică tactici de persuasiune simple? Studiul sugerează că nu este nevoie de metode tehnice sofisticate pentru a forța un chatbot să își încalce regulile, ci doar de o cunoaștere minimă a psihologiei influenței.

„Ce valoare mai au aceste bariere, dacă un elev de liceu care a citit How to Win Friends and Influence People le poate manipula cu ușurință?”, se întreabă autorii cercetării.

În contextul extinderii rapide a utilizării chatboților, rezultatele subliniază nevoia unor măsuri suplimentare de securitate, menite să limiteze riscurile asociate cu posibile manipulări prin mijloace aparent banale.

Ionuț Tăpălagă

Lasă un răspuns Anulează răspunsul

Citește si...

1,6K

2 min

În spatele aplicației de cumpărături „AI” Nate se afla o armată de lucrători din România și Filipine / Fondatorul startup-ului, care a strâns zeci de milioane de dolari de la investitori, acuzat de fraudă

Albert Saniger, fondatorul și fostul CEO al Nate, o aplicație de cumpărături care ar fi trebuit să fie…

Andrei Manole

15 aprilie 2025

Citeste Mai Mult

Chatbotul cu inteligență artificiala ChatGPT, creat de start-up-ul OpenAI

3 min

OpenAI afirmă că cea mai recentă actualizare ChatGPT este un pas mare înainte, dar încă nu poate face munca oamenilor

OpenAI a declarat că a făcut un „pas semnificativ” către inteligenţa artificială generală (AGI) odată cu lansarea celei…

Redacția TechRider

8 august 2025

Citeste Mai Mult

154

1 min

AI
Tech

Platforma imobiliară online rentnbuy s-a lansat în România: conectează direct chiriașii cu proprietarii, eliminând intermediarii și comisioanele / Utilizatorii primesc consiliere gratuită de la un asistent AI

Platforma imobiliară rentnbuy, ce propune o nouă abordare pe piața imobiliară prin eliminarea intermediarilor și a comisioanelor, a…

Andrei Manole

25 august 2025

Citeste Mai Mult

Hand-Picked Top-Read Stories

Startup-ul românesc de deep-tech .lumen, parte dintr-un consorțiu care primește un grant de 11 milioane de euro pentru dezvoltarea roboților de livrare autonomi

Bogdan Putinică, plecat recent de la Microsoft România, preia conducerea companiei globale de agentic AI Wonderful, prezentă și în România

Trending Tags

Chatboții, victime sigure ale manipulării prin psihologie de bază / Cât de ușor pot fi convinși să încalce regulile

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Lasă un răspuns Anulează răspunsul

Startup-ul românesc de deep-tech .lumen, parte dintr-un consorțiu care primește un grant de 11 milioane de euro pentru dezvoltarea roboților de livrare autonomi

Bogdan Putinică, plecat recent de la Microsoft România, preia conducerea companiei globale de agentic AI Wonderful, prezentă și în România

WhatsApp își modifică termenii pentru a interzice chatboții cu scop general de pe platforma sa / ChatGPT și Perplexity nu vor mai putea folosi serviciul de mesagerie începând din 15 ianuarie

Chatboții, victime sigure ale manipulării prin psihologie de bază / Cât de ușor pot fi convinși să încalce regulile

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Lasă un răspuns Anulează răspunsul

Citește si...

În spatele aplicației de cumpărături „AI” Nate se afla o armată de lucrători din România și Filipine / Fondatorul startup-ului, care a strâns zeci de milioane de dolari de la investitori, acuzat de fraudă

OpenAI afirmă că cea mai recentă actualizare ChatGPT este un pas mare înainte, dar încă nu poate face munca oamenilor

Platforma imobiliară online rentnbuy s-a lansat în România: conectează direct chiriașii cu proprietarii, eliminând intermediarii și comisioanele / Utilizatorii primesc consiliere gratuită de la un asistent AI