Reddit limitează accesul Internet Archive la conținutul său, după ce a descoperit că unele companii din domeniul inteligenței artificiale au extras date din Wayback Machine pentru a le utiliza în scopuri ce încalcă politicile platformei, conform TheVerge.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Potrivit purtătorului de cuvânt al companiei, Tim Rathschmidt, restricțiile vizează blocarea indexării paginilor detaliate ale postărilor, comentariilor și profilurilor de utilizatori. Astfel, Internet Archive va putea arhiva doar pagina principală Reddit.com, ceea ce se traduce prin păstrarea unor informații limitate despre ce postări și titluri au fost populare într-o anumită zi. „Internet Archive oferă un serviciu internetului liber, dar am aflat despre cazuri în care companiile de AI încalcă politicile platformei, inclusiv pe ale noastre, și extrag date din Wayback Machine”, a declarat Rathschmidt.
Misiunea Internet Archive este de a păstra o arhivă digitală a site-urilor web și a „altor artefacte culturale”, iar Wayback Machine este instrumentul care permite vizualizarea versiunilor anterioare ale paginilor. Totuși, reprezentanții Reddit susțin că nu tot conținutul ar trebui arhivat, mai ales atunci când există riscuri privind confidențialitatea utilizatorilor. „Până când vor putea să-și securizeze site-ul și să respecte politicile platformei (de exemplu, respectarea confidențialității utilizatorilor prin ștergerea conținutului eliminat), le vom limita accesul la datele Reddit pentru a proteja utilizatorii”, a precizat Rathschmidt.
Implementarea restricțiilor începe treptat începând de astăzi.
Reddit afirmă că a informat Internet Archive înainte de introducerea măsurilor și că în trecut și-a exprimat îngrijorarea privind posibilitatea de extragere a conținutului de pe Wayback Machine.
Această decizie se înscrie într-o serie de acțiuni similare prin care Reddit a limitat accesul la datele sale.
În contextul creșterii utilizării conținutului online pentru instruirea modelelor AI, compania a început să blocheze uneltele de scraping și să solicite plata pentru furnizarea de date. În 2024, Reddit a încheiat un acord cu Google pentru a permite accesul atât la datele necesare indexării în Google Search, cât și la cele destinate antrenării modelelor de inteligență artificială. Câteva luni mai târziu, platforma a început să restricționeze accesul motoarelor de căutare majore dacă acestea nu plătesc.
Modificările controversate aduse API-ului în 2023, care au dus la închiderea unor aplicații terțe și la proteste ale utilizatorilor, au fost justificate de companie prin faptul că aceste interfețe erau folosite pentru a antrena modele AI fără acordul său.
Pe lângă acordul cu Google, Reddit a încheiat și un parteneriat cu OpenAI, însă în iunie 2025 a dat în judecată compania Anthropic, susținând că aceasta continua să extragă date de pe platformă chiar și după ce declarase că a încetat.
De cealaltă parte, Mark Graham, directorul Wayback Machine, a declarat pentru The Verge: „Avem o relație de lungă durată cu Reddit și continuăm discuțiile pe această temă.”
Prin aceste măsuri, Reddit își continuă strategia de control asupra modului în care conținutul generat de utilizatori este utilizat de terți, în special în contextul creșterii cererii de date pentru antrenarea inteligenței artificiale.