Instrumentele AI de colectare a datelor au devenit o amenințare existențială pentru Wikipedia

Aplicatie Wikipedia
Credit foto: Geralt/Pixabay

Oficiali ai fundației non-profit Wikimedia, cea care operează Wikipedia, afirmă că din ianuarie 2024 a înregistrat o creștere de 50% a traficului de rețea generat de cereri pentru descărcarea de imagini și videoclipuri din catalogul său. Este vorba despre o creștere care vine în principal din partea programelor automate de tip scraper, utilizate de dezvoltatori pentru a colecta date necesare antrenării modelelor de inteligență artificială, anunță New Scientist.

Explozia fără precedent a traficului de internet obligă Wikimedia să cheltuie mai mulți bani pentru a furniza paginile Wikipedia și alte tipuri de conținut din centrele sale de date închiriate.

Fundația afirmă că 65% din traficul său de internet cel mai costisitor provine de la boți de scraping. Aceștia solicită adesea articole mai puțin populare, iar aceste cereri trebuie direcționate către centrele de date centrale, în loc să poată folosi cache-urile locale unde sunt stocate articolele populare.

„Acest volum mare de trafic provoacă perturbări constante echipei care se ocupă de fiabilitatea site-ului, și care trebuie să blocheze traficul uriaș generat de boți pentru a preveni problemele pentru cititorii noștri”, au declarat oficiali ai Fundației Wikimedia.

„Au existat mai multe rapoarte despre alte site-uri de conținut care suferă în același mod, dar când o organizație la fel de vizibilă și de importantă precum Wikimedia face o declarație publică, lumea începe să fie atentă”, subliniază Elena Simperl, cercetător în domeniul IA din cadrul King’s College London.

„Un lucru adesea trecut cu vederea în cazul conținutului public sau al celui cu licență liberă este că accesul la conținut este gratuit, dar infrastructura care îl susține nu este gratuită. Acea infrastructură costă mult, iar resursele și oamenii necesari pentru operarea ei trebuie să provină de undeva”, a adăugat cercetătoarea britanică pentru New Scientist.

Wikimedia vrea să reducă traficul generat de boți, însă folosește chiar ea inteligența artificială

Fundația Wikimedia a publicat un plan preliminar pentru a identifica dezvoltatorii din spatele boților de scraping, cu scopul de a reduce traficul automat generat de aceștia cu 30% .

În aceeași ordine de idei, Wikimedia se confruntă cu o concurență directă din partea chatboturilor AI care pot oferi răspunsuri rapide la întrebări dintr-o gamă extrem de largă de teme, chiar dacă răspunsurile generate de AI nu sunt întotdeauna corecte.

Deși site-urile Wikimedia nu au înregistrat o scădere semnificativă de trafic cauzată direct de AI, însă oficialii fundației s-au declarat îngrijorați de faptul că serviciile AI care „folosesc conținut Wikipedia pentru a oferi rezumate rapide generate automat” nu oferă, de obicei, citări corecte și „blochează accesul oamenilor la sursele originale de informație”.

Confor oficialilor fundației, există indicii clare că un anumit tip de conținut generat de AI a început deja să pătrundă în articolele Wikipedia.

Cu toate acestea, Fundația Wikimedia nu s-a declarat împotriva acestei tehnologii. În fapt, ea utilizează deja instrumente AI pentru a ajuta editorii umani să detecteze vandalismul, să aducă un plus de calitatea articolelor, să măsoare anumiți indici de vizibilitate și să sugereze îmbunătățiri ale conținutului.

Total
0
Shares
Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Citește si...