Ceea ce odinioară era sediul unei biserici creștine scientiste, este acum Sfântul Graal al istoriei internetului — Internet Archive, o bibliotecă non-profit administrată de un grup de ingineri software și bibliotecari, care de aproape 30 de ani salvează internetul pagină cu pagină, scrie canalul de știri CNN, conform G4Media.

La doar câteva străzi distanță de Presidio din San Francisco, parcul național situat la baza podului Golden Gate, se află o clădire albă strălucitoare, cu fațada împodobită cu opt coloane gotice impresionante.

În interiorul sanctuarului împodobit cu vitralii, sunetele predicilor bisericești au fost înlocuite de zumzetul serverelor, unde Wayback Machine al Internet Archive păstrează paginile web.

Wayback Machine, un instrument folosit de milioane de oameni în fiecare zi, s-a dovedit esențial pentru academicieni și jurnaliști care caută informații istorice despre ceea ce corporațiile, oamenii și guvernele au publicat online în trecut, mult după ce site-urile lor web au fost actualizate sau modificate.

Pentru mulți, Wayback Machine este ca o istorie vie a internetului și tocmai a înregistrat luna trecută cea de-a trilionă pagină.

Arhivarea web-ului este mai importantă și mai dificilă ca niciodată. În ianuarie, Casa Albă a ordonat eliminarea unui număr mare de pagini web ale guvernului. Între timp, inteligența artificială estompează granița dintre ceea ce este real și ceea ce este generat artificial — înlocuind, într-un fel, necesitatea de a vizita site-urile web. Și o parte din internet este acum ascunsă în spatele paywall-urilor sau ascunsă în conversațiile cu chatbot-urile AI.

Sarcina Internet Archive este de a găsi o soluție pentru a păstra toate aceste informații.

„Suntem aici pentru a încerca să oferim o înregistrare a ceea ce s-a întâmplat, astfel încât oamenii să poată învăța și să se bazeze pe aceasta pentru a construi un viitor mai bun sau pentru a dezvolta idei noi care merită să fie incluse în biblioteca (Internet Archive)”, a declarat fondatorul Internet Archive, Brewster Kahle.

Biblioteca internetului

Kahle a creat arhiva în 1996, când paginile salvate într-un an puteau încăpea pe hard disk-uri de aproximativ 2 terabytes, cantitatea de spațiu de stocare pe care o poți obține astăzi pe un iPhone. Acum, arhiva salvează aproape 150 de terabytes, sau sute de milioane de pagini web, pe zi.

Kahle este forța motrice și personalitatea din spatele arhivei, cu exuberanța și energia profesorului tău preferat de științe și ca un evanghelist a cărui religie este bibliotecile și tehnologia. Așezat pentru un interviu pe băncile originale din lemn ale bisericii, Kahle a spus că a fost inspirat să cumpere clădirea deoarece seamănă cu logo-ul grupului. Dar, mai important, el a spus că este un simbol al permanenței și o referință la Biblioteca din Alexandria din Egipt.

„A fost prima dată când cineva a încercat să adune tot ce a fost scris vreodată de oameni”, a spus Kahle. „Desigur, acum acel loc este internetul, iar Internet Archive servește întregului internet ca o bibliotecă.”

Instrumentul Wayback Machine face mai mult decât să facă capturi de ecran ale paginii. De asemenea, salvează arhitectura tehnică – codurile HTML, CSS, JavaScript și altele – astfel încât să poată încerca să „redă pagina așa cum a existat”, chiar dacă serverul nu mai funcționează, a spus Mark Graham, directorul Wayback Machine.

Apariția inteligenței artificiale și a chatbot-urilor AI înseamnă că Internet Archive schimbă modul în care înregistrează istoria internetului. În plus față de paginile web, Internet Archive capturează acum conținut generat de AI, cum ar fi răspunsurile ChatGPT și rezumatele care apar în partea de sus a rezultatelor căutării Google.

Echipa Internet Archive, formată din bibliotecari și ingineri software, experimentează modalități de a păstra modul în care oamenii obțin știrile de la chatbot-uri, venind cu sute de întrebări și solicitări în fiecare zi pe baza știrilor și înregistrând atât întrebările, cât și răspunsurile, a spus Graham.

Grupul păstrează copii ale arhivei sale în locații din întreaga lume, în cazul unui incendiu sau al unei inundații care ar putea deteriora serverele sale. Dar există și considerente politice în spatele acestei abordări. Administrația Trump a exercitat presiuni asupra conținutului cu care nu este de acord, intentând procese împotriva companiilor media sau prin intermediul Comisiei Federale de Comunicații.

„Bibliotecile sunt întotdeauna ținta criticilor. Noii veniți nu agreează adesea lucrurile vechi. Așadar, să ne adaptăm la această situație”, a afirmat Kahle. „Să profităm de acest moment și să facem în așa fel încât să existe diferite puncte de vedere stocate și accesibile permanent în diferite medii.”

Administrația Trump a implementat o revizuire masivă a site-urilor web guvernamentale, care a inclus eliminarea a numeroase pagini despre diverse subiecte, de la politici de sănătate până la realizările membrilor minorităților din armată. Arhiva, care a salvat pagini web în timpul tranziției site-urilor web ale administrației prezidențiale din 2004, a permis jurnaliștilor să înțeleagă ce a fost modificat.

„Această schimbare a fost uriașă. Secțiuni întregi ale web-ului au fost eliminate”, a spus Kahle. „(Administrația) are un nou punct de vedere și de aceea avem biblioteci care să păstreze înregistrările.”

Oamenii care păstrează web-ul

Majoritatea serverelor arhivei se află într-un depozit mare în afara orașului San Francisco, deși o serie de servere au fost amplasate simbolic în sanctuarul principal al fostei biserici. Această amplasare este intenționată, a spus Kahle. Prin expunerea serverelor, el speră „ca oamenii să înțeleagă că suntem cu toții parte a protecției colective a cunoștințelor noastre”.

Sediul central este un omagiu adus muncii celor 200 de angajați ai Internet Archive, printre care se numără ingineri, bibliotecari și arhiviști.

Arhiviștii folosesc mașini specializate pentru a digitaliza cărțile pagină cu pagină, transmisiunea în direct a muncii lor pe YouTube pentru ca toată lumea să o poată vedea (însoțită de muzică lo-fi). Pick-up-urile redau melodii vintage din anii 1920 și 1940, iar clădirea găzduiește toate tipurile de console media pentru orice tip de conținut imaginabil, de la microfilme la CD-uri și televiziune prin satelit. (Internet Archive păstrează și muzică, programe de televiziune, cărți și jocuri video).

Sanctuarul principal al fostei biserici se mândrește, de asemenea, cu peste 100 de statui de un metru înălțime ale angajaților care lucrează aici de cel puțin trei ani – o referință la faimoasa armată chineză de teracotă de acum mii de ani.

În anumite privințe, spațiul surprinde ciudățenia – și comunitatea – internetului în sine.

„Sunt mulți oameni care sunt pur și simplu pasionați de această cauză. Există o atmosferă cyberpunk”, a spus Annie Rauwerda, editor Wikipedia și influencer pe rețelele sociale, la o petrecere organizată la sediul Internet Archive pentru a sărbători atingerea unui trilion de pagini. „Internetul (pare) destul de corporativ când îl folosesc mult în zilele noastre, dar nu ți-ai da seama din oamenii de aici.”

Sediul central poate părea o expoziție de istorie vie. Dar obiectivul Internet Archive, spune Kahle, este de a păstra web-ul astfel încât acesta să poată avea în continuare un viitor, nu de a fi arbitrii adevărului.

„Nu este o prezentare. Nu este un muzeu care are o poveste”, a spus el. „Încearcă să fie o resursă pentru ca alți oameni să poată veni cu propriile lor idei.”