Brave lansează „Cookiecrumbler” open source
Brave a lansat în format open-source un nou instrument numit „Cookiecrumbler”, care utilizează modele lingvistice mari (LLM) pentru a detecta notificările de consimțământ privind cookie-urile, fără a afecta funcționalitatea site-ului anunță CyberInsider.
În plus, compania publică acum rezultatele accesării crawlerelor de site-uri web de către Cookiecrumbler pe GitHub, invitând comunitatea să contribuie la îmbunătățirea preciziei și acoperirii detectării.
Conform anunțului, motivația din spatele Cookiecrumbler este de a scala și rafina blocarea notificărilor privind cookie-urile de către Brave fără daunele colaterale pe care regulile de filtrare generice le provoacă adesea – cum ar fi machete defecte, funcționalitate lipsă a site-ului și probleme de randare.
Browserul Brave blochează implicit bannerele de consimțământ privind cookie-urile pe toate site-urile web din 2022, dar a constatat că blocarea bannerelor de consimțământ poate cauza probleme site-ului web care perturbă grav și degradează utilizabilitatea site-ului.
Brave Software Inc., cunoscută pentru browserul său bazat pe Chromium, axat pe confidențialitate, și-a creat o nișă prin integrarea blocării tracker-elor, a actualizărilor HTTPS și a protecțiilor anti-amprentă direct în browser. Bannerele de consimțământ pentru cookie-uri au fost o sursă constantă de frustrare a utilizatorilor, iar Brave a poziționat eliminarea lor ca o extensie logică a filozofiei sale privind confidențialitatea. Însă, spre deosebire de abordările convenționale care se bazează pe reguli generalizate de filtrare a reclamelor, Cookiecrumbler permite Brave să detecteze și să gestioneze bannerele cookie într-un mod specific site-ului, neinvaziv.
Cum funcționează
Cookiecrumbler automatizează detectarea notificărilor privind cookie-urile folosind un LLM implementat pe infrastructura backend a Brave. Instrumentul identifică bannerele cookie probabile prin analizarea elementelor HTML din randările live ale site-urilor în Puppeteer ( un instrument de browser) lansat din diverse proxy-uri regionale pentru a simula diferite geolocații. Acest lucru permite detectarea notificărilor specifice limbii și regiunii, inclusiv implementări în afara limbii engleze, care sunt adesea omise de metodele tradiționale.
Fiecare scanare a site-ului web începe cu o versiune a listei de popularitate a site-urilor adaptată regiunii, Tranco. Scripturile de crawling vizitează apoi fiecare site și invocă API-ul Cookiecrumbler. Instrumentul evaluează pagina, identifică potențialele bannere cookie, le clasifică folosind LLM și, opțional, recomandă strategii de atenuare. Aceste rezultate sunt apoi revizuite de către administratorii umani ai listei de filtre pentru a preveni blocarea excesivă și a asigura acuratețea înainte de implementare.
Este important de menționat că Brave publică rezultatele acestor accesări cu crawlere – inclusiv notificările privind cookie-urile detectate și metadatele relevante – pe GitHub. Această abordare își propune să obțină validare și corecție prin crowdsourcing din partea comunității mai largi pentru metodele de blocare a reclamelor și confidențialitate. Brave raportează, de asemenea, o scădere măsurabilă a reclamațiilor privind erorile și o creștere a retenției utilizatorilor în urma utilizării interne a Cookiecrumbler.
Deoarece Cookiecrumbler este open-source și gratuit prin GitHub, acesta poate fi utilizat direct de alți dezvoltatori de instrumente de confidențialitate, auditori de site-uri web, administratori de liste de blocare a reclamelor sau chiar utilizatori pricepuți la tehnologie care doresc să genereze sau să își îmbunătățească propriile reguli de filtrare.
Deși Cookiecrumbler funcționează în prezent în întregime pe serverele Brave, echipa explorează posibilitatea de a integra capabilitățile sale în browserul însuși, însă după analiza recenziilor privind confidențialitatea. Acest lucru ar aduce detectarea inteligentă a bannerelor de cookie direct pe dispozitivele utilizatorilor, permițând potențial blocarea în timp real, cu respectarea confidențialității, fără a se baza pe liste de filtre terțe.
Confidențialitatea rămâne o prioritate pentru Brave
Fiind un software axat pe confidențialitate, anunțul Brave subliniază mai multe aspecte legate de modul în care funcționarea Cookiecrumbler nu expune detalii sensibile.
În primul rând, se clarifică faptul că Cookiecrumber rulează în întregime pe backend-ul Brave și nu pe browserul utilizatorului, ceea ce înseamnă că nicio dată a utilizatorului nu este implicată în procesul său de detectare și analiză.
În al doilea rând, instrumentul nu interacționează cu sesiunile reale ale utilizatorului; în schimb, folosește proxy-uri și crawlere automate pentru a simula navigarea din diferite regiuni folosind liste de site-uri publice precum Tranco.
În cele din urmă, păstrarea confidențialității este principalul motiv pentru care Cookiecrumbler nu este în prezent integrat în browserul Brave, ci este utilizat intern ca instrument backend pentru analiză.