O inovație majoră în domeniul AI promite să reducă consumul energetic și să aducă inteligența artificială mai aproape de utilizatorii de rând, anunță TechXplore.
O echipă de cercetători de la Microsoft Research, în colaborare cu un coleg de la Universitatea Academiei Chineze de Științe, a dezvoltat un nou model de inteligență artificială care poate rula eficient pe procesoare CPU convenționale, fără a necesita costisitoarele plăci grafice (GPU) pe care se bazează majoritatea modelelor de tip ChatGPT. Lucrarea lor a fost publicată recent pe platforma arXiv.
De la supercalculatoare la laptopuri obișnuite
Modelele de limbaj de mari dimensiuni (LLM), precum cele din spatele chatbot-urilor inteligente, au devenit omniprezente în ultimii ani. Totuși, ele presupun un consum uriaș de energie, deoarece antrenarea și rularea lor implică volume masive de date și hardware performant, în special plăci grafice de înaltă performanță. Aceste cerințe au dus la îngrijorări legate de impactul asupra mediului, dat fiind consumul enorm al centrelor de date.
În acest context, cercetătorii Microsoft propun o abordare revoluționară: un model AI care rulează eficient pe CPU-uri standard, reducând considerabil resursele necesare și, implicit, amprenta energetică.
O arhitectură minimalistă, dar performantă
Secretul acestei eficiențe stă într-o schimbare fundamentală: în locul valorilor numerice clasice (de tip float, pe 8 sau 16 biți), noul model folosește o arhitectură de doar 1 bit. Cu alte cuvinte, greutățile rețelei neuronale sunt codificate folosind doar trei valori posibile: -1, 0 și 1. Această simplificare permite înlocuirea operațiilor complexe cu simple adunări și scăderi, care pot fi realizate cu ușurință de orice procesor obișnuit.
Rezultatul? Un model de inteligență artificială care, în testele de performanță, a reușit să rivalizeze cu modele echivalente care rulează pe GPU și, în unele cazuri, chiar să le depășească, folosind în același timp mult mai puțină memorie și energie.
BitNet – AI pentru toți?
Pentru a pune în funcțiune acest nou tip de model, cercetătorii au dezvoltat și un mediu de execuție special, numit bitnet.cpp, optimizat pentru a valorifica la maximum arhitectura pe 1 bit.
Modelul, denumit BitNet b1.58 2B4T, ar putea schimba radical modul în care folosim AI. În loc să depindem de centre de date uriașe și conexiuni rapide la internet, am putea ajunge să rulăm modele AI local, direct pe computerul personal sau chiar pe un smartphone. Pe lângă economia de energie, un astfel de scenariu ar aduce și avantaje importante în materie de confidențialitate și securitate a datelor.
Un pas spre democratizarea inteligenței artificiale
Dacă rezultatele promițătoare se confirmă și la scară largă, BitNet ar putea deschide drumul către o eră în care inteligența artificială devine cu adevărat accesibilă oricui. De la educație și productivitate personală, până la aplicații medicale sau industriale, această tehnologie ar putea funcționa fără infrastructuri complexe și costuri prohibitive.
Pentru moment, rămâne de văzut cum va evolua proiectul și în ce măsură Microsoft va integra această inovație în produsele sale comerciale. Dar un lucru e clar, viitorul AI-ului s-ar putea scrie nu în centrele de date, ci chiar pe propriul tău laptop.