Nu mai este de mult o noutate că lansarea din 20 ianuarie 2025 a modelului AI open source DeepSeek R1 de către un proiect secundar de doar doi ani al unui fond de investiții din China a cutremurat lumea IT, a șters miliarde de dolari din cotațiile bursiere ale giganților IT și a frânat brusc multe proiecte de investiții în infrastructura pentru dezvoltarea inteligenței artificiale.
Una din figurile principale ale revoluției AI este compania Nvidia, care a suferit o pierdere de aproape 600 de miliarde de dolari din valoarea de piață într-o singură zi, un record pentru o companie listată la bursă. Nu vreau să aduc în discuție argumentele pentru eficiența în procesul de dezvoltare AI și nici paradoxul Jevons (în anumite circumstanțe, creșterea eficienței utilizării unei resurse poate duce la o creștere a consumului acesteia, în loc să-l reducă).
Aș vrea să aduc în discuție un posibil „Moment Intel”. La ce mă refer când spun Moment Intel? Mă refer la perioada începutului cu 2017. Aceasta a urmat perioadei 2010 – 2017 când Intel a dominat covârșitor piața CPU mondială, când AMD nu reușea să ridice nicio problemă cu generația Bulldozer de procesoare. Era aproape un monopol și Intel, dormind pe lauri, nu a băgat în seamă niște lupi înfometați în umbră.
A întârziat semnificativ în adoptarea ultimelor standarde și tehnologii de litografie și s-a chinuit să treacă pe pragul de 10 nm, rămânând mult în urma TSMC pe partea de fabricație.
Pe partea de proiectare a procesoarelor, îmbătat de succesul anterior și propria mantră potrivit căreia 4 nuclee cu 8 fire de execuție pe o arhitectură monolitică este maximul pe care și-l poate dori vreodată un utilizator.
Și pe acest front a surprins de AMD, care a venit pe piață cu un suflu nou, cu arhitectura bazată pe chiplet, care îi oferea o flexibilitate în oferta de procesoare pe care Intel nu a putut să o egaleze. Această flexibilitate a fost dublată și de creșteri susținute ale performanței.
Acea perioadă de dominație lungă a făcut compania Intel să se relaxeze și să ridice piciorul de pe pedala de accelerație în inovație, relaxare care a costat-o enorm și care a adus compania în situația dezastruoasă din prezent.
Ce trebuie amintit este că un ciclu de dezvoltare al unei serii de CPU sau GPU se măsoară în ani, având o lungime de cam 4-6 ani. Aici mă refer de la începutul etapei de proiectare până la lansarea propriu-zisă pe piață. Pe partea de litografie, de producție efectivă a procesoarelor, aceste cicluri sunt și mai lungi, astfel că o decizie greșită sau întârziată are efect pe perioade de până la 10 ani. Deși de la exterior această parte a industriei IT pare agilă, este foarte greu să pivotezi într-o direcție cu totul nouă odată ce ai pornit pe un drum anume.
Ce mă face la Nvidia să mă gândesc la Momentul Intel este noua generație Blackwell, cu vârful de gamă reprezentat de modelul RTX 5090.
Această generație, lansată în 2025, la mai bine de 2 ani după lansarea anterioarei generații Ada Lovelace, este produsă pe tehnologie 4NP de la TSMC, de 4 nm, care este o îmbunătățire a tehnologiei 4N folosită la generațiile anterioare Hopper și Ada Lovelace.
În prezent, la TSMC, cea mai avansată tehnologie în uz este N3 de 3 nm. Nvidia are deja un istoric de tratament prost în relațiile sale cu partenerii și furnizorii, producătorii de cipuri pe care îi tratează cu aroganță și nu are grijă de construirea unei relații de colaborare de lungă durată cu aceștia. Acest renume îi închide ușile când vine vorba de priorități. TSMC prezintă și lansează cele mai noi și avansate tehnologii mai întâi cu colaboratori precum Apple și AMD, cu care are relații comerciale mult mai bune.
În tehnologia de producție nu a făcut un salt, ci doar a beneficiat de un rafinament al acestui proces. Lipsa accesului la cel mai avansat nod de producție este unul din motivele pentru care nu a putut obține salturi importante de performanță cum a reușit în trecut.
Analizând specificațiile tehnice comparativ cu vârful de gamă anterior, și anume 4090, observăm un trend și ni se sugerează avansul pe care l-ar putea avea. 92,2 miliarde de tranzistori modelul 5090 față de 76,3 miliarde modelul 4090, nuclee SM/CU 170 la 5090 față de 128 generația anterioară, GPU shaders avem 21.760 la 5090 față de 16.384 la 4090, nuclee Tensor/AI 680 pentru 5090 față de 512 pentru 4090.
În ceea ce privește memoria, la capacitate avem 32 GB la 5090 față de doar 24 întâlnite la 4090. Aici avem un avans major, memoria folosită este GDDR7 față de memoria GDDR6X folosită la 4090, care duce la o lățime de bandă crescută cu 70%.
În medie, sunt creșteri de 30% față de generația anterioară, care corelate cu păstrarea tehnologiei de fabricație, au dus și la creșterea dimensiunilor cipului propriu-zis.
Din punct de vedere al vitezei, frecvenței de lucru ale GPU-ului, avem totuși o scădere, de la un Boost clock de 2.520 MHz pentru 4090 la 2.407 MHz pentru noul 5090. La consum, vedem cu dezamăgire un spor. Modelul 5090 consumă 575 Wați față de „doar” 450 pentru modelul 4090.
În toate recenziile publicațiilor independente și canalelor de specialitate de media, câștigul de performanță testat a fost de doar 30% în jocuri și producție video și între 30 și 45% în aplicații de inteligență artificială.
Aceste performanțe i-au câștigat renumele zeflemitor de 4090 TI din partea unor bloguri.
Pentru cei care nu știu, o să explic care este aluzia cu TI (prescurtare de la Titanium). Toți producătorii de cipuri folosesc binningul. Binning este o procedură prin care sunt testate după fabricație toate cipurile pentru a vedea dacă se încadrează în plaja de performanță așteptată pentru fiecare model. Cele care se încadrează în plaja superioară de performanță sunt oprite pe stoc, cele din clasa medie se duc către clienți și cele care sunt sub așteptări le sunt dezafectate/blocate anumite părți ale cipului și vândute ca model din clasa inferioară.
În trecut, Nvidia își lansa primele vârfuri de gamă și aștepta și competitorii să își lanseze produsele, după care, cu cipurile care performau superior în teste, le aplicau un mod turbo cu creșterea frecvenței de lucru sau prin creșterea consumului de energie ca să obțină creșteri de performanță de 10-15 sau chiar 20%, sporuri care îi ajutau să rămână în frunte în clasamente. Aceste modele supra-turate aveau afixul de TI (titanium) în denumirea modelului.
Tot acest spor de 30% în numărul de nuclee, tranzistori etc. a venit și cu o creștere de preț, de 30%. De la 1.599 dolari preț recomandat de producător la 1.999 de dolari.
Nu vreau să zic că produsul 5090 este un produs slab, departe de mine acest gând. Utilizatorii individuali cu buzunare largi vor alerga după această creștere de performanță. Cercetătorii AI și start-upurile și-ar vinde un rinichi ca să poată achiziționa un astfel de card. Doar creșterea la 32 GB la cantitatea de memorie și creșterea considerabilă a lățimii de bandă cu 70% reprezintă un aport enorm pentru AI, care are nevoie de multă memorie pentru rularea modelelor de inteligență artificială.
Ce am căutat cu lupa și totuși nu am găsit a fost inovația. În trecut, Nvidia a obișnuit piața cu câștiguri considerabile de performanță și inovație, astfel că păstrarea vechilor modele se dovedea inutilă și ineficientă și te lipseau de noile tehnologii.
S-a păstrat aceeași tehnologie de producție și avem o arhitectură nouă, dar totuși nu s-a obținut o îmbunătățire evidentă. Adică, așa grosso modo, dacă iau un patent și tai 30% dintr-un procesor de 4090 și îl lipesc cu aracet la un altul cam obțin un 5090. Evident că exagerez, dar cam asta a făcut Nvidia.
Consumul de energie este crescut proporțional cu creșterea în dimensiuni și nu poate afirma că a câștigat în eficiență. Minus inovație și pe partea aceasta într-o lume tot mai însetată de energie.
Pe partea de procesare AI (inteligență artificială) se observă progres, dar nu unul care să trezească admirație.
Cu acest produs, Nvidia aleargă după doi iepuri mai mici, piața de jocuri video și producția video, și unul foarte mare, și anume inteligența artificială.
Tratamentul urât pe care îl aplică furnizorilor și partenerilor l-a extins în ultimii ani și către clienți. Dacă la începuturi lansa produse noi cu sporuri de performanță considerabile, menținând prețul la fiecare categorie de produs la ultimele 4 generații, a început să crească prețul nejustificat din punct de vedere economic, adică fără a fi provocat de inflație sau creșteri de costuri, ci doar că a putut crește prețul, bazându-se pe concurența slabă, lăsând clienții cu un sentiment de găină jumulită, agresată la portofel. Este tot mai evident că la Nvidia lăcomia a devenit unul dintre principalele motoare.
Deși încă sunt destui clienți care cumpără numele Nvidia, care a fost și încă este egal cu performanța de top, tot mai mulți încep să cântărească mai atent alternativele.
În seria 4000, Nvidia a vândut modelul 4090 și produsele pentru datacenter pe cât de repede au putut să le asambleze, aducând munți de bani în pușculiță, însă modelele pentru nivelul mediu sau entry level pentru pasionații de jocuri video, adică de la 4070, 4060 și 4050, au prins rugina la propriu pe rafturi.
Pericolul nu o să vină doar din partea AMD sau Intel. Google a anunțat în decembrie 2024 TPU Trillium (tensor processing unit), procesor specializat pentru inteligența artificială, ca fiind disponibil, adică deja este la lucru în data centerele proprii. Open AI nu a ascuns niciodată intenția și deja lucrează la procesorul propriu, intenționând chiar să aibă și o fabrică de procesoare proprie, adică să nu controleze doar designul, ci și producția efectivă a acestora.
Rapoartele financiare ale ultimului trimestru arată că peste 88% din producția de cipuri Nvidia s-a dus către centrele de date pentru inteligența artificială. Produsele din noua serie 5000 adresate clienților individuali s-au dovedit a fi în cantitate foarte mică și unele din aceste produse pe care doar un număr foarte mic de clienți au reușit să le achiziționeze s-au descoperit că nu întrunesc specificațiile, adică au mai puține nuclee. Această lansare, care este doar de imagine de marketing, produsele lipsind din piață, ne arată că Nvidia se concentrează doar pe segmentul centrelor de date și ce nu poate vinde către acestea, direcționează către restul consumatorilor individuali. Deși are contracte și colaborări și cu piața auto și încercări de a extinde paleta de produse oferite, aceste ultime mișcări ale companiei ne arată o lipsă de viziune pe termen lung și concentrarea acesteia pe câștigurile masive din prezent pe un singur produs.
Pe lângă asta, momentul DeepSeek mai înseamnă că nu doar puterea nemărginită de procesare informatică contează, pentru care vom fi nevoiți să repornim reactoare nucleare ca să le alimentăm, ci se readuce în discuție eficiența, adică a obține cât mai mult cu resurse limitate.
Nvidia a beneficiat de 2 valuri de mining pentru criptomonede și un val de vânzări accelerat de pandemie. Acum călărește un al patrulea val, și mai mare, împins de progresul inteligenței artificiale. Întrebarea este dacă va fi în stare să învețe din momentul Intel, acum la pragul DeepSeek.