Companiile chineze de top își antrenează modelele de inteligență artificială în străinătate pentru a avea acces la cipurile Nvidia și a ocoli eforturile SUA de a împiedica dezvoltarea acestei tehnologii puternice. Conform Financial Times, Alibaba și ByteDance se numără printre grupurile tehnologice care își antrenează cele mai recente modele lingvistice de mari dimensiuni în centrele de date din Asia de Sud-Est.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Operator de date: „Este o alegere evidentă”
Două persoane care au cunoștințe în această materie au afirmat că a existat o creștere constantă a formării în locații offshore după ce, în aprilie, SUA au decis să restricționeze vânzările de H20, semiconductorii Nvidia destinați exclusiv pieței din China.
„Este o alegere evidentă să venim aici. Ai nevoie de cele mai bune cipuri pentru a forma cele mai avansate modele și totul este conform legii”, susține un operator de centru de date din Singapore.
În ultimul an, modelele Qwen de la Alibaba și Doubao de la ByteDance au devenit printre cele mai performante LLM-uri la nivel mondial. Qwen a devenit, de asemenea, adoptat la scară largă în afara Chinei de către dezvoltatori, deoarece este un model „deschis” disponibil gratuit.
Practica este conformă cu controalele de export ale SUA
Multe dintre aceste centre de date sunt echipate cu produse Nvidia de ultimă generație, similare cu cele utilizate de marile grupuri tehnologice americane pentru a antrena LLM-urile. Companiile chineze semnează de obicei un contract de închiriere pentru a utiliza centrele de date din străinătate deținute și operate de entități non-chineze.
Acest lucru este conform cu controalele de export ale SUA, deoarece „regula de difuzare” din era Joe Biden, concepută pentru a elimina această lacună, a fost eliminată de președintele Donald Trump la începutul acestui an. O excepție este DeepSeek, producător de modele AI de înaltă calitate și cu costuri reduse, care este antrenat pe plan intern.
Compania colaborează îndeaproape cu producătorii interni de cipuri, conduși de Huawei, pentru a optimiza și dezvolta următoarea generație de cipuri AI chinezești. Compania consideră parteneriatul cu DeepSeek ca un efort strategic de a-și promova sistemele de semiconductori și software pentru a fi adoptate pentru instruirea AI în toată țara.
China oferă energie ieftină pentru stimularea producției interne de cipuri AI
Instruirea LLM-urilor necesită o putere de calcul enormă pentru a procesa seturi de date masive, ceea ce face ca majoritatea grupurilor chineze să prefere produsele avansate ale Nvidia pentru această sarcină.
Sectorul tehnologic recomandat China oferă giganților tehnologici energie ieftină pentru a stimula producția internă de cipuri AI. Cu toate acestea, aceste companii apelează din ce în ce mai mult la cipuri chinezești fabricate local pentru „inferență”, atunci când sistemele AI răspund la solicitările utilizatorilor, ceea ce reprezintă o parte din ce în ce mai mare din volumul total de lucru al AI.
Companiile chineze extind, de asemenea, accesul la centrele de date din alte regiuni, cum ar fi Orientul Mijlociu. O constrângere este faptul că grupurile tehnologice chineze nu au voie să transfere date private în afara țării.
Aceasta înseamnă că, pentru a personaliza un model de AI pe baza datelor specifice furnizate de un client local, instruirea trebuie să rămână în China, potrivit specialiștilor din industrie.