Într-un regres semnificativ pentru eforturile Chinei de a deveni independentă din punct de vedere tehnologic, compania chineză de inteligență artificială DeepSeek a fost nevoită să amâne lansarea noului său model R2, după ce a întâmpinat probleme critice în timpul procesului de antrenare a acestuia cu cipuri Ascend de la Huawei, transmite Financial Times.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Potrivit unor surse familiarizate cu situația, autoritățile de la Beijing au încurajat DeepSeek să utilizeze cipurile Huawei pentru a reduce dependența de tehnologia americană, în special de cea a Nvidia. Cu toate acestea, problemele tehnice persistente apărute în timpul procesului de antrenare a modelului R2 – etapa crucială în care AI învață din seturi vaste de date – au obligat DeepSeek să revină la cipurile Nvidia pentru antrenare și să utilizeze cipurile Huawei doar pentru „inferență”, sarcina mai puțin solicitantă de utilizare a unui model antrenat.
Probleme tehnice și decalajul față de Nvidia
Dificultățile întâmpinate de DeepSeek subliniază decalajul considerabil care există încă între cipurile fabricate în China și cele americane. Specialiști din industrie au remarcat că cipurile chinezești suferă de probleme de stabilitate, conectivitate inter-cip mai lentă și software inferior în comparație cu produsele Nvidia.
În ciuda faptului că Huawei a trimis o echipă de ingineri la sediul DeepSeek, compania nu a reușit să finalizeze cu succes un ciclu de instruire pe cipul Ascend. Această dependență de Nvidia este o problemă mai amplă, întrucât, potrivit unor informații, Beijingul a cerut companiilor chineze de tehnologie să justifice comenzile de cipuri H20 de la Nvidia, în efortul de a promova alternative interne.
Deși cercetătorul în domeniul Ritwik Gupta a recunoscut că Huawei se confruntă cu „dificultăți de creștere” în utilizarea Ascend pentru instruire, el consideră că este „o chestiune de timp” până când compania se va adapta.
Cu toate acestea, întârzierea a costat DeepSeek timp prețios, fondatorul Liang Wenfeng exprimându-și nemulțumirea internă față de progresul R2 și insistând pentru un model și mai avansat pentru a menține poziția bună a companiei în domeniu.
Citește și: Ce noutăți aduce GPT-5 / Îmbunătățiri tehnice, funcții noi și o actualizare incrementală