Startupul chinez DeepSeek a anunțat o versiune îmbunătățită a modelului său de inteligență artificială, R1, care oferă progrese importante în capacitatea de raționare, precizie și rezolvare a sarcinilor logice. Noua versiune, denumită DeepSeek-R1-0528, este prezentată ca fiind mai eficientă în matematică, programare și logică generală și ca având o rată mai scăzută de halucinații – un aspect esențial pentru fiabilitatea modelelor AI, transmite Bloomberg.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Potrivit companiei, DeepSeek-R1-0528 se apropie acum de performanțele unor modele de top precum OpenAI o3 și Google Gemini 2.5 Pro. „Performanța sa generală se apropie acum de cea a modelelor de vârf”, a transmis DeepSeek într-un mesaj publicat pe platforma Hugging Face.
Modelul R1 original a fost lansat în ianuarie 2025 și a atras atenția industriei globale de tehnologie prin capacitatea sa de a concura cu sisteme dezvoltate de companii americane mult mai mari, dar la un cost semnificativ mai redus. Succesul R1 a fost perceput drept un moment de cotitură în cursa globală pentru dominația în domeniul inteligenței artificiale, impulsionând și alți actori chinezi, precum Alibaba, Zhipu AI și Tencent, să accelereze propriile lansări de modele.
DeepSeek are sediul în Hangzhou și a devenit rapid un nume proeminent în peisajul AI din China. Fondatorul său, Liang Wenfeng, a devenit o figură publică importantă, fiind invitat în februarie de președintele Xi Jinping la o întâlnire de rang înalt alături de antreprenori precum Jack Ma (Alibaba) și Pony Ma (Tencent).
Versiunea îmbunătățită R1-0528 a fost anunțată cu doar câteva ore înainte ca Nvidia, liderul mondial în producția de cipuri pentru AI, să publice cele mai recente rezultate financiare. Lansarea R1 în ianuarie a avut un impact negativ inițial asupra valorii acțiunilor Nvidia, însă piața și-a revenit rapid, pe fondul cererii continue pentru infrastructură de calcul AI. Compania americană a oferit recent și o prognoză solidă pentru trimestrul curent.
Anunțul DeepSeek vine într-un moment de intensă competiție între companiile chineze și cele americane în dezvoltarea modelelor mari de limbaj (LLM). Lansările recente din China includ:
Tencent, care a dezvăluit un model open source pentru conversia imaginilor în videoclipuri.
Xiaomi, care a intrat în domeniul AI cu un model de tip similar DeepSeek.
Alibaba, care a lansat un nou model emblematic în contextul unei „curse post-DeepSeek”.
Baidu, care a actualizat modelele Ernie și a redus prețurile.
Zhipu AI, care a lansat un agent AI gratuit, ca răspuns la DeepSeek.
Noua versiune DeepSeek-R1-0528 este disponibilă pe Hugging Face, una dintre cele mai populare platforme pentru testarea și distribuirea modelelor AI. Compania nu a oferit detalii despre arhitectura exactă a modelului sau despre volumul de date utilizat, dar susține că progresul său confirmă viabilitatea unor abordări mai eficiente din punct de vedere al costurilor în dezvoltarea AI de înaltă performanță.