Computerul DGX Spark AI al NVIDIA, prezentat la începutul acestui an, va fi pus în vânzare la prețul de 3.999 dolari, a anunțat compania. Deși relativ mic, acesta găzduiește întreaga platformă AI a companiei, inclusiv GPU-uri și CPU-uri, împreună cu pachetul de software AI al NVIDIA „într-un sistem suficient de mic pentru un laborator sau un birou”, a declarat NVIDIA.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Acesta este conceput pentru a oferi dezvoltatorilor, cercetătorilor și oamenilor de știință din domeniul datelor suficientă putere de calcul pentru a rula modele AI complexe. Printre primii destinatari ai computerelor se numără Anaconda, Google, Hugging Face, Meta și Microsoft.
Computerul desktop AI care încorporează o performanță de calcul de un petaflop și 128 GB de memorie unificată într-un format suficient de mic pentru a încăpea pe un birou. Cel mai mare avantaj al său este probabil memoria integrată de mare capacitate, care poate rula modele AI mai mari decât GPU-urile destinate consumatorilor, potrivit ArsTechnica.
Nvidia va începe să preia comenzi pentru DGX Spark miercuri, 15 octombrie, prin intermediul site-ului său web, sistemele fiind disponibile și de la partenerii de producție și anumite magazine de retail din SUA.
DGX Spark, pe care Nvidia l-a prezentat în ianuarie sub numele de „Project DIGITS” și l-a denumit oficial în mai, reprezintă încercarea Nvidia de a crea o nouă categorie de stații de lucru desktop special pentru dezvoltarea AI.
Cu Spark, Nvidia încearcă să rezolve o problemă cu care se confruntă unii dezvoltatori de AI: multe sarcini de AI depășesc capacitățile de memorie și software ale PC-urilor standard, forțându-i să-și mute activitatea către servicii cloud sau centre de date. Cu toate acestea, piața actuală pentru stațiile de lucru desktop AI rămâne incertă, în special având în vedere costul inițial în comparație cu alternativele cloud, care permit dezvoltatorilor să plătească pe măsură ce utilizează.
Se pare că Spark de la Nvidia include suficientă memorie pentru a rula modele AI mai mari decât cele obișnuite pentru sarcini locale, cu până la 200 de miliarde de parametri și modele ajustate conținând până la 70 de miliarde de parametri, fără a necesita infrastructură la distanță. Utilizările potențiale includ rularea de modele lingvistice open source mai mari și modele de sinteză media, cum ar fi generatoarele de imagini AI.
Nvidia a înghesuit multe într-o cutie de 1,2 kg care măsoară 150 mm L x 150 mm l x 50,5 mm și consumă 240 de wați. Sistemul rulează pe chipul GB10 Grace Blackwell de la Nvidia, include rețea ConnectX-7 de 200 Gb/s și utilizează tehnologia NVLink-C2C, care oferă o lățime de bandă de cinci ori mai mare decât PCIe Gen 5. De asemenea, include memoria unificată de 128 GB menționată anterior, care este partajată între sarcinile sistemului și ale GPU-ului.
În ceea ce privește sistemul de operare, Spark este un sistem bazat pe ARM care rulează DGX OS de la Nvidia, un sistem de operare bazat pe Ubuntu Linux, creat special pentru procesarea GPU. Acesta vine cu pachetul de software AI de la Nvidia preinstalat, inclusiv bibliotecile CUDA și microserviciile NIM ale companiei.
Prețurile pentru DGX Spark încep de la 3.999 USD. Poate părea mult, dar având în vedere costul GPU-urilor de ultimă generație cu memorie RAM video amplă, cum ar fi RTX Pro 6000 (aproximativ 9.000 USD) sau GPU-urile pentru servere AI (cum ar fi 25.000 USD pentru un H100 de bază), DGX Spark poate reprezenta o opțiune mult mai ieftină în ansamblu, deși nu este la fel de puternic.
Performanța de calcul GPU a cipului GB10 este aproximativ echivalentă cu cea a unui RTX 5070. Cu toate acestea, 5070 este limitat la 12 GB de memorie video, ceea ce limitează dimensiunea modelelor AI care pot fi rulate pe un astfel de sistem. Cu 128 GB de memorie unificată, DGX Spark poate rula modele mult mai mari, deși la o viteză mai mică decât, să zicem, un RTX 5090 (care vine de obicei cu 24 GB de RAM). De exemplu, pentru a rula versiunea mai mare, cu 120 de miliarde de parametri, a modelului lingvistic gpt-oss recent al OpenAI, ai nevoie de aproximativ 80 GB de memorie, ceea ce este mult mai mult decât poți obține într-un GPU de consum.
Alți furnizori, precum Dell, HP, Lenovo și ASUS, au prezentat mini PC-uri similare orientate către AI la Computex în acest an, utilizând același cip GB10. NVIDIA lucrează, de asemenea, la DGX Station, care va include supercipul GB300 Grace Blackwell Ultra Desktop, cu o performanță de 20 petaflopi și 784 GB de memorie de sistem unificată. Prețul acestui model nu a fost încă anunțat.
„În 2016, am construit DGX-1 pentru a oferi cercetătorilor din domeniul AI propriul lor supercomputer. Am livrat personal primul sistem unei mici companii start-up numită OpenAI, iar de acolo a apărut ChatGPT”, a declarat Huang într-un comunicat. „DGX-1 a lansat era supercomputerelor AI și a deblocat legile de scalare care stau la baza AI-ului modern. Cu DGX Spark, ne întoarcem la acea misiune.”