NVIDIA a prezentat Cosmos Policy, o nouă tehnologie menită să standardizeze procesul decizional al roboților, prin conectarea percepției, acțiunii și planificării într-un singur cadru AI. Această inovație se înscrie în strategia companiei de a dezvolta modele fundamentale pentru sisteme AI fizice, care să permită roboților să opereze mai eficient și mai autonom, anunță Interesting Engineering.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
În robotică, o „politică” reprezintă stratul decizional care transformă observațiile, de la imagini captate de camere la datele senzorilor,în acțiuni fizice, cum ar fi mișcările articulațiilor sau gesturile de prindere. Politicile tradiționale sunt adesea construite ca rețele neuronale specifice fiecărei sarcini și necesită module separate pentru percepție, planificare și control. Acestea implică volume mari de date etichetate și ajustări personalizate pentru fiecare robot sau mediu.
Cosmos Policy abordează lucrurile diferit. În loc să creeze un model de control complet nou de la zero, NVIDIA folosește un model video deja antrenat, numit Cosmos Predict, și îl „recalibrează” folosind date din demonstrații reale ale roboților. Modelul știe deja cum se comportă lumea fizică în timp, pentru că a învățat dintr-o cantitate foarte mare de videoclipuri.
Această arhitectură le permite roboților să planifice acțiuni, să anticipeze stările viitoare și să estimeze succesul unei sarcini, toate într-un singur sistem.
Rezultate promițătoare în testele practice
Testele arată că metoda funcționează. În experimentele de manipulare robotică, Cosmos Policy a obținut rate mari de succes pentru sarcini complexe care necesită gândire pe termen lung. Uneori, performanța sa a egalat sau chiar depășit metodele existente, și asta cu mult mai puține date de antrenament. Această eficiență este extrem de importantă, pentru că strângerea datelor reale în robotică este costisitoare și consumatoare de timp.
Prin valorificarea cunoștințelor deja încorporate în modelele video, Cosmos Policy reduce cantitatea de date necesare fiecărui robot pentru a învăța comportamente fiabile.
Planificare pe termen lung
Un alt punct forte al Cosmos Policy este abilitatea de a planifica acțiuni pe termen lung. În loc să se concentreze doar pe următoarea mișcare imediată, modelul poate genera mai multe secvențe de acțiuni și să estimeze rezultatele posibile pentru fiecare.
Astfel, roboții pot alege acțiuni cu șanse mai mari de succes pe termen lung și pot reacționa strategic, nu doar reactiv, la sarcini complexe. Experimentele cu manipulare arată că roboții pot finaliza sarcini complexe folosind doar date vizuale, ceea ce demonstrează că sistemul poate funcționa și în lumea reală, nu doar în simulări.