VIDEO Google Deepmind lansează Genie 3, un model AI care generează lumi virtuale 3D, cu care utilizatorii pot interacționa în timp real

Genie 3 de la Google Deepmind, un generator de lumi virtuale 3d interactive
Sursa foto: Google Deepmind

Google DeepMind lansează o nouă versiune a modelului său AI „world” (generator de lumi virtuale), numit Genie 3, capabil să genereze medii 3D cu care utilizatorii și agenții AI pot interacționa în timp real, relatează The Verge.

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Compania promite, de asemenea, că utilizatorii vor putea interacționa cu aceste lumi mult mai mult timp decât înainte și că modelul va reține efectiv locul în care se află obiectele atunci când utilizatorul își îndreaptă privirea de la ele.

Modelele generatoare de lumi virtuale sunt un tip de sistem AI care poate simula medii în scopuri precum educația, divertismentul sau pentru a ajuta la antrenarea roboților sau a agenților AI. Cu modelele de acest tip, le dai o comandă și ele generează un spațiu în care te poți mișca ca într-un joc video, dar în loc ca lumea să fie creată manual cu elemente 3D, totul este generat cu AI. Este un domeniu în care Google depune eforturi considerabile; compania a prezentat Genie 2 în decembrie, care poate crea lumi interactive pe baza unei imagini, și construiește o echipă de modele condusă de un fost co-lider al instrumentului de generare video Sora al OpenAI.

Însă modelele actuale au multe dezavantaje. De exemplu, lumile Genie 2 puteau fi jucate doar până la un minut.

Genie 3 pare a fi un pas înainte notabil. Utilizatorii vor putea genera lumi cu o comandă care acceptă „câteva” minute de interacțiune continuă, față de 10-20 de secunde de interacțiune posibilă cu Genie 2, potrivit unui articol de blog. Google spune că Genie 3 poate păstra spațiile în memoria vizuală timp de aproximativ un minut, ceea ce înseamnă că, dacă te îndepărtezi de obiect dintr-o lume și apoi te întorci la acel lucru, lucrurile precum vopseaua de pe un perete sau scrisul de pe o tablă vor fi în același loc. Lumile vor avea, de asemenea, o rezoluție de 720p și vor rula la 24 fps.

DeepMind adaugă în Genie 3 și ceea ce numește „evenimente mondiale promptabile”. Folosind un prompt, vei putea face lucruri precum schimbarea condițiilor meteorologice într-o lume sau adăugarea de personaje noi.

Totuși, probabil că nu veți putea încerca încă acest model. Acesta este lansat ca „o versiune preliminară limitată pentru cercetare”, care va fi disponibilă „unui grup restrâns de academicieni și creatori”, astfel încât dezvoltatorii să poată înțelege mai bine riscurile și modul de a le atenua în mod adecvat, potrivit Google. Există, de asemenea, o serie de restricții, cum ar fi modalitățile limitate în care utilizatorii pot interacționa cu lumile generate și faptul că textul lizibil este „adesea generat numai atunci când este furnizat în descrierea lumii de intrare”. Google spune că „explorează” modalități de a pune Genie 3 la dispoziția „altor testeri” în viitor.

  • Ștefan Munteanu este un jurnalist specializat în domenii variate precum tehnologie, inteligență artificială, securitate cibernetică și apărare. Articolele sale acoperă noutățile din industrie, analize și impactul tehnologiei asupra societății. El este pasionat de inovațiile digitale și are un interes puternic pentru cele mai recente evoluții geopolitice.

Total
0
Shares
Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Citește si...