Reflection, un startup fondat de foști cercetători Google DeepMind, a strâns 2 miliarde de dolari la o evaluare de 8 miliarde de dolari. Compania, care inițial s-a concentrat pe agenți de programare autonomi, se poziționează acum ca o alternativă open-source la laboratoarele închise de frontieră precum OpenAI și Anthropic și ca un echivalent occidental al firmelor chineze de AI precum DeepSeek, relatează TechCrunch. Reflection intenționează să lanseze anul viitor un model lingvistic de frontieră antrenat pe „zeci de trilioane de tokenuri” și a obținut un cluster de calcul.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Startup-ul a fost lansat în martie 2024 de Misha Laskin, care a condus modelarea recompenselor pentru proiectul Gemini al DeepMind, și Ioannis Antonoglou, care a co-creat AlphaGo, sistemul de AI care a învins în 2016 campionul mondial la jocul de societate Go. Experiența lor în dezvoltarea acestor sisteme AI foarte avansate este esențială pentru argumentul lor, și anume că talentele potrivite în domeniul AI pot construi modele de frontieră în afara giganților tehnologici consacrați.
„Am construit ceva ce odată se credea posibil doar în laboratoarele de top din lume”
Odată cu noua rundă de finanțare, Reflection AI a anunțat că a recrutat o echipă de talente de top de la DeepMind și OpenAI și a construit o platformă avansată de formare în domeniul AI, care, promite compania, va fi deschisă pentru toți. Poate cel mai important, Reflection AI afirmă că a „identificat un model comercial scalabil, care se aliniază strategiei noastre de inteligență deschisă”.
Echipa Reflection AI numără în prezent aproximativ 60 de persoane, în mare parte cercetători și ingineri în domeniul IA din domeniile infrastructurii, formării datelor și dezvoltării algoritmilor, potrivit lui Laskin, CEO-ul companiei. Reflection AI și-a asigurat un cluster de calcul și speră să lanseze anul viitor un model lingvistic de frontieră, antrenat pe „zeci de trilioane de tokenuri”.
„Am construit ceva ce odată se credea posibil doar în laboratoarele de top din lume: o platformă LLM și de învățare prin întărire la scară largă, capabilă să antreneze modele Mixture-of-Experts (MoE) masive la scară de frontieră”, a scris Reflection AI într-o postare pe X. „Am văzut eficacitatea abordării noastre în mod direct atunci când am aplicat-o în domeniul critic al programării autonome. Odată cu atingerea acestui obiectiv, aducem acum aceste metode în raționamentul general al agenților”.
„DeepSeek, Qwen și toate aceste modele sunt un semnal de alarmă”
MoE se referă la o arhitectură specifică care alimentează LLM-urile de frontieră, sisteme care, anterior, numai laboratoarele mari și închise de IA erau capabile să antreneze la scară largă. DeepSeek a avut un moment de cotitură când a descoperit cum să antreneze aceste modele la scară largă într-un mod deschis, urmat de Qwen, Kimi și alte modele din China.
„DeepSeek, Qwen și toate aceste modele sunt un semnal de alarmă pentru noi, deoarece, dacă nu facem nimic în acest sens, standardul global de inteligență va fi construit de altcineva”, a spus Laskin.
Laskin a adăugat că acest lucru pune SUA și aliații săi într-o poziție dezavantajoasă, deoarece companiile și statele suverane nu vor folosi adesea modelele chinezești din cauza potențialelor repercusiuni legale.
Clem Delangue, cofondator și CEO al Hugging Face, o platformă open source colaborativă pentru dezvoltatorii de IA, a declarat despre această rundă: „Este într-adevăr o veste excelentă pentru… IA open-source.” Delangue a adăugat: „Acum, provocarea va fi să demonstrăm viteza mare de partajare a modelelor și seturilor de date IA deschise (similar cu ceea ce vedem în laboratoarele dominante în domeniul IA open-source)”.
Reflection AI nu a lansat încă primul său model
Definiția Reflection AI pentru „deschis” pare să se concentreze mai degrabă pe acces decât pe dezvoltare, similar strategiilor Meta cu Llama sau Mistral. Laskin a declarat că Reflection AI va publica ponderile modelelor, parametrii de bază care determină modul de funcționare al unui sistem AI, pentru uz public, păstrând în mare parte seturile de date și algoritmul de antrenare ca proprietate exclusivă.
Acest echilibru stă la baza modelului de afaceri al Reflection AI. Cercetătorii vor putea utiliza modelele în mod liber, a spus Laskin, dar veniturile vor proveni de la marile întreprinderi care construiesc produse pe baza modelelor Reflection AI și de la guvernele care dezvoltă sisteme „AI suverane”, adică modele AI dezvoltate și controlate de națiuni individuale.
Reflection AI nu a lansat încă primul său model, care va fi în mare parte bazat pe text, cu capacități multimodale în viitor, potrivit lui Laskin. Compania va utiliza fondurile din această ultimă rundă de finanțare pentru a obține resursele de calcul necesare pentru antrenarea noilor modele, primul dintre acestea urmând să fie lansat la începutul anului viitor.
Modelele Llama ale Meta au depășit 800 de milioane de descărcări
Ecosistemul AI open-source a fost în centrul atenției de când modelul R1 al DeepSeek a uimit industria la începutul acestui an, egalând performanța GPT-4. Lansarea sa sub licență MIT a demonstrat că modelele de înaltă performanță nu mai necesită infrastructură de miliarde de dolari.
Urmând acest exemplu, modelele Llama ale Meta au depășit 800 de milioane de descărcări, promovând colaborarea deschisă ca o cale către inovare mai rapidă. În Europa, Mistral AI și-a creat o nișă în sectoare reglementate, precum finanțele și apărarea, apropiindu-se de o evaluare de 14 miliarde de dolari.
Reflection AI își propune să combine eficiența DeepSeek, amploarea Meta și precizia Mistral. O ambiție care ar putea redefini modul în care sunt dezvoltate și partajate modelele de AI de frontieră. Concentrându-se pe eficiență, transparență și accesibilitate globală, compania speră să construiască sisteme suficient de puternice pentru a fi utilizate de companii, dar suficient de deschise pentru a accelera colaborarea în domeniul cercetării.
Printre investitorii din ultima rundă de finanțare a Reflection AI se numără Nvidia, Disruptive, DST, 1789, B Capital, Lightspeed, GIC, Eric Yuan, Eric Schmidt, Citi, Sequoia, CRV și alții.