Noul model de inteligență artificială Devstral lansat de Mistral a fost conceput pentru programare

Noul model de inteligență artificială Devstral lansat de Mistral a fost conceput pentru programare
Sursa imagine: Mistral

Producătorul francez de modele de inteligență artificială, Mistral, a înregistrat constant rezultate bune de la lansarea propriului model puternic de bază open source în toamna anului 2023 – dar a fost criticat recent de dezvoltatori pe X pentru ultima sa lansare a unui model de limbaj mare (LLM) proprietar numit Medium 3, pe care unii l-au considerat o trădare a rădăcinilor și angajamentului său față de open source.

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Modelele open source pot fi preluate și adaptate liber de către oricine, în timp ce modelele proprietare trebuie plătite, iar opțiunile lor de personalizare sunt mai limitate și controlate de către producătorul modelului.

Devstral, despre care Mistral spune că a fost dezvoltat în parteneriat cu compania de inteligență artificială All Hands AI, este disponibil în mod deschis sub o licență Apache 2.0, ceea ce înseamnă că poate fi utilizat comercial fără restricții, conform TechCrunch. Mistral susține că Devstral depășește alte modele open source, precum Gemma 3 27B de la Google și V3 de la laboratorul chinez de inteligență artificială DeepSeek, în testul SWE-Bench Verified, un test de referință care măsoară abilitățile de codare.

Bazat pe Codestral

Devstral reprezintă următorul pas în portofoliul tot mai mare de modele axate pe programare al Mistral, după succesul anterior cu seria Codestral.

Lansat inițial în mai 2024, Codestral a fost prima incursiune a Mistral în domeniul LLM-urilor specializate de codare. A fost un model cu 22 de miliarde de parametri, antrenat să gestioneze peste 80 de limbaje de programare și a devenit bine apreciat pentru performanțele sale în sarcinile de generare și completare a codului.

Popularitatea și punctele forte tehnice ale modelului au dus la iterații rapide, inclusiv lansarea Codestral-Mamba – o versiune îmbunătățită construită pe arhitectura Mamba – și, cel mai recent, Codestral 25.01, care a fost adoptat de dezvoltatorii de pluginuri IDE și de utilizatorii din mediul de afaceri care caută modele de înaltă frecvență și latență redusă.

Impulsul din jurul Codestral a contribuit la consolidarea Mistral ca jucător cheie în ecosistemul modelelor de codare și a pus bazele dezvoltării Devstral – extinzându-se de la completări automate a liniilor de cod la execuția completă a sarcinilor cu agent. Dar Codestral nu a fost lansat sub o licență care să permită dezvoltatorilor să utilizeze modelul pentru aplicații comerciale; licența sa interzicea în mod explicit „orice utilizare internă de către angajați în contextul activităților comerciale ale unei companii”.

Construit pentru implementări agentice

Devstral nu este doar un model de generare de cod – este optimizat pentru integrarea în framework-uri agentice precum OpenHands, SWE-Agent și OpenDevin.

„Devstral excelează în utilizarea instrumentelor pentru explorarea bazelor de cod, editarea mai multor fișiere și alimentarea agenților de inginerie software”, scrie Mistral într-o postare pe blog. „Rulează pe schele (scaffold) de agenți de cod, cum ar fi OpenHands sau SWE-Agent, care definesc interfața dintre model și cazurile de testare […] Devstral este suficient de mic pentru a rula pe un singur Nvidia RTX 4090 sau pe un Mac cu 32 GB RAM, ceea ce îl face o alegere ideală pentru implementare locală și utilizare pe dispozitiv.”

Scaffolding în dezvoltarea de software se referă la tehnici automate de generare de cod care produc rapid structura fundamentală a aplicațiilor software. Este un tip special de generare de cod care creează o structură sau un schelet de bază pentru proiectul tău, bazat pe niște opțiuni sau parametri predefiniți.

Devstral sosește pe măsură ce asistenții de codare AI – și modelele care îi alimentează – devin din ce în ce mai populari. Chiar luna trecută, JetBrains, compania din spatele unei game de instrumente populare de dezvoltare a aplicațiilor, a lansat primul său model de inteligență artificială „deschis” pentru codare. În ultimele luni, companii de inteligență artificială, inclusiv Google, Windsurf, Anthropic și OpenAI, au dezvăluit, de asemenea, modele, atât disponibile public, cât și proprietare, optimizate pentru sarcini de programare.

Noul model de inteligență artificială Devstral lansat de Mistral a fost conceput pentru programare
Rezultatele evaluărilor interne de benchmarking ale Mistral asupra Devstral. Sursa imagine: Mistral

Modelele de inteligență artificială încă nu pot produce software de calitate

Modelele de inteligență artificială încă se luptă să programeze software de calitate – inteligența artificială care generează cod tinde să introducă vulnerabilități de securitate și erori, din cauza unor slăbiciuni în domenii precum capacitatea de a înțelege logica de programare. Cu toate acestea, promisiunea lor de a crește productivitatea codării împinge companiile – și dezvoltatorii – să le adopte rapid. Un sondaj recent a constatat că 76% dintre dezvoltatori au folosit sau intenționau să utilizeze instrumente de inteligență artificială în procesele lor de dezvoltare anul trecut.

Disponibil prin API sau utilizare locală

Devstral, pe care Mistral îl lansează în stadiu de „previzualizare” cu scop de cercetare, poate fi descărcat de pe platformele de dezvoltare AI, inclusiv Hugging Face, și, de asemenea, accesat prin API-ul Mistral. Prin API prețul său este de 0,1 USD pentru un milion de token-uri de intrare și 0,3 USD pentru un milion de token-uri de ieșire, token-urile fiind fragmentele brute de date cu care lucrează modelele AI. (Un milion de token-uri este echivalentul a aproximativ 750.000 de cuvinte). Pentru utilizarea locală Mistral oferă documentație și un tutorial video. Dacă alegeți să îl implementați singuri, puteți descărca modelul de pe platformele HuggingFace, Ollama, Kaggle, Unsloth sau LM Studio.

Mistral spune că „lucrează din greu la construirea unui model de codare agentică mai amplu, care va fi disponibil în următoarele săptămâni”. Devstral nu este un model mic în sine, cu 24 de miliarde de parametri. (Parametrii corespund aproximativ abilităților de rezolvare a problemelor ale unui model, iar modelele cu mai mulți parametri au, în general, performanțe mai bune decât cele cu mai puțini parametri.)

Mistral, fondată în 2023, este un laborator de modele de frontieră, care își propune să construiască o gamă de servicii bazate pe inteligență artificială, inclusiv o platformă de chatbot, Le Chat, și aplicații mobile. Este susținută de fonduri de capital de risc, inclusiv General Catalyst, și a strâns până în prezent peste 1,1 miliarde de euro (aproximativ 1,24 miliarde de dolari). Printre clienții Mistral se numără BNP Paribas, AXA și Mirakl.

Devstral este a treia lansare de produs a Mistral în această lună. Acum câteva săptămâni, Mistral a lansat Mistral Medium 3, un model eficient de uz general. Cam în aceeași perioadă, compania a lansat Le Chat Enterprise, un serviciu de chatbot axat pe corporații, care oferă instrumente precum un constructor de „agenți” bazat pe inteligență artificială și integrează modelele Mistral cu servicii terțe, precum Gmail, Google Drive și SharePoint.

Total
0
Shares
Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Citește si...