Prima pagină Articole Alibaba lansează Qwen3, o familie de modele de raționament AI „hibride”, cea mai recentă evoluție în domeniul AI open-source din China, o poți descărca și folosi acum

4 minute de citit

Alibaba lansează Qwen3, o familie de modele de raționament AI „hibride”, cea mai recentă evoluție în domeniul AI open-source din China, o poți descărca și folosi acum

Remus Suciu

30 aprilie 2025

Alibaba lansează Qwen3, o familie de modele de raționament AI „hibride”, cea mai recentă evoluție în domeniul AI open-source din China

Sursa imagine: Qwenlm

Alibaba a lansat următoarea generație a modelelor sale AI open-source, Qwen3

Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -

Alibaba a lansat următoarea generație a modelelor mari de limbaj open-source, Qwen3 – iar experții o numesc un pas înainte în spațiul lumea inteligenței artificiale open-source din China.

Într-o postare pe blog, gigantul tehnologic chinez a declarat că Qwen3 promite îmbunătățiri în raționament, urmărirea instrucțiunilor, utilizarea instrumentelor și sarcinile multilingve, rivalizând cu alte modele de top, cum ar fi R1 de la DeepSeek, în mai multe teste de referință din industrie.

Seria LLM include opt variante care acoperă o gamă largă de arhitecturi și dimensiuni, oferind dezvoltatorilor flexibilitate atunci când utilizează Qwen pentru a construi aplicații AI pentru dispozitive edge, cum ar fi telefoanele mobile.

Qwen3 este, de asemenea, debutul Alibaba în așa-numitele „modele de raționament hibrid”, despre care spune că combină capacitățile LLM tradiționale cu „raționament dinamic avansat”. Qwen a lansat 6 modele de instrucțiuni împreună cu versiunile lor de bază și variantele cuantizate, inclusiv două amestecuri disperse de modele expert (MoE)-mix of experts, Qwen3-235B-A22B și Qwen3-30B-A3B1, ambele cu factori de dispersie similari cu arhitectura DeepSeek MoE, și 6 modele dense cu parametrii Apache Licențe 32B, 14B, 8B, 4B, 1.7B și 0.6B. Pentru referință, cel mai mic model Llama 4 are încă 109B de parametri totali, iar intervalul 32B este cunoscut ca fiind foarte popular printre utilizatorii de modele deschise.

Referințele pentru cele mai mari modele complet antrenate sunt incluse mai jos (Rețineți că acestea nu se compară cu unele modele recente, cum ar fi o3). Evaluările sunt probabil toate cu modul de gândire activat și posibil pentru numărul maxim de token-uri. Se recomandă așteptarea evaluărilor independente pentru o imagine clară asupra performanțelor reale.

Alibaba lansează Qwen3, o familie de modele de raționament AI „hibride”,Comparație cu pricipalele modele AI — Comparație cu modele AI cum ar fi Gemini 2.5Pro si Open AI o3mini. Sursa imagine: qwenlm

Evaluările modelului de bază incluse de echipa Qwen arată cât de apropiate sunt scorurile între principalele modele de bază, Llama 4, DeepSeek V3 și acum Qwen.

Potrivit Alibaba, astfel de modele pot trece fără probleme între un „mod de gândire” pentru sarcini complexe, cum ar fi codarea, și un „mod non-gândire” pentru răspunsuri mai rapide, de uz general.

Utilizări Agentice

Qwen3 excelează în capacitățile de apelare a instrumentelor susține companie în anunțul de lansare. Propune utilizarea Qwen-Agent, un agent AI, pentru a folosi la maximum capacitatea agentică a Qwen3. Qwen-Agent încapsulează intern șabloanele de apelare a instrumentelor și parserele de apelare a instrumentelor, reducând considerabil complexitatea codării.

Pentru a defini instrumentele disponibile, puteți utiliza fișierul de configurare MCP, puteți utiliza instrumentul integrat al Qwen-Agent sau puteți integra alte instrumente singur.

„În special, modelul Qwen3-235B-A22B MoE reduce semnificativ costurile de implementare în comparație cu alte modele de ultimă generație, consolidând angajamentul Alibaba față de o inteligență artificială accesibilă și de înaltă performanță”, a declarat Alibaba.

Noile modele sunt deja disponibile gratuit pentru utilizatorii individuali pe platforme precum Hugging Face și GitHub, precum și pe interfața web Alibaba Cloud. Qwen3 este folosit și pentru a alimenta asistentul de inteligență artificială al Alibaba, Quark.

Avansul AI în China

Analiștii de inteligență artificială au declarat pentru CNBC că Qwen3 reprezintă o provocare serioasă pentru omologii Alibaba din China, precum și pentru liderii industriei din SUA.

Într-o declarație pentru CNBC, Wei Sun, analist principal al inteligenței artificiale la Counterpoint Research, a declarat că seria Qwen3 este o „descoperire semnificativă – nu doar pentru performanța sa de cea mai bună calitate din clasa sa”, ci și pentru mai multe caracteristici care indică „potențialul de aplicare al modelelor”.

Aceste caracteristici includ modul de gândire hibrid al Qwen3, suportul său multilingv care acoperă 119 limbi și dialecte și disponibilitatea sa open-source, a adăugat Sun.

Software-ul open-source se referă, în general, la software-ul în care codul sursă este pus la dispoziție gratuit pe web pentru posibile modificări și redistribuiri. La începutul acestui an, modelul R1 open-source de la DeepSeek a zguduit lumea inteligenței artificiale și a devenit rapid un catalizator pentru spațiul inteligenței artificiale din China și adoptarea modelelor open-source.

„Lansarea seriei Qwen 3 de către Alibaba subliniază încă o dată capacitățile puternice ale laboratoarelor chineze de a dezvolta modele extrem de competitive, inovatoare și open-source, în ciuda presiunii tot mai mari din cauza controalelor stricte la export din SUA”, a declarat Ray Wang, un analist cu sediul la Washington, specializat în concurența economică și tehnologică dintre SUA și China.

Potrivit Alibaba, Qwen a devenit deja una dintre cele mai adoptate serii de modele de inteligență artificială open-source din lume, atrăgând peste 300 de milioane de descărcări în întreaga lume și peste 100.000 de modele derivate pe Hugging Face. „În contextul mai larg al cursei inteligenței artificiale dintre SUA și China, decalajul dintre laboratoarele americane și chineze s-a redus – probabil la câteva luni, iar unii ar putea argumenta, chiar la doar câteva săptămâni”, a spus Wang. „Odată cu cea mai recentă lansare a Qwen 3 și lansarea iminentă a DeepSeek R2, este puțin probabil ca această diferență să se adâncească – și chiar ar putea continua să se micșoreze.”

Remus Suciu

Hand-Picked Top-Read Stories

Ariane 6 va lansa încă 32 de sateliți pentru rețeaua Project Kuiper pe 28 aprilie

Warner Bros. pregătește un nou film inspirat din universul „Stăpânul Inelelor”

AI-ul poate crea radiografii false care induc în eroare atât medicii, cât și alte sisteme AI

Trending Tags

Alibaba lansează Qwen3, o familie de modele de raționament AI „hibride”, cea mai recentă evoluție în domeniul AI open-source din China, o poți descărca și folosi acum

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Lasă un răspuns Anulează răspunsul

Ariane 6 va lansa încă 32 de sateliți pentru rețeaua Project Kuiper pe 28 aprilie

Warner Bros. pregătește un nou film inspirat din universul „Stăpânul Inelelor”

AI-ul poate crea radiografii false care induc în eroare atât medicii, cât și alte sisteme AI

Alibaba lansează Qwen3, o familie de modele de raționament AI „hibride”, cea mai recentă evoluție în domeniul AI open-source din China, o poți descărca și folosi acum

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Lasă un răspuns Anulează răspunsul

Citește si...

Primele „societăți AI” prind viață / Cât de aproape sunt agenții artificiali de comportamentul uman real?

Anthropic folosește Brave Search pentru funcția de căutare web a chatbot-ului Claude

STUDIU Un nou model de Inteligență Artificială creat de cercetători de la Harvard, asemănător cu ChatGPT, ar putea detecta mai multe tipuri diferite de cancer