Gigantul tehnologic chinez Tencent lansează două modele de traducere AI care depășesc Google Translate

tescent traducere AI
Photo by geralt on Pixabay

Tencent a făcut publice două modele de traducere AI care, potrivit companiei, depășesc performanțele Google Translate și ale altor sisteme consacrate. Noile modele, Hunyuan MT 7B și Hunyuan MT Chimera 7B, au obținut primul loc în 30 din 31 de perechi de limbi testate la WMT2025, unul dintre cele mai prestigioase workshop-uri internaționale dedicate traducerii automate, informează TheDecoder.

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Modelele Hunyuan suportă traducere bidirecțională în 33 de limbi, începând cu engleza, chineza, japoneza, dar și limbi mai puțin digitalizate precum ceha, marathi, estona sau islandeza. Un obiectiv special este traducerea între mandarina chineză și limbile minoritare din China, precum kazahă, uigură, mongolă și tibetană.

Performanțe superioare chiar și față de modele mari

Modelele Hunyuan au 7 miliarde de parametri, mult mai puțin decât altele din clasa lor, dar oferă performanțe mai bune.

Comparativ cu Google Translate, scorurile au fost cu 15–65% mai bune, iar față de GPT-4.1, Claude 4 Sonnet sau Gemini 2.5 Pro, rezultatele au fost superioare în majoritatea testelor. În plus, modelele Hunyuan depășesc seria Tower Plus (până la 72 miliarde de parametri) cu 10–58%.

Tencent a făcut modelele disponibile pe Hugging Face și a publicat codul sursă pe GitHub, ceea ce oferă cercetătorilor și dezvoltatorilor acces liber la tehnologia sa de traducere AI.

Cum au fost antrenate modelele

Procesul de antrenament a fost complex, în cinci etape, care au inclus texte generale, date specifice traducerii, învățare supravegheată, învățare prin recompensă și o etapă finală de „reinforcement learning” de la slab la puternic. Datele au inclus 1,3 trilioane de tokeni pentru limbile minoritare, acoperind 112 limbi și dialecte.

Modelul Chimera folosește o tehnică de fuziune, care combină mai multe sugestii de traducere pentru un rezultat final mai precis, cu un câștig mediu de 2,3% în testele standard.

Recent, Google a lansat la rândul său funcții noi pentru serviciul de traducere, inclusiv traducere live în timp real și un mod personalizat de învățare a limbilor, bazat pe modelele sale Gemini.

  • George Radu este un autor care abordează subiecte variate din domeniul tehnologiei, apărării și viitorului. Domeniile sale de expertiză includ inteligența artificială etică, interfețele om-mașină (HMI), realitatea augmentată și virtuală aplicată (XR), precum și impactul social și cultural al noilor tehnologii. Nu se teme să pună întrebări dificile și să exploreze implicațiile filozofice ale inovațiilor tehnologice.

Total
0
Shares
Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Citește si...