Tencent a făcut publice două modele de traducere AI care, potrivit companiei, depășesc performanțele Google Translate și ale altor sisteme consacrate. Noile modele, Hunyuan MT 7B și Hunyuan MT Chimera 7B, au obținut primul loc în 30 din 31 de perechi de limbi testate la WMT2025, unul dintre cele mai prestigioase workshop-uri internaționale dedicate traducerii automate, informează TheDecoder.
Urmărește cele mai noi producții video TechRider.ro
- articolul continuă mai jos -
Modelele Hunyuan suportă traducere bidirecțională în 33 de limbi, începând cu engleza, chineza, japoneza, dar și limbi mai puțin digitalizate precum ceha, marathi, estona sau islandeza. Un obiectiv special este traducerea între mandarina chineză și limbile minoritare din China, precum kazahă, uigură, mongolă și tibetană.
Performanțe superioare chiar și față de modele mari
Modelele Hunyuan au 7 miliarde de parametri, mult mai puțin decât altele din clasa lor, dar oferă performanțe mai bune.
Comparativ cu Google Translate, scorurile au fost cu 15–65% mai bune, iar față de GPT-4.1, Claude 4 Sonnet sau Gemini 2.5 Pro, rezultatele au fost superioare în majoritatea testelor. În plus, modelele Hunyuan depășesc seria Tower Plus (până la 72 miliarde de parametri) cu 10–58%.
Tencent a făcut modelele disponibile pe Hugging Face și a publicat codul sursă pe GitHub, ceea ce oferă cercetătorilor și dezvoltatorilor acces liber la tehnologia sa de traducere AI.
Cum au fost antrenate modelele
Procesul de antrenament a fost complex, în cinci etape, care au inclus texte generale, date specifice traducerii, învățare supravegheată, învățare prin recompensă și o etapă finală de „reinforcement learning” de la slab la puternic. Datele au inclus 1,3 trilioane de tokeni pentru limbile minoritare, acoperind 112 limbi și dialecte.
Modelul Chimera folosește o tehnică de fuziune, care combină mai multe sugestii de traducere pentru un rezultat final mai precis, cu un câștig mediu de 2,3% în testele standard.
Recent, Google a lansat la rândul său funcții noi pentru serviciul de traducere, inclusiv traducere live în timp real și un mod personalizat de învățare a limbilor, bazat pe modelele sale Gemini.