Hunyuan-MT-7B obtuvo el primer puesto en 30 de las 31 pruebas de una competencia general de traducción automática celebrada en el marco de la próxima conferencia WMT25.
El gigante tecnológico chino Tencent Holdings lanzó el lunes un nuevo modelo de traducción de código abierto que arrasó en una competencia mundial de traducción automática a pesar de su reducido tamaño de parámetros, lo que pone de relieve el progreso que el país ha estado logrando en inteligencia artificial.
El modelo Hunyuan-MT-7B de Tencent obtuvo el primer puesto en 30 de las 31 pruebas de la competencia general de traducción automática, celebrada en el marco de la Décima Conferencia sobre Traducción Automática, también conocida como WMT25, según los resultados preliminares publicados por la organización del evento. La WMT25 sirve como plataforma para que investigadores y desarrolladores muestren sus avances en traducción asistida por computadora.
A pesar de contar con tan solo 7 mil millones de parámetros (una medida de los modelos de IA donde, generalmente, cuanto mayor sea, mejor), el modelo de Tencent superó con creces sus expectativas, superando modelos significativamente más grandes y de código cerrado de competidores globales como Google y OpenAI.
Tencent, con sede en Shenzhen, atribuyó la destreza de traducción del nuevo modelo Hunyuan a un «paradigma completo de entrenamiento de modelos de traducción», que abarca la curación de conjuntos de datos, el preentrenamiento continuo y múltiples ajustes finos y aprendizaje de refuerzo: técnicas utilizadas para ajustar los modelos y lograr un rendimiento óptimo.

“La fortaleza de Hunyuan-MT-7B reside en que utiliza un número reducido de parámetros para ofrecer resultados que igualan o incluso superan a los modelos más grandes”, declaró el equipo de Tencent, responsable del desarrollo de la serie de sistemas de IA Hunyuan, en un comunicado.

