El modelo de IA más avanzado de la empresa con sede en Beijing puede procesar texto, imágenes, audio y vídeo.
Baidu presentó el jueves Ernie 5.0, un modelo de inteligencia artificial multimodal con 2,4 billones de parámetros, mientras que el uso del asistente homónimo impulsado por IA del gigante tecnológico chino alcanzó los 200 millones de usuarios activos mensuales.
Este modelo fundacional omnimodal, capaz de procesar texto, imágenes, audio y vídeo, es el más avanzado de la compañía con sede en Beijing hasta la fecha.
El modelo se presentó por primera vez en noviembre y desde entonces ha escalado posiciones en las clasificaciones. Una tabla de clasificación publicada la semana pasada por LMArena mostró que Ernie-5.0-0110 ocupó el primer lugar entre los modelos chinos y el octavo a nivel mundial en rendimiento de texto, por delante de modelos estadounidenses líderes como GPT-5.1-High de OpenAI y Gemini-2.5-Pro de Google.
El nuevo modelo de Baidu se basa en una arquitectura de mezcla de expertos ultragrande con activación altamente dispersa, lo que significa que utiliza menos del 3% de sus parámetros por inferencia para mejorar la eficiencia sin sacrificar el rendimiento.

La filial de chips de la compañía, Kunlunxin Technology, solicitó confidencialmente una oferta pública inicial en Hong Kong a principios de este mes, a medida que el impulso de Beijing hacia la autosuficiencia tecnológica, particularmente en sectores de vanguardia como los semiconductores, se intensificaba en medio de una mayor adopción y un nuevo impulso en el mercado de capitales.
Los modelos de inteligencia artificial de China podrían estar «seis meses por detrás» de las capacidades de sus homólogos estadounidenses, afirmó Demis Hassabis, director ejecutivo de Google DeepMind, en el Foro Económico Mundial celebrado en Davos, Suiza, el miércoles.

