Zhipu afirma que GLM-Image logró puntuaciones líderes en la industria entre los modelos de código abierto para la representación de texto y la generación de caracteres chinos.
La firma china de inteligencia artificial Zhipu AI afirmó que su nuevo modelo de generación de imágenes se entrenó con chips de Huawei Technologies, lo que lo convierte en el primer modelo potente de código abierto desarrollado con una pila de entrenamiento completamente nacional.
La compañía con sede en Beijing, recién salida de su oferta pública inicial en Hong Kong, declaró el miércoles que el logro demostró la viabilidad de desarrollar potentes modelos multimodales sin semiconductores estadounidenses, mientras Beijing impulsa la autosuficiencia de la industria china de IA en medio de las restricciones estadounidenses a la exportación de chips de vanguardia.
Según Zhipu, todo el proceso de entrenamiento de GLM-Image, desde la preparación de los datos hasta la ejecución final, se llevó a cabo en el servidor Ascend Atlas 800T A2 de Huawei, que incorpora los procesadores de IA Ascend de la compañía, y con MindSpore, el marco de aprendizaje automático integral de Huawei.
«Esperamos que esto sirva de referencia valiosa para que la comunidad explore el potencial de la computación doméstica», afirmó Zhipu.
Los expertos del sector consideran que los potentes modelos de IA multimodal, capaces de procesar de forma nativa texto, voz, imagen y vídeo, son la próxima frontera de los modelos de IA.

El modelo de Zhipu cuenta con una arquitectura híbrida compuesta por elementos autorregresivos y de difusión, un diseño que habilita las capacidades multimodales iniciadas por Nano Banana Pro de Google DeepMind, que puede generar imágenes y texto con precisión.

