El operador estatal de telecomunicaciones entrena sus modelos TeleChat3 con chips Ascend 910B de Huawei.
La empresa estatal China Telecom ha desarrollado los primeros modelos de inteligencia artificial del país con la innovadora arquitectura Mixture-of-Experts (MoE), entrenados íntegramente con chips avanzados de Huawei Technologies.
Esta fue la primera vez que un desarrollador chino validó públicamente la viabilidad de utilizar únicamente chips Huawei para entrenar modelos de IA con la arquitectura MoE, que se ha adoptado ampliamente gracias a su capacidad para ofrecer un alto rendimiento con menos recursos computacionales.
Los modelos TeleChat3, que abarcan desde 105 mil millones hasta billones de parámetros, se entrenaron con los chips Ascend 910B de Huawei y su marco de trabajo de inteligencia artificial de aprendizaje profundo de código abierto, MindSpore, según un documento técnico publicado el mes pasado por el Instituto de Inteligencia Artificial de China Telecom (TeleAI).
La pila de Huawei logró satisfacer las exigentes exigencias del entrenamiento de modelos MoE a gran escala y de diferentes tamaños, según los investigadores de TeleAI.
“Estas contribuciones abordan colectivamente los obstáculos críticos en el entrenamiento de modelos a escala de frontera, estableciendo una solución integral madura y adaptada a los ecosistemas computacionales nacionales”, afirmaron.
La iniciativa de China Telecom, uno de los mayores operadores de redes fijas y móviles del mundo, resaltó los crecientes esfuerzos de varias empresas chinas incluidas en la lista negra de Estados Unidos, como Huawei e iFlytek, para entrenar modelos de IA utilizando semiconductores de diseño nacional.


