La empresa de inteligencia artificial menciona en redes sociales el lanzamiento inminente de chips de fabricación propia, pero no ofrece más detalles.
La startup china de inteligencia artificial DeepSeek anunció que China pronto contará con chips de «próxima generación» de fabricación propia para el apilamiento de IA, lo que avivó las especulaciones sobre los posibles avances que China podría haber logrado.
En una nota de una sola línea en su cuenta oficial de WeChat, donde explica la «escala UE8M0 FP8» de su nuevo modelo V3.1, la empresa con sede en Hangzhou afirmó que el modelo fue diseñado específicamente para los chips de desarrollo propio que se lanzarán próximamente. No especificó el proveedor de estos chips ni si se utilizarían para el entrenamiento de modelos de IA o la inferencia.
En un documento técnico que explica la V3.1, que integra los modos de razonamiento y no razonamiento en un solo modelo, DeepSeek indicó que el modelo se entrenó utilizando el formato de datos de escala UE8M0 FP8 para garantizar la compatibilidad con formatos de datos de microescalado.
Esta información sugiere que China ha logrado avances clave en la creación de una pila de IA autosuficiente compuesta por tecnologías nacionales, un avance que podría ayudar al país a eludir las restricciones estadounidenses a la exportación de chips.
FP8, o coma flotante 8, es un formato de datos de 8 bits que reduce la precisión para acelerar el entrenamiento y la inferencia de la IA al utilizar menos memoria y ancho de banda. UE8M0, un formato con 8 bits para el exponente y 0 bits para la mantisa, podría aumentar aún más la eficiencia del entrenamiento y, a su vez, reducir los requisitos de hardware, ya que podría reducir el uso de memoria hasta en un 75%.
El uso de estos formatos por parte de DeepSeek, si se combina con los chips chinos, podría traducirse en un nuevo avance en la coordinación hardware-software.
Esta revelación supone una afirmación audaz por parte de la compañía, que ha mantenido un silencio relativo desde que sorprendió al mundo con el lanzamiento de su modelo de razonamiento R1 en enero de 2025 y su modelo V3 en diciembre de 2024. DeepSeek afirmó que su modelo V3 se entrenó con 2048 chips Nvidia H800. No reveló los chips utilizados para entrenar R1 ni V3.1.

