Según informes, DeepSeek ha retrasado el lanzamiento de su modelo R2 debido a dificultades para entrenarlo con chips Huawei.
DeepSeek, la principal startup china de inteligencia artificial, se encuentra en el centro de la especulación sobre el lanzamiento de su modelo de razonamiento R2 de próxima generación, tras el lanzamiento del modelo GPT-5 por parte de OpenAI la semana pasada.
DeepSeek, que causó sensación en la industria con su modelo V3 en diciembre y el modelo R1 en enero, no ha introducido actualizaciones importantes en sus productos en los últimos meses, salvo dos revisiones menores.
Si bien el mercado esperaba que DeepSeek introdujera un nuevo modelo base a los pocos meses del lanzamiento de R1, la startup con sede en Hangzhou, fundada por el informático Liang Wenfeng como un proyecto paralelo de su firma de trading cuantitativo, aún no ha anunciado un calendario para el lanzamiento del modelo R2.
DeepSeek no respondió a una solicitud de comentarios el miércoles.
Desarrollar y entrenar un modelo avanzado es una tarea costosa y compleja, que requiere considerables recursos informáticos y datos de entrenamiento, así como algoritmos sofisticados. OpenAI tardó dos años y medio en lanzar GPT-5 tras el lanzamiento de GPT-4 en marzo de 2023.

Según un informe del Financial Times del jueves, DeepSeek ha retrasado el lanzamiento de su nuevo modelo debido a dificultades para entrenarlo con los chips de inteligencia artificial Ascend de Huawei Technologies. La startup se ha enfrentado a “problemas técnicos persistentes” durante el proceso, afirma el informe, que cita una fuente no identificada.

