En este momento estás viendo DeepSeek aprovecha la tecnología de IA de código abierto de Alibaba para mejorar el rendimiento del OCR
La actualización subraya el creciente papel del ecosistema de código abierto de China en el avance del desarrollo nacional de IA.

DeepSeek aprovecha la tecnología de IA de código abierto de Alibaba para mejorar el rendimiento del OCR

  • Autor de la entrada:
  • Categoría de la entrada:China
  • Última modificación de la entrada:enero 28, 2026

La startup china de IA afirma que su último modelo de OCR ofrece un rendimiento más sólido tras adoptar un modelo de código abierto desarrollado por Alibaba.

La startup china de inteligencia artificial DeepSeek presentó el martes una versión mejorada de su modelo de reconocimiento óptico de caracteres (OCR), que incorpora un sistema de código abierto desarrollado por Alibaba Cloud para mejorar el rendimiento.

El nuevo modelo, DeepSeek-OCR 2, sustituyó un componente clave de su arquitectura original por el modelo ligero Qwen2-0.5b de Alibaba Cloud, según un informe de investigación publicado por la compañía.

La actualización, que llega poco más de tres meses después del lanzamiento de la primera versión de DeepSeek de su sistema OCR, subraya el creciente papel del ecosistema de código abierto de China en el avance del desarrollo nacional de la IA.

Alibaba Cloud es la división de inteligencia artificial y computación en la nube de Alibaba Group Holding.

En el modelo original, DeepSeek se basaba en el preentrenamiento de imágenes en lenguaje contrastivo (CLIP), un marco de redes neuronales desarrollado en 2021 por OpenAI, respaldado por Microsoft, que vincula imágenes con descripciones de texto.

En las aplicaciones de OCR, CLIP ayuda a los sistemas a identificar e interpretar el texto incrustado en las imágenes.

DeepSeek afirmó que la sustitución de CLIP por Qwen2-0.5b de Alibaba permitió a su modelo de OCR procesar documentos de forma similar a la lectura humana, siguiendo «patrones de escaneo flexibles pero semánticamente coherentes, impulsados ​​por estructuras lógicas inherentes», según la investigación.