Tres variantes del modelo de código abierto Seed-OSS-36B de ByteDance ya están disponibles en la plataforma para desarrolladores de IA Hugging Face.
El gigante de las redes sociales ByteDance lanzó el miércoles un nuevo modelo de inteligencia artificial que busca competir con los de DeepSeek y Alibaba Cloud en el mercado global de sistemas de IA de código abierto. El departamento Seed de ByteDance, propietario de TikTok y Douyin, que supervisa la investigación en IA y el desarrollo de modelos de lenguaje extensos (LLM) de la empresa, ha subido tres variantes de su modelo de IA de código abierto Seed-OSS-36B a Hugging Face, la plataforma de desarrollo de IA de código abierto más grande del mundo.
Seed-OSS-36B fue diseñado con capacidades de propósito general y de razonamiento, con soporte para el procesamiento de ventanas de contexto extenso y diversas funciones fáciles de usar para desarrolladores, según declaró ByteDance en un comunicado.
A pesar de su modesto tamaño de 36 mil millones de parámetros (las variables internas que utiliza el sistema durante el entrenamiento para mejorar su rendimiento), Seed-OSS-36B ofrecía capacidades competitivas, según la compañía. Los modelos de IA de código abierto lanzados por otras empresas chinas tienen parámetros decenas de veces mayores.
Citando pruebas de referencia recientes, ByteDance afirmó que su nuevo modelo de IA igualaba o superaba las capacidades de ofertas de tamaño similar de competidores como Alibaba Cloud, Google y OpenAI, así como del modelo Seed 1.6 de la propia empresa. Alibaba Cloud es la división de inteligencia artificial y computación en la nube de Alibaba Group Holding.

El lanzamiento de Seed-OSS-36B AI por parte de ByteDance refleja cómo las empresas chinas de IA siguen reduciendo la brecha con sus homólogas estadounidenses mediante el enfoque de código abierto, que pone el código fuente de los modelos de IA a disposición de desarrolladores externos para su uso, modificación y distribución.

