En este momento estás viendo Gigantes tecnológicos chinos y la «madrina» de la IA, Li Fei-Fei, compiten por liderar el desarrollo de modelos del mundo
Captura de pantalla del modelo del mundo de Happy Oyster.

Gigantes tecnológicos chinos y la «madrina» de la IA, Li Fei-Fei, compiten por liderar el desarrollo de modelos del mundo

  • Autor de la entrada:
  • Categoría de la entrada:China
  • Última modificación de la entrada:abril 17, 2026

La presentación del modelo Happy Oyster de Alibaba para la creación en tiempo real de mundos virtuales sigue a la presentación de Spark 2.0 de World Labs, la empresa de Li.

Una oleada de empresas, desde la startup fundada por la «madrina» de la inteligencia artificial, Li Fei-Fei, hasta las mayores empresas tecnológicas chinas, compiten por presentar sus enfoques más novedosos en modelos del mundo: un campo emergente que busca extender la IA más allá del procesamiento del lenguaje, para que aprenda y comprenda la realidad física.

Alibaba Group Holding presentó el jueves Happy Oyster, un modelo de mundo abierto diseñado para la creación e interacción en tiempo real y fluida de mundos virtuales, según un comunicado de Alibaba Token Hub (ATH), la unidad de negocio del grupo de comercio electrónico recientemente creada para consolidar sus iniciativas clave de IA.

Según ATH, Happy Oyster admite dos modos de creación de mundos virtuales: un modo dirigido para construir un mundo a partir de indicaciones de texto e imágenes, y un modo exploratorio para descubrirlo.

A diferencia de las herramientas de vídeo de IA convencionales, que generan clips únicos de unos pocos segundos o minutos, Happy Oyster puede generar vídeos de hasta tres minutos que muestran mundos virtuales, explicó la compañía. Además, el modelo puede responder continuamente a las instrucciones durante todo el proceso de generación, a diferencia del paradigma de IA convencional de un solo uso.

Happy Oyster admite dos modos de creación de mundos virtuales: un modo de dirección para construir un mundo a partir de indicaciones de texto e imágenes y un modo de exploración libre para descubrir ese mundo.

Esto significa que los usuarios pueden seguir desarrollando sus mundos imaginarios con nuevas ideas, según ATH. Por ejemplo, un vídeo de demostración mostró que, durante el proceso de generación, un usuario podía simplemente escribir «cuervos negros pasan volando» para crear una bandada de cuervos volando, o ordenar a los personajes que «hablen entre sí».

El lanzamiento se produjo un día después de que World Labs, con sede en San Francisco y cofundada por Li, profesor de Stanford, presentara a principios de 2024 Spark 2.0, un motor de renderizado 3D de código abierto basado en la técnica de dispersión gaussiana, cuyo objetivo es permitir que incluso dispositivos menos potentes, como los teléfonos inteligentes, puedan visualizar imágenes 3D detalladas y a gran escala.