Kuaishou espera que las capacidades del nuevo modelo impulsen su adopción por parte de cineastas, estudios de producción, anunciantes e influencers.
La plataforma china de videos cortos Kuaishou lanzó el lunes un nuevo modelo de generación de video con inteligencia artificial para competir con Sora de OpenAI y la startup Runway en el mercado global de la creación de contenido con IA.
Kuaishou, que compite con Douyin, la plataforma china hermana de TikTok, afirmó que Kling O1 fue el primer modelo de video multimodal unificado de la industria, basado en una arquitectura que integra diversas tareas de creación de video (generación, edición precisa y controlable, y comprensión) en una única plataforma, proporcionando un «flujo de trabajo integral y fluido para la industria creativa», según un comunicado.
Kling O1 fue aclamado como el «Nano Banana para video con IA», según Álvaro Cintas-Canto, profesor adjunto de IA y ciberseguridad en la Universidad Marymount de EE.UU. Elogió la versatilidad de la herramienta de video para gestionar la conversión de texto a video, la edición de contenido y el mantenimiento de la coherencia de los personajes en escenas complejas en una publicación en su cuenta X el lunes.
Nano Banana es el modelo de generación y edición de imágenes de Google, conocido por su precisa manipulación de los elementos visuales en una foto. Kuaishou afirmó ser el primero en la industria en incorporar las mismas capacidades avanzadas de edición en un modelo de generación de video, allanando el camino para su uso en entornos reales en diferentes industrias.

Kuaishou atribuyó las capacidades multimodales y la comprensión semántica de Kling O1 a la capacidad de asimilar y comprender diferentes formatos de contenido, desde texto, imágenes, video y elementos visuales. Esto le permitió ver y comprender diferentes partes y perspectivas de una imagen, video o personaje que los usuarios suben como referencia al generar videos, a la vez que retocaba el contenido de video con mayor precisión.

