Fysics AI, con sede en Shanghái, afirma que Fysiverse es un «modelo de mundo de nueva generación basado en la física que se ajusta a las leyes físicas del mundo real».
Una *startup* china especializada en IA física ha lanzado un nuevo modelo de mundo diseñado para simular la realidad integrando las leyes de la física directamente en su código; un enfoque que se aleja de las metodologías basadas en datos que prefieren gigantes tecnológicos estadounidenses como OpenAI y Meta Platforms.
Fysics AI, empresa con sede en Shanghái, anunció el lanzamiento de Fysiverse —descrito como un «modelo de mundo de nueva generación basado en la física que se ajusta a las leyes físicas del mundo real»— a través de una publicación en su cuenta de la red social WeChat el miércoles.
La *startup*, fundada por Zhang Lihua (exdirectivo de Nvidia), afirmó que el modelo «representa un nuevo paradigma» capaz de abordar eficazmente problemas habituales en los modelos de mundo actuales, tales como «ilusiones físicas, fallos de razonamiento y errores en escenarios no convencionales».
El sector de los modelos de mundo —utilizados para crear contenido y entrenar robots o tecnología de conducción autónoma— está dominado actualmente por tres paradigmas principales.
El primero es la generación basada en vídeo, que replica movimientos aprendiendo de enormes cantidades de videoclips. Sora, de OpenAI, es un ejemplo típico; la empresa describe el escalado de modelos de generación de vídeo como «una vía prometedora para construir simuladores de propósito general del mundo físico».
El segundo enfoque consiste en permitir que el modelo —sin conocimientos previos de física— construya sus propias reglas del mundo dentro de una «caja negra». La serie V-JEPA de Meta (siglas en inglés de arquitectura predictiva de incrustación conjunta de vídeo) es uno de estos sistemas que adopta un enfoque de «aprendizaje autosupervisado», según el sitio web de Meta.
El paradigma final se basa en el modelado tridimensional para aprender, predecir y simular la geometría y la dinámica de entornos reales a partir de texto, imágenes, vídeo o elementos 3D rudimentarios.

