¿Alguna vez has imaginado la existencia de universos paralelos?.
El equipo DISC de Fudan, dirigido por el profesor asociado Wei Zhongyu de la Escuela de Big Data de la Universidad de Fudan, ha construido una «sociedad humana basada en silicio» impulsada por agentes inteligentes a gran escala, que utilizan la realidad como espejo.
Este mundo simulado cuenta con el respaldo de un grupo de más de diez millones de usuarios reales, lo que le permite simular actividades de grupos sociales, escuchar voces de todo el mundo y de todos los ámbitos de la vida, y ayudar a los gobiernos y a las empresas a tomar decisiones más informadas.
Este es su simulador social basado en modelos a gran escala: SocioVerse.
Desde la simulación de la comunicación en las redes sociales hasta el servicio a la toma de decisiones sociales, ¿cómo se construye una sociedad de millones de “personas basadas en silicio”?.
Quienes han participado en investigaciones de práctica social o del sector se han encontrado con esta situación: distribuyen cuestionarios a varios grupos, piden a la gente que los complete e incluso les adjuntan sobres rojos (regalos en efectivo). Después de tanto esfuerzo, a menudo solo obtienen unos pocos cientos de resultados.
En una sociedad más amplia, ¿cómo formulan políticas los gobiernos?. ¿Cómo optimizan y renuevan sus productos las empresas?. ¿Cómo predicen los asesores de inversión las tendencias del sector?. Todas estas decisiones se basan en encuestas sociales a gran escala, un proceso que requiere mucho tiempo y trabajo.
¿Es posible construir una sociedad basada en silicio, impulsada por agentes inteligentes a gran escala, una plataforma de encuesta ideal que pueda responder a todas las preguntas, satisfacer todas las solicitudes y proporcionar la cantidad de datos necesaria, satisfaciendo así las necesidades de las encuestas sociales?. SocioVerse, un modelo de simulación social mundial lanzado por el equipo DISC, fue creado precisamente para satisfacer esta necesidad.

El equipo DISC, fundado en 2016, no fue el primero en pensar en el uso de modelos a gran escala para la simulación social. Académicos de la Universidad de Stanford, la Universidad de California y la Universidad de Tsinghua, entre otros, ya habían realizado investigaciones similares. Sin embargo, construir una «sociedad simulada» verdaderamente creíble siempre ha enfrentado un desafío fundamental: ¿cómo armonizar lo virtual con la realidad?.
La respuesta del equipo DISC es el concepto central de SocioVerse: a través del motor de entorno social, el motor de usuario, el motor de escena y el motor de comportamiento, la sociedad simulada se actualiza constantemente para mantenerse al día con la dinámica del mundo real.
Entre ellos, el motor del entorno social es responsable de inyectar la información más reciente de la realidad (como la introducción de nuevas regulaciones, ajustes de precios del petróleo, etc.) en la sociedad simulada en tiempo real; el motor del usuario proporciona perfiles de población del mundo real e información semilla para simulaciones individuales; el motor de escena abstrae las interacciones sociales del mundo real en plantillas estandarizadas, como cuestionarios, entrevistas en profundidad e interacciones en las redes sociales; y el motor de comportamiento es el cerebro del marco, responsable de integrar la información e impulsar las acciones de los agentes inteligentes.

Durante la construcción del simulador social, el equipo se enfrentó a numerosos desafíos técnicos. Los dos principales desafíos fueron: cómo diseñar un buen motor de comportamiento para reducir el coste de inferencia de la simulación individual a gran escala, y cómo construir un motor de usuario para lograr una simulación individual de alta precisión a gran escala.
Las dos bases de investigación existentes del equipo en simulación social allanaron el camino para esto. Ya a principios de 2024, el equipo DISC propuso usar LLM y ABM para construir agentes híbridos, reduciendo así los costos de simulación. Dividieron al grupo objetivo en usuarios principales y usuarios comunes, diseñaron un motor de comportamiento mediante un mecanismo de conducción jerárquico de «LLM → usuarios principales, ABM → usuarios comunes», y lanzaron HiSim, la primera plataforma de simulación de redes sociales de código abierto de China. Esta plataforma replica el entorno interactivo y el mecanismo de mensajería de la plataforma social X, admite la transmisión de información de doble canal en dominios públicos y privados, la conducción en tiempo real y la activación de eventos fuera de línea, y logra una simulación dinámica de la interacción del usuario, la evolución de la actitud y la difusión del comportamiento grupal.

La plataforma creó agentes gemelos para 1.000 usuarios reales de redes sociales y realizó predicciones de comportamiento durante 14 días. El rendimiento de la simulación se validó con un conjunto de datos compuesto por tres eventos reales. Los resultados experimentales muestran que la plataforma de simulación se ajusta en gran medida a los datos de comportamiento reales en diversas métricas, como la consistencia del comportamiento del usuario y las tendencias en los cambios de actitud emocional. Los resultados de la investigación se publicaron en ACL 2024, una conferencia de referencia en el campo del procesamiento del lenguaje natural.

La construcción de usuarios semilla dentro del motor de usuarios es el motor principal que permite alinear todo el marco con poblaciones reales, y su diseño se basa en el marco ElectionSim desarrollado por el equipo para la predicción de elecciones políticas. En este trabajo, comenzaron diseñando una población de millones de personas.
“Recopilamos una gran cantidad de publicaciones históricas públicas de usuarios de Twitter y desarrollamos un modelo de lenguaje para etiquetarlas automáticamente con etiquetas demográficas en múltiples dimensiones, como género, edad y raza”, explicó Lin Jiayu, miembro principal del proyecto ElectionSim y estudiante de doctorado en estadística para 2024. ElectionSim, mediante la construcción de 340.000 agentes, logró una precisión de predicción promedio superior al 90% en las elecciones presidenciales estadounidenses de 2016, 2020 y 2024, con una mejora del rendimiento del 34% con respecto a métodos tradicionales como el ABM en la predicción del porcentaje de votos en estados clave. En este estudio, también revelaron que el error de simulación disminuye a medida que aumenta la proporción de la población muestreada, lo que valida la necesidad de la construcción individual a gran escala.

El éxito de HiSim y ElectionSim hizo que Wei Zhongyu se diera cuenta de que la simulación social no debería limitarse a uno o dos escenarios de aplicación específicos, sino que debería expandirse a más campos y a una investigación en ciencias sociales a mayor escala.
“Aunque todos mis mentores durante mi época estudiantil tenían formación en ingeniería, todos prestaban mucha atención a las dinámicas sociales. Por eso, cuando investigo, suelo pensar en cómo lograr que la investigación realmente impulse el sustento de las personas y los servicios sociales”, compartió Wei Zhongyu. Además de ser profesor asociado en la Escuela de Big Data, también es mentor a tiempo completo en la Academia de Innovación de Shanghái y director del Centro de Investigación Conjunta de Finanzas Electrónicas Fudan-China para Tecnología Financiera Inteligente.
Tras meses de desarrollo, se lanzó SocioVerse. El número de usuarios ha crecido de millones a decenas de millones, abarcando tanto usuarios chinos como angloparlantes, y las dimensiones de las etiquetas se han ampliado a 15, incluyendo edad, género, ocupación, ingresos, nivel educativo, tipo de residencia, región, situación laboral, estado civil e intereses. Esto significa que el modelo no solo puede simular entornos sociales más complejos, sino que también proporciona datos individuales más precisos, lo que facilita la investigación en ciencias sociales.
SocioVerse integra múltiples ejemplos de aplicaciones, incluidos efectos de difusión de noticias, predicción de elecciones, encuestas económicas nacionales y agentes inteligentes de investigación en ciencias sociales, y ha logrado excelentes resultados en la verificación en varios escenarios.

La plataforma Socioverse desarrollada por el equipo logra un alto grado de alineación con el mundo real en diferentes escenarios de simulación social, y utiliza DeepSeek-V3 como motor de comportamiento, que tiene el mejor rendimiento en promedio.
Zhang Xinong, miembro clave del proyecto y estudiante de doctorado de la generación 2023, afirmó que el avance de Socioverse es inseparable de la participación conjunta de académicos de humanidades y ciencias sociales de la Universidad de Fudan. «Integrar el paradigma de investigación de las humanidades y las ciencias sociales en la IA es un proceso muy complejo. Todo el proyecto es producto de una continua interacción y optimización iterativa por parte de académicos de diferentes disciplinas. Académicos de instituciones como la Facultad de Periodismo, el Instituto de Estudios Avanzados en Ciencias Sociales, la Facultad de Economía y la Facultad de Relaciones Internacionales y Asuntos Públicos de la Universidad de Fudan, así como de la Universidad de Rochester, han aportado valiosas sugerencias para mejorar la plataforma», afirmó.

“El sistema académico integral de la Universidad de Fudan nos proporciona un entorno excelente para promover la investigación interdisciplinaria en IA”, comentó Wei Zhongyu. «Es una gran suerte poder encontrar fácilmente a destacados académicos de diferentes disciplinas con quienes intercambiar ideas».
Actualmente, SocioVerse ha abierto un grupo de usuarios de un millón de plataformas de redes sociales en inglés y ha lanzado la plataforma de simulación de encuestas sociales «SocioVerse», que ofrece servicios de simulación social en línea y apoya la investigación interdisciplinaria. Más de 100 organizaciones, incluyendo el Centro de Nuevos Medios de CCTV, han completado más de 10.000 interacciones en la plataforma.

Colaboración entre la industria y la universidad y tecnología para el bien: hacer de la IA una infraestructura para promover la salud.
Además de centrarse en cuestiones sociales más amplias, el equipo DISC también analiza la vida cotidiana y el trabajo de las personas, adaptando herramientas de IA a diferentes profesiones y escenarios. La atención médica es una de las áreas de aplicación clave del equipo.
El 1 de septiembre de 2023, el equipo Fudan-DISC lanzó su modelo médico a gran escala, DISC-MedLLM, desarrollado por él mismo, y publicó 470.000 puntos de datos de ajuste, lo que atrajo la atención de Huawei. Tras conversaciones, ambas partes decidieron cooperar técnicamente en un asistente de IA para el deporte y la salud.
Esta tecnología se ha implementado con éxito en el módulo deportivo y de salud «Wrist Art» del primer reloj inteligente con inteligencia artificial HarmonyOS de Huawei, el Watch 5.

“ Xiao Yi, he estado teniendo muchos sueños estos últimos días, y cuando me despierto siempre siento que no he descansado lo suficiente”.
“Acabo de revisar tus datos de sueño. Últimamente duermes un poco menos y te has estado acostando tarde. Intenta un horario de sueño regular; ¡tu calidad de sueño mejorará mucho!”.
Con solo unas palabras con «Xiaoyi», recibirás asesoramiento amable y profesional. Actualmente, «Xiaoyi» ofrece un análisis exhaustivo de 200 datos de salud, como frecuencia cardíaca, sueño y ejercicio, así como análisis específicos para más de 20 tipos de ejercicio.
Detrás de «Wrist Art» se encuentra el primer sistema de razonamiento de grafos de conocimiento causal de la industria para el deporte y la salud, creado por el equipo DISC. Este sistema, llamado «Expert-In-The-Loop», tiene una estructura de dos capas: una recopila datos de ejercicio e indicadores corporales del usuario, y la otra conecta con grandes cantidades de conocimiento médico, fusionando ambas redes para lograr un razonamiento científico.
Durante el desarrollo, el equipo estaba sujeto a restricciones de privacidad y no podía acceder directamente a los datos de los usuarios. En ese momento, el proyecto SocioVerse, que se desarrollaba simultáneamente en el equipo, los inspiró: ¿por qué no crear sus propios escenarios simulados de interacción médica y sanitaria y utilizar los datos de diálogo sintéticos generados por el modelo completo como corpus de entrenamiento?. Finalmente, el equipo logró los objetivos del proyecto gracias a su sólida experiencia técnica.

¿Qué lecciones podemos aprender de esta exitosa colaboración?. Wei Zhongyu afirmó que los académicos universitarios deben mantener su independencia académica y afrontar con confianza las necesidades de las empresas. «Debemos aprender a transformar los problemas prácticos en temas de investigación para lograr la promoción mutua entre la investigación científica y la industria». La cooperación universidad-empresa también es un proceso de interacción entre la tecnología y la sociedad. «La IA debe estar profundamente arraigada en la sociedad, integrando la experiencia clínica con las necesidades reales. La regulación gubernamental y la concienciación pública también son elementos clave para su desarrollo saludable».
Participar activamente en situaciones reales de colaboración entre la universidad y la industria también es una excelente oportunidad de formación para los estudiantes. «La verdadera implementación de la investigación no consiste en convertir artículos en productos, sino en reincorporar situaciones reales a la investigación: estamos construyendo un puente entre la academia y la ingeniería que conecta problemas y necesidades», afirmó Bao Zhijie, miembro principal del proyecto y estudiante de doctorado en estadística en 2024.
El equipo DISC se ha dedicado durante muchos años a facilitar la gestión de la salud humana con IA, y su colaboración con Huawei es solo un ejemplo. También se han asociado con el Grupo Yili para crear el primer agente inteligente de nutrición y salud de China, con un despliegue a gran escala; han colaborado con el Centro de Enfermería Basada en la Evidencia de la Universidad de Fudan para desarrollar EviNurse, el primer modelo inteligente de preguntas y respuestas para enfermeras, que promueve el desarrollo inteligente de la enfermería; y han desarrollado conjuntamente con varios hospitales el asistente de triaje médico y de salud «PIORS» para mejorar la precisión del triaje.

Wei Zhongyu cree que la IA se convertirá en una infraestructura esencial en nuestras vidas en el futuro, con funciones cada vez más potentes y menos barreras de entrada. «Lo que debemos considerar es cómo usar la IA para mejorar el índice de felicidad de la sociedad humana. Este es también el motor de mi continua investigación y estudio en profundidad».
Dirección del proyecto Socioverse: www.fudan-disc.com/socioverse.

