En el verano de 2009, Zhang Shanghang, entonces estudiante de tercer año de universidad, cargaba una pesada mochila y se apretujó en un lento tren con destino a Beijing desde Nanjing. Acababa de pasar varias noches sin dormir preparándose para una competición y solo había conseguido comprar un billete de ida y vuelta; su cuerpo, cansado, estaba agobiado por la anticipación. El tren se balanceaba hacia el norte en la noche, mientras su mente evocaba repetidamente imágenes de su desconocido destino.

Cuando finalmente llegó a la orilla del lago Weiming, los días de viaje y ruido parecieron silenciarse al instante. El agua resplandeciente, los sauces colgantes y una profunda tranquilidad la envolvieron. «En ese momento, mi corazón se tranquilizó al instante y mis pensamientos se aclararon», recordó Zhang Shanghang. «La frase “la tranquilidad produce una influencia de gran alcance” resonó en mi mente».

Fue en esta tranquilidad que Zhang Shanghang escuchó por primera vez con una claridad incomparable su elección para su futuro: la Universidad de Beijing. Una semilla brotó en su corazón y, tras más de una década de exploración, en 2022 finalmente se incorporó a la Facultad de Ciencias de la Computación de la Universidad de Beijing como profesora adjunta, comenzando su adorada labor de investigación y docencia.

Diecisiete años después, la joven que una vez consiguió un boleto de entrada para ir a Beijing con lleno total se ha convertido en supervisora de doctorado en la Facultad de Ciencias de la Computación de la Universidad de Beijing, una de las jóvenes académicas más activas a nivel mundial en el campo de la inteligencia corpórea, y ha ocupado el primer puesto entre los académicos de la Universidad de Beijing en el prestigioso ranking mundial de ciencias de la computación, CS Ranking, durante los últimos dos años. Esa semilla que brotó junto al lago Weiming se ha convertido desde hace mucho en un árbol imponente, alimentando muchos más sueños juveniles.

01 Regresando a casa, pasando la antorcha.

Principios del verano en la Universidad de Beijing en 2013. La alegría de la temporada de graduación impregnaba los senderos arbolados, mientras los estudiantes a punto de emprender sus viajes se abrazaban para tomarse fotos, el sonido de las persianas y las risas tejían el fondo de la juventud. Zhang Shanghang, graduándose de maestría, se encontraba entre ellos cuando una figura inesperadamente captó su atención: un profesor anciano, de cabello blanco y porte refinado, que se dirigía lentamente en una bicicleta antigua hacia el Comedor de Estudiantes del Quinto Año. La luz del sol se filtraba entre las hojas, proyectando patrones de luz moteada. El anciano parecía estar envuelto en un filtro sereno, creando un suave contraste con el ruido circundante.

En ese momento, el tiempo pareció detenerse, recordándole la tranquilidad que sintió cuando vio por primera vez el lago Weiming en 2009. De pie allí, observando la figura que se alejaba, Zhang Shanghang sintió un anhelo ardiente que la invadía. El pensamiento de años atrás resurgió: «¡Qué feliz sería si pudiera regresar a la Universidad de Beijing y dedicarme a la docencia toda mi vida!».

Este profundo apego a la Universidad de Beijing se convirtió en su mayor impulso durante sus ocho años de estudios en el extranjero y en una brújula que guió su vida. La creciente sensación de reticencia la guió sutilmente hacia su destino. «Lo que amas, sin duda se hará realidad. El sueño que planté al dejar el campus en 2013 siempre ocupó un lugar especial en mi corazón, un sentimiento de ‘volveré’, y realmente se hizo realidad».

En 2022, la semilla que plantó durante su primera visita a la Universidad de Beijing como estudiante de tercer año echó raíces y germinó. Zhang Shanghang regresó a China como deseaba, incorporándose a la Facultad de Informática de la Universidad de Beijing para dedicarse a la docencia y la investigación, convirtiendo su anhelado sueño en realidad. Liderando un equipo de más de diez estudiantes de maestría y doctorado, con el apoyo del Centro Nacional de Investigación en Ingeniería de Video y Tecnología Visual y el Laboratorio Nacional Clave de Procesamiento de Información Multimedia, investiga en su campo de profundas raíces, el «aprendizaje automático generalizado», buscando mejorar la capacidad de generalización de la inteligencia incorporada en mundos abiertos.

En cuanto a sus premios y logros, admite con franqueza que no los ha convertido en su objetivo, sino que enfatiza su firme convicción: «Céntrate en el proceso, no en el resultado». El ambiente y la cultura del grupo de investigación de Zhang Shanghang son idénticos a los que experimentó durante sus estudios.

Está profundamente agradecida con su tutor de maestría, el profesor Gao Wen, por cultivar sus habilidades de pensamiento para identificar, definir y resolver problemas; con su tutor de doctorado, el profesor José Moura, por apoyarla en la experimentación de nuevos métodos; y con su tutor postdoctoral, el profesor Kurt Keutzer, por permitirle explorar libremente en el ambiente académico abierto y diverso del Instituto BAIR de UC Berkeley. «Crecí para ser como tú», dice. Ahora, como profesora, enfatiza «enseñar según las aptitudes, guiar por los intereses, complementar las fortalezas y debilidades, y asegurar que cada uno encuentre su lugar». Primero, permite a los estudiantes elegir temas de investigación según sus intereses, consolidando sus bases de investigación y brindándoles retroalimentación positiva; luego, aborda específicamente sus debilidades, asegurándose de que cada estudiante «encuentre su lugar, tenga pasión en el corazón y luz en la mirada».

Años después, los estudiantes de su equipo han crecido rápidamente. Entre ellos, Liu Jiaming, el primer estudiante de doctorado de Zhang Shanghang, publicó una serie de trabajos sobre modelos corporizados de gran tamaño en importantes congresos internacionales, atrayendo la atención de reconocidos académicos internacionales como el profesor Sergey Levine de la Universidad de California en Berkeley, recibiendo financiación para un Proyecto Juvenil de la Fundación Nacional de Ciencias Naturales de China (NSFC) y una beca ByteDance, y emergiendo como una estrella emergente en el campo de la inteligencia corporizada.

El estudiante de doctorado canadiense Gaole Dai recibió asesoramiento de Zhang Shanghang para realizar una investigación interdisciplinaria en IA y biología, con un enfoque en el desarrollo de habilidades de aprendizaje profundo, basándose en su formación universitaria en biología. Gaole se ha convertido en un talento integral, publicando un extenso artículo como primer autor en *Nature Computational Science*.

De igual manera, el estudiante de maestría Tan Huajie también experimentó una transformación interdisciplinaria. Con experiencia en hardware de circuitos integrados, bajo la guía de Zhang Shanghang, construyó el modelo corpóreo de RoboBrain, convirtiéndose en un pionero en el campo de los cerebros corpóreos. Su trabajo en RoboBrain, como primer autor, se ha convertido en un hito en el desarrollo de «cerebros corpóreos de propósito general» y fue presentado en el sitio web de la prestigiosa conferencia internacional CVPR.

«El crecimiento de mis estudiantes es lo que encuentro más gratificante. Verlos pasar de la confusión a la determinación, de la perseverancia a la creación; la retroalimentación positiva de este proceso supera cualquier premio.»

Al hablar con sus alumnos, siempre piensa en su propio camino, en las innumerables veces que se abrió paso a tientas en la niebla, en los numerosos reinicios, comprendiendo profundamente la dificultad de cada paso del crecimiento. También está profundamente agradecida con cada profesor y alumno que la ha ayudado en el camino, empatizando así con las dificultades que enfrentan sus alumnos en su investigación.

A menudo anima a sus alumnos a afrontar todas las experiencias de forma positiva, incluso ante la adversidad, a encontrar sus fortalezas en ellas, a «mirar hacia arriba con los pies en la tierra» y a esperar pacientemente su camino hacia el éxito. No se preocupen por el resultado, sino que sigan adelante hasta perfeccionarlo, convirtiendo el «resultado» en un «proceso». «Todos los resultados son buenos; si no son lo suficientemente buenos, aún no son resultados».

Antes de unirme al grupo, la profesora Zhang y yo tuvimos una larga conversación telefónica. Analizó mi futura dirección de investigación desde mi perspectiva y me proporcionó referencias para la planificación basadas en sus experiencias de vida. Durante los tres años siguientes, fue mentora y amiga, una figura de hermana mayor cariñosa, supervisando constantemente el desarrollo y la investigación de cada estudiante del laboratorio, comunicándose proactivamente con ellos y esforzándose por brindarles orientación y consejos.

02 Rastreando y llegando lejos.

A finales del año pasado, se celebró con éxito el discurso de Nochevieja «Ciencia de la Universidad de Beijing ¡Sí! — 2026», organizado por la Universidad de Beijing, que atrajo a más de un millón de espectadores en línea. Zhang Shanghang se paró frente a la cámara y pronunció un discurso titulado «Cómo hacer que los robots se muevan y piensen como humanos», explicando su profunda investigación sobre la inteligencia corpórea de forma accesible y repasando su trayectoria investigadora en la construcción del «cerebro» de los robots.

En su discurso, Zhang Shanghang señaló sucintamente los puntos débiles de la industria y ofreció su respuesta tras años de dedicación: construir un «marco de circuito cerrado de largo alcance para sistemas rápidos y lentos similares a los humanos», creando un modelo base unificado para robots que sea completamente modal, permanente y autoevolutivo.

La innovación de Zhang Shanghang supera las limitaciones de los algoritmos tradicionales de control de robots, que carecen de generalización y versatilidad. Introduce la tecnología de modelos a gran escala «completamente modal, permanente y autoevolutivo» en la inteligencia corpórea, permitiendo que los robots evolucionen hasta convertirse en agentes inteligentes pensantes y generalizables. Esto proporciona una vía tecnológica clave para construir el cerebro de un robot de propósito general.

Desde RoboOS, el primer marco de colaboración cerebelo-cerebelo corpóreo entre robots de la industria, hasta RoboBrain, el cerebro corpóreo recomendado oficialmente por la principal conferencia internacional de IA CVPR; Desde RoboMamba, el cerebelo corpóreo reconocido como un logro de vanguardia en tecnología de inteligencia corpórea que superó el obstáculo de la eficiencia del razonamiento en grandes modelos corpóreos, hasta WoW, el modelo del mundo que permite a los robots comprender y predecir el mundo real y que apareció en CCTV News; desde Fast-in-Slow, el primer modelo a gran escala de sistema integrado rápido-lento, hasta LaST0, un modelo a gran escala integrado con comprensión generativa que introduce el razonamiento en cadena de pensamiento espaciotemporal en el espacio latente; desde TwinRL, un marco de aprendizaje de refuerzo colaborativo de gemelos digitales para expandir sistemáticamente el espacio de exploración de los sistemas operativos de robots del mundo real, hasta RoboMIND, el primer conjunto de datos nacional de inteligencia corpórea de propósito general con más de dos millones de descargas en todo el mundo y ganador del premio «Best Open Source Intelligence Breakthrough Award» en la conferencia anual de tecnología de sistemas operativos de código abierto…

Zhang Shanghang y su equipo han superado sucesivamente los obstáculos que impiden que los robots salgan del laboratorio, construyendo sistemáticamente una ruta tecnológica clave desde un modelo base unificado hasta capacidades de evolución autónoma para que los robots se incorporen al mundo real.

Precisamente gracias a esta serie de logros «de 0 a 1», Zhang Shanghang se convirtió en la única profesora de la Universidad de Beijing en formar parte del Comité Técnico de Normalización de Robots Humanoides del Ministerio de Industria y Tecnología de la Información. Fue seleccionada para la Lista Global de Jóvenes Académicas Chinas en IA y para el 2% de las Científicas más Destacadas del Mundo, ganando el Premio a la Mejor Interacción en los Juegos Mundiales de Robots Humanoides, el Premio a la Excelencia en la Competencia de Robots Biónicos de Zhongguancun y el Premio a la Científica Shi Qingyun de la Sociedad China de Imagen y Gráficos. Durante los últimos dos años, ha ocupado el primer puesto entre los académicos de la Universidad de Beijing en el prestigioso ranking mundial de informática CS Ranking, y su trabajo ha sido citado más de 25.000 veces en Google Académico.

Sin embargo, la exploración científica de Zhang Shanghang no ha sido un avance repentino, sino la culminación de más de una década de esfuerzo constante. Esta dedicación a la construcción del «cerebro» de los robots ya era evidente desde el inicio de sus estudios. A lo largo de su trayectoria académica, acumuló una amplia experiencia en el campo del aprendizaje automático generalizado, lo que le permitió alcanzar un rápido crecimiento y grandes avances en su campo elegido, la inteligencia corporizada.

Zhang Shanghang, en broma, se define a sí misma como una idealista a nivel macro. Incluso en su época de estudiante hace diez años, atreverse a romper barreras e innovar siempre ha sido su estilo de investigación. Aunque el camino por delante pueda estar envuelto en niebla, los pioneros avanzarán con determinación para enfrentarse a lo desconocido, a tientas y esperando pacientemente el amanecer.

03 Definición y Avance.

Durante sus estudios en la Universidad Carnegie Mellon, su asesor doctoral, el profesor José Moura (miembro de la Academia Nacional de Ingeniería, la Academia Nacional de Inventores y presidente global del IEEE 2019), le encomendó una tarea ambicioso y abierta: «Hay videos de vigilancia en cada intersección de la ciudad de Nueva York. Vean qué información pueden analizar de ellos». No existía una definición clara del problema, ni datos fácilmente disponibles, ni una guía metodológica específica. Su primer proyecto doctoral se desplegó ante ella como un páramo yermo, casi sin señales de tráfico.

Todo tuvo que empezar desde cero. Descargó, organizó y etiquetó vídeos de 212 cámaras en el área de Manhattan. Cuantos más datos se acumulaban, más difícil se volvía el problema. La enorme cantidad de vídeos de tráfico de baja resolución, baja velocidad de fotogramas y alta variabilidad la obsesionó casi por completo; incluso mientras caminaba y comía, pensaba constantemente en cómo definir y resolver el problema. Lo más difícil no fue la metodología ni la realización de experimentos, sino la pregunta fundamental de «¿qué problema ‘real’ se está resolviendo?». Durante un tiempo, refutó casi a diario las ideas del día anterior.

A pesar de repetidos rechazos, volvió al principio más básico de «identificar el problema». Una noche, cuando se dio cuenta de que «cada cámara es en realidad un dominio de datos diferente», su pensamiento se aclaró de repente. Diferentes fondos, diferentes condiciones climáticas, diferentes ángulos: en esencia, todo esto resultó en diferencias en la distribución de los datos. Ya no se centraba en el rendimiento de una sola tarea, sino que comenzó a pensar: ¿cómo puede el modelo generalizarse de forma estable en diferentes distribuciones de datos? Finalmente, definió el tema abierto como un problema científico claro: la detección y el conteo de vehículos generalizados en todo el dominio.

La compleja ingeniería se condensó gradualmente en un problema científico claro y profundo: el aprendizaje automático generalizado. Este no solo fue el principal obstáculo técnico al que se enfrentó en ese momento, sino también el punto de partida de su investigación posterior sobre el «aprendizaje automático generalizado».

Desde sus estudios de doctorado y posdoctorado hasta su puesto como profesora en la Universidad de Beijing, su investigación ha girado constantemente en torno al tema central del «aprendizaje automático generalizado». En su opinión, la clave para que los robots puedan salir realmente del laboratorio y entrar en el mundo físico real reside en lograr capacidades de generalización entre escenarios y tareas. Este no solo es el desafío científico más crítico al que se enfrenta actualmente la inteligencia incorporada, sino también un camino esencial para lograr la evolución de los robots autónomos.

Una vez definido el problema, el siguiente paso es resolverlo. En los inicios del aprendizaje profundo, la mayoría de los problemas de visión artificial se resolvían mediante algoritmos tradicionales de aprendizaje automático. Para mejorar la capacidad de generalización de los modelos, Zhang Shanghang propuso inicialmente una teoría y un algoritmo de aprendizaje antagónico adaptativo multidominio basado en redes neuronales profundas. Esto mejoró eficazmente la capacidad de generalización del modelo entre escenarios y abrió una nueva dirección de investigación para problemas adaptativos multidominio.

Este intento audaz produjo resultados significativos. Incluso ahora, Zhang Shanghang agradece profundamente a sus antiguos mentores, quienes, en lugar de rechazar de inmediato sus soluciones poco convencionales, le brindaron amplio apoyo y espacio para la exploración. Atreverse a romper con las mentalidades establecidas, trascender los métodos tradicionales y proponer ideas innovadoras se ha convertido en la mentalidad investigadora de Zhang Shanghang. Como autora principal, participó en el AAAI Best Paper, *Informer*, uno de los primeros trabajos internacionales sobre predicción de series temporales basado en *Transformer*, y propuso técnicas de modelado de atención dispersa para superar el problema de la acumulación de errores en las redes neuronales recurrentes tradicionales. Este trabajo ha sido citado más de 9.500 veces en Google Scholar.

«Lo más importante no son los puntos de conocimiento específicos, sino el proceso de pensamiento investigador: desde el descubrimiento de problemas ‘reales’ importantes, hasta su definición como preguntas científicas claras y la propuesta de soluciones novedosas y eficaces. Este proceso de descubrir y resolver problemas ‘reales’ es más importante que el resultado».

Gradualmente, se dio cuenta de que la verdadera retroalimentación positiva en la investigación científica no proviene de la noticia de la aceptación de un artículo o de los premios, sino de una comprensión repentina tras mucha reflexión; la concentración y la dedicación en el proceso son la fuente de que todo «encaje».

04 Conclusión.

Del agotamiento de una noche abarrotada a la tranquilidad del lago Weiming; del desconcierto ante 212 cámaras en Nueva York a la exploración del Laboratorio Berkeley; de estudiar en el extranjero al aula de la Universidad de Beijing. La trayectoria vital de Zhang Shanghang encarna claramente una creencia simple pero poderosa: «Persigue tu pasión, nunca olvides tus aspiraciones originales, concéntrate en el proceso y no te preocupes por el resultado».

Es precisamente esta concentración extrema en el proceso y la paciencia para «escuchar el trueno en silencio» lo que le permitió tomar decisiones claras en cada encrucijada, encontrar la fuerza para superar cada adversidad y, en última instancia, escribir una historia de vida que se desarrolla con naturalidad.

01 Regresando a casa, pasando la antorcha.

02 Rastreando y llegando lejos.

03 Definición y Avance.

04 Conclusión.

También podría gustarte

Descubre el futuro de la IA en China a través de 1.500 proyectos

Más allá del bien y el mal ¿Qué papel juega la IA en ciberseguridad?

Un recorrido exclusivo por el laboratorio Trainium de Amazon, el chip que ha conquistado a Anthropic, OpenAI e incluso a Apple