El ganador del Premio Turing ha argumentado que el progreso en robótica depende esencialmente de importantes avances en la investigación en arquitecturas de planificación de «modelos mundiales».
En medio de los crecientes temores de que el auge de la IA se esté convirtiendo en una burbuja, un científico ampliamente respetado y pionero del aprendizaje profundo ha advertido ahora sobre otra burbuja que se está gestando: la carrera de robots humanoides.
Yann LeCun, científico jefe de IA en Meta, ha advertido que la mayoría de las empresas de robótica no saben cómo desarrollar la inteligencia necesaria para hacer que los robots humanoides sean útiles y, en cambio, se centran en construir el hardware.
«Hay un gran número de empresas de robótica que se han creado en los últimos años construyendo robots humanoides. El gran secreto de la industria es que ninguna de esas empresas tiene idea de cómo hacer que esos robots sean lo suficientemente inteligentes como para ser útiles o, debería decir, lo suficientemente inteligentes como para ser útiles en general», dijo LeCun. Habló en el Simposio inaugural sobre impacto de la IA generativa (MGAIC) del MIT en el prestigioso Instituto de Tecnología de Massachusetts en Massachusetts, Estados Unidos.
«Podemos entrenar esos robots para tareas particulares, tal vez en la fabricación y cosas así. Pero en el caso de los robots domésticos, hay un montón de avances que deben llegar a la IA antes de que eso sea posible», añadió LeCun. Sostuvo además que el futuro de estas empresas, que han logrado recaudar miles de millones de dólares en inversiones, depende esencialmente de «si vamos a lograr avances, avances significativos, hacia ese tipo de arquitecturas de tipo planificación de modelo mundial».
Los comentarios de LeCun reflejan una evaluación aleccionadora de varios obstáculos a nivel de investigación que deben abordarse para iniciar la década de la robótica. La carrera de la IA generativa también ha generado comentarios de advertencia, y los expertos señalan que se deben abordar desafíos como el aprendizaje continuo para lograr la inteligencia artificial general o AGI.
«No tienen un aprendizaje continuo. No puedes simplemente decirles algo y lo recordarán. Tienen deficiencias cognitivas y simplemente no funciona. Se necesitará alrededor de una década para resolver todos esos problemas», dijo Andrej Karpathy, cofundador de OpenAI e investigador de IA/ML, en un episodio de podcast reciente que se volvió viral en las redes sociales.
Al igual que AGI, los plazos para el lanzamiento de robots humanoides a escala comercial se han convertido en un tema de debate. LeCun cree que los grandes modelos lingüísticos actuales no son capaces de impulsar robots humanoides. «En primer lugar, nos estamos perdiendo algo importante: necesitamos que los sistemas de inteligencia artificial aprendan de datos sensoriales naturales y de gran ancho de banda, como el video. Nunca vamos a llegar a la inteligencia a nivel humano entrenándonos solo con texto», dijo en el evento del MIT.
«Un niño de cuatro años ha visto tantos datos a través de la visión como los mayores LLM formados en todo el texto disponible públicamente», añadió. En cambio, el investigador francés de 65 años ha expresado su confianza en algo conocido como un “modelo mundial” para hacer que los robots sean más inteligentes.
¿Qué es un modelo mundial?.
Un modelo mundial es un sistema de inteligencia artificial que puede aprender a partir de videos de gran ancho de banda y de información sensorial para construir una comprensión interna del mundo físico.
«Dada una representación del estado del mundo en el momento T, y dada una acción que un agente se imaginaría realizar, ¿se puede predecir el estado del mundo resultante de realizar esta acción?. Ese es un modelo mundial», dijo LeCun. Destacando su propia investigación sobre arquitecturas no generativas y autosupervisadas como V-JEPA (Video Joint Embedding Predictive Architecture), que están entrenadas para predecir lo que sucederá a continuación en un video, LeCun dijo: «Esos sistemas básicamente pueden mostrar que han aprendido un poco de sentido común».
«Si les muestras un vídeo en el que ocurre algo imposible, como un objeto que desaparece espontáneamente o cambia de forma o algo así, el error de predicción se dispara. Y entonces pueden decirte que ocurrió algo realmente inusual que no entiendo. Ésa es una primera señal de un sistema de aprendizaje autosupervisado», añadió. Según LeCun, los modelos mundiales se pueden utilizar «para conseguir que un robot realice una tarea de cero posibilidades. No es necesario entrenarlo para realizar esta tarea. No hay ningún tipo de entrenamiento. No hay RL. El entrenamiento es completamente autosupervisado».
¿Quién es Yann LeCun?.
Conocido como uno de los tres padrinos de la IA, LeCun es un informático francés con experiencia en diversos campos como el aprendizaje automático, la neurociencia computacional, la visión por computadora y la robótica móvil.
LeCun tiene un doctorado en informática de la Universidad de la Sorbona. Actualmente también es profesor en la Universidad de Nueva York. Su trabajo sobre redes convolucionales y aprendizaje profundo ha transformado la forma en que las máquinas ven y aprenden, y cómo escuchan y comprenden el mundo.
En 2018, LeCun ganó el Premio Turing (que es el equivalente al Premio Nobel de informática) junto con Geoffrey Hinton y Yoshua Bengio.

