El centro RDI de UC Berkeley presentó a principios de este mes *Agents’ Last Exam*, una nueva prueba de referencia para evaluar el rendimiento de los agentes de IA.
La próxima frontera de la inteligencia artificial estará constituida por agentes capaces de realizar trabajos de «valor económico» en una amplia gama de ámbitos del mundo real, según Dawn Song, nueva vicepresidenta de investigación de IA de Meta Platforms.
«El objetivo no es reemplazar a los humanos», declaró Song al *South China Morning Post* la semana pasada, al margen del Foro Económico Mundial de Dalian —conocido también como el «Davos de verano»—, días antes de incorporarse a Meta.
«Pero queremos que estos agentes de IA sean más eficaces en estos ámbitos importantes del mundo real, ayuden a los humanos a realizar mejor su trabajo y aporten más valor económico», afirmó.
Song, profesora de informática en la Universidad de California, Berkeley, y codirectora de su Centro de Inteligencia Responsable y Descentralizada (RDI), es una reconocida científica chino-estadounidense experta en seguridad de la IA y cofundadora de Virtue AI, una *startup* dedicada a la seguridad de la IA empresarial.
El viernes, Song anunció en X que ella, junto con «muchos miembros del equipo de Virtue AI», se incorporaría a los Superintelligence Labs de Meta como vicepresidenta de investigación de IA para ayudar a definir las iniciativas de seguridad y protección de la IA de la compañía.
A principios de este mes, el centro RDI de UC Berkeley presentó *Agents’ Last Exam* (ALE), una nueva prueba de referencia que evalúa el rendimiento de los agentes de IA en más de 1.500 tareas del mundo real que generan «valor económico», abarcando 55 sectores industriales.

