Un popular punto de referencia para el rendimiento de modelos de IA podría presentar fallas, advierten investigadores de Meta
"Hemos identificado múltiples lagunas en SWE-bench Verified", afirma el director del laboratorio de investigación de IA Fair de Meta Platforms. Un popular punto de referencia para medir el rendimiento de…
Sin comentarios
septiembre 10, 2025
