Un análisis publicado en *Nature* revela que un número creciente de investigadores utiliza modelos lingüísticos complejos para la búsqueda de literatura, la redacción de manuscritos y la compilación de bibliografías. Sin embargo, los modelos de inteligencia artificial (IA) a veces generan entradas sin fundamento alguno. Se prevé que, a partir de 2025, decenas de miles de publicaciones académicas podrían verse afectadas por estas citas inválidas generadas por IA.
Los expertos señalan que si se permite que las «citas ilusorias» se infiltren en el sistema académico, no solo conducirán a conclusiones erróneas e interferirán con investigaciones posteriores, sino que incluso podrían desviar las líneas de investigación. A largo plazo, esto erosionará silenciosamente la confianza pública en la ciencia.
La «fabricación de citas de la nada» se intensifica.
A principios de este año, Guillaume Kabanaker, informático de la Universidad de Toulouse (Francia), recibió una notificación de Google Scholar informándole de que su artículo había sido citado en un trabajo publicado en el *International Journal of Dentistry*. Quedó bastante desconcertado: su investigación se centraba en identificar artículos falsificados, completamente ajenos a la odontología, y no recordaba en absoluto el artículo citado. Especuló que la cita probablemente era una alucinación creada por la IA.
Esto es solo la punta del iceberg. Numerosos estudios e investigaciones demuestran que, con el creciente uso de grandes modelos lingüísticos en la recuperación de información, la redacción de manuscritos y la bibliografía, el fenómeno de la «fabricación» de citas académicas por parte de la IA se está volviendo cada vez más frecuente.
Los errores de citación no son nuevos en la publicación académica. Mohammed Hussein, experto en ética e integridad académica de la Facultad de Medicina Feinberg de la Universidad Northwestern, afirmó que los errores de citación existían antes del auge de la IA generativa, como nombres de autores mal escritos, años de publicación o títulos de revistas incorrectos, identificadores de objetos digitales (DOI) faltantes o introducidos incorrectamente, y discrepancias entre el contenido real de la literatura citada y los detalles proporcionados por quien la cita. Sin embargo, las «citas ilusorias» actuales no son simples discrepancias de información, sino falsificaciones directas; son conceptos fundamentalmente distintos.
Durante el último año, las «citas fantasma» han aparecido con frecuencia en diversas publicaciones. Un análisis de casi 18.000 artículos de tres congresos de informática reveló un aumento considerable en el número de referencias que no se pueden rastrear hasta sus publicaciones originales. Los datos publicados en enero indicaron que el 2,6% de los artículos de 2025 ya contenían al menos una «cita fantasma», en comparación con solo el 0,3% en 2024. Otro estudio de febrero estimó que entre el 2% y el 6% de los artículos presentados en otras cuatro conferencias de informática en 2025 contenían títulos o referencias que no podían verificarse mediante bases de datos y archivos de revistas.
Un análisis exclusivo realizado por el equipo de noticias de *Nature* en colaboración con la empresa británica Grounded AI confirma además que al menos decenas de miles de artículos de revistas, monografías y actas de congresos de 2025 podrían contener «citas fantasma» generadas por IA.
Nick Morley, cofundador y director de producto de Grounded AI, reveló que los tipos de errores de citación detectados en 2025 son muy diferentes de los errores tradicionales que el equipo encontró antes de la adopción generalizada de los grandes modelos de lenguaje. Este cambio demuestra claramente que el uso generalizado de la IA es la causa principal de este problema.
En respuesta, Allison Johnston, politóloga de la Universidad Estatal de Oregón, afirmó sin rodeos que los investigadores podrían enfrentarse a una proliferación desenfrenada de «citas ilusorias».
Múltiples medidas de verificación.
Ante la abrumadora afluencia de «citas ilusorias», están surgiendo diversas herramientas y mecanismos.
Michael Wolsch, doctor en neurociencia por la Universidad Libre de Berlín (Alemania), desarrolló un script en Python para cotejar muestras de citas en la base de datos Crossref, comprobando con precisión si hay errores en los metadatos. Actualmente, ha identificado más de 500 documentos cuestionables que, tras una verificación manual, se publican en la plataforma de revisión académica PubPeer.
La plataforma de código abierto CheckIfExist puede verificar automáticamente si las referencias están incluidas en las bases de datos académicas designadas, ayudando a los investigadores a evitar el error de «artículo inexistente». Por su parte, el Centro Nacional de Investigación Científica de Francia (CNRS) y el equipo de Kabanack han lanzado conjuntamente la herramienta gratuita bibCheck, ya disponible para investigadores. Esta herramienta compara con precisión las citas para verificar si remiten a literatura real o retractada.
Frontiers, un grupo editorial con sede en Lausana, Suiza, también ha desarrollado una herramienta interna de detección mediante IA específicamente para identificar defectos de integridad durante la etapa inicial de revisión de manuscritos, abarcando problemas como las «citas falsas» y las citas irrelevantes.
Construyendo una sólida barrera académica.
Según Kabanack, los artículos que contienen «citas falsas» nunca deberían publicarse abiertamente en el ámbito académico. Una vez detectados, las editoriales deben emitir un comunicado de inmediato y, según las circunstancias, iniciar los procedimientos de corrección o retractación.
La respuesta de la industria editorial ante estos problemas varía. SAGE y el Grupo Taylor-Francis admiten que, si los errores de citación identificados no afectan las conclusiones ni implican una falta académica más amplia, suelen rechazar el manuscrito o solicitar revisiones. Un portavoz de Wiley Publishing Group declaró que, por lo general, solo envían cartas a los autores para aclarar detalles específicos. La postura de Springer Nature Publishing Group es clara: cualquier manuscrito que contenga citas ficticias será retractado. Johnston, editor jefe de la *International Political Economy Review*, adopta una postura más estricta, descalificando permanentemente a cualquier autor que presente nuevos artículos a la revista si se detectan este tipo de problemas.
Si las «citas ilusorias» constituyen una falta académica y en qué circunstancias, sigue siendo objeto de debate en el ámbito académico. Estos descuidos a veces son involuntarios por parte del autor, pero pueden tener graves consecuencias. Por ejemplo, algunos autores, por comodidad, utilizan grandes modelos lingüísticos para formatear automáticamente las referencias, sin ser conscientes de que la IA ha alterado sutilmente la redacción de las citas, ha colocado incorrectamente los DOI o incluso ha falsificado entradas. En marzo de este año, Hussein y David Resnick, bioeticista del Instituto Nacional de Ciencias de la Salud Ambiental, publicaron un artículo en el que argumentaban que si una revisión o un estudio bibliométrico utiliza citas ficticias como evidencia clave para respaldar sus argumentos principales, debería clasificarse como falta académica, ya que equivale a la falsificación de datos.
Actualmente, las revistas tienen diferentes estándares para controlar las herramientas de IA. Si bien la mayoría de las editoriales exigen que los autores informen sobre el uso de IA, no existe un estándar unificado para el alcance específico de dicha información. En cualquier caso, la revisión humana sigue siendo la última línea de defensa contra el riesgo.
Hosseini y otros destacaron que cada caso de citación errónea representa una grieta en el ecosistema académico que requiere una reparación minuciosa para restablecer la transparencia en el ámbito científico.

