El repositorio de acceso abierto ArXiv, dedicado a la difusión de investigaciones académicas en formato de preprints, ha anunciado una nueva política para sancionar a los autores que envíen trabajos generados por herramientas de inteligencia artificial (IA) sin supervisión adecuada.

Thomas Dietterich, presidente de la sección de Ciencias de la Computación de ArXiv, declaró en la red social X que los autores serán responsables si sus trabajos incluyen contenido generado por IA con lenguaje inapropiado, plagio, sesgos, errores, referencias falsas o información engañosa. «Si una presentación contiene pruebas incontrovertibles de que los autores no verificaron los resultados de la generación con modelos de lenguaje, significa que no podemos confiar en nada del artículo», afirmó.

Entre los ejemplos de contenido inaceptable se incluyen referencias inventadas, comentarios internos de los modelos de IA como «aquí tienes un resumen de 200 palabras; ¿quieres que haga algún cambio?» o «los datos de esta tabla son ilustrativos; rellénalos con los números reales de tus experimentos».

La sanción consistirá en una prohibición de un año para publicar en ArXiv, seguida de la obligación de que los trabajos posteriores sean aceptados previamente en una revista científica revisada por pares. Dietterich aclaró que esta norma se aplica solo en casos de pruebas claras y que los autores tendrán derecho a apelar. «Queremos enfatizar que solo actuamos cuando hay evidencia incontrovertible», añadió.

El proceso interno exige que un moderador documente el problema y que el presidente de la sección lo confirme antes de imponer la sanción.

Contexto: el auge del 'AI slop' en la investigación

En noviembre de 2025, ArXiv ya había anunciado que dejaría de aceptar artículos de revisión y trabajos posicionales en Ciencias de la Computación debido a la avalancha de contenido generado por IA. «Los modelos de lenguaje grandes han facilitado la creación rápida de artículos, especialmente aquellos que no presentan nuevos resultados de investigación», explicó la plataforma en un comunicado.

En enero de 2026, ArXiv implementó otra medida: los nuevos autores deberán obtener un aval de un investigador establecido para poder publicar, como respuesta al aumento de envíos fraudulentos.

El problema de las citas falsas generadas por IA es especialmente grave. Un estudio reciente de la Universidad de Columbia analizó 2,5 millones de artículos biomédicos durante tres años y descubrió que, en las primeras siete semanas de 2026, uno de cada 277 artículos contenía referencias inventadas. En 2023, la proporción era de uno en 2.828, y en 2025, de uno en 458. Estas cifras reflejan cómo el 'AI slop' está saturando el proceso de revisión por pares, permitiendo que trabajos con datos falsos o comentarios internos de IA pasen desapercibidos.

ArXiv, gestionado actualmente por Cornell Tech, se convertirá en julio de 2026 en una organización sin ánimo de lucro independiente. Greg Morrisett, decano y vicepresidente de Cornell Tech, declaró a Science.org que este cambio permitirá a ArXiv recaudar fondos de una mayor variedad de donantes, algo esencial para hacer frente al problema del 'AI slop'.

Fuente: 404 Media