ArXiv, la plateforme open access de prépublications scientifiques, a annoncé qu’elle suspendrait les auteurs pendant un an en cas de soumission de travaux manifestement générés par intelligence artificielle (IA) sans vérification humaine.

Jeudi soir, Thomas Dietterich, président de la section informatique d’ArXiv, a précisé sur X : « Si des outils d’IA générative produisent un langage inapproprié, du plagiat, des biais, des erreurs, des références incorrectes ou trompeuses, et que ces éléments sont intégrés dans des travaux scientifiques, la responsabilité en incombe aux auteurs. »

Parmi les preuves irréfutables d’une absence de vérification, il cite les « références hallucinées » ou les commentaires intégrés par l’IA, comme « Voici un résumé de 200 mots ; souhaitez-vous des modifications ? » ou « Les données de ce tableau sont illustraives, veuillez les remplacer par les résultats réels de vos expériences. »

La sanction prévoit une interdiction d’un an sur ArXiv, suivie d’une obligation de faire valider les futures soumissions par une revue à comité de lecture reconnue. Dietterich a confirmé que cette règle s’applique dès la première infraction, mais que les décisions restent soumises à appel.

« Nous n’appliquons cette mesure qu’en cas de preuves irréfutables », a-t-il ajouté. « Notre processus interne exige d’abord qu’un modérateur documente le problème, puis que le président de la section le valide avant toute sanction. »

ArXiv face à l’inflation de contenus générés par IA

En novembre 2025, ArXiv avait déjà annoncé qu’il n’accepterait plus les articles de revue et les papiers de position en informatique, submergé par des contenus de mauvaise qualité générés par IA. « Les modèles de langage ont facilité et accéléré la rédaction de papiers, notamment ceux qui ne présentent pas de nouveaux résultats de recherche », avait expliqué la plateforme dans un communiqué.

En janvier 2026, ArXiv a renforcé ses mesures en exigeant un parrainage par un auteur établi pour les nouveaux soumissionnaires, en réponse à la hausse des soumissions frauduleuses.

L’impact des références fabriquées par IA

Les citations générées par IA posent un problème majeur dans le milieu académique. Une étude récente de l’Université Columbia, portant sur 2,5 millions d’articles biomédicaux publiés sur trois ans, révèle que 1 publication sur 277 en 2026 contenait des références fabriquées, contre 1 sur 2 828 en 2023 et 1 sur 458 en 2025. Ces erreurs, souvent accompagnées de commentaires intégrés par l’IA ou de données hallucinées, perturbent le processus de révision par les pairs.

ArXiv, géré par Cornell Tech, deviendra en juillet 2026 une organisation indépendante à but non lucratif. Greg Morrisett, doyen et vice-recteur de Cornell Tech, a indiqué à Science.org que cette transition permettra à la plateforme de diversifier ses sources de financement, essentielles pour faire face à l’afflux de « slop » généré par IA.

Source : 404 Media