ArXiv interdit aux chercheurs pendant un an pour soumission de contenu IA non vérifié

ArXiv, la plateforme open access de prépublications scientifiques, a annoncé qu’elle suspendrait les auteurs pendant un an en cas de soumission de travaux manifestement générés par intelligence artificielle (IA) sans vérification humaine.

Jeudi soir, Thomas Dietterich, président de la section informatique d’ArXiv, a précisé sur X : « Si des outils d’IA générative produisent un langage inapproprié, du plagiat, des biais, des erreurs, des références incorrectes ou trompeuses, et que ces éléments sont intégrés dans des travaux scientifiques, la responsabilité en incombe aux auteurs. »

Parmi les preuves irréfutables d’une absence de vérification, il cite les « références hallucinées » ou les commentaires intégrés par l’IA, comme « Voici un résumé de 200 mots ; souhaitez-vous des modifications ? » ou « Les données de ce tableau sont illustraives, veuillez les remplacer par les résultats réels de vos expériences. »

La sanction prévoit une interdiction d’un an sur ArXiv, suivie d’une obligation de faire valider les futures soumissions par une revue à comité de lecture reconnue. Dietterich a confirmé que cette règle s’applique dès la première infraction, mais que les décisions restent soumises à appel.

« Nous n’appliquons cette mesure qu’en cas de preuves irréfutables », a-t-il ajouté. « Notre processus interne exige d’abord qu’un modérateur documente le problème, puis que le président de la section le valide avant toute sanction. »

ArXiv face à l’inflation de contenus générés par IA

En novembre 2025, ArXiv avait déjà annoncé qu’il n’accepterait plus les articles de revue et les papiers de position en informatique, submergé par des contenus de mauvaise qualité générés par IA. « Les modèles de langage ont facilité et accéléré la rédaction de papiers, notamment ceux qui ne présentent pas de nouveaux résultats de recherche », avait expliqué la plateforme dans un communiqué.

En janvier 2026, ArXiv a renforcé ses mesures en exigeant un parrainage par un auteur établi pour les nouveaux soumissionnaires, en réponse à la hausse des soumissions frauduleuses.

L’impact des références fabriquées par IA

Les citations générées par IA posent un problème majeur dans le milieu académique. Une étude récente de l’Université Columbia, portant sur 2,5 millions d’articles biomédicaux publiés sur trois ans, révèle que 1 publication sur 277 en 2026 contenait des références fabriquées, contre 1 sur 2 828 en 2023 et 1 sur 458 en 2025. Ces erreurs, souvent accompagnées de commentaires intégrés par l’IA ou de données hallucinées, perturbent le processus de révision par les pairs.

ArXiv, géré par Cornell Tech, deviendra en juillet 2026 une organisation indépendante à but non lucratif. Greg Morrisett, doyen et vice-recteur de Cornell Tech, a indiqué à Science.org que cette transition permettra à la plateforme de diversifier ses sources de financement, essentielles pour faire face à l’afflux de « slop » généré par IA.

Source : 404 Media

← Précédent

Le député démocrate Steve Cohen annonce son départ après le redécoupag...

Le DOJ qualifie les opposants au salon de Trump de « malades »

15:19 · 15 mai 2026

Les coulisses du blog : musique, IA et révélations sur ICE

This is Behind the Blog, where we share our behind-the-scenes thoughts about how a few of our top stories of the week came together. This week, we dis...

13:00 · 15 mai 2026

La Mayo Clinic utilise l'IA pour enregistrer les échanges aux urgences

Mayo Clinic, the massive U.S. hospital network, is using what it describes as “Ambient Listening” to record patient interactions with nurses, includin...

20:35 · 14 mai 2026

L'IA avancée, une révolution dans la guerre selon un haut responsable du Pentagone

Advanced artificial intelligence models will “fundamentally change warfare as we know it,” a top cyber official at the Defense Department said Thursda...

20:15 · 14 mai 2026

Cybersécurité : l'identité numérique devient cruciale face à l'essor de l'IA

As AI becomes more integrated into federal IT (and attacker toolsets) government agencies will need to focus their resources on regulating and monitor...

13:30 · 14 mai 2026

Une application d'IA analyse les selles : son créateur propose à la vente une base de données de 150 000 images de selles

A few weeks ago, I came across a wild post on Reddit’s r/DHExchange, a subreddit for trading large datasets: “I hoarded a large database of something...

22:29 · 13 mai 2026

L'IA pulvérise les records en cybersécurité autonome : les nouveaux modèles dépassent toutes les attentes

Two of the most advanced artificial intelligence models — Anthropic’s Claude Mythos Preview and OpenAI’s GPT-5.5 — have significantly surpassed the al...

22:10 · 13 mai 2026

La Chambre des représentants enquête sur l'IA Mythos d'Anthropic et ses risques cyber

The House Homeland Security Committee is digging into Anthropic’s AI model Mythos in a series of briefings and hearings, as questions proliferate on w...

18:30 · 13 mai 2026

Fraude et usurpation d'identité par IA : une menace en pleine accélération

Today’s enterprise executives are navigating a complex landscape of AI-driven challenges, but none is more urgent than the rapid escalation of AI-gene...

Cybersécurité