Die Open-Access-Plattform arXiv, die wissenschaftliche Preprints aus verschiedenen Fachbereichen veröffentlicht, führt ab sofort strengere Regeln gegen KI-generierte Inhalte ein. Autoren, die offensichtlich mit generativer KI erstellte Arbeiten einreichen, droht ein einjähriges Einreichungsverbot.
Thomas Dietterich, Vorsitzender der Informatik-Sektion von arXiv, erklärte am Donnerstag auf der Plattform X:
„Wenn generative KI-Tools unangemessene Sprache, plagiierte Inhalte, verzerrte Darstellungen, Fehler, falsche Referenzen oder irreführende Aussagen erzeugen und diese in wissenschaftlichen Arbeiten verwendet werden, liegt die Verantwortung bei den Autoren. Wir haben unsere Strafmaßnahmen kürzlich präzisiert: Enthält eine Einreichung unumstößliche Beweise dafür, dass die Autoren die KI-Ergebnisse nicht überprüft haben, können wir dem gesamten Papier nicht mehr vertrauen.“
Als Beispiele für solche Beweise nannte Dietterich „halluzinierte Referenzen“ oder Meta-Kommentare der KI wie „Hier ist eine 200-Wörter-Zusammenfassung; möchten Sie Änderungen?“ oder „Die Daten in dieser Tabelle sind beispielhaft – fügen Sie die tatsächlichen Zahlen Ihrer Experimente ein.“
Die Strafe umfasst ein einjähriges Verbot der Nutzung von arXiv sowie die Pflicht, zukünftige Einreichungen zunächst in einem renommierten, peer-reviewten Fachjournal zu veröffentlichen. Dietterich betonte, dass es sich um eine „Ein-Streich-Regel“ handelt: Bereits ein Verstoß führt zum Ausschluss, wobei Einsprüche möglich sind.
„Wir wenden diese Maßnahme nur bei eindeutigen Beweisen an. Zudem durchläuft jeder Fall einen internen Prozess, bei dem zunächst ein Moderator das Problem dokumentiert und der Sektionsvorsitzende die Strafe bestätigt.“
Bereits im November 2025 hatte arXiv angekündigt, keine Computerwissenschaft-Reviews und Positionspapiere mehr anzunehmen, da die Plattform mit KI-generierten Inhalten „überflutet“ wurde. In einer Pressemitteilung hieß es damals:
„Generative KI und Large Language Models haben diesen Trend verstärkt, da sie das Verfassen von Papieren – insbesondere solcher ohne neue Forschungsergebnisse – schnell und einfach machen. Während alle Kategorien auf arXiv einen deutlichen Anstieg der Einreichungen verzeichnen, ist dies besonders in der Informatik zu beobachten.“
Im Januar 2025 führte arXiv zudem eine neue Regel ein: Erstautor:innen benötigen nun eine Empfehlung eines etablierten Wissenschaftlers, um Betrugsversuche zu reduzieren.
Das Problem falscher KI-Zitate verschärft sich zunehmend. Eine Studie der Columbia University analysierte 2,5 Millionen biomedizinische Publikationen über drei Jahre und stellte fest, dass im Jahr 2026 bereits eine von 277 Arbeiten in den ersten sieben Wochen gefälschte Referenzen enthielt – 2023 lag das Verhältnis bei 1 zu 2.828, 2025 bei 1 zu 458. Immer mehr Papers durchlaufen den Peer-Review-Prozess, ohne dass Meta-Kommentare oder erfundene Daten erkannt werden.
arXiv wird von Cornell Tech betrieben, soll aber ab Juli 2025 als eigenständige gemeinnützige Organisation agieren. Greg Morrisett, Dekan und Vizekanzler von Cornell Tech, erklärte gegenüber Science.org, dass diese Umstrukturierung notwendig sei, um zusätzliche Finanzierungsquellen zu erschließen und die wachsende Flut an „KI-Schrott“ („AI slop“) zu bewältigen.