ArXiv, det åpne arkivet for vitenskapelige forhåndspublikasjoner, vil straffe forfattere med ett års utestengelse dersom de leverer arbeider som er tydelig generert av kunstig intelligens. Thomas Dietterich, leder for datavitenskapelig seksjon ved ArXiv, kunngjorde dette på X (tidligere Twitter) sent torsdag kveld.

«Dersom generative AI-verktøy produserer upassende språk, plagiert innhold, skjevheter, feil, uriktige referanser eller villedende innhold, og dette inngår i vitenskapelige arbeider, er det forfatterens ansvar,» skrev han. «Vi har nylig klargjort straffen for slike tilfeller. Dersom en innsending inneholder ubestridelig bevis på at forfatterne ikke har sjekket resultatene fra LLM-generering, betyr det at vi ikke kan stole på noe i artikkelen.»

Eksempler på straffbare forhold

Dietterich pekte på flere eksempler på hva som regnes som ubestridelig bevis:

  • «Hallusinerte referanser» – AI genererer referanser som ikke eksisterer.
  • Meta-kommentarer fra AI, som «Her er en 200-ords oppsummering; ønsker du endringer?» eller «Dataene i denne tabellen er illustrative – fyll inn med reelle tall fra eksperimentene dine».

Straffen og mulighet for klage

Straffen for slike overtredelser er ett års utestengelse fra ArXiv, etterfulgt av krav om at påfølgende innsendinger må godkjennes i et anerkjent fagfellevurdert tidsskrift før de kan publiseres. Dietterich understreket at dette er en «en-streik-regel» – én overtredelse fører til straff – men avgjørelser kan ankes. «Vi anvender dette kun ved ubestridelig bevis,» sa han. «Vårt interne system krever først dokumentasjon fra en moderator, etterfulgt av godkjenning fra seksjonslederen før straffen iverksettes.»

ArXivs tidligere tiltak mot AI-slurv

I november 2025 besluttet ArXiv å slutte å akseptere datavitenskapelige anmeldelser og posisjonsartikler på grunn av en «flom» av AI-generert sladder. «Generativ AI og store språkmodeller har forsterket denne flommen ved å gjøre det raskt og enkelt å skrive arbeider – spesielt de som ikke introduserer ny forskning,» skrev ArXiv i en pressemelding på den tiden. I januar 2026 innførte de også krav om at nye forfattere måtte ha en anbefaling fra en etablert forsker, på grunn av økende antall svindelinnsendinger.

AI-genererte referanser undergraver forskningskvalitet

AI-genererte, fabrikkerte referanser utgjør et stort problem innen forskning. En nylig studie fra Columbia University undersøkte 2,5 millioner biomedisinske artikler over tre år og fant at én av 277 artikler publisert i de første syv ukene av 2026 inneholdt fabrikkerte referanser. Til sammenligning var det én av 2 828 i 2023 og én av 458 i 2025. Slike AI-genererte artikler og referanser belaster allerede fagfellevurderingsprosessen, og flere arbeider slipper gjennom med slike feil og villedende data intakte.

ArXiv drives av Cornell Tech, men fra juli 2026 vil det bli en uavhengig ideell organisasjon. Greg Morrisett, dekan og viserektor ved Cornell Tech, uttalte til Science.org at denne endringen vil hjelpe ArXiv med å skaffe mer finansiering fra et bredere spekter av donorer – noe som er nødvendig for å håndtere utfordringene med AI-slurv.