AI-scraping: Sådan tjener techgiganter millioner på stjålet medieindhold

OpenAI retssystem dataindsamling techgiganter AI-lovgivning ophavsret medieindustrien AI-scraping

Den juridiske kamp mellem medieindustrien og AI-virksomheder om ophavsret har flere dimensioner, men ét af de mest afgørende spørgsmål handler om outputs – altså hvad der sker med det indhold, der bliver scrapet.

At scrappe indhold uden tilladelse kan være problematisk, men hvis den skyldige part ikke bruger det på en måde, der konkurrerer direkte med indholdsskaberen, er det svært at bevise skade. Mange retssager, især civile sager, afhænger netop af at kunne dokumentere økonomisk skade. Et tidligere retsafgørelse illustrerer dette dilemma.

Forfattere tabte sag mod OpenAI

En gruppe forfattere, herunder komikeren Sarah Silverman, sagsøgte i 2023 OpenAI for at have brugt deres bøger til træning af AI-modeller uden kompensation. En dommer afviste senere flere af forfatternes påstande, fordi de ikke kunne påvise konkrete eksempler på, at AI’en havde produceret outputs, der direkte konkurrerede med deres værker. Retten fastslog, at det ikke er nok blot at hævde, at en stor sprogmodel (LLM) er blevet trænet på ens materiale – man skal kunne vise, at outputsene tager forretning fra en.

Den skjulte industri bag AI-scraping

Retssager som Silverman-sagen afhænger ofte af at kunne påvise specifikke tilfælde af scraping og gengivelse. Problemet er, at meget af denne aktivitet foregår i det skjulte: hurtigt, lydløst og i stor skala. Mens outputsene fra store, offentligt tilgængelige AI-tjenester som ChatGPT, Gemini og Perplexity er synlige for alle, eksisterer der en hel skyggeindustri af massescraping, der ikke er det.

Det har længe været en åben hemmelighed, at AI-virksomheder sommetider skaffer data fra tredjepartsmæglere. Medieanalytiker Matthew Scott Goldstein har for nylig udgivet en omfattende rapport om dette fænomen. Ifølge Digiday afslører rapporten, at mindst 21 selskaber – flere af dem finansieret med hundredvis af millioner dollars – regelmæssigt scrapper medieindhold uden at betale for det. Disse selskaber sælger derefter deres "datatjenester" videre til kunder som OpenAI, Amazon og endda andre mediehuse som The Telegraph.

Fra scraping til multimillionforretning

Rapporten viser, hvordan scraping i stor skala skaber outputs i form af multimillionforretninger. Disse selskaber – som Parallel AI, Exa og Bright Data – specialiserer sig i at parse internettet for data til bots og agenter, indeksere indholdet og sælge det videre. Som Goldstein påpeger, er de ikke sene til at reklamere for deres forretning: Mens en Wall Street Journal-profil beskrev Parallel AI som en platform "dedikeret til at servicere AI-agenter", karakteriserer Goldstein det som et "scraper-selskab med bedre branding".

"Vis mig incitamenterne, så viser jeg jer resultatet."

Med de juridiske tilbageslag i ophavsretssagerne og den nuværende amerikanske administrations tilsidesættelse af ophavsretlige bekymringer, er budskabet klart: Der er næsten ingen konsekvenser ved ulovlig scraping, og de juridiske og tekniske mekanismer favoriserer i stedet større adgang for AI-systemer.

Mediehuse står over for et eksistentielt valg

Denne udvikling skaber et eksistentielt dilemma for mediehuse: Skal de blokere bots fra at tilgå deres indhold, eller skal de lade dem gøre det? At lade botsne få adgang betyder i praksis at opgive kampen – eller i det mindste overlade den til andre at føre. Men blokering af bots kan også betyde, at man mister synlighed i AI-systemernes økosystem, hvilket potentielt reducerer trafikken til ens eget website.

Kilde: Fast Company

← Forrige

Virksomheder udnytter vilkårene i serviceaftaler mod dig – hvordan du...

Næste →

Et år med Trump svigter den religiøse højrefløj

12:15 · 16 maj 2026

AI får karakterer til at eksplodere: A’er og B’er bliver normen

Some college classes are seeing a boom in students earning A's — many with the help of AI.Why it matters: Universities and colleges were already conce...

11:00 · 16 maj 2026

Amerikanske arbejdsfordele trues af økonomisk virkelighed

The era of ever-expanding workplace perks is ending. It's not just free kombucha and laundry — policies like paid parental leave and retirement matche...

09:00 · 16 maj 2026

AI-tarpits: Sådan forurener skabere data for at sabotere chatbots

In order for a chatbot to become more intelligent, and thus more useful to the end-user, it needs to assimilate data continuously. This process is kno...

08:00 · 16 maj 2026

Delta-topchef brugte AI til at skrive sin tale – og smed den i papirkurven

During a commencement address at Emory University in Atlanta on Monday, Delta Air Lines CEO Ed Bastian admitted that he used artificial intelligence t...

19:41 · 15 maj 2026

Sony’s nye AI-kamerafunktion bliver til meme: Var bagtalen en del af planen?

Artificial intelligence has notoriously struggled with creating images, writing out gibberish on signs, or adding extra fingers to people. But it seem...

14:21 · 15 maj 2026

Paven advarsler mod AI i krigsførelse: 'Fører til en udryddelsesspiral'

Pope Leo XIV on Thursday denounced how investments in artificial intelligence and high-tech weaponry were leading the world into a “spiral of annihila...

13:45 · 15 maj 2026

AI-genereret leksikon bliver til kaos: Halupedia fyldes med absurditet og had

As the preeminent internet encyclopedia, Wikipedia is known for having articles on every topic under the sun. From the commonplace to the esoteric, if...

13:45 · 15 maj 2026

Figma's nye prissætning for AI-funktioner sender aktiekursen til syvugers højde

With its AI credit limits officially up and running, design software maker Figma has just notched another successful quarter under its belt. The compa...

Erhverv

AI-selskaber tjener millioner på ulovlig scraping af medieindhold

Forfattere tabte sag mod OpenAI

Den skjulte industri bag AI-scraping

Fra scraping til multimillionforretning

Mediehuse står over for et eksistentielt valg

Virksomheder udnytter vilkårene i serviceaftaler mod dig – hvordan du...

Et år med Trump svigter den religiøse højrefløj

Erhverv

AI-selskaber tjener millioner på ulovlig scraping af medieindhold

Forfattere tabte sag mod OpenAI

Den skjulte industri bag AI-scraping

Fra scraping til multimillionforretning

Mediehuse står over for et eksistentielt valg

Virksomheder udnytter vilkårene i serviceaftaler mod dig – hvordan du...

Et år med Trump svigter den religiøse højrefløj

Relaterede artikler

AI får karakterer til at eksplodere: A’er og B’er bliver normen

Amerikanske arbejdsfordele trues af økonomisk virkelighed

AI-tarpits: Sådan forurener skabere data for at sabotere chatbots

Delta-topchef brugte AI til at skrive sin tale – og smed den i papirkurven

Sony’s nye AI-kamerafunktion bliver til meme: Var bagtalen en del af planen?

Paven advarsler mod AI i krigsførelse: 'Fører til en udryddelsesspiral'

AI-genereret leksikon bliver til kaos: Halupedia fyldes med absurditet og had

Figma's nye prissætning for AI-funktioner sender aktiekursen til syvugers højde