En ny bølge af tech-startups har fundet en uventet indtægtskilde: salg af de digitale rester fra tidligere medarbejderes kommunikation. Slack-beskeder, e-mails og kodebiblioteker fra nedlagte virksomheder bliver solgt til AI-virksomheder, der bruger dem til at træne nye modeller. Ifølge Forbes er dette blevet en hel industri, hvor mellemhandlere og specialiserede selskaber faciliterer transaktionerne.

AI-træning kræver realistiske data

Kvalitetsdata er afgørende for at udvikle effektive AI-modeller, men efterhånden som internettet bliver udtømt for brugbare data, søger virksomheder nye kilder. Data fra digitale arbejdspladser som Slack er særligt værdifulde, fordi de afspejler reelle arbejdsmiljøer. Dette gør dem ideelle til at træne AI-agenter, der skal udføre konkrete arbejdsopgaver.

Ali Ansari, grundlægger af micro1 – som sælger virtuelle selskaber til AI-træning – forklarer:

"Modelfirmaer indser, at støj og uorden i virkelige arbejdsmiljøer er nødvendige for at teste modellerne præcist."

Disse simuleringer kaldes reinforcement learning gyms (eller "RL gyms"), og de er blevet en ny branche med stor efterspørgsel. Anthropic overvejer eksempelvis at investere 1 milliard dollar i RL gyms i år, og flere startups inden for området, herunder Prime Intellect og Fleet, bliver nu vurderet til lignende beløb.

Mellemhandlere og anonymisering – en etisk gråzone

Grundlæggerne af nedlagte startups er villige til at sælge deres digitale aktiver, og mellemhandlere som SimpleClosure – der kalder sig selv for "TurboTax for virksomhedslukninger" – faciliterer disse handler. Deres nye værktøj, Asset Hub, giver virksomheder mulighed for at sælge Slack-arkiver, e-mails og kodebiblioteker, som angiveligt bliver anonymiseret inden salg.

Ifølge Dori Yona, CEO for SimpleClosure, har selskabet gennemført næsten 100 handler på et år og indtjent over 1 million dollar for grundlæggerne af de nedlagte virksomheder. Men praksis rejser alvorlige spørgsmål om privatliv og etik.

Marc Roteberg, grundlægger af Center for AI and Digital Policy, udtaler til Forbes:

"Jeg mener, at privatlivsspørgsmålene her er betydelige. Medarbejderes privatliv er en central bekymring, især fordi mange er blevet så afhængige af interne kommunikationsværktøjer som Slack."

Han tilføjer:

"Det er ikke generiske data. Det er identificerbare personer."

Eksperter stiller også spørgsmålstegn ved, hvor effektiv anonymiseringen reelt er. Hvis data ikke bliver anonymiseret korrekt, kan købere potentielt identificere de personer, der har skrevet beskederne, hvilket udgør en betydelig risiko for privatlivets fred.

Er det den rette vej for AI-træning?

Spørgsmålet er, om det er hensigtsmæssigt at træne AI-modeller på data fra virksomheder, der er gået konkurs. Selvom dataene kan give indsigt i arbejdsprocesser, rejser det etiske dilemmaer om, hvorvidt medarbejderes fortrolige kommunikation bør blive en handelsvare. Samtidig kan det være en nødvendighed for at udvikle mere præcise og funktionelle AI-systemer.

Uanset hvad er denne nye praksis et tydeligt tegn på, hvordan tech-branchen konstant søger nye måder at udnytte eksisterende ressourcer på – også når det kommer til menneskers privatliv.

Kilde: Futurism