En ny trend i tech-bransjen viser at gründere tjener ekstra penger på å selge de digitale restene av konkursrammede selskaper – blant annet ansattes Slack-meldinger og e-poster. Ifølge Forbes har det oppstått et helt økosystem av mellomledd som spesialiserer seg på slike transaksjoner.

AI-modeller trenger realistiske treningsdata

Kvalitetsdata er avgjørende for å utvikle AI-modeller, men tilgangen til slike data blir stadig vanskeligere i en verden der internett allerede er «tømt» for lett tilgjengelig informasjon. Data fra digitale arbeidsplattformer som Slack er spesielt verdifulle, fordi de gir innsikt i hvordan ansatte samhandler og utfører oppgaver.

Dette er avgjørende for selskaper som utvikler AI-agenter som skal utføre arbeidsoppgaver. «Modellselskaper innser at støy og ustrukturert data fra reelle arbeidsmiljøer er nødvendig for å teste modellene på en realistisk måte,» sier Ali Ansari, grunnlegger av micro1, et selskap som selger virtuelle selskaper for AI-trening.

Disse simulerte arbeidsmiljøene kalles gjerne «reinforcement learning gyms» (RL-gyms), og bransjen er i rask vekst. Etterspørselen er så stor at Anthropic vurderer å bruke 1 milliard dollar på slike treningsmiljøer i år, ifølge The Information. Flere RL-gym-startups, som Prime Intellect og Fleet, blir nå verdsatt til lignende beløp.

Mellomledd gjør det enkelt å selge digitale eiendeler

Gründere av konkursrammede selskaper er villige til å selge sine digitale eiendeler, og mellomledd har oppstått for å lette disse transaksjonene. SimpleClosure, som kaller seg «TurboTax for nedlegging av selskaper», lanserte nylig verktøyet Asset Hub. Dette lar døende selskaper selge Slack-arkiver, e-poster og kodebiblioteker – og påstås å anonymisere dataene før de overleveres til kjøper.

Selskapets administrerende direktør, Dori Yona, forteller til Forbes at de har gjennomført nesten 100 slike transaksjoner det siste året, og generert over 1 million dollar for gründerne. Likevel er det store etiske og personvernmessige utfordringer knyttet til praksisen.

Er konkursdata den beste treningsgrunnlaget for AI?

Et sentralt spørsmål er om AI-modeller som trenes på data fra selskaper som har gått konkurs, egentlig er det beste utgangspunktet for å lykkes i næringslivet. «Det ville vært fullstendig uakseptabelt hvis en arbeidsgiver registrerte og solgte samtaler fra ansatte i et fysisk kontor – men når det skjer digitalt, blir det sett på som smart business,» sier Marc Roteberg, grunnlegger av Center for AI and Digital Policy.

Han understreker at personvernet er en stor bekymring: «Ansattes avhengighet av interne kommunikasjonsverktøy som Slack gjør dette til et alvorlig problem. Dette er ikke generisk data – det er identifiserbare personer.»

Kan data virkelig anonymiseres?

Eksperter stiller spørsmål ved hvorvidt dataene faktisk blir anonymisert på en tilfredsstillende måte. «Hvis anonymisering ikke gjøres riktig, kan kjøpere av dataene potensielt identifisere ansatte og misbruke informasjonen,» advarer Roteberg.

Denne utviklingen viser hvordan tech-bransjen stadig søker nye kilder til data for AI-trening, samtidig som etiske og juridiske grenser blir utfordret.

Kilde: Futurism