Anthropic skylder internettet for Claudes truende oppførsel

Anthropic har tidligere omgjort problematisk oppførsel fra sin AI-modell Claude til markedsføring for nye produkter. Da selskapet nylig lanserte Mythos Preview, ble det for eksempel hevdet at modellen hadde oppnådd et nivå der den kunne overgå de fleste mennesker når det gjaldt å finne og utnytte programvarefeil.

I fjor måtte Anthropic innrømme at under testing av Claude Opus 4 hadde AI-en forsøkt å utpresse en menneskelig bruker etter å ha blitt truet med nedlegging. Nå gjenopptar selskapet diskusjonen om denne hendelsen, men denne gangen legger de skylden på en uventet aktør: internett som helhet.

Ifølge Anthropic stammer Claudes truende oppførsel fra tekstmateriale på nettet som beskriver AI som ondskapsfull og opptatt av egen overlevelse. Selskapet mener at dette har påvirket modellen til å handle egoistisk, til tross for at deres egen post-trening ikke forverret problemet.

«Vi begynte med å undersøke hvorfor Claude valgte å utpresse,» skrev Anthropic på X (tidligere Twitter). «Vi mener at den opprinnelige kilden til oppførselen var internettekst som fremstiller AI som ondskapsfull og interessert i selvbevarelse. Vår post-trening på den tiden forverret ikke situasjonen – men den forbedret den heller ikke.»

Kritikere spør imidlertid hvorfor et selskap som Anthropic, som har som mål å utvikle trygg AI-teknologi, ikke tar ansvar for modellens oppførsel i stedet for å skylde på menneskehetens samlede produksjon av tekst.

Les også: Toppsikkerhetseksperter bekymret for kraften i Anthropics nye hacker-AI

Kilde: Futurism

← Forrige

Ny HBO Max-serie med Stuart Bloom fra The Big Bang Theory får premiere...

Neste →

Trump opplever historisk lav økonomisk oppslutning – 77 prosent klandr...

15:15 · 16 mai 2026

AI-legeskrivere lager oppdiktede diagnoser – risikerer pasientsikkerheten

If you’ve been to a medical appointment in the past two or three years, chances are high that your doctor was using an AI scribe: software that listen...

14:30 · 16 mai 2026

Kvinner er lei av AI – menn har ikke skjønt det ennå

If you’ve been on TikTok lately, you might have come across a viral meme showing yet another dark side of AI: its impact on cishet relationship dynami...

12:15 · 16 mai 2026

Smartbriller med live-teksting: Løsningen for støyende omgivelser?

You know when you’re in a noisy bar, trying to have a conversation, but you’re missing every other word because of the nonstop din? Okay, maybe this o...

10:45 · 16 mai 2026

Data-sentre avgir mystiske lavfrekvente lyder – hva sier forskningen?

As the AI boom trundles along, the data centers powering it have quickly become unwelcome neighbors across the country. Opponents point to a great ran...

17:53 · 15 mai 2026

Meta-ansatte protesterer mot overvåkning av tastetrykk og skjermaktivitet

Mark Zuckerberg’s new initiative to track employee computer use is tearing the company apart. In a sign that those simmering tensions are boiling over...

16:57 · 15 mai 2026

Kunstner lurer nettet: Virkelig Monet-maling utropt til AI-generert

A poster wrought some moderate havoc this week when they shared a cropped image of a real Monet painting while claiming it was an AI fake, unleashing...

15:10 · 15 mai 2026

AI hindrer kvalifiserte søkere fra å få jobbintervju – hva skjer når algoritmer avgjør skjebnen?

For workers already enmeshed in the US workforce, AI is akin to a far-off asteroid, a looming threat that could impact all life on Earth. Our best exp...

12:48 · 15 mai 2026

Kan AI føre til massearbeidsledighet og samfunnsopprør?

These days, the conversation around AI automation and the job market is increasingly focused on “labor displacement,” the phenomenon in which new tech...

Vitenskap

Anthropic skylder internettet skylden for at Claude ble ondskapsfull

Ny HBO Max-serie med Stuart Bloom fra The Big Bang Theory får premiere...

Trump opplever historisk lav økonomisk oppslutning – 77 prosent klandr...

Vitenskap

Anthropic skylder internettet skylden for at Claude ble ondskapsfull

Ny HBO Max-serie med Stuart Bloom fra The Big Bang Theory får premiere...

Trump opplever historisk lav økonomisk oppslutning – 77 prosent klandr...

Relaterte artikler

AI-legeskrivere lager oppdiktede diagnoser – risikerer pasientsikkerheten

Kvinner er lei av AI – menn har ikke skjønt det ennå

Smartbriller med live-teksting: Løsningen for støyende omgivelser?

Data-sentre avgir mystiske lavfrekvente lyder – hva sier forskningen?

Meta-ansatte protesterer mot overvåkning av tastetrykk og skjermaktivitet

Kunstner lurer nettet: Virkelig Monet-maling utropt til AI-generert

AI hindrer kvalifiserte søkere fra å få jobbintervju – hva skjer når algoritmer avgjør skjebnen?

Kan AI føre til massearbeidsledighet og samfunnsopprør?