Ny ChatGPT-modell fra OpenAI: 52% færre hallusinasjoner

Redusert hallusinasjoner i ny ChatGPT-modell

OpenAI har lansert en ny standardmodell for ChatGPT, kalt GPT-5.5 Instant, som skal redusere antallet hallusinasjoner betydelig. Hallusinasjoner, der AI-en genererer usanne eller villedende svar, har vært et kjent problem for tidligere modeller.

Ifølge OpenAI har den nye modellen «betydelige forbedringer i faktisk nøyaktighet på tvers av alle områder». Basert på interne evalueringer skal GPT-5.5 Instant ha produsert 52,5 prosent færre hallusinasjoner sammenlignet med GPT-5.3 Instant når det gjelder høystakkertifikasjonsoppgaver innenfor medisin, jus og økonomi.

I tillegg reduserte modellen 37,3 prosent av unøyaktige svar i spesielt utfordrende samtaler som brukere tidligere hadde rapportert som feilaktige.

Forbedret ytelse i krevende samtaler

OpenAI understreker at den nye modellen ikke bare presterer bedre på fakta, men også håndterer kompliserte spørsmål med større presisjon. Dette kan være avgjørende for brukere som er avhengige av pålitelige svar, for eksempel innen helse, rettsvitenskap eller finans.

Hva betyr dette for brukerne?

Med færre hallusinasjoner og mer nøyaktige svar håper OpenAI at brukerne vil oppleve en mer pålitelig og nyttig ChatGPT. Selskapet har imidlertid ikke oppgitt når modellen vil bli tilgjengelig for alle brukere som standard.

Foreløpig er det uklart om den nye modellen vil erstatte GPT-5 Instant fullstendig på kort sikt, eller om den vil bli tilbudt som et alternativ.

Utfordringer med AI-hallusinasjoner

«Hallusinasjoner har vært en av de største utfordringene for store språkmodeller. Selv om vi har gjort betydelige fremskritt, gjenstår det arbeid for å eliminere slike feil fullstendig.» – OpenAI

Fremtidig utvikling

OpenAI fortsetter å jobbe med å forbedre nøyaktigheten og påliteligheten til sine modeller. Selskapet har tidligere uttalt at de prioriterer redusert hallusinasjoner og bedre faktasjekking i utviklingen av nye versjoner.

Om den nye modellen vil bli tilgjengelig for alle brukere, og når dette eventuelt vil skje, er foreløpig ikke bekreftet.

Kilde: The Verge

← Forrige

Republikanerne foreslår milliarder til ICE uten kontroll

Neste →

Ny angrep på AMA’s kodesystem for legehonorarer

12:00 · 16 mai 2026

De beste bærbare datamaskinene for de fleste brukere i 2024

Need a new laptop? It’s a tough decision. If you’re like most people, a laptop is one of the most expensive tech purchases you’ll make, and it’s somet...

11:00 · 16 mai 2026

USA satser på AI for å avsløre innsidehandel i prediksjonsmarkeder

For most of the past year, it looked like prediction markets had kicked off a new golden age of fraud. On Polymarket, traders raked in fortunes from s...

22:25 · 15 mai 2026

YouTube utvider AI-verktøy mot deepfakes til alle voksne brukere

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 mai 2026

Anthropic-kontroversen: Dommer utsetter $1,5 milliarder-kopiavtale

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 mai 2026

ArXiv innfører forbud mot forskere som publiserer AI-generert sladder

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 mai 2026

arXiv innfører forbud mot AI-generert innhold med feil

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 mai 2026

OpenAI omorganiserer igjen – Brockman tar styringen i kampen om AI-agenter

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

18:13 · 15 mai 2026

OpenAI vurdere juridiske skritt etter skuffende ChatGPT-integrasjon med Apple

OpenAI is reportedly exploring legal options after Apple's ChatGPT integration into its products didn't live up to the AI firm's expectations. When th...

Teknologi

OpenAI lanserer ny ChatGPT-modell med betydelig færre feil

Redusert hallusinasjoner i ny ChatGPT-modell

Forbedret ytelse i krevende samtaler

Hva betyr dette for brukerne?

Utfordringer med AI-hallusinasjoner

Fremtidig utvikling

Republikanerne foreslår milliarder til ICE uten kontroll

Ny angrep på AMA’s kodesystem for legehonorarer

Teknologi

OpenAI lanserer ny ChatGPT-modell med betydelig færre feil

Redusert hallusinasjoner i ny ChatGPT-modell

Forbedret ytelse i krevende samtaler

Hva betyr dette for brukerne?

Utfordringer med AI-hallusinasjoner

Fremtidig utvikling

Republikanerne foreslår milliarder til ICE uten kontroll

Ny angrep på AMA’s kodesystem for legehonorarer

Relaterte artikler

De beste bærbare datamaskinene for de fleste brukere i 2024

USA satser på AI for å avsløre innsidehandel i prediksjonsmarkeder

YouTube utvider AI-verktøy mot deepfakes til alle voksne brukere

Anthropic-kontroversen: Dommer utsetter $1,5 milliarder-kopiavtale

ArXiv innfører forbud mot forskere som publiserer AI-generert sladder

arXiv innfører forbud mot AI-generert innhold med feil

OpenAI omorganiserer igjen – Brockman tar styringen i kampen om AI-agenter

OpenAI vurdere juridiske skritt etter skuffende ChatGPT-integrasjon med Apple