Redusert hallusinasjoner i ny ChatGPT-modell

OpenAI har lansert en ny standardmodell for ChatGPT, kalt GPT-5.5 Instant, som skal redusere antallet hallusinasjoner betydelig. Hallusinasjoner, der AI-en genererer usanne eller villedende svar, har vært et kjent problem for tidligere modeller.

Ifølge OpenAI har den nye modellen «betydelige forbedringer i faktisk nøyaktighet på tvers av alle områder». Basert på interne evalueringer skal GPT-5.5 Instant ha produsert 52,5 prosent færre hallusinasjoner sammenlignet med GPT-5.3 Instant når det gjelder høystakkertifikasjonsoppgaver innenfor medisin, jus og økonomi.

I tillegg reduserte modellen 37,3 prosent av unøyaktige svar i spesielt utfordrende samtaler som brukere tidligere hadde rapportert som feilaktige.

Forbedret ytelse i krevende samtaler

OpenAI understreker at den nye modellen ikke bare presterer bedre på fakta, men også håndterer kompliserte spørsmål med større presisjon. Dette kan være avgjørende for brukere som er avhengige av pålitelige svar, for eksempel innen helse, rettsvitenskap eller finans.

Hva betyr dette for brukerne?

Med færre hallusinasjoner og mer nøyaktige svar håper OpenAI at brukerne vil oppleve en mer pålitelig og nyttig ChatGPT. Selskapet har imidlertid ikke oppgitt når modellen vil bli tilgjengelig for alle brukere som standard.

Foreløpig er det uklart om den nye modellen vil erstatte GPT-5 Instant fullstendig på kort sikt, eller om den vil bli tilbudt som et alternativ.

Utfordringer med AI-hallusinasjoner

«Hallusinasjoner har vært en av de største utfordringene for store språkmodeller. Selv om vi har gjort betydelige fremskritt, gjenstår det arbeid for å eliminere slike feil fullstendig.» – OpenAI

Fremtidig utvikling

OpenAI fortsetter å jobbe med å forbedre nøyaktigheten og påliteligheten til sine modeller. Selskapet har tidligere uttalt at de prioriterer redusert hallusinasjoner og bedre faktasjekking i utviklingen av nye versjoner.

Om den nye modellen vil bli tilgjengelig for alle brukere, og når dette eventuelt vil skje, er foreløpig ikke bekreftet.