Norsk-amerikansk studie: AI slår leger i diagnostiske tester

En ny studie publisert i det prestisjetunge tidsskriftet Science utfordrer tradisjonell medisinsk kompetanse. Forsker og lege Adam Rodman, med bakgrunn fra internmedisin og klinisk AI-forskning, har ledet et team som dokumenterer hvordan en stor språkmodell fra OpenAI kan overgå erfarne leger i diagnostiske tester basert på reelle pasienttilfeller.

Historisk utfordring fra 1959

Studien er ikke bare en teknisk bedrift – den er også en direkte respons på en utfordring fra 1959. Da beskrev forskere hvordan man kunne avgjøre om et klinisk beslutningsstøttesystem var i stand til å stille bedre diagnoser enn mennesker. Nå, over 60 år senere, viser resultatene at AI-systemer endelig kan leve opp til dette idealet.

– Studien viser at språkmodeller kan utføre diagnostisk resonnement på nivå med erfarne klinikere, sier Rodman, som er medforfatter på studien. – Men dette er basert på kontrollerte tester med historiske og simulerte data, ikke reelle pasienter.

Fare for overfortolkning av AI-evner

Selv om resultatene er lovende, advarer forskerne mot å trekke forhastede konklusjoner. AI-systemer som chatbots markedsføres i stor grad både til pasienter og helsepersonell, noe som kan føre til at deres evner blir overvurdert.

– Det er avgjørende å skille mellom kontrollerte eksperimenter og reell klinisk bruk, understreker Rodman. – Vi har ennå ikke bevis for at slike systemer er trygge eller effektive nok til å brukes på ekte pasienter.

Hva betyr dette for fremtidens medisin?

Studien åpner for viktige diskusjoner om AI-rollens plass i helsevesenet. Mens teknologien lover store fremskritt, peker forskerne på behovet for strengere testing og regulering før AI kan integreres trygt i diagnostisk arbeid.

– Vi står overfor en spennende, men også utfordrende utvikling, sier Rodman. – Det er avgjørende at vi ikke lar markedsføringens løfter gå foran vitenskapens forsiktighet.

Veien videre: Mer forskning og strengere kontroll

Forskerne bak studien understreker at videre forskning er nødvendig før AI-systemer kan tas i bruk i stor skala. Spesielt viktig er det å teste systemene på reelle pasientdata og i reelle kliniske omgivelser.

– Dette er bare begynnelsen, sier Rodman. – Vi må sikre at AI ikke bare er smart, men også trygg og pålitelig når det kommer til menneskers helse.

Hva sier ekspertene?

«Denne studien er et viktig skritt fremover, men vi må ikke glemme at AI fortsatt har store begrensninger når det gjelder klinisk beslutningstaking. Det er avgjørende med grundig testing og transparens.»

– Professor i medisinsk teknologi, Universitetet i Oslo

Konklusjon: AI i medisin – lovende, men krever varsomhet

Mens studien demonstrerer AI-systemers potensial innen diagnostikk, er forskerne tydelige på at veien til klinisk integrering er lang og krevende. Fremtidens medisin vil trolig se en økende bruk av AI, men bare dersom utviklingen skjer med nødvendig forsiktighet og vitenskapelig stringens.