En AI-model skræddersyet til biologiens udfordringer

OpenAI har udviklet GPT-Rosalind, en stor sprogmodel specifikt trænet på almindelige biologiske arbejdsgange. Navnet er en hyldest til den britiske forsker Rosalind Franklin, hvis arbejde var afgørende for opdagelsen af DNA’s struktur.

Ifølge OpenAI adskiller GPT-Rosalind sig fra andre videnskabelige AI-modeller, som typisk er designet til at fungere på tværs af flere fagområder. I stedet fokuserer den udelukkende på biologiens kompleksitet og de udfordringer, som forskere møder i hverdagen.

To store udfordringer for biologisk forskning

Under en pressemøde forklarede Yunyun Wang, OpenAIs leder for livsvidenskabelige produkter, at modellen er udviklet til at løse to centrale problemer for biologer:

  • Mængden af data: Årtier med genomsekventering og proteinbiokemi har skabt enorme datamængder, som er svære for enkeltforskere at overskue.
  • Specialiseret viden: Biologi består af mange nicheområder med egen terminologi og metoder. En genetiker, der eksempelvis arbejder med gener aktive i hjerneceller, kan have svært ved at forstå neurobiologisk litteratur.

Hvordan GPT-Rosalind kan hjælpe

OpenAI har trænet modellen på 50 af de mest almindelige biologiske arbejdsgange og integreret adgang til store offentlige biologiske databaser. Resultatet er en model, der kan:

  • Foreslå sandsynlige biologiske pathways.
  • Prioritere potentielle lægemål.
  • Forbinde genotype med fænotype gennem kendte pathways og reguleringsmekanismer.
  • Inferere strukturelle eller funktionelle egenskaber hos proteiner.

"Vi forbinder genotype med fænotype gennem kendte pathways og reguleringsmekanismer. Vi kan desuden forudsige sandsynlige strukturelle eller funktionelle egenskaber hos proteiner og udnytte denne mekanistiske forståelse," forklarer Wang.

En milepæl for AI i livsvidenskaberne

GPT-Rosalind markerer et skridt mod mere målrettet anvendelse af AI inden for biologi. I modsætning til generiske modeller, der forsøger at dække alle videnskabelige discipliner, er denne model skræddersyet til biologiens specifikke behov. Det kan potentielt accelerere forskningen inden for lægemiddeludvikling, sygdomsforståelse og grundlæggende biologiske processer.