Nowy model OpenAI dla biologii

OpenAI ogłosiło wprowadzenie na rynek modelu językowego GPT-Rosalind, którego zadaniem jest wspomaganie badań biologicznych. Nazwa modelu nawiązuje do Rosalind Franklin, pionierki w dziedzinie badań nad strukturą DNA.

W przeciwieństwie do ogólnych modeli naukowych, które są projektowane z myślą o szerokim zakresie zastosowań, GPT-Rosalind został wyspecjalizowany w obsłudze typowych procesów biologicznych. Jak podkreślił Yunyun Wang, szef ds. produktów w dziedzinie nauk o życiu w OpenAI, głównym celem było rozwiązanie dwóch kluczowych wyzwań stojących przed współczesnymi badaczami.

Główne wyzwania dla biologów

Pierwszym z nich są ogromne zbiory danych generowane przez dekady sekwencjonowania genomów i badania biochemii białek. Taka ilość informacji jest często zbyt obszerna, aby pojedynczy badacz mógł ją samodzielnie przeanalizować. Drugim problemem jest wysoki stopień specjalizacji w biologii – każda poddziedzina posiada własną terminologię i metody badawcze.

Przykładowo, genetyk zajmujący się badaniem genu aktywnego w komórkach mózgowych może mieć trudności z interpretacją literatury neurobiologicznej. GPT-Rosalind ma pomóc w takich sytuacjach, oferując dostęp do najważniejszych publicznych baz danych biologicznych oraz sugerując prawdopodobne ścieżki biologiczne i priorytetyzując potencjalne cele terapeutyczne.

Możliwości nowego modelu

Model został przeszkolony na 50 najczęściej stosowanych procesach biologicznych. Dzięki temu potrafi on łączyć genotyp z fenotypem poprzez znane ścieżki i mechanizmy regulacyjne, przewidywać właściwości strukturalne lub funkcjonalne białek oraz wykorzystywać mechanistyczne zrozumienie biologii do generowania nowych hipotez badawczych.

„Łączymy genotyp z fenotypem poprzez znane ścieżki i mechanizmy regulacyjne, przewidujemy prawdopodobne właściwości strukturalne lub funkcjonalne białek i naprawdę wykorzystujemy to mechanistyczne zrozumienie” – wyjaśnił Wang podczas briefingu prasowego.

Źródło: Ars Technica