Новая модель ИИ для биологии от OpenAI
Компания OpenAI объявила о создании специализированной языковой модели GPT-Rosalind, получившей название в честь известного биофизика Розалинды Франклин. В отличие от универсальных научных моделей, разрабатываемых другими технологическими гигантами, эта система ориентирована исключительно на биологические рабочие процессы.
Ключевые задачи, которые решает GPT-Rosalind
По словам Юньюнь Ванг, руководителя направления наук о жизни в OpenAI, модель была разработана для устранения двух основных проблем, с которыми сталкиваются биологи:
- Обработка больших данных: десятилетия геномных исследований и биохимических экспериментов привели к накоплению огромных массивов информации, которые сложно анализировать вручную.
- Специализированная терминология: биология включает множество узких направлений, каждое из которых имеет собственный жаргон и методы. Например, генетик, работающий с геном, активным в нейронах, может испытывать трудности при изучении нейробиологической литературы.
Как работает новая модель
OpenAI обучила GPT-Rosalind на 50 наиболее распространённых биологических рабочих процессах, а также на методах доступа к основным публичным биологическим базам данных. В результате система способна:
- Предсказывать биологические пути;
- Приоритизировать потенциальные мишени для лекарственных препаратов;
- Связывать генотип с фенотипом через известные пути и механизмы регуляции;
- Анализировать структурные и функциональные свойства белков.
«Мы соединяем генотип с фенотипом через известные пути и механизмы регуляции, предсказываем вероятные структурные или функциональные свойства белков и используем это понимание для более глубокого анализа», — отметила Юньюнь Ванг.
Перспективы применения
GPT-Rosalind может стать ценным инструментом для биологов, биоинформатиков и фармацевтических компаний. Модель способна ускорить исследования в таких областях, как геномика, протеомика и разработка лекарств, предоставляя точные прогнозы на основе огромных объемов данных.