Слишком умная для биотеррористов. OpenAI показала нейросеть, которую страшно выпускать в интернет

Модель GPT-Rosalind показала экспертный уровень в тестах на биологическое рассуждение.


7wrbk2u2ktje1mtzuisfqvekx65z2zwl.jpg

OpenAI решила зайти в биологию не с универсальной моделью на все случаи жизни, а с узким инструментом под реальные задачи исследователей. Компания представила GPT-Rosalind , большую языковую модель, которую обучали на самых распространенных биологических рабочих процессах и на работе с крупными открытыми базами данных. Название отсылает к Розалинд Франклин , одной из ключевых фигур в истории молекулярной биологии.

Разработчики говорят, что GPT-Rosalind должна помочь там, где современная биология давно уперлась в масштаб и сложность. За десятилетия геномных исследований и белковой биохимии ученые накопили такие массивы данных, что одному человеку уже трудно охватить весь нужный контекст. К проблеме объема добавляется и другая трудность: биология давно распалась на множество узких направлений со своим языком, методами и массивами публикаций. Генетик, который внезапно выходит на тему работы гена в клетках мозга, может быстро столкнуться с огромным пластом нейробиологических исследований, в котором трудно разобраться без дополнительной помощи.

По словам OpenAI, модель обучили на 50 самых распространенных биологических процессов и дополнительно научили обращаться к основным публичным источникам научной информации. После такой настройки GPT-Rosalind может предлагать вероятные биологические пути, связывать генотип с фенотипом через известные регуляторные механизмы, делать выводы о возможных структурных или функциональных свойствах белков и помогать с отбором потенциальных мишеней для лекарств.

Компания отдельно подчеркивает, что пыталась ослабить типичную проблему языковых моделей, когда система слишком охотно соглашается с пользователем и выдает чрезмерно уверенные советы. GPT-Rosalind сделали более скептичной, чтобы модель чаще указывала на слабые гипотезы и сомнительные цели для разработки препаратов. OpenAI также говорит о способности системы проходить сложные многошаговые цепочки рассуждений и ссылается на результаты нескольких тестов, где модель показала экспертный уровень.