Прорыв в генетике: Российские ученые обнаружили скрытые «рычаги» управления раком
NewsMakerИскусственный интеллект нашёл в ДНК 360 тысяч скрытых «выключателей»
Международная группа учёных, включая исследователей из Высшей школы экономики, создала первую полную карту ДНК-квадруплексов — кратковременных узловых структур, которые управляют включением и выключением генов.
Квадруплексы образуются, когда участки ДНК, богатые гуанином, сворачиваются в трёхмерные узлы из нескольких слоёв. Эти структуры служат ориентирами для белков, регулирующих активность генов. Проблема в том, что квадруплексы возникают быстро и так же быстро исчезают, поэтому традиционные методы картирования генома не могли их зафиксировать в полном объёме.
Для решения этой задачи исследователи использовали искусственный интеллект. Они обучили языковую модель DNABERT на базе EndoQuad — крупнейшей в мире базе экспериментально подтверждённых квадруплексов. Получившаяся модель GQ-DNABERT анализирует последовательности ДНК и предсказывает, где вероятнее всего сформируется квадруплекс, учитывая при этом окружающий генетический контекст. В результате удалось предсказать около 360 тысяч квадруплексов — значительно больше, чем выявляли экспериментальные методы.
Главное открытие состоит в том, что квадруплексы работают парами. Они одновременно формируются в промоторах, где начинается транскрипция гена, и в расположенных рядом энхансерах — элементах ДНК, усиливающих активность генов. Эти пары совместно регулируют экспрессию генов.
Международная группа учёных, включая исследователей из Высшей школы экономики, создала первую полную карту ДНК-квадруплексов — кратковременных узловых структур, которые управляют включением и выключением генов.
Квадруплексы образуются, когда участки ДНК, богатые гуанином, сворачиваются в трёхмерные узлы из нескольких слоёв. Эти структуры служат ориентирами для белков, регулирующих активность генов. Проблема в том, что квадруплексы возникают быстро и так же быстро исчезают, поэтому традиционные методы картирования генома не могли их зафиксировать в полном объёме.
Для решения этой задачи исследователи использовали искусственный интеллект. Они обучили языковую модель DNABERT на базе EndoQuad — крупнейшей в мире базе экспериментально подтверждённых квадруплексов. Получившаяся модель GQ-DNABERT анализирует последовательности ДНК и предсказывает, где вероятнее всего сформируется квадруплекс, учитывая при этом окружающий генетический контекст. В результате удалось предсказать около 360 тысяч квадруплексов — значительно больше, чем выявляли экспериментальные методы.
Главное открытие состоит в том, что квадруплексы работают парами. Они одновременно формируются в промоторах, где начинается транскрипция гена, и в расположенных рядом энхансерах — элементах ДНК, усиливающих активность генов. Эти пары совместно регулируют экспрессию генов.