Прорыв в генетике: Российские ученые обнаружили скрытые «рычаги» управления раком

Искусственный интеллект нашёл в ДНК 360 тысяч скрытых «выключателей»


whtw9jz3b87mned11jk5l8hu8b718jjo.jpg

Международная группа учёных, включая исследователей из Высшей школы экономики, создала первую полную карту ДНК-квадруплексов — кратковременных узловых структур, которые управляют включением и выключением генов.

Квадруплексы образуются, когда участки ДНК, богатые гуанином, сворачиваются в трёхмерные узлы из нескольких слоёв. Эти структуры служат ориентирами для белков, регулирующих активность генов. Проблема в том, что квадруплексы возникают быстро и так же быстро исчезают, поэтому традиционные методы картирования генома не могли их зафиксировать в полном объёме.

Для решения этой задачи исследователи использовали искусственный интеллект. Они обучили языковую модель DNABERT на базе EndoQuad — крупнейшей в мире базе экспериментально подтверждённых квадруплексов. Получившаяся модель GQ-DNABERT анализирует последовательности ДНК и предсказывает, где вероятнее всего сформируется квадруплекс, учитывая при этом окружающий генетический контекст. В результате удалось предсказать около 360 тысяч квадруплексов — значительно больше, чем выявляли экспериментальные методы.

Главное открытие состоит в том, что квадруплексы работают парами. Они одновременно формируются в промоторах, где начинается транскрипция гена, и в расположенных рядом энхансерах — элементах ДНК, усиливающих активность генов. Эти пары совместно регулируют экспрессию генов.