AlphaGenome от Google DeepMind: ИИ-модель, которая читает регуляторный код ДНК

Google DeepMind опубликовала исследование новой модели AlphaGenome - нейросети, которая помогает понять, как изменения в ДНК влияют на работу генов. Разработка нацелена на одну из самых сложных задач биологии и медицины: интерпретацию генетических мутаций за пределами кодирующих участков.
В чём суть AlphaGenome
Большинство генетических мутаций, связанных с заболеваниями, находятся не в самих генах, а в так называемых регуляторных областях ДНК - они управляют тем, когда, где и насколько активно работают гены. Понять влияние таких мутаций крайне сложно, и именно здесь DeepMind предлагает новое решение.
AlphaGenome принимает на вход длинный фрагмент ДНК - до одного миллиона «букв» - и предсказывает, как изменения в этой последовательности повлияют на разные биологические процессы: экспрессию генов, сплайсинг РНК, доступность хроматина и другие регуляторные сигналы.
Почему это заметный шаг вперёд
Ранее модели обычно сталкивались с компромиссом: либо они видели большой участок генома, но давали грубые предсказания, либо работали точно, но только на коротких фрагментах. AlphaGenome объединяет оба подхода - большой контекст и высокую точность вплоть до одного нуклеотида.
По результатам тестов модель показывает лучшие или сопоставимые результаты почти во всех ключевых задачах по сравнению с предыдущими решениями, включая предсказание влияния мутаций на экспрессию генов и сплайсинг. Это особенно важно для анализа редких и неочевидных вариантов, связанных с заболеваниями.
Пример из реальной биологии
Авторы демонстрируют работу модели на примере онкогенных мутаций при Т-клеточном лейкозе. AlphaGenome показывает, как изменения в некодирующих участках ДНК запускают цепочку эффектов - от локальных регуляторных сдвигов до повышения активности конкретного гена. Такой анализ раньше требовал сложных и разрозненных методов.
Зачем это нужно на практике
AlphaGenome можно рассматривать как универсальный «движок» для геномики. Он подходит как для базовой аннотации генома, так и для прикладных задач - от исследований наследственных заболеваний до персонализированной медицины. Авторы также публикуют инструменты для оценки эффектов мутаций напрямую из ДНК-последовательности, что упрощает интеграцию модели в научные и клинические workflows.



