"Разработка компьютерных методов выявления функциональных контекстных сигналов в регуляторных районах генов". Олег Владимирович Вишневский, ИЦиГ СО РАН, НГУ, 19.11.2025
Состав коллектива
- Олег Владимирович Вишневский. К.б.н., н.с. ИЦиГ (основное место работы), Старший преподаватель НГУ (совмещение)
Аннотация
Развитие технологии ChIP-seq произвело революцию в генетическом анализе основных механизмов регуляции транскрипции и привело к накоплению информации об огромном количестве последовательностей ДНК. В настоящее время доступно множество веб-сервисов для обнаружения мотивов de novo в наборах данных, содержащих информацию о связывании ДНК/белков. Огромное разнообразие мотивов усложняет поиск. Чтобы избежать трудностей, исследователи используют различные стохастические подходы. К сожалению, эффективность программ обнаружения мотивов резко снижается с увеличением размера набора запросов. Это приводит к тому, что анализировать удается только небольшую часть последовательностей наиболее значимых пиков ChIP-Seq или приходится сужать область анализа. Таким образом, выявление мотивов в массивных наборах данных остается сложной проблемой. Разработанная нами система Argo_CUDA предназначена для обработки огромных данных ДНК. Это программа для обнаружения вырожденных олигонуклеотидных мотивов фиксированной длины, записанных в 15-буквенном коде IUPAC. Argo_CUDA — это комплексный подход, основанный на высокопроизводительных технологиях графических процессоров. По сравнению с существующими методами выявления мотивов, Argo_CUDA демонстрирует более высокое качество выявления контекстных сигналов на смоделированных наборах. С помощью разработанной нами системы были получены наборы олигонуклеотидных мотивов достоверно перепредставленнные в выборках последовательностей ChIP-Seq. На основе наборов выявленных мотивов строились уравнения множественной регрессии для предсказания высоты ChIP-seq пиков по их нуклеотидным последовательностям. В анализе использованы геномные последовательности ChIP-Seq пиков в районах связывания 8 ТФ (CEBPA, CEBPB, SP1, FOXA2, FOXO1, NFYA, MEF2D, STAT5B). На контрольных выборках была показана достоверная корреляции экспериментально полученных и предсказанных величин значимости ChIP-Seq пиков. Нами показано, что последовательности ChIP-Seq пиков обогащены не одиночными значимыми мотивами, а их наборами, имеющими достоверное сходство с сайтам связывания конкретного целевого ТФ. Кроме того, последовательности ChIP-Seq пиков обогащены специфичными наборами значимых мотивов, достоверно сходных с сайтами связывания других ТФ.
Финансовая поддержка
- Бюджетный проект ИЦиГ FWNR-2022-0020 «Системная биология и биоинформатика: реконструкция, анализ и моделирование структурно-функциональной организации и эволюции генных сетей человека, животных, растений и микроорганизмов».
Публикации
- Vishnevsky OV, Bocharnikov AV, Ignatieva EV. Peak Scores Significantly Depend on the Relationships between Contextual Signals in ChIP-Seq Peaks. Int J Mol Sci. 2024;25(2):1011. Published 2024 Jan 13. doi:10.3390/ijms25021011