Развитие технологии ChIP-seq произвело революцию в генетическом анализе основных механизмов регуляции транскрипции и привело к накоплению информации об огромном количестве последовательностей ДНК. В настоящее время доступно множество веб-сервисов для обнаружения мотивов de novo в наборах данных, содержащих информацию о связывании ДНК/белков. Огромное разнообразие мотивов усложняет поиск. Чтобы избежать трудностей, исследователи используют различные стохастические подходы. К сожалению, эффективность программ обнаружения мотивов резко снижается с увеличением размера набора запросов. Это приводит к тому, что анализировать удается только небольшую часть последовательностей наиболее значимых пиков ChIP-Seq или приходится сужать область анализа. Таким образом, выявление мотивов в массивных наборах данных остается сложной проблемой. Разработанная нами система Argo_CUDA предназначена для обработки огромных данных ДНК. Это программа для обнаружения вырожденных олигонуклеотидных мотивов фиксированной длины, записанных в 15-буквенном коде IUPAC. Argo_CUDA — это комплексный подход, основанный на высокопроизводительных технологиях графических процессоров. По сравнению с существующими методами выявления мотивов, Argo_CUDA демонстрирует более высокое качество выявления контекстных сигналов на смоделированных наборах. С помощью разработанной нами системы были получены наборы олигонуклеотидных мотивов достоверно перепредставленнные в выборках последовательностей ChIP-Seq. На основе наборов выявленных мотивов строились уравнения множественной регрессии для предсказания высоты ChIP-seq пиков по их нуклеотидным последовательностям. В анализе использованы геномные последовательности ChIP-Seq пиков в районах связывания 8 ТФ (CEBPA, CEBPB, SP1, FOXA2, FOXO1, NFYA, MEF2D, STAT5B). На контрольных выборках была показана достоверная корреляции экспериментально полученных и предсказанных величин значимости ChIP-Seq пиков. Нами показано, что последовательности ChIP-Seq пиков обогащены не одиночными значимыми мотивами, а их наборами, имеющими достоверное сходство с сайтам связывания конкретного целевого ТФ. Кроме того, последовательности ChIP-Seq пиков обогащены специфичными наборами значимых мотивов, достоверно сходных с сайтами связывания других ТФ.