Развитие технологии ChIP-seq произвело революцию в генетическом анализе основных механизмов регуляции транскрипции и привело к накоплению информации об огромном количестве последовательностей ДНК. В настоящее время доступно множество веб-сервисов для обнаружения мотивов de novo в наборах данных, содержащих информацию о связывании ДНК/белков. Огромное разнообразие мотивов усложняет поиск. Чтобы избежать трудностей, исследователи используют различные стохастические подходы. К сожалению, эффективность программ обнаружения мотивов резко снижается с увеличением размера набора запросов. Это приводит к тому, что анализировать удается только небольшую часть последовательностей наиболее значимых пиков ChIP-Seq или приходится сужать область анализа. Таким образом, выявление мотивов в массивных наборах данных остается сложной проблемой. Система Argo_CUDA предназначена для обработки огромных данных ДНК. Это программа для обнаружения вырожденных олигонуклеотидных мотивов фиксированной длины, записанных в 15-буквенном коде IUPAC. Argo_CUDA — это комплексный подход, основанный на высокопроизводительных технологиях графических процессоров. По сравнению с существующими методами выявления мотивов, Argo_CUDA демонстрирует более высокое качество выявления контекстных сигналов на смоделированных наборах. Анализ последовательностей пиков ChIP-Seq выявил мотивы, соответствующие известным сайтам связывания транскрипционных факторов как целевого транскрипционного фактора, так и транскрипционных факторов - партнеров.