Мы выполнили ряд ключевых шагов для разработки нового метода диагностики наследственных заболеваний человека, основанном на комбинации методов захвата конформации хромосом и экзомного секвенирования.
Во-первых, мы существенно переработали существующий протокол приготовления Hi-C-библиотек при помощи ДНКазы, сделав его более воспроизводимым и эффективным, а также показав его преимущества перед классическим Hi-C для детекции однонуклеотидных вариантов в экзоме пациента. Мы совместили этот протокол с экзомным обогащением и, таким образом, разработали методику Exo-C.
Во-вторых, мы собрали достаточно большую выборку индивидуумов (более 40) с различными хромосомными перестройками. Для всех полученных образцов мы выполнили Exo-C-анализ, получив, таким образом, одну из самых больших коллекций унифицированных 3C-карт контактов для образцов человека.
В-третьих, благодаря анализу полученных 3С-данных, мы определили ранее описанных границы хромосомных перестроек и нашли новые, не доступные для детекции классическими методами, перестройки. В ряде случаев это позволило нам выдвинуть гипотезы о молекулярном механизме развития патологии. Проведение современных функциональных тестов, включая получение и дифференцировку индуцированных плюрипотентных клеток и полногеномный анализ экспрессии генов, дало возможность подтвердить часть из предложенных гипотез и, таким образом, установить молекулярную причину заболеваний.
В-четвертых, мы разработали две биоинформационные модели, позволяющие предсказывать трехмерные контакты перестроенных локусов. Модель 3DPredictor позволяет оценивать функциональное значение изменений архитектуры хроматина, вызванных хромосомной перестройкой. Эта модель полезна в тех случаях, когда хромосомная перестройка была найдена “классически” методом, а не с помощью Exo-C, но ее функциональные последствия могут реализовываться на уровне контактов хроматина. Алгоритм ReMOD предназначен для моделирования выбросов, отклонений и шумов в данных Exo-C и других Hi-C-данных. Этот алгоритм позволяет создавать распределения со статистиками, соответствующими наблюдаемым при хромосомных перестройках. Такие распределения необходимы для разработки и валидации биоинформационных алгоритмов для детекции перестроек.