Состав коллектива

  • Кечин Андрей Андреевич, к.б.н., руководитель работы, старший преподаватель ФЕН и ИМПЗ НГУ (по совместительству); научный сотрудник Лаборатории фармакогеномики ИХБФМ СО РАН
  • Боробова Виктория Сергеевна, студент ФЕН НГУ, 2-й курс магистратуры, кафедра молекулярной биологии и биотехнологии

Аннотация

Массовое параллельное секвенирование (NGS) позволяет проводить поиск патогенных мутаций во всем геноме пациентов, повышая шанс определить именно те мутации, которые и связаны с развитием или прогрессированием заболевания. С появленим секвенирования третьего поколения, с протяженными прочтениями, стало возможным выявление не только точечных и коротких мутаций, но и протяженных перестроек генома. Целью работы стала отработка подходов к выявлению точечных и протяженных мутаций в данных полногеномного секвенирования с протяженными прочтениями технологией Oxford Nanopore. Для этого был секвенирован один образец ДНК из лейкоцитов крови человека. Всего при секвенировании в течение 48 часов было получено 4,12 миллиона прочтений с суммарной длиной прочтений 15,8 миллиардов п.о. Технология секвенирования Oxford Nanopore подразумевает регистрацию изменения силы тока при прохождения цепи ДНК через пору, из-за чего при секвенирования накапливается огромное количество данных, которые должны быть конвертированы в нуклеотидные последовательности. Для этого применяются алгоритмы, основанные на машинном обучении. В то же время, опыт применения данной технологии показал, что для быстрой конвертации необходимым является применение программно-аппаратной архитектуры параллельных вычислений CUDA. Для последующего выявления точечных и протяженных мутаций нами были использованы несколько свободно доступных программ: BWA и minimap2 – для картирования полученных прочтений на геном; Pisces и LongShot – для поиска точечных мутаций; Sniffles и NanoVar – для выявления крупных перестроек. С помощью ROC-анализа нами были определены оптимальные параметры выявления точечных вариаций программой Pisces: минимально допустимое качество прочитанного основания – 6, минимальное качество варианта – 2; минимальное покрытие – 4. Для части выявленных крупных перестроек (более 100 тысяч различных перестроек до фильтрации по их качеству) было проведено сравнение числа и типа мутаций были сконструированы праймеры для их валидации в образце ДНК.

Грантовая поддержка

  • Грант Президента МК-4082.2021.1.4, номер соглашения 075-15-2021-200

Публикации

  • Кечин А.А., Корюков М.А., Боробова В.С., Филипенко М.Л. Особенности выявления мутаций в данных полногеномного секвенирования с протяженными прочтениями // Сборник трудов XVIII Российской конференции с международным участием (Новосибирск, 5-8 декабря 2022 г.) / Под ред. С.А. Рылова, Ю.И. Молородова, А.А. Жирнова, Ю.Н. Синявского. – Новосибирск: ФИЦ ИВТ, 2022. – С. 109–114. 10.25743/DIR.2022.16.63.019
  • Кечин А.А., Боробова В.С., Корюков М.А., Субботина К.В., Боярских У.А., Тархов А.В., Филипенко М.Л. Технология секвенирования Oxford Nanopore: перспективы и возможности в молекулярной онкологии // VII Всероссийская конференция по молекулярной онкологии (г. Москва, 21–23 декабря 2022).