, , , , , ,

"Механизмы канцерогенеза BRCA-зависимого рака яичников". Андрей Андреевич Кечин, НГУ, ИХБФМ СО РАН, 4.7.2023

nsu_icbfm_aakechin_202307.pdf

Состав коллектива

Аннотация

Массовое параллельное секвенирование (NGS) позволяет проводить поиск патогенных мутаций во всем геноме пациентов, повышая шанс определить именно те мутации, которые и связаны с развитием или прогрессированием заболевания. С появленим секвенирования третьего поколения, с протяженными прочтениями, стало возможным выявление не только точечных и коротких мутаций, но и протяженных перестроек генома. Целью работы стала отработка подходов к выявлению точечных и протяженных мутаций в данных полногеномного секвенирования с протяженными прочтениями технологией Oxford Nanopore. Для этого был секвенирован один образец ДНК из лейкоцитов крови человека. Всего при секвенировании в течение 48 часов было получено 4,12 миллиона прочтений с суммарной длиной прочтений 15,8 миллиардов п.о. Технология секвенирования Oxford Nanopore подразумевает регистрацию изменения силы тока при прохождения цепи ДНК через пору, из-за чего при секвенирования накапливается огромное количество данных, которые должны быть конвертированы в нуклеотидные последовательности. Для этого применяются алгоритмы, основанные на машинном обучении. В то же время, опыт применения данной технологии показал, что для быстрой конвертации необходимым является применение программно-аппаратной архитектуры параллельных вычислений CUDA. Для последующего выявления точечных и протяженных мутаций нами были использованы несколько свободно доступных программ: BWA и minimap2 – для картирования полученных прочтений на геном; Pisces и LongShot – для поиска точечных мутаций; Sniffles и NanoVar – для выявления крупных перестроек. С помощью ROC-анализа нами были определены оптимальные параметры выявления точечных вариаций программой Pisces: минимально допустимое качество прочитанного основания – 6, минимальное качество варианта – 2; минимальное покрытие – 4. Для части выявленных крупных перестроек (более 100 тысяч различных перестроек до фильтрации по их качеству) было проведено сравнение числа и типа мутаций были сконструированы праймеры для их валидации в образце ДНК.

Грантовая поддержка

Публикации