Геномы живых организмов содержат десятки тысяч генов, кодирующих белки. Каждый белок экспрессируется в результате транскрипции и трансляции и принимает уникальную трехмерную структуру, которая, как правило, состоит из нескольких функциональных доменов. Каждый домен отвечает за специфические взаимодействия с лигандами и обуславливает функцию белка.
Функции белка определяются комбинацией доменов, один из которых, как правило, является основным (ферментативным).
Биологов интересует распознавание функций белков, кодируемых в геномах. Поскольку количество генов велико, то решение такой задачи связано с необходимостью вычислительной обработки больших геномных данных.
Главной целью работы является создание автоматического вычислительного конвейера для поиска и анализа белков-ортологов в геномах групп организмов. Данный конвейер может использоваться молекулярными биологами и биоинформатиками для более точного анализа многодоменных белков в геномах немодельных организмов.
Работа поддержана «Курчатовским геномным центром ИЦиГ СО РАН», проект № 075-15-2019-1662