Построение разделяющих паралоги семейств гомологичных белков, кодируемых в пластидах цветковых растений
Любецкий В.А., Селиверстов А.В., Зверков О.А.
Федеральное государственное бюджетное учреждение науки Институт проблем передачи информации им. А.А. Харкевича Российской академии наук (ИППИ РАН)
lyubetsk@iitp.ru
slvstv@iitp.ru
zverkov@iitp.ru
Аннотация. Разделение белков по семействам, разделяющим паралоги, позволяет уточнять аннотации белков и выполнять поиск семейства по его филогенетическому профилю, который определяется разбиением множества видов на три части. Части задают присутствие/отсутствие белка (сайта связывания или другого признака вида), а также случай неопределённости в этом отношении. Другое применение – поиск белков, уникальных для узкой таксономической группы («подписей»). Нами разработан алгоритм, формирующий такие семейства. Он применён к разным множествам белков. В том числе к белкам, кодируемым в пластомах 186-ти видов цветковых растений. В этом случае соответствующая база данных и алгоритм поиска семейства по его филогенетическому профилю свободно доступны по адресу http://lab6.iitp.ru/ppc/magnoliophyta/. Алгоритм применён для разделения (кластеризации) белков, кодируемых в митохондриях 66-ти видов таксономической группы зелёных растений (Viridiplantae), и получена соответствующая база данных http://lab6.iitp.ru/mpc/viridiplantae/. Он применён к родофитной и хлорофитной (водоросли и мохообразные) ветвям пластид, и получены соответствующие базы данных, http://lab6.iitp.ru/ppc/redline/ и http://lab6.iitp.ru/ppc/chlorophyta/. На этой основе получены биологические результаты. Например, в митохондриях винограда (Vitis vinifera) найдены уникальные для них белки, которые в то же время типичны для пластид, что позволяет предсказать горизонтальный перенос из пластид в митохондрии. Формальная постановка задачи кластеризации белков, по-видимому, далека от завершения.
Ключевые слова: кластеризация, белковые семейства, пластиды, митохондрии.