Метрическая кластеризация последовательностей аминокислотных остатков в ранговых шкалах
Стрижов Вадим Викторович, Кузнецов Михаил Павлович, Рудаков Константин Владимирович
Вычислительный центр им А.А. Дородницына, Российская академия наук, Москва, 19333, Россия
Московский физико-технический институт (Государственный университет), Долгопрудный, Московская область, 141700, Россия
strijov@ccas.ru
mikhail.kuznecov@phystech.edu
Аннотация. Для решения задачи распознавания вторичной структуры белков предложен алгоритм кластеризации подпоследовательности аминокислотных остатков. Для выявления кластеров используются парные расстояния между подпоследовательностями. Отличительной особенностью алгоритма является то, что не требуется строить полную матрицу парных расстояний, что снижает сложность вычислений. При кластеризации рассматриваются только ранги расстояний между подпоследовательностями. Работа алгоритма проиллюстрирована синтетическими данными и данными из базы UniProt KB.
Ключевые слова: кластеризация, функция расстояния, матрица парных расстояний, метрическая конфигурация, ранговые шкалы.