Типологические подходы к распознаванию рода и подрода коронавирусов по структурным и неструктурным генам
Чалей М.Б.1, Кутыркин В.А.2
1Институт математических проблем биологии – филиал ИПМ им. М.В. Келдыша РАН, Пущино, Московская область, Россия
2Московский государственный технический университет им. Н.Э. Баумана, Москва, Россия
Аннотация. В работе предлагаются типологические подходы к распознаванию рода и подрода коронавирусов на основе частот кодонов в кодирующих последовательностях их генов. Распознавание осуществляется на основе статистики, выявляющей отклонение рассматриваемого гена коронавируса от соответствующего гена из генома известного рода или подрода. В работе рассматривались структурные S- и N-гены, и также неструктурные гены, объединенные единой рамкой считывания ORF1ab. Три из четырех подходов выявили высокую эффективность распознавания рода и подрода коронавирусов на основании N-гена. В последовательности N-гена были выделены кодоны наиболее значимые для распознавания. Предложенный статистический подход для определения таксономической принадлежности вирусов является менее трудоемким в сравнении с методами филогенетического анализа и может быть использован для аннотирования вирусных геномов.
Ключевые слова: распознавание рода и подрода коронавирусов, геном коронавируса, прототипные штаммы коронавирусов, S-, N-гены коронавируса, ORF1ab коронавируса.