Русская версия English version   
Том 18   Выпуск 2   Год 2023
Анализ эффективности микс-сборки метатранскриптомных наборов данных в исследовании вирусных сообществ

Букин Ю.С., Бондарюк А.Н., Бутина Т.В.

Федеральное государственное бюджетное учреждение науки Лимнологический институт Сибирского отделения Российской академии наук, Иркутск, Россия


Аннотация. В данной работе проведен сравнительный анализ раздельной и комбинированной («микс») сборки метатранскриптомных данных для исследования вирусных сообществ в нескольких образцах на примере четырех метатранскриптомов эндемичных байкальских моллюсков Benedictia baicalensis. Анализ показал, что микс-сборка по сравнению с раздельной сборкой образцов увеличивает количество вирусных контигов (или скаффолдов) на образец, количество идентифицированных виротипов, среднюю длину скаффолдов на образец и долю собранных вирусных прочтений от общего количества прочтений в образцах. Микс-геномные de novo сборки с использованием скрытых марковских моделей для идентификации вирусов представляют данные в виде таблицы с количеством прочтений из разных образцов для каждого скаффолда (таблица представленности). Такая таблица позволяет сравнивать образцы по представленности всех вирусных скаффолдов, в том числе, не имеющих аналогов в известных базах данных, то есть для которых не удалось установить таксономическую принадлежность. Таким образом, микс-геномные сборки позволяют проводить сравнительный анализ с учетом скрытого разнообразия вирусов. В работе предложен конвейер по анализу данных метатранскриптомов с применением микс-геномной de novo сборки для исследования вирусов, которым могут воспользоваться другие исследователи. 


Ключевые слова: метагеномика, транскриптомика, вирусы, вирусные сообщества, метагеномная сборка, микс-сборка, метатранскриптомный анализ, вирусные скаффолды.

Содержание Оригинальная статья
Мат. биол. и биоинф.
2023;18(2):418-433
doi: 10.17537/2023.18.418
опубликована на рус. яз.

Аннотация (рус.)
Аннотация (англ.)
Полный текст (рус., pdf)
Список литературы

 

  Copyright ИМПБ РАН © 2005-2024