К вопросу о распознавании скрытой периодичности в последовательностях ДНК
Коротков Е.В., Шеленков А.А., Короткова М.А.
Центр «Биоинженерия», Российская академия наук, Москва, 117312, Россия
Национальный исследовательский ядерный университет (МИФИ), Москва, 115409, Россия
genekorotkov@gmail.com
Аннотация. В данной работе мы сравнили метод информационного разложения (ИР) и спектрально-статистический подход (СС). Мы показываем, что СС подход не учитывает влияния малой выборки, а выделение статистически значимого периода в последовательности оснований ДНК СС подход проводит математически некорректно. Обнаружение «профильной периодичности» СС подходом зависит исключительно от соотношения длин скрытых периодов. Обнаруженные недостатки СС подхода показывают, что для поиска районов ДНК со скрытой периодичностью в нуклеотидных последовательностях более корректно использовать статистику Z и метод ИР.
Ключевые слова: cкрытая периодичность, информационное разложение, спектрально-статистический подход, гены, триплетная периодичность, профильная периодичность.