БЫСТРАЯ ОЦЕНКА СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ ПАРНОГО ВЫРАВНИВАНИЯ ДВУХ НУКЛЕОТИДНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
Колпаков Ф. А., Селедцов И. А.
Институт цитологии и генетики СО РАН, 630090 Новосибирск
Основным вопросом при
сравнении последовательностей является статистическая значимость
наблюдаемого сходства. Для выравнивания, содержащего вставки и
делеции, чтобы оптимизировать сходство последовательностей, эта
проблема еще не решена математически. Проведя регрессионный анализ
наблюдаемого сходства для случайных последовательностей в зависимости
от длины и нуклеотидного состава, мы представляем практический
метод, чтобы оценить вероятность того, что наблюдаемое сходство
является случайным. После того как параметры регрессии определены
для заданной схемы выравнивания (матрица сходства и штрафы за
делецию) для любой пары нуклеотидных последовательностей вероятность
того, что наблюдаемое сходство является случайным, может быть
точно оценена только на основе их длины и нуклеотидного состава
последовательностей. Работа выполнена при поддержке гранта РФФИ
97-04-49740, РФФИ 98-04-49479.