БЫСТРАЯ ОЦЕНКА СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ ПАРНОГО ВЫРАВНИВАНИЯ ДВУХ НУКЛЕОТИДНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

Колпаков Ф. А., Селедцов И. А.
Институт цитологии и генетики СО РАН, 630090 Новосибирск
Основным вопросом при сравнении последовательностей является статистическая значимость наблюдаемого сходства. Для выравнивания, содержащего вставки и делеции, чтобы оптимизировать сходство последовательностей, эта проблема еще не решена математически. Проведя регрессионный анализ наблюдаемого сходства для случайных последовательностей в зависимости от длины и нуклеотидного состава, мы представляем практический метод, чтобы оценить вероятность того, что наблюдаемое сходство является случайным. После того как параметры регрессии определены для заданной схемы выравнивания (матрица сходства и штрафы за делецию) для любой пары нуклеотидных последовательностей вероятность того, что наблюдаемое сходство является случайным, может быть точно оценена только на основе их длины и нуклеотидного состава последовательностей. Работа выполнена при поддержке гранта РФФИ 97-04-49740, РФФИ 98-04-49479.