КЛАССИФИКАЦИЯ И РАСПОЗНАВАНИЕ ДОНОРНЫХ И АКЦЕПТОРНЫХ САЙТОВ СПЛАЙСИНГА С ПОМОЩЬЮ СКРЫТЫХ МАРКОВСКИХ ЦЕПЕЙ

Поздняков М. А.
Лаборатория теоретической генетики, Институт цитологии и генетики СО РАН, 630090 Новосибирск
Известно, что сайты сплайсинга представляют собой пример сайтов, распознаваемых клеточным аппаратом сплайсинга с очень высокой точностью. Однако до сиз пор неизвестно, на основании каких особенностей последовательности нуклеотидов происходит это распознавание. Нами проведено исследованиеособенностей первичной и вторичной структуры РНК вблизи донорных и акцепторных сайтов сплайсинга генов человека. Выборки сайтов сплайсинга были составлены с использованием банка данных о нуклеотидных последовательностях EMBL. Для исследования этих выборок был реализован алгоритм классификации фазированных выборок нуклеотидных последовательностей, основанный на оценке параметров скрытых марковских цепей. Этот алгоритм был применен по отдельности к донорным и акцепторным сайтам сплайсинга генов человека, а также совместно к обеим выборкам сайтов. Были обнаружены статистически значимые контекстные характеристики донорных и акцепторных сайтов сплайсинга, а также корреляции нуклеотидного контекста между донорным и акцепторным сайтами сплайсинга.