КЛАССИФИКАЦИЯ И РАСПОЗНАВАНИЕ ДОНОРНЫХ И АКЦЕПТОРНЫХ САЙТОВ СПЛАЙСИНГА С ПОМОЩЬЮ СКРЫТЫХ МАРКОВСКИХ ЦЕПЕЙ
Поздняков М. А.
Лаборатория теоретической генетики, Институт цитологии и генетики СО РАН, 630090 Новосибирск
Известно, что сайты сплайсинга
представляют собой пример сайтов, распознаваемых клеточным аппаратом
сплайсинга с очень высокой точностью. Однако до сиз пор неизвестно,
на основании каких особенностей последовательности нуклеотидов
происходит это распознавание. Нами проведено исследованиеособенностей
первичной и вторичной структуры РНК вблизи донорных и акцепторных
сайтов сплайсинга генов человека. Выборки сайтов сплайсинга были
составлены с использованием банка данных о нуклеотидных последовательностях
EMBL. Для исследования этих выборок был реализован алгоритм классификации
фазированных выборок нуклеотидных последовательностей, основанный
на оценке параметров скрытых марковских цепей. Этот алгоритм был
применен по отдельности к донорным и акцепторным сайтам сплайсинга
генов человека, а также совместно к обеим выборкам сайтов. Были
обнаружены статистически значимые контекстные характеристики донорных
и акцепторных сайтов сплайсинга, а также корреляции нуклеотидного
контекста между донорным и акцепторным сайтами сплайсинга.