САЙТЫ СВЯЗЫВАНИЯ ТРАНСКРИПЦИОННЫХ ФАКТОРОВ: КОНФОРМАЦИОННЫЕ И ФИЗИКО-ХИМИЧЕСКИЕ КОДЫ ФУНКЦИОНИРОВАНИЯ
Пономаренко Ю. В., Пономаренко М. П., Фролов А. С., Подколодный Н. Л., Воробьев Д. Г., Колчанов Н. А.
Институт цитологии и генетики СО РАН 630090 Новосибирск
Предложен подход к построению
конформационного и физико-химического кода функционирования сайтов
связывания транскрипционных факторов. В рамках этого подхода созданы
компьютерные системы ACTIVITY (http://wwwmgs.bionet.nsc.ru/ACTIVITY/)
и B-DNA-Video (http://wwwmgs.bionet.nsc.ru/systems/BDNAVideo/).
Система ACTIVITY позволяет исследовать зависимости активностей
сайтов от конформационных и физико-химических особенностей их
ДНК и строить методы предсказания активности сайтов. ACTIVITY
состоит из базы экспериментальных данных по активности сайтов,
базы данных PROPERTY по конформационным и физико-химических свойствам
динуклеотидных дуплексов В-ДНК и базы знаний об активности сайтов.
Создан метод предсказания активности сайта по его последовательности
на основе выявленных системой значимых контекстных, конформационных
и физико-химических особенностей сайтов. Предложено компьютерное
представление знаний об активности сайтов в виде кодов программ
для предсказания специфической активности сайта с произвольной
последовательностью. Анализ данных нескольких десятков экспериментов
показал, что специфическая
активность сайтов определяется конформационными и физико-химическими
особенностями ДНК. Система B-DNA-Video позволяет выявлять конформационные
и физико-химические особенности ДНК сайтов связывания транскрипционных
факторов и распознавать по ним сайты в произвольных последовательностях.
B-DNA-Video состоит из базы данных по последовательностям экспериментально
определенных сайтов связывания транскрипционных факторов SAMPLES,
базы PROPERTY и базы знаний FEATURES. Знания об особенностях ДНК
сайтов представлены в виде кодов программ, строящих профили особенностей
ДНК и распознающих функций для сайтов вдоль произвольной последовательности.
В базе знаний хранятся также гистограммы распределений выявленных
особенностей для сайтов в сравнении со случайными последовательностями
ДНК и графики зависимости ошибок I рода от ошибок II рода для
распознающих сайт функций. На основе выявленных закономерностей
построен граф сходства сайтов связывания транскрипционных факторов
по конформационным и физико-химическим особенностям ДНК этих сайтов,
который достоверно согласуется с общепринятой классификацией этих
белковых факторов по типу их ДНК-связывающих доменов. Общие конформационные
и физико-химические особенности ДНК, которые могут, таким образом,
рассматриваться в качестве конформационного и физико-химического
кода этих сайтов.