САЙТЫ СВЯЗЫВАНИЯ ТРАНСКРИПЦИОННЫХ ФАКТОРОВ: КОНФОРМАЦИОННЫЕ И ФИЗИКО-ХИМИЧЕСКИЕ КОДЫ ФУНКЦИОНИРОВАНИЯ

Пономаренко Ю. В., Пономаренко М. П., Фролов А. С., Подколодный Н. Л., Воробьев Д. Г., Колчанов Н. А.
Институт цитологии и генетики СО РАН 630090 Новосибирск
Предложен подход к построению конформационного и физико-химического кода функционирования сайтов связывания транскрипционных факторов. В рамках этого подхода созданы компьютерные системы ACTIVITY (http://wwwmgs.bionet.nsc.ru/ACTIVITY/) и B-DNA-Video (http://wwwmgs.bionet.nsc.ru/systems/BDNAVideo/). Система ACTIVITY позволяет исследовать зависимости активностей сайтов от конформационных и физико-химических особенностей их ДНК и строить методы предсказания активности сайтов. ACTIVITY состоит из базы экспериментальных данных по активности сайтов, базы данных PROPERTY по конформационным и физико-химических свойствам динуклеотидных дуплексов В-ДНК и базы знаний об активности сайтов. Создан метод предсказания активности сайта по его последовательности на основе выявленных системой значимых контекстных, конформационных и физико-химических особенностей сайтов. Предложено компьютерное представление знаний об активности сайтов в виде кодов программ для предсказания специфической активности сайта с произвольной последовательностью. Анализ данных нескольких десятков экспериментов показал, что специфическая активность сайтов определяется конформационными и физико-химическими особенностями ДНК. Система B-DNA-Video позволяет выявлять конформационные и физико-химические особенности ДНК сайтов связывания транскрипционных факторов и распознавать по ним сайты в произвольных последовательностях. B-DNA-Video состоит из базы данных по последовательностям экспериментально определенных сайтов связывания транскрипционных факторов SAMPLES, базы PROPERTY и базы знаний FEATURES. Знания об особенностях ДНК сайтов представлены в виде кодов программ, строящих профили особенностей ДНК и распознающих функций для сайтов вдоль произвольной последовательности. В базе знаний хранятся также гистограммы распределений выявленных особенностей для сайтов в сравнении со случайными последовательностями ДНК и графики зависимости ошибок I рода от ошибок II рода для распознающих сайт функций. На основе выявленных закономерностей построен граф сходства сайтов связывания транскрипционных факторов по конформационным и физико-химическим особенностям ДНК этих сайтов, который достоверно согласуется с общепринятой классификацией этих белковых факторов по типу их ДНК-связывающих доменов. Общие конформационные и физико-химические особенности ДНК, которые могут, таким образом, рассматриваться в качестве конформационного и физико-химического кода этих сайтов.