СРАВНИТЕЛЬНЫЙ ПОДХОД К АНАЛИЗУ РЕГУЛЯЦИИ ТРАНСКРИПЦИИ

Миронов А. А., Гельфанд М. С.
ГосНИИГенетика, Москва; Институт белка РАН, 142292 Пущино
Секвенирование полных бактериальных геномов открыло новую эру в биоинформатике. В настоящее время хорошо разработаны методы распознавания генов и метаболической реконструкции на основании сравнения белковых последовательностей. В то же время регуляция экспрессии генов, как правило, остается неизвестной. Существующие методы предсказания участков регуляции транскрипции основаны на использовании различных алгоритмов распознавания образов от простых статистических моделей до нейронных сетей. Однако, как правило, не удается построить надежного распознающего правила как из-за малого объема обучающей выборки, так и из-за того, что недостаток знаний о ДНК-белковом взаимодействии не дает возможности использовать оптимальные признаки. Мы использовали сравнительный подход, основанный на следующем предположении: регулон, т.е. группа генов, находящихся под общей регуляцией, консервативен, т.е. в состав регулона в близких геномах будут входить ортологичные гены. В соответствии с этим предположением, первоначальный состав регулона в двух геномах определяется с использованием весовой матрицы для операторов данного типа с низким порогом. Далее производится выравнивание всех пар генов из двух потенциальных регулонов. Похожие гены рассматриваются более подробно для восстановления отношений ортолог/паралог. Пары паралогов, каждый из которых имеет в регуляторной области потенциальный оператор, выдаются в качестве предсказания. Дополнительное усложнение связано с необходимостью учета оперонной структуры - для этого в состав первоначальных регулонов включаются не только гены с потенциальными операторами, но и гены, которые могут входить с ними в опероны (т.е. непосредственные соседи, транскрибируемые в том же направлении). Указанный подход был применен к ряду регулонов кишечной палочки (Escherichi coli), гемоглобинофильной палочки (Haemophilus influenzae) и сенной палочки (Bacillus subtilis). Был обнаружено семейство транспортных белков кишечной палочки, входящих в пуриновый регулон и, по-видимому, осуществляющих импорт пуринов (единственный представитель этого семейства имеется в геноме гемоглобинофильной палочки). Было обнаружено несколько генов, входящих в SOS (DinR) регулон сенной палочки. В ряде случаев (несколько оперонов пуринового регулона, триптофановый оперон кишечной и гемоглобинофильной палочек) показано, что регуляция сохраняется, несмотря на изменение оперонной структуры. Таким образом, предложенный подход не только позволяет предсказывать регуляцию генов с известной функцией в новосеквенированных геномах, но и обнаруживать новые члены известных регулонов в хорошо изученных геномах.