где суммирование ведётся
по всем словам из носителя ЧС шаблона. Покрытие представляет собой
ступенчатую функцию, определённую на целочисленной решётке, соответствующей
реальной последовательности. Очевидно, что вид функции
существенно зависит от двух параметров: длины шаблона и толщины
его частотного словаря q. Напомним, что толщиной словаря
q называется длина слов, содержащихся в этом ЧС. Кроме
того, вид покрытия зависит и от выбора собственно шаблона. Если
при его построении интервал выходит за границы исследуемого текста
(это бывает для центров, расположенных достаточно близко к границам),
то такие участки будем покрывать усечёнными интервалами, нижняя,
либо верхняя граница которых совпадает с границей исследуемого
текста. Всякое покрытие может быть хорошим, либо плохим. Назовём
покрытие хорошим, если оно связно и полностью покрывает весь исходный
текст; в противном случае покрытие будем называть плохим. Всякое
плохое покрытие можно сделать хорошим, если увеличить толщину
словаря, для которого оно строится, либо увеличить ширину полуинтервала.
Всюду впредь будем работать только с хорошими покрытиями. Выделение
слабо периодической структуры в НП с помощью покрытия производится
стандартными методами спектрального анализа этой функции. В нашей
работы мы строили покрытия для хромосом III, IX и XV дрожжей.
Выбор именно этих хромосом был обусловлен большим интересом к
ним со стороны исследователей, а также тем, что на них находятся
многие важные гены. Исследование спектральных свойств покрытия
для этих НП показало существование на них структур типа слабой
периодичности. Кроме того, для некоторых размеров интервалов и
величины шаблона наблюдается заметная корреляция между слабопериодической
структурированностью и такими структурами, как, например, интрон-экзонная
структура НП.