Геномные ландшафты: распределение эволюционных ограничений по разным классам сайтов в геноме
Рис. 3-7. Схематические геномные ландшафты. Распределение эволюционных ограничений по разным сайтам в геномах прокариот и эукариот вскрывает различные принципы геномной архитектуры: а — геном прокариот; б — геном эукариот.
Любой геном может быть представлен в виде геномного ландшафта, графика, напоминающего панораму города, где каждому нуклеотидному сайту присваивается высота, пропорциональная силе влияющих на него эволюционных ограничений. Ограничения имеет смысл рассматривать как меняющиеся в диапазоне от 0 (лишенная ограничений, нейтрально эволюционирущая, функционально не значимая позиция) до 1 (полностью ограниченная, функционально важная позиция, в которой изменения недопустимы, см. рис. 3-7; Koonin and Wolf, 2010b). Распределения ограничений по геному значительно отличаются у форм жизни с различными архитектурами генома. Эти отличия проявляются особенно ярко, если говорить о сравнении, с одной стороны, вирусов и прокариот с их геномами «стена к стене», в основном состоящими из генов, кодирующих белок или РНК, и, с другой стороны, многоклеточных эукариот, в геномах которых кодирующие нуклеотиды находятся в меньшинстве (см. рис. 3-7). В пересчете на один сайт, ограничения в компактных геномах, особенно у прокариот, на несколько порядков сильнее, чем ограничения в больших геномах многоклеточных эукариот. Белок-кодирующие последовательности и последовательности, кодирующие структурные РНК, подвержены наиболее сильным ограничениям во всех геномах. Подавляющее большинство белок-кодирующих генов, особенно у прокариот, имеют низкие значения Ka/Ks, что указывает на сильное давление очищающего отбора на эти последовательности (см. рис. 3-8 и предыдущую главу). В то же время во всех группах организмов существует значительная положительная корреляция между Ka и Ks, указывающая, что даже синонимические сайты в белок-кодирующих генах ограничены примерно в пропорции к ограничениям на несинонимичные сайты (Drummond and Wilke, 2008; см. также гл. 4). Учитывая, что прокариотические геномы почти полностью состоят из белоккодирующих генов со вкраплениями генов структурных РНК и коротких межгенных промежутков, в основном занятых разно образно ограниченными регуляторными регионами, эти компактные геномы содержат мало неограниченных сайтов. Заметным исключением являются псевдогены, редкие у большинства прокариот, но распространенные у некоторых паразитических бактерий, особенно растущих внутри эукариотических клеток, например Rickettsia или Mycobacterium leprae (Harrison and Gerstein, 2002). Геномы большинства вирусов еще более компактны, чем геномы прокариот, причем почти вся последовательность генома занята белок-коди рующими генами.
Рис. 3-8. Распределение отношения Ka/Ks в геномах прокариот и эукариот. Salinispora sp.: вычислено по ортологам в S. arenicola CNS-205 и S. tropica CNB-440 (актинобактерии). Homo sapiens: вычислено по ортологам в H. sapiens и Macaca mulatta (приматы). Значения Ка и Ks оценены с использованием программного обеспечения PAML (Yang, 2007). График в логарифмических координатах по оси абсцисс; ФПВ обозначает функцию плотности вероятности.
Рис. 3-9. Схематическая сводка эволюционных ограничений, действующих на различные классы геномных сайтов.