Как уже отмечалось в главе 3, практически сразу же, как только были опубликованы первые полные геномные последовательности, стало очевидным, что последовательность генов в бактериальных и архейных геномах относительно мало консервативна, она сохраняется существенно хуже, чем последовательность нуклеотидов в самих генах (см. рис. 3-6). Для того чтобы анализировать эволюцию последовательности генов, необходимо иметь надежный набор ортологичных генов в сравниваемых геномах (см. табл. 3-1). Как только такое множество ортологичных генов задано, становится достаточно просто оценить степень сохранения последовательности генов, например с помощью точечного графика (одно из самых ранних представлений степени сходства нуклеотидных и белковых последовательностей), в котором каждая точка представляет собой пару ортологов. Исследование этих графиков показывает быстрое расхождение порядка генов у прокариот таким образом, что даже между близкородственными организмами коллинеарность хромосом разрушена в нескольких точках (см. рис. 5-2а), a умеренно разошедшиеся организмы показывают лишь несколько протяженных коллинеарных районов (см. рис. 5-2б и 5-2в). Для любой пары более отдаленных друг от друга организмов график выглядит как карта звездного неба (см. рис. 5-2г). Разрушение синтении в процессе эволюции бактериальных и архейных геномов обычно явно бросается в глаза на графике, образуя картину в форме буквы X (см. рис. 5-2б и 5-2в). В свое время было сделано предположение, что такая картина возникает в результате симметричных хромосомных инверсий с центром в точке начала репликации (Eisen et al., 2000). Исходной причиной таких инверсий может быть высокая частота рекомбинаций в репликационных вилках, которые в кольцевых хромосомах бактерий и архей обычно располагаются с обеих сторон и на одинаковом расстоянии от точки начала репликации.
Рис. 5-2. Расхождение порядка следования генов между геномами бактерий: а — Borrelia afzelii PKo по сравнению с Borrelia burgdorferi B31; б — Shewanella oneidensis MR-1 по сравнению с Shewanella sp. ANA-3; в — Pseudomonas fluorescens PfO-1 по сравнению с Pseudomonas fluorescens Pf-5; г — Pseudomonas fluorescens Pf-5 по сравнению с Pseudomonas syringae pv. tomato str. DC3000. Каждая точка представляет пару ортологичных генов, идентифицированных с использованием метода наилучшего сходства при двунаправленном сравнении (см. табл. 3-1). Яркие точки показывают пары ортологичных генов, принадлежащих консервативным массивам генов; бледные точки показывают изолированные ортологи. DY — расстояние между сравниваемыми геномами в терминах порядка следования генов, как описано в Novichkov et al., 2009. DN — медианное расстояние между последовательностями несинонимических сайтов в белок-кодирующих генах.