Изначально не вполне складная аббревиатура КОГ относилась к кластерам ортологичных групп (белков), чтобы обозначать соортологичные связи, вызванные дупликацией генов (см. табл. 3-1; Tatusov et al., 1997). Сейчас я предпочитаю расшифровывать КОГ просто как кластеры ортологичных генов, однако само по себе это сокращение остается чрезвычайно удобным для обозначения фундаментального свойства таких кластеров. Эта трехбуквенная аббревиатура широко используется в литературе, и я использую ее в данной книге в качестве сокращенного названия наборов ортологичных генов. Обычно каждый секвенированный геном более чем на 70 процентов состоит из генов, относящихся к КОГ (см. рис. 3-4). В эволюции генома, к которой мы обращаемся в этой книге неоднократно, эта величина представляется важной. Таким образом, существенное большинство генов в каждом геноме весьма консервативно, то есть представлено ортологами во многих далеко отстоящих друг от друга организмах.
В этой главе основной упор делается на рассмотрении взаимосвязи между стабильностью и изменчивостью в ходе эволюции. В настоящем разделе мы сосредоточим внимание на отдельных элементах белковой структуры, доменах и мультидоменной организации многих белков (Doolittle, 1995). Таким образом, мы заглянем по другую сторону генной эволюции, которая противостоит стабильности ортологичных линий, отмеченной ранее, и дополняет ее. Домен — центральное понятие в исследовании белков, и определение ему можно дать по меньшей мере на двух уровнях. По первому определению, домены представляют собой компактные элементы белковой структуры с характерными размерами около ста аминокислотных остатков. В этой главе нас интересуют родственные связи геномов, в частности ортология, поэтому необходимости рассматривать структурные элементы нет. Второе определение доменов относится к компактным единицам эволюции, которые могут охватывать один или несколько структурных элементов; здесь нас интересуют именно такие
Мультидоменные белки обнаружены у всех форм жизни, но особенно характерны для сложных многоклеточных эукариот (Koonin et al., 2000a; Koonin et al., 2000b). Доменная архитектура этих белков демонстрирует различную степень эволюционной пластичности. Изменчивость особенно выражена у белковых архитектур, включающих так называемые «неразборчивые домены» (promiscuous domains), имеющие склонность к слиянию с разнообразными другими доменами (Basu et al., 2009). Разнообразная мультидоменная архитектура белков запутывает понятие ортологии. Считается, что в ходе долгой эволюции ортологичные гены сохраняют свою уникальность, в том числе функциональную (имеют одну и ту же эволюционную историю). Однако это правило нарушается в тех случаях, когда гены, казалось бы подпадающие под определение ортологии (см. табл. 3-1), меняют доменную архитектуру (см. рис. 3-5): в этих случаях лишь части соответствующих белков в разных организмах имеют одну и ту же эволюционную историю и выполняют одни и те же функции (хотя второе и не может быть гарантировано, поскольку взаимодействие доменов вполне может иметь существенные функциональные последствия).