Различия между геномами видов должны соответствовать не только экспериментально наблюдаемым типам мутаций, но и филогенетическому дереву, и палеонтологической летописи. Подобно тому, как анализ ДНК позволяет установить степень родства между двумя людьми, тот же самый анализ ДНК (сравнение отдельных генов или целых геномов) позволяет выяснить степень родства между видами, а зная количество накопленных различий, исследователи определяют время расхождения двух видов, то есть время, когда жил их последний общий предок. Например, согласно данным палеонтологии, общий предок человека и шимпанзе жил примерно 6 миллионов лет назад (такой возраст имеют, например, ископаемые находки оррорина и сахелантропа — форм, морфологически близких к общему предку человека и шимпанзе). Для того, чтобы получилось наблюдаемое число различий между геномами, на каждый миллиард нуклеотидов должно было приходиться в среднем 20 изменений за одно поколение. Сегодня у людей скорость мутаций составляет 10–50 изменений на каждый миллиард нуклеотидов за одно поколение (
Для того, чтобы построить филогенетическое дерево, достаточно рассмотреть несколько генов, присутствующих у всех организмов, которые мы хотим включить в это дерево (обычно чем больше генов, тем статистически достовернее получаются элементы дерева — порядок ветвления и длины ветвей).
Особый интерес представляют случаи, когда различия геномов оказываются нейтральными, то есть не влияют на организм. Например, было рассчитано, что цитохром c может быть составлен как минимум 2.3 * 1093 разными способами за счет того, что одинаковую по функции и биологически значимым свойствам молекулу белка можно получить с помощью разных последовательностей аминокислот. В свою очередь, каждая из этих последовательностей может быть закодирована 1046 различными последовательностями ДНК вследствие избыточности генетического кода (разные тройки нуклеотидов кодируют одну и ту же аминокислоту). Нет никаких априорных причин, кроме происхождения от общего предка, по которым два разных вида должны были бы иметь хотя бы отдаленно похожие последовательности ДНК для кодирования нормально работающего (функционального) цитохрома c. То же самое справедливо и для других белков. Тем не менее аминокислотные последовательности большинства белков у близкородственных видов (например, у шимпанзе и человека), как правило, очень похожи. Так, подавляющее большинство гомологичных белков человека и шимпанзе различаются лишь на 1–2 аминокислоты или не различаются вовсе. Различий в нуклеотидных последовательностях обычно больше за счет незначимых, или синонимичных (не влияющих на аминокислотную последовательность белка) нуклеотидных замен.
По соотношению несинонимичных и синонимичных нулеотидных замен (dN/dS) можно определить, насколько сильно действует на данный ген «очищающий» отбор, отбраковывающий мутации, которые меняют свойства белка. Как правило, чем консервативнее (постояннее) функция белка, тем ниже этот показатель. Повышение dN/dS свидетельствует о положительном отборе, т. е. о закреплении полезных мутаций. Например, повышенное значение dN/dS у человека по сравнению с другими млекопитающими зафиксировано в гене
Малое число различий в аминокислотных последовательностях белков у близких видов связано не только с тем, что эти различия еще не успели накопиться, но и с тем, что многие одинаково удачные для выполнения данной функции аминокислотные последовательности (см. выше) отделены друг от друга так называемыми «ямами в ландшафте приспособленности». Это значит, что для того, чтобы перейти от одной такой последовательности к другой, функционально равнозначной, нужно приобрести сразу несколько мутаций, каждая из которых по отдельности может снижать функциональность белка. Многие из этих «ям» можно обойти, последовательно приобретая ряд нейтральных мутаций, но это долгий процесс, основанный на случайностях, а не на позитивном отборе, и поэтому он занимает много времени (см.: The Molecular Sequence Evidence из архива TalkOrigins.org.)