В рассматриваемой работе автор, Е.Я. Тетушкин, сетует, что калибровка скоростей мутаций, основанная на археологических «и прочих непрямых свидетельствах» часто «очень неточна и ненадежна», а вот прямые результаты скоростей мутаций по парам отец-сын якобы намного точнее, если только убедиться, что нет проблемы с отцовством. Тогда можно просто разделить число наблюдаемых мутаций на число мейозов. И в качестве примера автор приводит недавнюю работу Ballantyne et al (2010) по установлению скоростей мутаций для 186 маркеров почти в 2000 пар отец-сын.
Этим «теоретикам» в популяционной генетике, которые сами не считают, но думают, что все так просто и надежно, можно только порекомендовать опробовать свои рекомендации самим. На самом деле то, что приводится в статье Ballantyne et al (2010) и других подобных статьях, совершенно неприменимо для реальных расчетов в ДНК-генеалогии. Может в судебной практике это и полезно, но не при расчетах времен жизни общих предков.
На первый взгляд кажется, что в той статье – замечательная статистика, и вот наконец-то получены данные, которые позволят откорректировать скорости мутаций для протяженных гаплотипов и вывести ДНК-генеалогию на новый количественный уровень. Закончились споры и дискуссии, какие величины скоростей мутации самые правильные, и осталось только щелкать древние (и современные) гаплотипы как орехи. Видимо, этой эйфорией прониклись и сами авторы, поскольку в абстракте статьи написано черным по белому, после фразы, что теперь можно анализировать как близких, так и удаленных родственников «This finding is expected to revolutionize Y-chromosomal applications…»
Увы, не тут-то было.
Во-первых, поскольку мутации в гаплотипах обычно редки, то этих почти двух тысяч пар отец-сын явно недостаточно для хорошей статистики. Во многих маркерах мутаций не было вообще, в большинстве маркеров по одной-две-три мутации на все две тысячи пар, что вовсе немного для статистики. Понятно, что если мутаций в маркере вообще нет, то он остается неохарактеризованным. Одна мутация означает статистическую погрешность плюс-минус 100 %, поскольку где одна мутация, то там легко могло быть две или ни одной. Это можно показать и количественно, в терминах математической статистики. Две мутации – это погрешность примерно плюс-минус 70 %. Ясно, что о расчетах на основе отдельных маркеров здесь не может быть и речи. Не случайно в предыдущих статьях на эту тему я писал, что для статистически надежных данных нужны серии из сотен тысяч, а то и миллионов пар отец-сын, что практически нереально, пока, во всяком случае.
Во-вторых, для каждого маркера изучалось разное количество пар отец-сын. Это почти неизбежная проблема в таких массовых исследованиях, поскольку часто имеют место сбои, аллели не определяются, лаборанты ошибаются, а переделывать – дорого и неохота. Скорее второе, чем первое. В итоге итоговая таблица данных выглядит как лоскутное одеяло, с массой прорех. Но это самая незначительная проблема, поскольку данные можно пересчитать на некую «нормированную» величину, что мы ниже и сделаем двумя способами.
В-третьих, авторы не ориентировались на ДНК-генеалогию, а преследовали свои цели. В итоге ряд важных маркеров определен вообще не был, а именно из 37- и 67-маркерной панелей. Поэтому для этих расчетов, с использованием наиболее ценных, протяженных гаплотипов, данные обсуждаемой статьи вообще непригодны.
В-четвертых, и это очень важно, данные в парах отец-сын имеют принципиальный, системный недостаток в рамках понятий ДНК-генеалогии. Они позволяют рассчитать скорости мутации только НА ПОКОЛЕНИЕ, просто по определению. А исторические расчеты, понятия, исследования ведутся в годах. Переход же от числа поколений к числу лет принципиально невозможен со сколько-нибудь приемлемой точностью. Этот «коэффициент» – величина плавающая, и меняется от эпохи к эпохе, от культуры к культуре, и вообще зависит от массы факторов. В разных работах популяционных генетиков он варьируется от 18 до 35 (как минимум) лет. Соответственно, при этих величинах число лет будет варьироваться почти в два раза, и вся точность определения скоростей мутаций в парах отец-сын сводится на нет. Один выход из ситуации – калибровать полученные данные по историческим и генеалогическим данным, что мы и так делаем без тех хлопот.
Это – к «революционированию» науки, о чем в состоянии эйфории воскликнули авторы статьи. Как видно, революционирования особого не видно, хотя исследование полезное, как мы ниже покажем. Вся его полезность в основном сводится к тому, что показывает, что наши значения скоростей мутации, определенные эмпирически, вполне согласуются – по порядку (!) – с расчетами по парам отец-сын.
Напомним сначала основные положения нашего эмпирического подхода и соответствующие величины констант скоростей мутации для разных протяженных гаплотипов, а потом посмотрим, что в этом отношении дают результаты рассматриваемой статьи.