|
Но читаем Клёсова дальше. Оказывается, это не совсем правильно использовать “линейные” формулы (т.е. 5/10/0.0088 = 57 поколений и 12/10/0.0088 = 136 поколений) для расчёта числа поколений до общего предка, а правильнее использовать логарифмическое соотношение ln(10/6)/0.0088 = 58 поколений. (Здесь 10 – размер гаплотипа, а 6 – число неизменных гаплотипов.) На основании чего второй ряд гаплотипов (где мы получили 136 поколений) объявляется “смешанным”, “искажённым” или “деформированным” и не может быть использован для расчёта “общего предка”. (Пока не будем комментировать данное утверждение, хотя и очень хочется...)
Далее идёт многословное описание “подтверждения истинности” “логарифмического” подхода на примере клана Дональдов, когда на примере 84 дональдовских гаплотипов (из которых 21 идентичны) просто фантастически точно считается число поколений до основателя династии: ln(84/21)/0.046 = 30 поколений (число 0.046 здесь – это частота мутаций для 25-ти маркерного гаплотипа).
Чтобы добить оставшегося недоверчивого читателя, приводится результат и “линейного” расчёта: 109/84/0.046 = 28 поколений, где 109 – это число накопившихся мутаций в 84-х дональдовских гаплотипах. После чего делаются следующие выводы: 1) Доказана надёжность расчётов; 2) Получено доказательство существования единственного общего предка на серии 84 гаплотипов; 3) Общий предок жил приблизительно 29±2 поколений назад.
Далее по тексту (стр. 24) говорится, что скорости мутации для разных гаплотипов были калиброваны главным образом по гаплотипам макдональдов.
Теперь, наверное, пора прокомментировать уже прочитанное. Во-первых, для тех, кто никогда не занимался многочисленными расчётами, подгонками, калибрацией данных и т.д. должен знать, что в общем случае совпадения и корреляции ничего не значат, как бы красиво они не выглядели. Например, есть даже портал (https://tylervigen.com/spurious-correlations), правда на английском, где показаны сомнительные корреляции. Например, разводы в штате Мейн отлично коррелируют с потреблением маргарина на душу населения. Или что число людей в США, утонувших в своих домашних бассейнах отлично коррелирует с количеством электроэнергии, выработанной на американских ядерных станциях.
Как мы видели, клан Дональдов играет особую роль в “подтверждении” клёсовских расчётов и в калибрации его модели. Тут само по себе использование всего только 84-х гаплотипов с 109 мутациями и частотой мутаций 0.046 вызывает сомнение в надёжности расчётов. Но гораздо больше сомнений вызывает использование сомнительных исторических источников в качестве калибровочных данных. Где гарантия, что история первых Дональдов — это не фикция, сочинённая в позднее время? Что мы знаем о похождении Дональдов по окрестным деревням и весям? Был ли вообще первый Дональд отцом своих детей? С какой это кстати он был единственным носителем «предкового» гаплотипа? А что если их было 10? 100?
Таким образом, использование клана Дональдов для обоснования и калибровки расчётов является совершенно необоснованным и не заслуживает доверия. А полученные совпадения следует считать случайными.
В качестве небольшого отступления здесь стоит сказать, что совершенно не обязательно пытаться использовать сомнительные исторические данные. Уже накоплено достаточно современного материала, откуда можно получить гораздо более надёжные данные по частотам мутаций маркеров. Например, в статье «Mutation rate estimates for 110 Y-chromosome STRs combining population and father–son pair data», European Journal of Human Genetics (2011) 19, 70–75 приводится таблица по мутациям по отдельным маркерам для пар отец-сын. В отдельных случаях выборка достаточно репрезентативная. Например, для маркера DYS392 на 13948 парах отец-сын обнаружено 6 мутаций, после чего посчитана частота мутации в 0.00043.
Интересно посмотреть поближе на так называемый “логарифмический” подход, который подаётся как кинетические уравнения для описаний химических реакций первого порядка. Кинетическое уравнение реакции первого порядка представляют дифференциальным уравнением: V = -dC/dt = k C, где V — скорость химической реакции, С — концентрация реагента, t — время и k — константа скорости. После интегрирования этого уравнения мы имеем для реагента: С(t) = С(0) exp(-k t), где С(t) — концентрация реагента в момент времени t, С(0) - концентрация реагента в начальный момент времени. Соответственно, для продукта мы имеем: Р(t) = С(0)(1 - exp(-k t))
“Логарифмическая” формула Клёсова может быть выведена из уравнения V = dC/dt = k C, где V — скорость мутации (?), С — количество мутированных/немутированных гаплотипов, t — время и k — константа скорости мутаций. После интегрирования имеем B = A exp(k t), где B — общее число гаплотипов, А — число немутированных гаплотипов. Следует обратить внимание, что экспонента здесь — без отрицательного знака, т.е. «В» растёт экспоненциально. Обычно используется для расчёта числа поколений до «общего предка» в виде t = ln(B/A)/k Что делать, если нет немутированных гаплотипов (А) — непонятно… Сам форма дифференциального уравнения вызывает сомнения в своей корректности...
В качестве предварительного вывода, можно сказать, что математический подход у Клёсова выглядит очень сомнительным и калиброван по ещё более сомнительным историческим данным. Поэтому почти все его расчёты по вычислению времени жизни «общих предков» сродни гаданию на кофейной гуще.
|