Кому мешает ДНК-генеалогия? Ложь, инсинуации, и русофобия в современной российской науке. А. А. Клёсов
Чтение книги онлайн.
Читать онлайн книгу Кому мешает ДНК-генеалогия? Ложь, инсинуации, и русофобия в современной российской науке - А. А. Клёсов страница 50
Еще пример – при сравнительном изучении 1752 пар гаплотипов в 17-маркерном формате было выявлено 84 мутации. Из них 83 были одношаговые (98,8 %) и одна – двухшаговая (1,2 % от всех). Поскольку все 1752 гаплотипа содержали 1752 х 17 = 29784 маркера, то средняя скорость мутаций соответствовала 84/29784 = 0.00282 мутации на маркер на поколение, медиана была равна 0.0025 мутации на маркер на поколение. Из этих 84 мутаций 43 мутации были «вверх» (число повторов в аллели возросло) и 41 – «вниз». Самая высокая скорость мутаций была в маркере DYS458 (0.0074 мутаций за поколение), самая низкая – в маркере DYS448 (0.0003 мутаций за поколение, то есть примерно в 25 раз медленнее). Когда все отцы были подразделены на две (неравные) группы – те, у кого произошла мутация в гаплотипах, и те, у кого мутаций не было, то средний возраст первых и вторых составил – при рождении сына – 34.4±11.6 лет (округленно 34±12) и 30.3±10.2 лет (округлённо 30±10). Хотя разница в возрасте и имела место, эти величины находятся в пределах погрешности эксперимента. Объединение всех опубликованных данных подобных экспериментов выявило 331 мутацию на 135212 маркерах, то есть средняя скорость оказалась равна 0.00244 мутации на маркер за поколение. При сопоставлении скоростей мутаций с генеалогическими данными и историческими событиями (при калибровке) средняя скорость мутаций в 17-маркерных гаплотипах составила 0.0020 мутаций на маркер на поколение.
Эти оценки в целом приемлемы для расчетов, но только полуколичественно. Дело в том, что 84 мутации для 1752 пар гаплотипов – это неважная статистика. Мало того, что 84 мутации – это на самом деле 84±9 мутаций с 68 %-ной доверительностью, и 84±18 мутаций с 95 %-ной доверительностью, но это только для 17-маркерных гаплотипов, то есть для более протяженных (да и для более коротких) гаплотипов эти константы неприменимы. Далее, при 84 мутациях на 1752 пар гаплотипах и при 17 маркерах даже при относительно высоких скоростях мутаций в отдельных маркерах на них приходилось всего несколько мутаций. Например, в маркере DYS458, в котором наблюдалось максимальное количество мутаций, их было всего 13, что дало константу скорости мутации 13/1752 = 0.0074 мутаций на маркер на поколение. В другой серии экспериментов по парам отец-сын получили величину константу скорости мутации 0.0084 мутаций на тот же маркер на поколение. В наших исследованиях по 11 тысячам гаплотипов мы получили величину 0.0062 мутаций на маркер на поколение[56]. Но с такими экспериментами, как в цитируемой статье, дело на самом деле хуже – например, сообщенную в статье величину константы скорости мутации 0.0003 для DYS448 получить вообще нельзя, так как даже при одной мутации на все 1752 пары отец-сын получится 1/1752 = 0.0006, то есть скорость вдвое выше. На самом деле ошибка получилась из-за статистически малого числа мутаций. По нашим данным, в маркере DYS448 константа скорости мутаций равна 0.0014 мутаций на маркер за поколение, то есть для 1752 пар отец-сын авторы эксперимента должны были получить 2.45 мутации, то есть 2.45/1752 = 0.0014. Но 2.45 мутаций получить невозможно, можно две или три, но авторы и этого не получили, что неудивительно. Если бросить монету два или три раза, никакой статистики не получится.
Вопрос
56
Клёсов,