Вы находитесь на странице: 1из 5

RJGG

The Russian Journal of Genetic Genealogy (Русская версия): Том 2, №1, 2010 год
ISSN: 1920-2997 http://ru.rjgg.org © Все права защищены

Расчет возраста общего предка Дмитрий Адамов

по мужской линии
для «чайников»

Введение

Вы – обладатель 12-маркерного или 17-маркерного гаплотипа Y-хромосомы (собственной,


отца, мужа, брата и т.д.) и только начинаете знакомство с миром ДНК-генеалогии. Перед тем,
как прочитать эту статью, рекомендую ознакомиться с содержанием двух основных российских
Интернет-ресурсов по ДНК-генеалогии:

www.molgen.org
www.rodstvo.ru

1. Два гаплотипа другим маркерам числа совпадают. В этом


случае родство в среднем отдаляется. Отли-
Вы нашли гаплотип, полностью совпа- чие на единицу между двумя 12-
дающий с Вашим. Какова степень родства маркерными гаплотипами помещают общего
между обладателями двух одинаковых гап- предка в интервал от 6 до 122 поколений
лотипов? Теория вероятностей говорит, что назад. Для 17-маркерного гаплотипа – от 6
однозначного ответа нет. Если совпали 12- до 85 поколений назад. Если два 67-
маркерные гаплотипы, то общий предок маркерных гаплотипа отличаются на едини-
обоих мужчин отстоит от нынешнего време- цу, то общий предок жил от 1 до 22 поколе-
ни в интервале от 1 до 77 поколений! Веро- ний назад.
ятность этого 95 %. При совпадении двух
17-маркерных гаплотипов ситуация чуть
лучше - общий предок жил от 1 до 54 по- 2. Выборка гаплотипов
колений назад. Гораздо лучше, если Ваш
гаплотип определен по 67 маркерам. Тогда Ваши поиски продолжаются. Критерии
общий предок двух идентичных гаплотипов могут быть разными. Одинаковая фамилия.
попадает в интервал от 1 до 14 поколений. Один и тот же субклад Вашей гаплогруппы.
Для того, чтобы с достоверностью опреде- В результате Вашего отбора накапливаются
лить генетического отца, потребуется срав- гаплотипы, которые по Вашему предполо-
нение гаплотипов, содержащих не менее жению являются родственниками по муж-
500 одинаковых маркеров. ской линии и имеют общего предка.

Ваш гаплотип редкий, совпадений не Рассмотрим пример. В таблице 1 содер-


нашлось. Но есть гаплотипы, отличающиеся жится выборка из 32-х 12-маркерных гапло-
от Вашего на единицу, то есть по одному из типов.
маркеров количество повторов отличается
на единицу. Например, вместо 11 у Вас, в
сравниваемом маркере стоит 12 (или 10). По

______________________________________________________________
Принята 15 января 2010; опубликована 21 февраля 2010
Связаться с автором по email: nimissin@mail.ru

24
RJGG
The Russian Journal of Genetic Genealogy (Русская версия): Том 2, №1, 2010 год
ISSN: 1920-2997 http://ru.rjgg.org © Все права защищены

Таблица 1

Маркеры

Количество
Гаплотипы

DYS389B
DYS385b
DYS385a

DYS389I

DYS390

DYS391

DYS392

DYS393

DYS437

DYS438

DYS439
DYS19

1 16 12 13 13 16 25 10 11 13 14 10 10 17
2 16 12 13 13 16 25 10 11 13 15 10 10 1
3 16 11 13 13 16 25 10 11 13 14 10 10 2
4 15 12 13 13 16 25 10 11 13 14 10 10 5
5 15 13 13 13 16 25 10 11 13 14 10 10 2
6 16 12 13 13 17 25 10 11 13 14 10 10 2
7 16 12 13 14 17 25 10 11 13 14 10 10 1
8 16 12 13 13 16 26 10 11 13 14 10 10 1
9 17 12 13 13 16 25 10 11 13 14 10 10 1
Пр. 16 12 13 13 16 25 10 11 13 14 10 10
Мут. 8 4 0 1 3 1 0 0 0 1 0 0

Для сокращения записи идентичные га- У остальных мутации привели к неболь-


плотипы были объединены. Например, гап- шим изменениям аллелей. Поэтому наибо-
лотип 1 был обнаружен у 17 человек, гап- лее часто наблюдаемый гаплотип мы при-
лотип 2 – у одного, гаплотип 3 – у 2 чело- нимаем за предковый:
век и т.д. Всего на 32 человека было выяв-
лено 9 гаплотипов. 16-12-13-13-16-25-10-11-13-14-10-10.

Итак, перед Вами выборка из 32-х 12-


маркерных гаплотипов. Мы должны отве- 2.2. Подсчет числа мутаций
тить на 2 вопроса:
Все отклонения в числе повторов от
1) мог ли быть у этих мужчин один об- предкового гаплотипа условно назовем му-
щий предок? тациями. Условно – потому, что фактиче-
ское число мутаций может быть другим. Ес-
2) если да, то как давно он жил? ли мутация произошла достаточно рано,
например, у внука основателя рода, то она
Обработку исследуемой выборки прове- будет передаваться последующим поколе-
дем в несколько этапов. ниям и в нашей выборке может быть пред-
ставлена сразу у нескольких человек. Тем
не менее, считать надо все отклонения.
2.1. Определение предкового гаплотипа Рассмотрим в нашей выборке маркер
DYS19. Предковый аллель – 16 повторов.
Гаплотипы из таблицы 1 отличаются Отклонения от предкового аллеля, т.е. му-
друг от друга. Но различия – небольшие, в тации, наблюдаем в гаплотипах 4 (значение
отдельных маркерах. В целом они все по- 15), 5 (значение 15) и 9 (значение 17).
хожи друг на друга. Мы предполагаем, что Подсчитаем число мутаций: в гаплотипе 4
у этих людей был один общий предок по отклонение на единицу, гаплотип выявлен
мужской линии. Его гаплотип в значитель- у 5 человек, следовательно, всего 5 мута-
ной мере сохранился до наших дней. Он ций. По гаплотипу 5 – 2 мутации, по гапло-
состоит из наиболее часто наблюдаемых типу 9 – 1 мутация. Итого в маркере DYS19
чисел повторов в каждом из маркеров. У 17 8 мутаций. Аналогично делаем подсчет чис-
человек – один и тот же гаплотип: ла мутаций в других локусах (маркерах):

16-12-13-13-16-25-10-11-13-14-10-10. DYS385a – 4 мутации;


DYS385b – 0 мутаций;
DYS389I – 1 мутация;
25
RJGG
The Russian Journal of Genetic Genealogy (Русская версия): Том 2, №1, 2010 год
ISSN: 1920-2997 http://ru.rjgg.org © Все права защищены

DYS389B – 3 мутации; 2.4. Оценка возраста


DYS390 – 1 мутация;
DYS391 – 0 мутаций; Теперь можно приближенно оценить
DYS392 – 0 мутаций; возраст общего предка. Скорость мутаций
DYS393 – 0 мутаций; для нашего 12-маркерного гаплотипа:
DYS437 – 1 мутация; 0.024 мутации на гаплотип, или 0.00197
DYS438 – 0 мутаций; мутации на маркер. При этом продолжи-
DYS439 – 0 мутаций. тельность одного поколения принимается
равной 25 лет. Если принять продолжи-
В целом на всю выборку наблюдаем 18 тельность поколения не 25, а 30 лет, то
мутаций. скорость мутаций изменится соответствую-
щим образом: 0.0288 мутаций на гаплотип
на поколение 30 лет, или 0.00236 мутации
2.3. Расчет наблюдаемого среднего числа на маркер на поколение 30 лет. На резуль-
мутаций на маркер тат расчетов продолжительность одного по-
коления практически не влияет.
Общее число мутаций на выборку (18
мутаций) делим на количество гаплотипов Небольшое отступление о скорости му-
(32 гаплотипа) и число маркеров в гапло- таций. Скорости (вероятности) мутаций в
типе (12 маркеров): различных локусах (маркерах) Y-
хромосомы различаются. Поэтому средняя
18 скорость на один маркер меняется в зави-
= 0.0469 (мутаций на один маркер). симости от набора маркеров. Калибровки
32 × 12
скоростей для различных наборов маркеров
проведены А.А.Клесовым (см. в статье Кле-
Мы получили для исследуемой выборки
сов А.А. Общие принципы ДНК-генеалогии
среднее наблюдаемое число мутаций на
(новая редакция). Вестник Российской Ака-
маркер 0.0469. Ясно, что чем больше это
демии ДНК-генеалогии. 2: № 7, 1264-1330
значение, тем больше возраст предка.
(2009)). В таблице 2 приведены скорости
мутаций для наиболее часто применяемых
наборов маркеров из работы А.А.Клесова.

Таблица 2

Средняя величина кон-


станты скорости мутаций
Гаплотип в формате FTDNA на поколение продолжи- Примечания
тельностью 25 лет
На гаплотип На маркер
12-маркерный гаплотип
393-390-19-391-385a-385b-426-388-
0.022 0.00183 в стандарте FTDNA
439-389I-392-389II
393-390-19-391-385a-385b-X-X-439-
17-маркерный гаплотип
389I-392-389II-458- 0.034 0.00200
Y-Filer
(…)-437-448-GATAH4-456-438-635
393-390-19-391-385a-385b-426-388-
439-389I-392-389II- 25-маркерный гаплотип
0.046 0.00184
458-459a-459b-455-454-447-437-448- в стандарте FTDNA
449-464a-464b-464c-464d
37-маркерный гаплотип
Стандартный 37-маркерный гаплотип 0.090 0.00243 в стандарте FTDNA

67-маркерный гаплотип
Стандартный 67-маркерный гаплотип 0.145 0.00216 в стандарте FTDNA

26
RJGG
The Russian Journal of Genetic Genealogy (Русская версия): Том 2, №1, 2010 год
ISSN: 1920-2997 http://ru.rjgg.org © Все права защищены

Оценку возраста получаем путем деле- вильная", в ней собраны гаплотипы с раз-
ния среднего наблюдаемого числа мутаций ными предками. 15-20% - это обычная ста-
на маркер на скорость мутаций (тоже на тистическая точность определения возрас-
маркер): та, взятая из практики. В теории же возрас-
ты, рассчитанные линейным и логарифми-
0.0469 ческим методами, должны совпадать.
= 23.8 поколений.
0.00197
Для нашего случая относительная раз-
ница составляет
Умножая 23.8 поколений на продолжи-
тельность одного поколения 25 лет, получа- 26.3
ем 595 лет. Поскольку расчет приблизитель- = 1.105 ,
23.8
ный, рекомендую округлять результат до де-
сятков лет. В нашем случае округление дает то есть возрасты отличаются на 10.5%. Га-
600 лет. 600 лет – это приближенная, грубая плотипы из нашего примера могут иметь
оценка возраста общего предка. одного общего предка.

2.5. Происхождение от одного предка 2.6. Поправка на возвратные мутации

Для того, чтобы убедиться, что иссле- Возраст общего предка, рассчитанный
дуемая выборка действительно может вос- по наблюдаемому среднему числу мутаций,
ходить к одному общему предку, нужно со- вообще говоря, не совпадает с реальным
поставить возрасты предка, рассчитанные возрастом. Основная причина – наличие так
по двум разным методам: линейным и лога- называемых возвратных мутаций. Напри-
рифмическим. мер, значение маркера DYS439 нашего
примера одинаково для всех гаплотипов и
Линейный метод был уже применен в равно 10. Никаких мутаций не наблюдаем.
предыдущем пункте. Возраст получился Но мутации могли быть. Сначала произошла
равным 23.8 поколений. мутация с увеличением числа повторов на
единицу, т.е. значение маркера стало рав-
По логарифмическому методу мы снача- ным 11. Затем произошла вторая, возврат-
ла должны разделить общее число гаплоти- ная, мутация, которая вернула число по-
пов (32 гаплотипа) на количество гаплоти- второв к предковому значению 10. В итоге
пов с предковыми аллелями (17 - мы не видим мутаций, а на самом деле было
количество предковых гаплотипов): две взаимоисключающие мутации.

32 Не углубляясь в тонкости, рекомендую


= 1.882 . рассчитывать поправку на возраст в пред-
17 положении симметричного дерева мутаций,
то есть для случая, когда мутации происхо-
Затем от полученной величины берем дят в сторону увеличения и уменьшения
натуральный логарифм и делим результат числа тандемных повторов с равной веро-
на скорость мутаций, соответствующую ятностью. Можно воспользоваться следую-
этому гаплотипу (0.024): щей формулой:

ln 1.882 1 + exp(l набл )


= 26.3 поколений. l = l набл × ,
0.024 2
Если относительная разница между по-
где l набл - уже рассчитанное нами наблю-
лученными возрастами не превышает 15-
20%, то это означает, что изучаемая вы- даемое среднее число мутаций на маркер,
борка гаплотипов вполне может иметь од- exp – экспоненциальная функция, l - ис-
ного общего предка. В противном случае, тинное среднее число мутаций на маркер.
если разница превышает 20%, расчеты на-
до прекращать, поскольку выборка "непра-
27
RJGG
The Russian Journal of Genetic Genealogy (Русская версия): Том 2, №1, 2010 год
ISSN: 1920-2997 http://ru.rjgg.org © Все права защищены

Поправка для нашего примера ность в определении скорости мутаций. На


( l набл
= 0.0469 ) составит настоящее время неопределенность в ско-
рости мутаций можно принять равной 15%.
Общая погрешность расчета возраста обще-
1 + exp(0.0469) го предка определяется по формуле:
= 1.024 .
2
DT Dl
Среднее число мутаций на маркер с уче- = ( ) 2 + 0.15 2 .
том возвратных мутаций равно T l

0.0469 × 1.024 = 0.0480 . Для нашего примера относительная по-


грешность равна
Наконец, мы получаем оценку возраста
общего предка: DT
= 0.24 2 + 0.15 2 = 0.283 .
T
0.0480
= 24.4 поколения,
0.00197 Это относительная погрешность. Абсо-
лютное значение погрешности получается
или 24.4 × 25 = 610 лет. Общий предок 32-х путем умножения относительной погрешно-
сти на саму оценку возраста:
мужчин из нашего примера жил около 610
лет назад.
0.283 × 610 = 170 лет.

2.7. Определение погрешности возраста Таким образом, возраст общего предка


для 32 человек из нашего примера
Чем больше гаплотипов в выборке, тем
точнее определяется среднее число мута- 610 ± 170 лет.
ций и, соответственно, возраст общего
предка. Относительная погрешность опре- С вероятностью 68% общий предок жил
деления среднего числа мутаций на маркер 440-780 лет назад.
линейным методом рассчитывается по сле-
дующей формуле:
Заключение
Dl 1 l
= (1 + ) , (1) Для более детального знакомства с ме-
l N ×M ×l 2 тодами расчета возраста общего предка ре-
комендую следующие работы:
Dl
где - относительная погрешность, N – Адамов Д.С., Клесов А.А. Определение возраста попу-
l ляций по STR гаплотипам Y- хромосомы. Часть III.
число гаплотипов, M – число маркеров в Примеры "линейных" и "квадратичных" моделей с
гаплотипе, l - среднее число мутаций на учетом степени асимметрии мутаций. Вестник Рос-
сийской Академии ДНК-генеалогии. 2: № 2, 187-
маркер. 199 (2009).
Клесов А.А. Общие принципы ДНК-генеалогии (новая
Подставим в формулу (1) числовые зна- редакция). Вестник Российской Академии ДНК-
генеалогии. 2: № 7, 1264-1330 (2009).
чения из нашего примера:
Walsh B. Estimating the Time to the Most Recent Com-
mon Ancestor for the Y chromosome or Mitochondrial
Dl 1 0.048 DNA for a Pair of Individuals. Genetics, 158: 897-912
= (1 + ) = 0.24 . (2001).
l 32 × 12 × 0.048 2
Примеры расчетов возраста различных
Относительная погрешность – 24%. выборок можно посмотреть в статье:
Адамов Д.С., Клесов А.А. Практические методы опре-
Кроме погрешности величины среднего деления возраста больших выборок STR гаплоти-
числа мутаций, зависящей от размера вы- пов Y-хромосомы. Вестник Российской Академии
борки и числа маркеров, есть и погреш- ДНК-генеалогии. 2: № 3, 422-442 (2009).

28