Стр. 78. 3-й абзац сверху. Вместо "2 mn1 новых состояний" должно быть "2n1 новых
состояний".
Стр. 83. В рисунках 1-4 и 1-5 должно быть p1 = 0.45 и p2 = 0.05 , а не p1 = 0.4 и p2 = 0.1 .
Стр. 87. Второй абзац сверху. Вместо k=1,. . . , 12 должно быть k=1,. . . , M
Стр.96. Графики на рис.2-4 должны иметь следующий вид:
Усреднен. относит. RMS смещения (%)
90
80
70
60
50 mu = 0,1
mu = 0,5
40
mu = 1,0
30 mu = 1,5
20 mu = 2,0
10
0
12 50 100 250 500 1000
Объем выборки (N)
Рис. 2-4. Относительное среднеквадратическое отклонение N МП-оценки среднего количества мутаций с ростом
количества гаплотипов N в выборке и при различных его истинных значениях
152
The Russian Journal of Genetic Genealogy (Русская версия): Том 1, №2, 2009 год
ISSN: 1920-2997 http://ru.rjgg.org © Все права защищены RJGG
Ответы на вопросы Д. Адамова
Вопрос 1:
На странице 79 Вы ввели параметр , являющийся долей вероятности.
Понятно, что вероятности изменения количества повторов на ±2 шага в результате мутации
малы по сравнению с одношаговыми (т.е., на ±1 ), но параметр может быть разным для ве-
роятностей p и q .
С другой стороны, принятое упрощение, по-видимому, слабо влияет на получаемые резуль-
таты.
Ответ:
Вы правы, влияет слабо. С другой стороны, удалось построить более сложную модель,
включающую в себя и возможность перескока аллели на ±2 в результате мутации, тем более,
что разговор про возможность такого перескока периодически поднимается среди специали-
стов. Поэтому в случае достоверного обнаружения и измерения таких мутаций теоретическую
базу надо уже готовить.
Вместе с тем, ведение дополнительного параметра (вероятность p2 ) сразу же ставит вопрос
о его калибровке по результатам опытных наблюдений. То есть, каждое усложнение модели
требует серьезного обоснования. Пока прямому и достоверному вычислению вероятность му-
тации сразу на ±2 не поддалась (таких публикаций не видел), то решено было пока в конкрет-
ных расчетах данный параметр (вероятность p2 ) временно исключить.
Замечу, что когда дополнительно вводился в алгоритм расчетов параметр p2 , обработка
тех же самых реальных наборов гаплотипов показала его крайне малое влияние (кроме для
аномально искаженных по форме гистограмм), которым спокойно можно пренебречь, что, в
свою очередь, позволяет использовать более простую в вычислительном плане двухпотоковую
модель (глава 7).
Вопрос 2:
В главе 7 на стр. 145 есть рис.7-2, на котором приведена зависимость относительного
среднеквадратического отклонения МП-оценки количества мутаций от объема выборки. Я про-
вел сравнение полученных Вами значений N с приведенной в статье Д. Адамова и А.
Клесова А (Определение возраста популяций по STR гаплотипам Y-хромосомы. Вестник РА-ДНК, т.2,
№1, январь, 2009) формулой для относительной погрешности определения средних величин му-
таций по методу ASD:
(1)
153
The Russian Journal of Genetic Genealogy (Русская версия): Том 1, №2, 2009 год
ISSN: 1920-2997 http://ru.rjgg.org © Все права защищены RJGG
Из таблицы видно, что имеется очень неплохое соответствие.
Ответ:
Если учесть, что результаты по оценке дисперсии в обсуждаемой статье получены стати-
стическим моделированием, да и сам вычислительный метод функции правдоподобия облада-
ет погрешностями, связанными с конечными размерами «сетки» параметров, по которой ве-
дется поиск оптимума, то уровень совпадения можно считать просто отличным.
Таким образом, два различных подхода в данном случае прошли взаимную проверку, что
не может не радовать.
Вопрос 3:
Для малых значений ≪1 относительное среднеквадратическое отклонение среднего
должно зависеть от оценки среднего числа мутаций и объема выборки N следующим обра-
зом:
(2)
. (3)
Отмечу, что кривые для =0.1 , =1.5 и =2 на рис.2-4 лежат как раз на асимптотике (3).
Поскольку оба Ваших метода эквивалентны (п. 7.3 статьи), то и результаты по N должны
быть в принципе одинаковы. В первом варианте Вашей работы, опубликованной в 4–м номере
Вестника Российской Академии ДНК-генеалогии за 2008 год, предлагаемая зависимость кривых от μ
выполняется (см. рис.2-4).
Ответ:
По поводу рисунка 2-4 приношу извинения, поскольку действительно в статье графики на
рис.2-4 НЕВЕРНЫЕ, а правильные графики даны в первой моей публикации в 4-м номере
Вестника РА-ДНК, как Вы справедливо указали.
Правильный вид графика мною приведен выше в разделе «Опечатки» (стр.96).
154
The Russian Journal of Genetic Genealogy (Русская версия): Том 1, №2, 2009 год
ISSN: 1920-2997 http://ru.rjgg.org © Все права защищены RJGG
Также полностью согласен и с тем, что действительно имеет смысл использовать асимпто-
тику (3). Это в значительной степени облегчает задачу оценки точности и при этом, как Вы
показали в Таблице 1, никаких «неожиданностей» с точки зрения дисперсии оценки не возни-
кает. К тому же, приведенная Вами асимптотика позволяет быстро вычислить оценку, причем,
встроив ее в компьютерную программу, а не «лазить» вручную по графикам, приведенным в
статье.
Вопрос 4:
На стр. 133 Вы даете формулы (6.1.6) для расчета границы доверительного интервала Tmin
и Tmax . Наверное, более корректно считать границы по другой формуле, содержащей суммы
квадратов погрешностей. Например, для 95% доверительного интервала:
Ответ:
Действительно, предложенные Вами формулы для расчета Tmin и Tmax дают значительно
лучшее приближение для границ доверительных интервалов, чем выражения (6.1.6), приве-
денные в статье.
Авторские дополнения:
(где N - общее количество пар «отец-сын»), которое для наших задач вполне приемлемо по
точности.
(2.1.1)
(7.1.6)
155
The Russian Journal of Genetic Genealogy (Русская версия): Том 1, №2, 2009 год
ISSN: 1920-2997 http://ru.rjgg.org © Все права защищены RJGG
одном и том же маркере, но в разных гаплотипах является в определенной степени допущени-
ем, поскольку многие подгруппы гаплотипов из исследуемой выборки имеют промежуточных
общих предков, и, таким образом, общие прошлые мутации, а, значит, имеется и некая сто-
хастическая связь между значениями аллелей в разных гаплотипах.
Сразу подчеркнем, что для функции правдоподобия, построенной для определения време-
ни жизни обладателя единственного гаплотипа (соотношения (3.1.3) и (7.2.5)), замена много-
мерной плотности на произведение одномерных справедлива, поскольку в качестве измерений
берутся значения разных маркеров в гаплотипе, а процесс мутаций в маркерах идет незави-
симо в каждом из них.
Во-первых, некоторую уверенность дает то, что главным параметром при вычислениях яв-
ляется среднее количество мутаций, которое, в свою очередь, является матожиданием пуассо-
новского потока мутаций. А как известно, выборочное среднее является максимально правдо-
подобной оценкой матожидания как для независимых случайных величин, так и для статисти-
чески зависимых (М.Дж.Кендалл, А.Стьюарт. «Статистические выводы и связи», М., Наука, 1973,
параграфы 29.9-10).
============
156