3. Выборка должна быть массовой. Имея в наблюдениях один-два элемента, невозможно сделать
объективные выводы.
После того, как выборка сделана, проводится первичная обработка наблюдений. Ряд наблюдений
упорядочивается по возрастанию. Это вариационный ряд. Некоторые наблюдения могут оказаться имеющими
одинаковое значение. Вводится понятие варианты. Вариантами называют различные численные значения
наблюдений.
Вариационный ряд представляется графически в виде полигона, гистограммы или графика накопленных
частот.
Полигоном частот называется ломаная линия, отрезки которой соединяют точки
(𝑥1 , 𝑛1 ), (𝑥2 , 𝑛2 ), … , (𝑥𝑘 , 𝑛𝑘 ), где 𝑥𝑖 , 𝑖 = 1,2, … , 𝑘 -варианты (члены вариационного ряда), 𝑛𝑖 – количества
появлений наблюдения 𝑥𝑖 в выборке. Полигон используется для изображения выборки в случае дискретных
случайных величин.
Гистограмма представляет собой ступенчатую фигуру, состоящую из прямоугольников с основаниями
𝑛
определенной длины 𝛥𝑥, высоты которых равны относительным частотам 𝑛𝛥𝑥, где 𝑛𝛥𝑥 – число наблюдений,
попавших в промежуток 𝛥𝑥.
При 𝑛 → ∞ и 𝛥𝑥 → 0 гистограмма сходится по вероятности в каждой точке 𝑥 к кривой плотности
распределения 𝑝𝜉 (𝑥) случайной величины 𝜉, т.е. для любого 𝜀 > 0 и любого 𝑥
𝑛𝛥𝑥
lim 𝑃 {|
𝑛→∞
− 𝑝𝜉 (𝑥)| ≥ 𝜀} = 0,
𝑛
𝛥𝑥→0
поэтому используется для изображения эмпирической плотности распределения в случае непрерывных
случайных величин.
График накопленных частот – это фигура, строящаяся аналогично гистограмме с той лишь разницей, что
𝑛
для расчета высот прямоугольников берутся накопленные относительные частоты 𝑛𝑥, где 𝑛𝑥 - число
наблюдений, меньших 𝑥.
При 𝑛 → ∞ график накопленных частот сходится по вероятности к кривой функции распределения 𝐹𝜉 (𝑥)
случайной величины 𝜉, т.е. для любого 𝜀 > 0 и любого 𝑥
𝑛𝑥
lim 𝑃 {| − 𝐹𝜉 (𝑥)| ≥ 𝜀} = 0.
𝑛→∞ 𝑛
Вследствие этого график накопленных частот используется для изображения эмпирической функции
распределения.
𝜎2 𝑛 − 1 2
= 𝑀(𝑥𝑖 − 𝑎)2 − 𝑀(𝑥̅ − 𝑎)2 = 𝐷𝑥𝑖 − 𝐷𝑥̅ = 𝜎 2 − = 𝜎
𝑛 𝑛
𝜎2
Полученный результат 𝑀𝜎 ̂ 2𝑛 = 𝜎 2 − указывает на смещенность (заниженность) выборочной
𝑛
дисперсии. С ростом n смещение убывает, но при малых значениях n не учет этого обстоятельства приводит к
ошибкам.
𝑛−1 2
Найдем несмещенную оценку дисперсии. Из равенства 𝑀𝜎 ̂ 2𝑛 = 𝜎 выделим 𝜎 2
𝑛
𝑛 2 𝑛
𝜎 2 = 𝑛−1 𝑀𝜎
̂ 𝑛 = 𝑀 (⏟ 𝜎̂𝑛2 ).
𝑛−1
2
𝑠̂𝑛
Откуда несмещенная или исправленная дисперсия 𝑆̂𝑛 будет равна
2
𝑛 𝑛 1 1
̂ 2𝑛 =
𝑠̂𝑛2 = 𝑛−1 𝜎 ∙ ∑𝑛 (𝑥 − 𝑥̅ )2 = 𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 . ►
𝑛−1 𝑛 𝑖=1 𝑖
≤⏟ 𝑃{|𝑦𝑛 − 𝑏| ≥ 𝛿} → 0 при 𝑛 → ∞.
𝑃{|𝑥𝑛 − 𝑎| ≥ 𝛿} + ⏟
→0 →0
𝑝
Следовательно, 𝑓(𝑥𝑛 , 𝑦𝑛 ) → 𝑓(𝑎, 𝑏).►
Замечание. Теорема справедлива и при большем числе сходящихся по вероятности
последовательностей, причем среди них могут находиться последовательности вида 𝑥𝑛 = 𝑐𝑜𝑛𝑠𝑡.
Точечная оценка 𝜎̂𝑛2 является состоятельной оценкой 𝜎 2 .
◄В формуле для выборочной дисперсии раскроем скобки
1 1 1 1
𝜎̂𝑛2 = 𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 = 𝑛 ∑𝑛𝑖=1(𝑥𝑖 2 − 2𝑥𝑖 𝑥̅ + 𝑥̅ 2 ) = 𝑛 ∑𝑛𝑖=1 𝑥𝑖 2 − 2𝑥̅2 + 𝑥̅ 2 = 𝑛⏟∑𝑛𝑖=1 𝑥𝑖 2 − 𝑥̅⏟2 .
2
̂2
𝛼 ̂1
𝛼
6
1
Выражение 𝑛 ∑𝑛𝑖=1 𝑥𝑖 2 есть выборочный начальный момент 𝛼̂2 , который, как мы уже знаем, сходится по
1 𝑛 𝑝 𝑝
вероятности к теоретическому начальному моменту 𝛼2 : ∑ 𝑥2 = 𝛼̂2 → 𝛼2 . Точно так же: 𝑥̅ ≡ 𝛼̂1 → 𝛼1 .
𝑛 𝑖=1 𝑖
Поэтому
𝑝
𝜎̂𝑛2 = 𝛼̂ 2 − 𝛼̂ 21 = 𝑓(𝛼̂ 2 , 𝛼̂ 1 ) → 𝑓(𝛼2 , 𝛼1 ) = 𝛼2 − 𝛼21 = 𝜎2 .
Таким образом, выборочная дисперсия 𝜎̂𝑛2 сходится по вероятности к теоретической 𝜎 2 , т.е. является
состоятельной оценкой 𝜎 2 . ►
Замечание 1. Аналогично доказывается, что несмещенная выборочная дисперсия сходится по вероят-
ности к теоретической 𝜎 2 .
Замечание 2. Все другие выборочные характеристики состоятельны, если их можно представить, как
функции от начальных моментов и дисперсии. Центральные моменты любого порядка выражаются через
начальные моменты. Асимметрия и эксцесс выражаются через центральные моменты. Поэтому их точечная
оценка состоятельна.
Замечание 3. Другой способ доказательства состоятельности состоит в нахождении предела от
выборочной характеристики. Вспомним, что если последовательность сходится, то она также сходится по
вероятности. В большинстве случаев такой подход наталкивается на непреодолимые трудности, например
1
̂ 2𝑛 = lim ( ∑𝑛𝑖=1(𝑥𝑖 − 𝑎)2 ) −? Ниже приведен пример 2, в котором этот подход привел к успеху.
lim 𝜎
𝑛→∞ 𝑛→∞ 𝑛
Этой вероятности можно поставить в соответствие некоторую новую функцию распределения 𝐹𝜂 (𝑥) новой
𝑥 𝑛
случайной величины 𝜂 с переменным аргументом 𝑥: 𝑃(𝜂 < 𝑥) = 𝐹𝜂 (𝑥) = ( ) . Ее производная есть плотность
𝜃
распределения вероятностей
𝑛
𝐹𝜂 (𝑥)′ = 𝑛 𝑥 𝑛−1 .
𝜃
Одно из значений величины 𝑥 ∈ [0, 𝜃] есть число 𝑥𝑚𝑎𝑥 . Найдем его математическое ожидание
𝜃
𝑛 𝑛−1 𝑛
𝑀𝑥𝑚𝑎𝑥 = ∫ 𝑥𝑚𝑎𝑥 ∙ 𝑛
𝑥𝑚𝑎𝑥 𝑑𝑥𝑚𝑎𝑥 = 𝜃.
0 𝜃 𝑛+1
𝑛
Здесь удобно переписать равенство через 𝜃̂𝑛 ≡ 𝑥𝑚𝑎𝑥 : 𝑀𝜃̂𝑛 = 𝑛+1 𝜃.
Оценка для границы распределения 𝜃 оказалась смещенной. Исправим ее, для чего умножим обе части
𝑛+1
равенства на
𝑛
Несмещенность
1. Доказать несмещенность выборочного среднего.
2. Доказать несмещенность выборочного начального момента 𝑘-го порядка.
3. Доказать смещенность выборочной дисперсии. Найти несмещенную оценку выборочной дисперсии.
8
щенную оценку.
𝑛
5. Доказать несмещенность эмпирической функции распределения 𝐹̂ (𝑥) = 𝑛𝑥 , где 𝑛𝑥 - число наблюдений,
меньших 𝑥.
Пусть для случайных величин 𝜉 и 𝜂 получены случайные выборки
𝑥1 , 𝑥2 , … , 𝑥𝑛 и 𝑦1 , 𝑦2 , … , 𝑦𝑛 — объемов 𝑛 соответственно с выборочными дисперсиями 𝑐𝑜̂𝑣(𝜉,𝜂)𝑛
6. 𝑟̂ 𝜉,𝜂 = .
𝜎̂𝑥2 и 𝜎̂𝑦2 и выборочной ковариацией 𝑐𝑜̂𝑣(𝜉, 𝜂). Найти выборочный коэффициент ̂𝑥2 ∙𝜎
√𝜎 ̂𝑦2
корреляции 𝑟̂ 𝜉,𝜂 на основе несмещенных оценок коэффициентов.
Пусть 𝑥1 , 𝑥2 , … , 𝑥𝑛 и 𝑦1 , 𝑦2 , … , 𝑦𝑚 — случайные выборки объема 𝑛 и 𝑚 из одной генеральной совокуп-
ности с исправленными выборочными дисперсиями 𝑠̂𝑥2 и 𝑠̂𝑦2 . Доказать, что исправленная дисперсия
7. 1
2
𝑠̂𝑥,𝑦 , построенная по элементам обеих выборок, определяемая формулой [(𝑛 − 1)𝑠̂𝑥2 + (𝑚 − 1)𝑠̂𝑦2 ],
𝑛+𝑚−2
2
является несмещенной оценкой дисперсии 𝜎 генеральной совокупности.
Для оценивания параметра 𝜎 нормального распределения 𝑁(0, 𝜎 2 ) используется
1 𝜋
8. выборочное линейное отклонение 𝜎̂𝑛 = ∑𝑛𝑖=1|𝑥𝑖 |. Построить исправленную оценку 𝑠̂испр = √ 𝜎̂𝑛
2
𝑛
𝑆̂испр параметра 𝜎.
Состоятельность
20. Доказать, что если 𝜃̂𝑛 – несмещенная оценка параметра 𝜃 и 𝐷𝜃̂𝑛 → 0 при 𝑛 → ∞, то оценка 𝜃̂𝑛
состоятельна.
𝑛
21. Доказать состоятельность эмпирической функции распределения 𝐹̂ (𝑥) = 𝑛𝑥 , где 𝑛𝑥 - число наблюдений,
меньших 𝑥.