Вы находитесь на странице: 1из 21

Лекция 11

ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ.

ПОЛИГОН И ГИСТОГРАММА.

К.ф.-м.н., доцент кафедры «Математика и статистика»


С.А.Джафарова

2021
ПЛАН

1. Генеральная и выборочная совокупности.

2. Эмпирическая функция распределения и ее свойства.

3. Полигон и гистограмма.

4. Статистические оценки параметров распределения.

5. Числовые характеристики выборки.

В этой лекции введем понятие генеральной и выборочной совокупности.


Определим эмпирическую функцию. Научимся строить полигон и
гистограмму. Ознакомимся с числовыми характеристиками выборки.

КОНТРОЛЬНЫЕ ВОПРОСЫ

1) Чем отличаются генеральная и выборочная совокупности?

2) Как определяется эмпирическая функция и каковы ее свойства?

3) Как строят полигон и гистограмму?

4) Что называют статистической оценкой параметров распределения?

5) Какие статистические оценки вы знаете?

6) Как определяются выборочная средняя, выборочная дисперсия?


1. Генеральная и выборочная совокупности.

Пусть требуется изучить совокупность однородных объектов


относительно некоторого количества или количественного признака,
характеризующего эти объекты. Например, если имеется партия деталей,
то качественным признаком может судить стандартность детали, а
количественным признаком – контрольный размер. На практике почти
невозможно обследовать каждый объект совокупности относительно
признака. По этой причине случайно отбирают из всей совокупности
ограниченное число объектов и подвергают их изучению.

Выборочной совокупностью (выборкой) называется совокупность


случайно отобранных объектов.

Генеральной совокупностью называется совокупность объектов, из


которых производится выборка.

Объемом совокупности называются число объектов совокупности.

Повторной называют выборку, при которой отобранный объект


возвращают в генеральную совокупность.

Бесповторной называют выборку, при которой отобранный объект в н


генеральную совокупность не возвращаются.

Если объем генеральной совокупности достаточно велик, а выборка


составляет лишь незначительную часть этой совокупности, то различие
между повторной и бесповторной выборками стирается.

СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ВЫБОРКИ

Пусть из генеральной совокупности извлечена выборка, причем х1


наблюдалось n1 раз, х2- n2 раз, .., хk- nk раз и ni = n- объем выборки.
i
Наблюдаемые значения хi называется вариантами, а последовательность
вариант, записанных в возрастающем порядке- вариационных рядом.
Числа наблюдений называют частотами, а их отношения к объему выборки
ni
- относительными частотами Wi = .
n

Статистическим распределением выборки называется перечень


вариант и соответствующих им частот или относительных частот.

Пример 1. Задано распределение частот выборки объема =20

хi 2 6 12
ni 3 10 7

Написать распределение относительных частот

n1 3 n 1 n 7
W1 = = ; W1 = 2 = ; W1 = 3 = .
n 20 n 2 n 20

хi 2 6 12
Wi 3 1 7
20 2 20
3 1 7
+ + = 1.
20 2 20

2.Эмпирическая функция распределения и ее свойства.

Пусть известно статистическое распределение частот количественного


признака Х.

Пусть nх - число наблюдений, при которых наблюдалось значение


признака меньших Х, n - общее число наблюдений (объем выборки).
nx
Относительная частота события (Х<х) равна , т.е. относительная
n
частота есть функция от х.

Так как эта функция находится эмпирическим (опытным) путем, то ее


называют эмпирической. Итак, эмпирической функцией распределения
называют функцию F*(x) , определяющую для каждого значения Х
относительную частоту события (Х<х).
nx
F*(x) = , где nx - число вариант, меньше Х; n-объем выборки.
n

В отличие от эмпирической функции распределения выборки,


интегральную функцию F(x) распределения генеральной совокупности
называют теоретической функцией распределения.

Различие между ними состоит в том, что функция F(x) определяет


вероятность события (Х<х), а эмпирическая функция F*(x) определяет
относительную частоту этого же события. Из теоремы Бернулли следует,
что числа F(x) и F*(x) мало отличаются друг от друга.

Отсюда следует целесообразность использования эмпирической


функции для приближенного представления теоретической (интегральной)
функции распределения генеральной совокупности.

Свойства F*(x)

1. Значение принадлежат отрезку [0; 1].

2. F*(x)- неубывающая функция;

3. Если х1- наименьшая варианта, то F*(x) = 0, при х ≤ х1;

Если хk- набольшая варианта, то F*(x) = 1, при х > хk.


Задача 1. Построить эмпирическую функцию по данному
распределению выборки

хi 2 6 10
ni 12 18 30

Решение: n=12+18+30=60

1. F*(x) = 0 ; при х ≤ 2;
12
2. F*(x) = ; при 2 < х ≤ 6;
60
12 + 18 1
3. F*(x) = = при 6 < х ≤ 10;
60 2

4. F*(x) = 1 ; при х > 10.

3.Полигон и гистограмма.

Полигоном частот называют ломаную, отрезки которой соединяют


точки (х1; n1), (х2; n2), (х3; n3), …, (хk; nk).
Для построения на оси абсцисс откладывают варианты хi , а на оси
ординат – соответствующие или частот ni.

Полигоном относительных частот называют ломаную, отрезки


которой соединяют точки (х1; W1), (х2; W2), (х3; W3), …, (хk; Wk).
Гистограммой частот называют ступенчатую фигуру, состоящую из
прямоугольников, основаниями которых служат частичные интервалы
ni
длиною h, а высоты равны отношению (плотность частоты).
h
Для построения гистограммы частот на оси абсцисс откладывают
частичные интервалы, а над ними проводят отрезки, параллельные оси
ni
абсцисс на расстоянии . Площадь i-ого частичного прямоугольника
h
ni
Si = h ∙ = ni равна сумме частот вариант i - ого интервала.
n
Следовательно площадь гистограммы частот равняется сумме всех частот,
т.е. объему выборки.

Рисунок

Гистограммой относительных частот называют ступенчатую фигуру,


состоящую из прямоугольников, основаниями которых служат частичные
Wi
интервалы длиной h, а высоты равны отношению (плотность
h
относительной частоты).

Wi
Площадь i-ого прямоугольника равна h ∙ = Wi -относительной
n
частоте вариант i-ого интервала. Следовательно площадь гистограммы
относительных частот равна сумме всех относительных частот, т.е.
единице.

Задание 1. Построить полигон относительных частот по данному


распределению выборки.

хi 2 4 5 7 10
Wi 0,15 0,2 0,1 0,1 0,45

рисунок
Задание 2.

Н о м е р Частичный С у м м а Плотность
интервал интервал ч а с т о т частоты
вариант
интервала
i хi − хi−1 ni ni /h
1 1-5 10 2,5
2 5-9 20 5
3 9-13 50 12,5
4 13-17 12 3
5 17-21 8 2

Решение:

Рисунок

4.Статистические оценки параметров распределения.

Статистической оценкой неизвестного параметра теоретического


распределения называют функцию от наблюдаемых случайных величин.

Точечной называют статистическую оценку, которая определяется


одним числом.

Несмещенной называют точечную оценку, математическое ожидание


которой равно оцениваемому параметру при любом объеме выборки.

Смещенной называют точечную оценку, математическое ожидание


которой не равно оцениваемому параметру.

Состоятельной называют статистическую оценку, которая при


n → ∞ стремится по вероятности к оцениваемому параметру.
5.Числовые характеристики выборки.

ГЕНЕРАЛЬНАЯ СРЕДНЯЯ

Генеральной средней Х̄г называется среднее арифметическое


значение признака генеральной совокупности.

Если все значения х1, х2, х3, …, хn признака генеральной


х1, + х2 + х3 + …+хN
совокупности объема N различны, то Х̄г = .
N

Если значения признака х1, х2, х3, …, хк имеют соответственно


частоты N1, N2, N3, …, Nк, где N1 + N2 + N3 + … + Nк = N, то

х1N1, + х2 N2 + х3 N3 + …+хk Nk
Х̄г = .
N

Если рассматривать обследуемый признак Х генеральной


совокупности как случайную величину, то математическое ожидание
признака равно генеральной средней этого признака М(х) = Х̄г.

ВЫБОРОЧНАЯ СРЕДНЯЯ

Выборочной средней Х̄в называют среднее арифметическое значений


признака выборочной совокупности.

Если все значения х1, х2, х3, …, хn признака выборки объема n


х1, + х2 + х3 + …+хN
различны, то Х̄в = .
n

Если не значения признака х1, х2, х3, …, хк имеют соответственно


частоты n1, n2, n3, …, nк, причем n1 + n2 + n3 + … + nк = n, то

х1n1, + х2n2 + х3n3 + …+хk nk


Х¯В = .
N
ОЦЕНКА ГЕНЕРАЛЬНОЙ СРЕДНЕЙ

ПО ВЫБОРОЧНОЙ СРЕДНЕЙ

Выборочная средняя Х¯В является несмещенной оценкой генеральной


средней, т.е. М(Х¯В) = Х̄г.

Можно показать, что Х¯В является и состоятельной оценкой


генеральной средней, т.е. при увеличении объема Х¯В по вероятности
стремится к Х̄г.

ГРУППОВАЯ И ОБЩАЯ СРЕДНИЕ

Групповой средней называют среднее арифметическое значений


признака, принадлежащих группе.

Общее среднее Х̄ называют среднее арифметическое значений


признака, принадлежащих всей совокупности.

Общая средняя равна средней арифметической групповых средних,


взвешенной по объемам групп.

Пример 2. Найти общую совокупности, состоящей из двух групп:

хi 1 6 хi 1 5
ni 10 15 ni 20 30
n 10+15=25 n 20+30=50

Решение:

Найдем групповые средние

1 ∙ 10 + 6 ∙ 15
х¯1 = =4
25
1 ∙ 20 + 5 ∙ 30
х¯2 = = 3,4
50
4 ∙ 25 + 3,4 ∙ 50
х̄ = = 3,6
75

ОТКЛОНЕНИЕ ОТ ОБЩЕЙ СРЕДНЕЙ

Отклонением называют разность xi − х̄ между значениями признака


и общей средней.

Теорема 1. Сумма произведений отклонений на соответственные


частоты равна нулю ni(xi − X̄ = 0)

ГЕНЕРАЛЬНАЯ ДИСПЕРСИЯ

Генеральной дисперсией Dг называют среднее арифметическое


квадратов отклонений значений признака от их среднего значения Х̄г.

Если все значения х1, х2, х3, …, хn признака генеральной совокупности

∑i=1 (xi − X̄)


N 2

объема N различны, Dг = .
N

Если же х1, х2, х3, …, хк частот


N1 + N2 + N3 + … + Nк N1 + N2 + N3 + … + Nк − N , то

∑i=1 Ni(xi − X̄)


N 2

Dг = , σг = Dг .
N

Пример 3. Генера льной совокупно сть задана т аблицей


распределения

хi 2 3 5 6
Ni 4 2 3 1

Найти генеральную дисперсию.

Решение:
2∙4+3∙2+5∙3+6∙1 35
Х̄ = = = 3,5
10 10

4 ∙ (2 − 3,5) + 2 ∙ (2 − 3,5) + 3 ∙ (5 − 3,5) + 6 ∙ (1 − 3,5)2


2 2 2
9 + 0,5 + 6,75 + 37,5
Dг = = = 5,375
10 10

ВЫБОРОЧНАЯ ДИСПЕРСИЯ

Выборочной дисперсией DВ называется среднее арифметическое


квадратов отклонений наблюдаемых значений признака от и х и среднего
значения Х¯В.

Если значения х1, х2, х3, …, хк имеют соответствующие частоты


n1, n2, n3, …, nk (n1, n2, n3, …, nk = n) , то

∑ Ni(xi − X̄В)
2

DВ = , σB = DB .
n

Теорема 2. Дисперсия равна среднему квадратов значений признака


минус квадрат общей средней.

D = X¯2 − [X¯ ] .
2

Пример 4. Найти дисперсию по данному распределению

хi 1 2 3
ni 20 10 20

Решение:

20 + 20 + 60
Х̄ = =2
50

20 + 40 + 180
X¯2 = = 4,8
50

D = 4,8 − 22 = 0,8.
ОЦЕНКА ГЕНЕРАЛЬНОЙ ДИСПЕРСИИ

ГРУППОВАЯ, ВНУТРИГРУППОВАЯ, МЕЖГРУППОВАЯ И

ОБЩАЯ ДИСПЕРСИИ

Групповой дисперсией называют дисперсию значения признака,


принадлежащих группе, относительно групповой средней

∑ ni(xi − x̄j)
2

Dj гр =
Nj

Nj- объем группы j.

Внутригрупповой дисперсией называют среднее арифметическое


групповых дисперсий, взвешенную по объемам групп:

∑ Nj Dj гр
Dвн гр =
n

Nj- объем группы j.


n= Nj- объем всей совокупности.

Межгрупповой дисперсией называют дисперсию групповых средних


относительно общей средней

∑ Ni(x̄j − x̄)
2

Dмежгр =
Nj


n= Nj- объем всей совокупности.

x̄- общая средняя


xj-средняя группа j.

Теорема 3. Если совокупность состоит из нескольких групп, то общая


дисперсия равна сумме внутригрупповой и межгрупповой дисперсии

Dобщ = D + Dвмежгр
вн гр

Пример 5. Найти общую дисперсию совокупности, состоящих из


следующих двух групп

хi 2 4 5 хi 3 8
ni 1 7 2 ni 2 3

Решение:

I способ:

2 + 28 + 10 + 6 + 24 70 14
Х̄ = = =
15 15 3

(2 − 3 )
+ 7 ∙ (4 − 3 )
+ 2 ∙ (5 − 3 )
+ 2 ∙ (3 − 3 )
+ 3 ∙ (8 − 3 )
2 2 2 2 2
14 14 14 14 14
148
Dобщ = =
15 45

I I способ:

Dобщ = D + Dвмежгр
вн гр

2 + 28 + 10 6 + 24
х¯1 = =4 х¯2 = =6
10 5

(2 − 4)2 + 7 ∙ (4 − 4)2 + 2 ∙ (5 − 4)
2
4+2
D1 гр = = = 0,6
10 10
2 ∙ (3 − 6) + 3 ∙ (8 − 6)
2 2
18 + 12
D2 гр = = =6
5 5

n = N1 + N2 = 10 + 5 = 15
0,6 ∙ 10 + 6 ∙ 5 6 + 30
Dвн гр = = = 2,4
15 15
4 ∙ 10 + 6 ∙ 5 70 14
Х̄ = = =
15 15 3

10 ∙ (4 − 3 )
+ 5 ∙ (6 − 3 )
2 2
14 14
8
Dмеж гр = =
15 9
12 8 108 + 40 148
Dобщ = + = =
5 9 45 45

ОЦЕНКА ГЕНЕРАЛЬНОЙ ДИСПЕРСИИ ПО

ИСПРАВНОЙ ВЫБОРОЧНОЙ

Выборочная дисперсия является смещенной оценкой генеральной


дисперсии, т.е. математическое ожидание выборочной дисперсии не равна
n−1
оцениваемой генеральной дисперсии, а равно M[DB] = ∙ Dг.
n

Легко «исправить» выборочную дисперсию так, чтобы ее математическое


ожидание было равно генеральной дисперсии.
n
Достаточно для этого умножить DB на дробь . Сделав это, получим
n−1
«исправленную дисперсию», которую обычно обозначают через S 2 .

∑ ni(xi − x¯В) ∑ ni(xi − x¯В)


2 2
n n
S2 = ∙ DВ = ∙ =
n−1 n−1 n n−1
Исправленная дисперсия является несмещенной оценкой генеральной
дисперсии.

[n − 1 ] n−1
n n n n−1
M [S2] = ∙ DВ = ∙ M(DВ) = ∙ Dг = Dг
n−1 n

Итак, в качестве оценки генеральной дисперсии принимают исправленную


дисперсию

∑ ni(xi − x¯В)
2

S2 =
n−1

Для оценки среднего квадратического отклонения генеральной


совокупности используют «исправленное» среднее квадратическое
отклонение.

∑ ni(xi − x¯В)
2

S=
n−1

Замечание. Сравнивая формулы

∑ ni(xi − x¯В) ∑ ni(xi − x¯В)


2 2

DВ = и S2 = .
n n−1

Видим, что они отличаются лишь знаменателями. При достаточно


больших и DВ и S 2 различаются мало. Исправной дисперсией S 2
пользуются, если примерно n<30.

ДРУГИЕ ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА.

Кроме выборочной средней и выборочной дисперсии применяются и


другие характеристики вариационного ряда.

Модой М0 называют варианту, которая имеет наибольшую частоту.


Медианой mе называют варианту, которая делит вариационный ряд на две
части, равные по числу вариант. Если число вариант нечетно, т.е n=2k+1,
xk + xk+1
то mе = хк+1, при четном n=2k me = .
2

Например, для ряда: 2 3 5 6 7 me = 5.


5+6
Для ряда 2 3 5 6 7 9 me = = 5,5.
2

Размахом варьирования R называют разность между наибольшей и


наименьшей вариантами: R = Xmax − Xmin.

Для ряда: 1 3 4 5 6 10

R=10-1=9.

Средним абсолютным отклонением θ называют среднее арифметическое

∑ ni xi − x¯В
абсолютных отклонений θ = .
n
σB
Коэффициентом вариации V называется V = ∙ 100%.
X¯B
ИТОГ

В этой лекции мы начали изучение элементов математической


статистики.

Выяснили, что такое выборка, как определяется эмпирическая


функции.

Выяснили чем эмпирическая функция отличается от теоретической


функции. Научились строить полигон и гистограмму частот. Выяснили,
что называют статистической оценкой параметров распределения.
Рассмотрим характеристики выборки.
ЛИТЕРАТУРА

1. В.Е.Гмурман. Теория вероятностей и математическая статистика.


Москва 2006.
2. В . Е . Г м у р м а н . Р у к о в о д с т в о п о р е ш е н и ю з а д а ч п о
теориивероятностейи математической статистики. Москва 2004.
3. Н.Ш.Кремер. Теория вероятностей и математическая статистика.
Москва 2006.
4. А.С. Шведов. Теория вероятностей и математическая статистика.
Москва 2005.
5. П.С. Бондаренко. Теория вероятностей и математическая статистика.
Москва 2017

Вам также может понравиться