Вы находитесь на странице: 1из 106

Литература

1. Гмурман, В.Е. Теория вероятностей и математическая


статистика: учебное пособие / В.Е. Гмурман. – 12-е изд.,
перераб. и доп. – М.: Юрайт , 2011. – 478с.
2. Кремер, Н.Ш. Теория вероятностей и математическая
статистика: учебник для вузов / Н.Ш. Кремер. – 3-е изд.,
перераб. и доп. – М.: ЮНИТИ-ДАНА, 2009. – 550с.
3. Письменный, Д. Т. Конспект лекций по теории
вероятностей, математической статистике и случайным
процессам - М. : Айрис-пресс, 2008
4. Вуколов, Э.А. Основы статистического анализа. Практикум
по статистическим методам и исследованию операций с
использованием пакетов STATISTIKA и EXCEL: учебное
пособие / Э.А. Вуколов. – 2-е изд., испр. и доп. – М.: Форум,
2011. - 464 с.: ил.
5. Мастицкий С.Э., Шитиков В.К. (2014) Статистический
анализ и визуализация данных с помощью R.
6. А. Б. Шипунов, Е. М. Балдин, П. А. Волкова, А. И.
Коробейников, С. А. Назарова, С. В. Петров, В. Г. Суфиянов
Наглядная статистика. Используем R! , 2014
• Официальный сайт: http://www.r-project.org/
• Сайт для начинающих: 
http://www.statmethods.net/
• Один из лучших справочников: The R Book
, 2nd Edition by Michael J. Crawley, 2012
• Список доступной литературы на русском +
хороший блог по теме: r-analytics.blogspot.fi
• https://tsamsonov.github.io/r-geo-course/
Теория вероятностей (ТВ) — раздел
математики, изучающий закономерности в
случайных явлениях.

Цель ТВ — осуществление прогноза в области


случайных явлений, контроль их, ограничение
сферы действия случайности.
Событием в теории вероятностей
(случайным событием, возможным
событием) называется любой факт,
который в результате испытания,
эксперимента, опыта может произойти
или не произойти.

События обозначаются обычно


заглавными латинскими буквами A, B, C.
...
Вероятность события — называется
численная мера степени объективной
возможности этого события.
Вероятность события А обозначается
Р(А), Р или р.
Если некоторый эксперимент (синоним
— испытание) проводится n раз, и в
результате событие A произошло kn раз,
то его частота в данной серии
экспериментов равна
При увеличении количества
экспериментов частота будет
измерена более точно, поэтому
следует за вероятность события A,
обозначаемую через P(A), принять
предел

P(A)=
Такой предел называют статистическим
определением вероятности.
Событие называется невозможным (обозначается
символом ∅), если оно никогда не может
произойти. Событие называется достоверным
(обозначается символом Ω), если оно происходит
при любом исходе эксперимента (происходит
всегда).
События называются несовместными, если они не
могут произойти одновременно. События, которые
могут происходить одновременно, называются
совместными.
Свойства вероятности

1.Вероятность любого события


заключена между нулем и единицей
0 <= P(A) <=1.
2.Вероятность невозможного события
равна нулю P(∅) = 0
3. Вероятность достоверного события
равна единице P(Ω) = 1.
Полной группой событий называется
несколько событий таких, что в результате
опыта непременно должно произойти хотя
бы одно из них.
Несколько событий в данном опыте
называются равновозможными, если по
условиям симметрии опыта, нет оснований
считать какое-либо из них более возможным,
чем любое другое.
Операции на множестве событий

Суммой двух событий A +B называется событие,


состоящее в том, что произошло хотя бы одно из
двух событий A или B.
Разностью двух событий A − B называется событие,
состоящее в том, что A произошло, но B не
произошло.
Произведением двух событий AB называется
событие, состоящее в том, что произошли оба
события A и B.
Теорема сложения вероятностей
Вероятность суммы двух несовместных
событий равна сумме вероятностей этих
событий:
Р(А + B ) = Р(А) + Р(B).
В случае, когда события А и В совместны,
вероятность их суммы выражается
формулой:
Р(A + В) = Р(B) + Р(В) - Р(А*В),
где А*В — произведение событий А и В.
Вероятность суммы нескольких
несовместных событий равна сумме их
вероятностей:

В случае, когда события Аi


{ совместны, вероятность их суммы
выражается формулой:
Условной вероятностью события А при
наличии В называется вероятность
события А, вычисленная при условии,
что событие В произошло. Эта
вероятность обозначается Р (А \ В).
События А и В называются
независимыми, если появление одного
из них не меняет вероятности появления
другого. Для независимых событий Р(А\
В) = Р(А); Р(В\А) = Р(В).
Теорема умножения вероятностей
Вероятность произведения двух событий
равна вероятности одного из них,
умноженной на условную вероятность
другого при наличии первого:
Р(АВ) = Р(А)Р(В\А) или
Р(АВ) = Р(В)Р(А\В). Для независимых
событий A и В
Р(АВ) = Р(А)Р(В).
Теорема умножения вероятностей для
нескольких событий

В случае, когда события независимы,


т.е. появление любого числа из них не
меняет вероятностей появления
остальных
ФОРМУЛА ПОЛНОЙ ВЕРОЯТНОСТИ И ФОРМУЛА
БЕЙЕСА
СЛУЧАЙНЫЕ ВЕЛИЧИНЫ. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ. ЧИСЛОВЫЕ
ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН
Случайной величиной называется величина, которая в
результате опыта может принять то или иное значение,
неизвестно заранее, какое именно. Дискретной
случайной величиной называется случайная величина,
принимающая отделенные друг от друга значения,
которые можно перенумеровать. Непрерывной
случайной величиной называется случайная величина,
возможные значения которой непрерывно заполняют
какой-то промежуток. Законом распределения случайной
величины называется всякое соотношение,
устанавливающее связь между возможными значениями
случайной величины и соответствующими им
вероятностями. Закон распределения может иметь
разные формы.
Если функция распределения F (х) везде
непрерывна и имеет производную,
случайная величина называется
непрерывной.
Плотность распределения
Плотностью распределения непрерывной
случайной величины называется функция f(x) =
F'(x). Плотность распределения любой случайной
величины неотрицательна, f(x) > 0, и обладает
свойством

График плотности f(x) называется кривой


распределения.
Функция распределения F (х) выражается через плотность
распределения формулой
Математическим ожиданием случайной
величины X называется ее среднее значение,
вычисляемое по формулам:

для дискретной случайной величины;

— для - для непрерывной случайной

величины. Для смешанной случайной величины

где сумма распространяется на все точки разрыва


функции распределения, а интеграл — на все
участки ее непрерывности.
Центрированной случайной величиной называется разность между
случайной величиной и ее математическим ожиданием:
Средним квадратическим отклонением
случайной величины X называется корень
квадратный из дисперсии

Начальным моментом k-то порядка случайной


величины X называется математическое ожидание
к-й степени этой случайной величины
Законы распределения
Дискретная случайная величина X называется
распределенной по закону Пуассона, если ее
возможные значения 0,1,2,..., n,..., а
вероятность того, что X = m, выражается
формулой

где а > О — параметр закона Пуассона.


Математическое ожидание и дисперсия
случайной величины X, распределенной по
закону Пуассона, равны параметру закона а:
Непрерывная случайная величина X называется
распределенной по нормальному закону, если ее
плотность распределения равна
Центральная предельная теорема
Если X1, X2 ,X3, …, XN – независимые случайные величины,
имеющие один и тот же закон распределения с мат.
ожиданием m и дисперсией Ϭ2 то при неограниченном
увеличении N , закон распределения суммы

приближается к нормальному закону.


Основы математической статистики.
Математическая статистика изучает
случайные события и случайные величины
по результатам наблюдений.
Наблюдением будем называть такой способ
получения данных, при котором воздействие
наблюдателя на наблюдаемый объект
сведено к минимуму.
Эксперимент тоже включает наблюдение, но
сначала на наблюдаемый объект
оказывается заранее рассчитанное
воздействие.
Этапы статистического исследования
1.Статистическое наблюдение - сбор первичного
статистического материала, научно организованная
регистрация всех существенных фактов, относящихся к
рассматриваемому объекту.
2.Метод группировок - дает возможность все
собранные в результате массового статистического
наблюдения факты подвергать систематизации и
классификации.
3.Метод обобщающих показателей - позволяет
характеризовать изучаемые явления и процессы при
помощи статистических величин - абсолютных,
относительных и средних. На этом этапе статистического
исследования выявляются взаимосвязи и масштабы
явлений, определяются закономерности их развития,
даются прогнозные оценки.
Под статистическими данными (информацией), понимают
совокупность количественных характеристик о явлениях и
процессах, полученных в результате статистического
наблюдения, их обработки или соответствующих расчетов.
Для получения статистических данных органы государственной
и ведомственной статистики проводят различного рода
статистические исследования. Процесс статистического
исследования включает три основные стадии: сбор данных, их
сводка и группировка, анализ и расчет обобщающих
показателей.
Для организации стат. исследования нужно определить цель и
задачи. Неясно поставленная цель может привести к тому, что в
процессе наблюдения будут собраны ненужные данные или,
наоборот, не будут получены сведения, необходимые для
анализа.
Объект статистического наблюдения. При подготовке
наблюдения кроме цели следует точно определить, что именно
подлежит обследованию, т. е. установить объект наблюдения.
Под объектом наблюдения понимается некоторая
статистическая совокупность, в которой проистекают
исследуемые явления и процессы. Объектом наблюдения
может быть совокупность физических лиц (население
отдельного региона, страны), физические единицы (машины,
жилые дома), юридические лица (предприятия, коммерческие
банки, учебные заведения).
Генеральная совокупность – это совокупность объектов или
наблюдений, все элементы которой подлежат изучению при
статистическом анализе..
Выборка – набор объектов, случайно отобранных из
генеральной совокупности для исследования. Объем
генеральной совокупности и объем выборки - число объектов
в генеральной совокупности и выборке - будем обозначать
соответственно как N и n.
Выборка бывает повторной, когда каждый отобранный объект
перед выбором следующего возвращается в генеральную
совокупность, и бесповторной, если отобранный объект в
генеральную совокупность не возвращается.
Репрезентативная выборка:
• правильно представляет особенности
генеральной совокупности, т.е. является
репрезентативной (представительной).

• По закону больших чисел, можно утверждать, что


это условие выполняется, если:
1) объем выборки n достаточно большой;
2) каждый объект выборки выбран случайно;
3) для каждого объекта вероятность попасть в
выборку одинакова.
Выборочный закон распределения
(статистический ряд)
• Пусть в выборке объемом n интересующая
нас случайная величина ξ (какой-либо
параметр объектов генеральной
совокупности) принимает n1 раз значение
x1, n2 раза – значение x2,... и nk раз –
значение xk. Тогда наблюдаемые значения
x1, x2,..., xk случайной величины ξ
называются вариантами, а n1, n2,..., nk – их
частотами.
• Разность xmax – xmin есть размах
выборки, отношение ωi = ni /n –
относительная частота варианты xi.
• Очевидно, что
• Если мы запишем варианты в возраста-
ющем порядке, то получим вариационный
ряд. Таблица, состоящая из таких
упорядоченных вариант и их частот (и/или
относительных частот) называется
статистическим рядом или выборочным
законом распределения.

-- Аналог закона распределения дискретной


случайной величины в теории вероятности
Пример 1. 20 студентов на экзамене по
психологии получили такие оценки (по
пятибалльной системе): 5, 4, 4, 3, 3, 5, 2, 3, 4,
3, 3, 4, 4, 4, 3, 5, 4, 4, 3 ,5. Составить
дискретный вариационный ряд, а также
статистическое распределение выборки.
Дискретный вариационный ряд:

Варианта 2 3 4 5

Частота
варианты 1 7 8 4
Статистическое распределение
выборки:

Варианта 2 3 4 5

Частота
варианты 1 7 8 4

Относительная
частота варианты
1/20 7/20 8/20 4/20
(частость)
Накопленная (кумулятивная)
частота –

каждое число единиц совокупности имеет


величину варианты не большую данной:
нак нак
n i 1 n i  n i 1 ,
где niнак– накопленная частота варианты , xi
n i –1 частота варианты . x i 1
нак
Заметим, что n 1 .n1
Варианта 2 3 4 5

Частота
варианты 1 7 8 4

Накопленная
(кумулятивная)
1 8 16 20
частота
• Если вариационный ряд состоит из очень
большого количества чисел или исследуется
некоторый непрерывный признак, используют
группированную выборку. Для ее получения
интервал, в котором заключены все
наблюдаемые значения признака, разбивают
на несколько обычно равных частей
(подинтервалов) длиной h. При составлении
статистического ряда в качестве xi обычно
выбирают середины подинтервалов, а ni
приравнивают числу вариант, попавших в i-й
подинтервал.
40

35
n2 n3
30 ns
- Частоты -

n1
25

20

15

10

a a+h/2 a+3h/2 - Варианты - b-h/2 b


Пример 2. По результатам измерений получена
выборка. Постройте интервальный
статистический ряд
6,8 12,0 6,6 8,8 12,5 10,7 13,5 10,6 10,8 8,7
9,5 9,4 11,4 11,1 7,1 13,3 11,9 7,3 9,3 10,4
11,5 12,6 7,0 8,2 8,4 11,3 13,7 9,7 11,3 10,1
9,7 9,9 8,4 7,9 10,6 9,1 10,4 8,5 6,9 8,0
8,2 9,0 13,5 9,6 13,8 13,4 11,7 11,5 7,8 9,4

Разобьем промежуток изменения выборки на 7 интервалов и


подсчитаем, сколько чисел из выборки принадлежит каждому
интервалу - частоты интервалов ni
Частота Относительная Накопленная
Интервалы интервала частота интервала wi частота интервала
ni ni (нак)
[6,0 ; 7,2) 5 0,1 5

[7,2 ; 8,4) 6 0,12 11

[8,4 ; 9,6) 11 0,22 22

[9,6 ; 10,8) 11 0,22 33

[10,8 ; 12,0) 8 0,16 41

[12,0 ; 13,2) 3 0,06 44

[13,2 ; 14,4) 6 0,12 50

 ni = 50  wi =1
Графическое изображение
вариационных рядов
Полигон
(греч. – «многоугольник»)

применяется для изображения как


дискретных, так и интервальных рядов
(если предварительно привести его к
дискретному).
При этом по оси абсцисс
откладываются варианты, а по оси
ординат – частоты или частости
Пример полигона для вариационного ряда
Время, мин 3 5 10 15 20 30 40
Частота 2 1 7 8 2 8 2

8"Б"

6
Ч ас то та

0
0 5 10 15 20 25 30 35 40 45
Время (мин)
Полигон частот,
выборочная функция распределения
• Отложим значения случайной величины xi по
оси абсцисс, а значения ni – по оси ординат.
Ломаная линия, отрезки которой соединяют
точки с координатами (x1, n1), (x2, n2),..., (xk, nk),
называется полигоном частот.
Если вместо абсолютных
значений ni на оси ординат
отложить относительные частоты
ωi, то получим полигон
относительных частот
Задание
• В магазине за день было продано 45 пар мужской обуви.
Имеется выборка значений случайной величины Х –
размера обуви:
• 39, 41, 40, 42, 41, 40, 42, 44, 40, 43, 42, 41, 43, 39, 42,
• 41, 42, 39, 41, 37, 43, 41, 38, 43, 42, 41, 40, 41, 38, 44,
• 40, 39, 41, 40, 42, 40, 41, 42, 40, 43, 38, 39, 41, 41, 42.
• Построить дискретный вариационный ряд, полигон,
кумулянту и эмпирическую функцию распределения.
Гистограмма
Применяется для изображения только
интервальных вариационных рядов и
представляет собой ступенчатую фигуру из
прямоугольников с основаниями, равными
интервалам значений признака и высотами,
равными частотам (частостям) интервалов.
При этом по оси абсцисс откладываются
интервалы, а по оси ординат – частоты (или
частости) в случае равенства интервалов, или
плотности распределения частот (или частостей) в
случае неравенства интервалов.
Таблица 2. Распределение рабочих по
выработке

Выработка, м (x) Число рабочих (n)


до 200 3
200 – 220 12
220 – 240 50
240 – 260 56
260 – 280 47
280 – 300 23
300 – 320 7
свыше 320 2
Итого: 200
Гистограмма
• По аналогии с функцией распределения
дискретной случайной величины по
выборочному закону распределения можно
построить выборочную (эмпирическую)
функцию распределения

• где суммирование выполняется по всем


частотам, которым соответствуют значения
вариант, меньшие x. Заметим, что
эмпирическая функция распределения
зависит от объема выборки n.
• В отличие от функции ,найденной для
случайной величины ξ опытным путем в
результате обработки статистических данных,
истинную функцию распределения
связанную с генеральной совокупностью,
называют теоретической. (Обычно
генеральная совокупность настолько велика,
что обработать ее всю невозможно, т.е.
исследовать ее можно только теоретически).
• Заметим, что:
Свойства эмпирической функции распределения

• Ступенчатый вид
Числовые характеристики
вариационного ряда:

• Средние величины
• Показатели вариации
Средние величины
• Средние величины характеризуют
значение признака, вокруг которого
концентрируются наблюдения или, как
говорят, центральную тенденцию
распределения.
• К ним относят: среднюю
арифметическую вариационного ряда,
моду и медиану.
• Средней арифметической вариационного ряда
называется сумма произведений всех вариантов на
соответствующие частоты, деленная на сумму
частот:
m

 x n i i
х i 1
,n
где xi - варианты дискретного ряда или
середины интервалов интервального
вариационного ряда;
ni - соответствующие им частоты; т – число
неповторяющихся вариантов или число
интервалов.
• Мода Mo - это значение, которое
встречается в выборке наиболее часто.
• Медиана Me - это значение, которое
делит упорядоченное множество данных
пополам.
• Медиана может быть приближенно
найдена с помощью кумуляты как значение
признака, для которого
нак п
п х 
2
Показатели вариации
• Дисперсией вариационного ряда называется
средняя арифметическая квадратов
отклонений вариантов от их средней
арифметической:

 x 
m
2
i  x  ni
2
s  i 1
n
• Среднее квадратическое отклонение s -
арифметическое значение корня
квадратного из дисперсии.
Нормальный закон распределения
случайных величин
Нормальное распределение возникает тогда,
когда на изменение случайной величины
действует множество различных
независимых факторов, каждый из которых в
отдельности не имеет преобладающего
значения.

Главная особенность - это предельный закон, к


которому при определенных условиях
стремятся другие законы распределения
Говорят, что X имеет нормальное (гауссовское)
распределение с параметрами μ и σ , где μR,
σ>0, если X имеет следующую плотность
распределения:
 
( x   ) 2
1 
2 2
f ( x) e
 2

дифференциальная функция распределения


Функция распределения вероятностей

x ( x   )2
1 
2  2
F ( x) 
 2 

e dx

интегральная функция распределения


Кривая нормального распределения
(Гаусса)
Функция распределения вероятностей
ЗАКОНОМЕРНОСТИ РАСПРЕДЕЛЕНИЯ:

• Параметр  характеризует математическое


ожидание (среднее арифметическое) случайной
величины, являясь центром распределения и
наиболее вероятным значением. Изменение
математического ожидания не влияет на форму
кривой, а только вызывает ее смещение вдоль оси x.

Пример:
Рост в группе Л101-M(x)=170 см, σ=5 см

Л102-M(x)=175 см, σ=5 см


Пример:
ЗАКОНОМЕРНОСТИ РАСПРЕДЕЛЕНИЯ:

• Параметр  характеризует изменчивость


случайной величины (меру растянутости
кривой вдоль оси x): чем больше , тем
больше кривая растянута.

Пример:
Рост в группе Л101-M(x)=170 см, σ=5 см

Л132-M(x)=170 см, σ=10 см


f(x)

0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09

156
158
160
162
164
166
168
170
172
Пример:

174
176
178
180
182
σ=5

184
186
188
190
X
σ=10
ЗАКОНОМЕРНОСТИ РАСПРЕДЕЛЕНИЯ:
• График нормальной кривой симметричен
относительно прямой x= (одинаковые по
абсолютной величине отрицательные и
положительные отклонения случайной величины от
центра равновероятны).

• По мере увеличения разности (x–) значение f(x)


убывает. Это значит, что большие отклонения менее
вероятны, чем малые.
При (x–) значение f(x) стремится к нулю, но
никогда его недостигает.
ЗАКОНОМЕРНОСТИ РАСПРЕДЕЛЕНИЯ:
• По мере увеличения разности (x–) значение f(x)
убывает. Это значит, что большие отклонения менее
вероятны, чем малые. При (x–) значение f(x)
стремитсяк нулю, но никогда его не достигает.

Рис.1. Кривая нормального распределения


Функция нормального закона
( x   ) 2
1 
2 2
f ( x) e функция плотности
 2 распределения вероятностей

x ( x   ) 2
1 
2  2
F ( x) 
 2 

e dx
функция распределения вероятностей

x 1
x t2
t  F ( x)  e

2
dt
 2 
Вероятность попадания значения случайной
величины в интервал от а до b:

b  a 
Р ( а  х  b)  Ф    Ф 
     

причем Ф(–t) = 1– Ф(t)

Характеристики кривой:
• Коэффициент асимметрии
• Показатель эксцесса
КОЭФФИЦИЕНТ АСИММЕТРИИ
M ( x  M ( x )) 3
А
 3 А>0 - правоасимметричные,
А<0 - левоасимметричные
f(x)

X
ПОКАЗАТЕЛЬ ЭКСЦЕССА
M ( x  M ( x )) 4
Е 4
3

f(x)

Х
Для нормального распределения показатели А=0 и Е=0
Задача:
• Записать функции нормального закона для
распределения студентов по росту:
M(X)=170 см; σ=5 см
( x 170 ) 2

1 
2 52
f ( x)  e
5 2

( x 170 ) 2

1 x 
2 52
F ( x)   e dx
5 2 
Нормальное распределение с параметрами
M(x)=0 и σ=1 называется стандартным N0,1
(нормированным нормальным распределением)

Функция плотности
распределения вероятностей
t 2
1 
f ( x)  e 2
2

Функция распределения
вероятностей t 2
1 x 
F ( x)   e 2 dt
2 
Нормированное отклонение:
Нормированным отклонением называется
отклонение случайной величины x,от её
математического ожидания, выраженное в
единицах σ

x  M (x)
t

Найти нормированное отклонение для x=166
см, если M(x)=170 см, σ=5 см.
0,09

0,08

0,07

0,06

0,05
f(x)

0,04 166  170


t  0,8
5
0,03

0,02

0,01

0
156 158 160 162 164 166 168 170 172 174 176 178 180 182 184
X
-0,8σ
Вероятность попадания значения случайной
величины в интервал от - до x:
x t2
x 1 

t  F ( x) 
2 e 2
dt
 

Функция F(x) не выражается через


элементарные функции, но для нее
составлены таблицы, которые называются
таблицами нормального интеграла
вероятности
Вероятность попадания значения
случайной величины в интервал от а до b:

b  a 
Р(а  х  b)  Ф   Ф 
     

=Ф(t2)-Ф(t1)

причем Ф(–t) = 1– Ф(t)


Задача:
• Найти вероятность попадания случайной величины
в интервал от 155 см до 160 см если M(x)=a=170 см,
σ=5 см.

 160  170   155  170 


Р(155  x  160)       
 5   5 

Ф(-2)-Ф(-3)=(1-Ф(2))-(1-Ф(3))=(1-0,9772)-(1-0,9986)=
0,0228-0,0014=0,0214 (2,14%)
Точечные оценки случайной величины:

• Математическое ожидание
• Дисперсия
• Среднее квадратическое отклонение
Математическое ожидание
дискретной случайной величины
(среднее значение) равно сумме произведений значений,
принимаемых этой величиной, на соответствующие им вероятности:

n
М(x)=x1Р1 + x2Р2 + . . . + xnPn = xi Pi
i 1
Дисперсия дискретной
случайной величины
это математическое ожидание квадрата соответствующего
отклонения случайной величины x от ее математического
ожидания:

D(x) = M [x – M(x)]2

или
N
D(x)   (xi  M(x)) Pi 2

i1
Основные числовые характеристики
непрерывных случайных величин

Математическое
ожидание М(х)   x  f(x)dx



Дисперсия
D(x)   (x  M(x)) 2  f(x)dx

Среднее квадратическое отклонение
для дискретной и непрерывной
случайной величины

σ(x)  D(x)
Интервальные оценки
x
t нормированное отклонение

х – μ=σt
 1σ – 68,3%;

 2σ – 95,5%;

 3σ – 99,7% всех вариант

Закон 3: в пределах 3σ находится 99,7% всех


вариант
Доверительные вероятности и
доверительные интервалы
• Вероятности 0,95 и 0,99 (95% и 99%) –
доверительные вероятности
• Δх=±t – доверительный интервал
Доверительным называется интервал, в
который попадает случайная величина с
заданной вероятностью

Вероятности Интервалы
0,95 1,96
0,99 2,58
0,999 3,03
Уровни значимости
• Определенным значениям доверительных
вероятностей соответствуют так называемые
уровни значимости ().
• Уровень значимости обозначает вероятность
выхода случайной величины за пределы
доверительного интервала. Если доверительную
вероятность обозначить – Р, а уровень значимости
– , то =1 – Р.
Доверительные Уровни значимости
вероятности

0,95 0,05

0,99 0,01

0,999 0,001
95% доверительный интервал
Задача:
• Найти доверительный интервал для роста
студентов с вероятностью p=0,95 (=0,05);
M(x)=170 см, σ=5 см

Δх=1,96510 см

Следовательно, рост студентов находится в


интервале: 170-10<x<170+10
160 см<x<180 см
Генеральная и выборочные
совокупности
• Наиболее общую совокупность,
подлежащих изучению объектов
называют генеральной.
• Выборка считается репрезентативной,
если каждый объект выборки отобран
случайно из генеральной совокупности,
то есть все объекты имеют одинаковую
вероятность попасть в выборку.
Сравнительная характеристика
Характеристики Совокупность
Генеральная Выборочная
Математическое
ожидание
 x
Среднее  s
квадратическое
отклонение
Средняя
квадратическая  s
ошибка sx  sx 
(стандартная
ошибка)
n n

значение генеральной средней


  Х  ts x с доверительным интервалом
Сравнение теоретических и
эмпирических распределений
• Нулевая гипотеза. Согласно этой гипотезе
первоначально принимается, что между
эмпирическим и теоретическим
распределением признака в генеральной
совокупности достоверного различия нет.
Средние квадратические ошибки
sА (асимметрии) и sЕ (эксцесса)
6(n  1)
sA 
(n  1)(n  3) 24n (n  2)(n  3)
sE 
(n  1) 2 (n  3)(n  5)
Для достаточно большой выборки (n>30),
если показатели асимметрии (А) и эксцесса
(Е) в два и более раза превышают показатели
их средних квадратических ошибок, гипотезу
о нормальности распределения нужно
отвергнуть.
Сравнение теоретических и экспериментальных
распределений по:
а) критерию Колмогорова – Смирнова,
б) критерию Пирсона.
Пунктирная линия – эмпирическое распределение,
сплошная – теоретическое распределение.
Критерий Пирсона
2
k (m i  np i )
 2
эмп. 
i 1 npi

где mi – экспериментальные частоты


попадания значения случайной
величины в интервал,
npi – теоретические частоты.
• Число степеней свободы – это общее число величин,
по которым вычисляются соответствующие
статистические показатели, минус число тех условий,
которые связывают эти величины, то есть
уменьшают возможности вариации между ними.
Число степеней свободы определяется по
следующей формуле:
df=k–r–1, где k – число интервалов, r – число
параметров предполагаемого распределения. Для
нашего случая r=2, следовательно, df=k–3.
• По заданному уровню значимости () и числу
степеней свободы df, находим критическое значение
2кр (,df).

• Если 2эмп <2кр гипотеза о согласии эмпирического и


теоретического распределения
подтверждается.
Основные этапы исследования:
• Сгруппировать исследуемый ряд по классам.
Подсчитать середины интервалов и частоты
попадания в интервал.
• Построить гистограмму и полигон распределения.
• Найти эмпирическую функцию распределения и
построить ее график.
• Вычислить числовые (точечные) характеристики
распределения.
• Найти интервальные оценки для генеральной
средней.
• Проверить гипотезу о том, что генеральная
совокупность, из которой извлечена выборка,
распределена по нормальному закону, используя
критерий Пирсона 2.
Заключение
Нами рассмотрены:
• Основные параметры нормального
распределения;
• Понятие доверительной вероятности и
доверительного интервала;
• Нулевая гипотеза и ее применение для
сравнения теоретического и практического
распределений.
Тест-контроль
Доверительная вероятность равна 0,999,
тогда уровень значимости равен:
1. 0,005
2. 0,001
3. 0,01
4. 0,1
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА

Обязательная:
• 1. Павлушков И.В. Основы высшей математики и математической статистики: учебник
для мед.вузов. М.: ГЭОТАР-Медиа. 2007
Дополнительная:
• Математика в примерах и задачах: учебное пособие /Л.Н.Журбенко, Г.А. Никонова,
Н.В.Никонова и др., М.: ИНФРА-М. 2010
• Шаповалов К.А. Основы высшей математики: учебное пособие. Красноярск: Печатные
технологии. 2004
• Математика: метод. указания к внеаудит. работе для студ. по спец. – педиатрия /сост.
Л.А.Шапиро и др. Красноярск: тип.КрасГМУ. 2009
Электронные ресурсы:
• Электронная библиотека Absotheue
• Электронная библиотека Colibris
• Ресурсы интернет

Вам также может понравиться