Вы находитесь на странице: 1из 15

Probabilitate și statistică aplicată

Prelegere nr. 11
Tema: Доверительный интервал
(Confidence interval)

Titularul cursului conf. univ. dr. Galina Marusic

Chișinău, 2022
Доверительным интервалом в математической статистике
называется интервал, в пределах которого с заданной
вероятностью лежат выборочные оценки статистических
характеристик генеральной выборки.

2
В основном статистические исследования
проводятся не на генеральной совокупности, а на какой-
то отдельно выбранной ее части (выборке). Очевидно, что
статистические характеристики совокупности будут
отличаться от выборочных на некоторую величину,
смещение. Высокое значение смещения отражает
степень недостоверности гипотезы о том, что
статистические свойства выборки можно обобщить на
всю совокупность.

3
Если выборка случайная, то выполняя ее, каждый раз
будем получать новые значения выборочных статистик.
В таком случае оценивается не само смещение, а
интервал, в который с заданным уровнем вероятности
попадут выборочные оценки статистических
характеристик, который и называется доверительным.
Чем шире доверительный интервал, тем ниже уровень
доверия к выборочным оценкам. Другими словами,
широкий доверительный интервал для выборочного
среднего указывает на неточное отражение средней по
совокупности.

4
Перед тем, как приступать в практической части,
рассмотрим условные обозначения, которые тесно связаны
с доверительными интервалами.
Уровень значимости α – это вероятность, с которой
значение параметра не попадает в доверительный
интервал.
Уровень доверия β = 1-α – это вероятность того, что
доверительный интервал накрывает значение параметра.
∆ - это точность интервальной оценки.

5
Пример 1: Дана выборка 9, 5, 7, 7, 4, 10, дисперсия =1.
Построить 99% доверительный интервал.
Решение: Прежде всего вычислим среднее значение, которое
будет равно 7. В таком случае наш интервал будет иметь
вид (7- ∆;7+ ∆).

Значение t мы берем из таблицы Лапласа. Там нам надо


найти значение 99/2=0.495.

6
7
Можем сделать вывод, что t примерно
равно 2.575.

Подставив это значение в нашу формулу получим, что


2.575=1,0512.
С этими данными можем посчитать доверительный
интервал: (7 - 1.0512 ; 7 + 1.0512).
Ответ: (5,9488;8,0512)

8
Решим данную задачу в R.
Для работы с доверительными интервалами
понадобится библиотека DescTools.

9
Воспользуемся функцией MeanCI().

Первым параметром передаем нашу выборку, второй


параметр – стандартное отклонение, которое мы
получили, зная дисперсию. И последний параметр –
уровень доверия.

Видим, что результаты совпали, за исключением


точности округлений.

10
Посмотрим, какие еще есть функции в языке R, которые
мы можем использовать для работы с доверительными
интервалами.

11
Пример 2.
Найти доверительный интервал оценки
математического ожидания нормального распределения
с надежностью 0,95, зная выборочную среднюю = 75.12,
объем выборки n=121 и среднее квадратичное
отклонение = 11.

12
Решение: Для того, чтобы решить данную задачу в R нужно
будет сгенерировать само нормальное распределение со
средним значением 75.12 и объемом 121. А затем для этого
распределения определить доверительный интервал. В
общем это можно сделать одной командой.

Если сравним данную команду с предыдущей, то заметим,


что пропал параметр conf.level. Произошло это потому, что
по умолчанию он уже задан как 0.95 и указывать это еще
раз нет надобности.

13
Для решения вручную тоже много делать не надо. Почти вся
необходимая информация у нас есть. По таблице найдем значение t,
равное 1.96.
Чтобы получить это значение находим в таблице значение 0.95/2=0,475.
Остальные все параметры известны из условия.
По уже известной формуле высчитываем дельту:

Подставив значения в формулу: (75.12- ∆;75.12+ ∆) = (75.12- 1.96;75.12+


1.96)
Получаем, что доверительный интервал равен (73.16 ; 77.08).
Результаты совпали, что свидетельствует о правильности решения.

14
Вывод:
Доверительный интервал – это интервал, который с
заданной вероятностью накрывает оцениваемый
параметр генеральной совокупности. Такой интервал
несложно высчитать и вручную, но намного проще сделать
это в R. Для этого существует большое количество
стандартных функций, с работой некоторых мы уже
ознакомились.
Значения доверительного интервала дают много полезной
информации, которую можно использовать в своих
исследованиях относительно конкретно решаемой задачи.

15

Вам также может понравиться