Вы находитесь на странице: 1из 6

Тема 9: Оценивание параметров распределения

Доверительные интервалы
Цель лекции: Изучить точечные и интервальные оценки параметров
распределения, определять границы доверительных интервалов. Освоить
основные этапы проверки статистических гипотез.
Основные вопросы:
1 Точечная оценка.
2 Интервальная оценка.
3 Доверительные интервалы.

Доверительные интервалы
Вычисление выборочных статистических показателей в качестве оценки
параметров генеральной совокупности дает в результате нам то, что мы знаем как
точечную оценку (point estimates). Однако нам известно, что эта точечная оценка будет
сделана с некоторой ошибкой, называемой оценочной ошибкой (estimation error).
Следовательно, нам нужен механизм, который бы позволил определить степень
доверия к этим точечным оценкам. Таким образом, мы подошли к понятию
доверительного интервала (confidence interval) или интервальной оценки.
Проиллюстрируем принцип доверительных интервалов, применив его к средней, также мы
адаптируем процесс определения объема выборки, необходимого для получения заданной
степени доверия.

Точный доверительный интервал


С помощью z-значений можно точнее оценить доверительный интервал и определить
общую форму доверительного интервала. Точная формулировка доверительного интервала
для выборочного среднего имеет следующий вид:
   
 x  Z1 / 2 , x  Z1 / 2 .
 n n

Таким образом, для случайной выборки 25 наблюдений, удовлетворяющих нормальному


распределению, с   4 доверительный интервал выборочного среднего имеет следующий
вид:
 4 4 
  x  Z10.5 / 2 , x  Z10.5 / 2 
 25 25 
 x  1.96  0.8 , x  1.96  0.8
 x  1.568
Таким образом, на 95% можно быть
уверенным, что значение  лежит в
пределах ±1,568 единицы от
выборочного среднего. С помощью
такого же метода можно определить, что 99%-ный доверительный интервал лежит в
пределах ±2,0608 единицы от выборочного среднего
1
значение Таким образом, имеем и отсюда
, Аналогично получаем нижний предел, который равен
Например, 95%а доверительные пределы для веса упаковок с шоколадом производства
компании «Даунбрукс», где средний вес составляет 400 г, а среднеквадратическое
отклонение — 20 г, равны , или от 360.8 до
439.2 г. Итак, мы можем быть на 95% уверены, что вес упаковки с шоколадом находится
в пределах от 360.8 до 439.2
Данный подход лежит в основе ряда методов контроля качества, используемых в
промышленности и производстве. Доверительные пределы служат ориентиром в том,
что касается ожидаемого диапазона для конкретных переменных. Любое значение,
оказавшееся в ходе исследования за пределами этого ожидаемого диапазона,
можно считать подозрительным, и за этим может последовать более тщательная
проверка общего «качества» продукции.

Доверительные интервалы для средней (большая выборка)


Проблема состоит в том, что мы не знаем среднюю генеральной совокупности, и
нам известна только выборочная средняя. Тем не менее, согласно центральной предель-
ной теореме мы знаем, что выборочное распределение средних имеет среднее значение,
которое в свою очередь равно генеральной средней, а среднее квадратическое отклонение
(стандартная ошибка) равно , где — среднее квадратическое отклонение в
генеральной совокупности.
Но появляется другая проблема — мы не знаем величины среднего квадратического
отклонения в генеральной совокупности, нам известно только выборочное среднее
квадратическое-отклонение. Однако здесь можно применить другую часть теории
выборочного наблюдения, согласно которой наилучшей оценкой является:

(5.5)

Другими словами, при условии, что выборочное среднее квадратическое отклонение


найдено при использовании в качестве делителя, является несмещенной оценкой
среднего квадратического отклонения генеральной совокупности. Доказательство этого
утверждения рассмотрено в приложении 5.1.
Известно, что для нормально распределенной величины 95% наблюдений будет находиться
выше или ниже средней не более, чем на 1,96
среднего квадратического отклонения. Так как
средние квадратические отклонения
выборочных распределений средних
называются стандартными ошибками, мы
можем сказать, что выборочная средняя в 95%
случаев будет находиться внутри интервала,
равного генеральной средней плюс/минус
1,96 стандартной ошибки. Формула
доверительного интервала выглядит так:
(5.6)
где — выборочное среднее квадратическое отклонение.

Наглядно это может быть проиллюстрировано с помощью рис. 5.1 ( —


стандартная ошибка). График показывает, что в 95% случаев (2,5% в каждой из
2
граничных областей) выборочная средняя находится в пределах 1,96 стандартной
ошибки от генеральной средней. Данный интервал можно представить с 95%-ным
уровнем вероятности следующим образом:

(5.7)

Небольшое алгебраическое преобразование в двойном неравенстве даст:

(5.8)

Проиллюстрируем это с помощью конкретного примера. Допустим, что у нас есть


данные по 60 месячным наблюдениям доходности по индексу . Выборочная
средняя ежемесячной доходности равна 1,125% со средним квадратическим
отклонением 2,5%. Каким будет 95%-ный доверительный интервал для этой средней?
Сначала необходимо рассчитать стандартную ошибку.

Доверительный интервал будет:

Доверительный интервал можно проиллюстрировать с помощью рис. 5.2.


Уровень вероятности будет:

Каким образом аналитик используют эту информацию? Может ли он принять решение


относительно того, велик ли диапазон, содержащий в себе значение генеральной средней, с
точки зрения практического применения доверительного интервала?
Например, приведенный выше доверительный интервал покрывает отрезок от 0,4925 до
1,7775%, т.е., размах составляет 1,265%, что больше по величине самой средней.

3
Ясно, что аналитик может не согласиться с таким широким размахом и предпочтет его
уменьшить. При условии, что выборочная средняя фиксирована, а значение 1,96 привязано
к 95%-ной вероятности, переменной, с помощью которой возможно изменить значение
размаха, является стандартная ошибка, которая зависит от выборочного среднего
квадратического отклонения и объема выборки. Таким образом, единственный способ
уменьшить значение стандартной ошибки — это увеличить объем выборки.
Чтобы проиллюстрировать влияние объема выборки, рассмотрим пример, приведенный
выше, но с объемом выборки, увеличенным до 120, выборочное среднее квадратическое
отклонение останется неизменным —2,5. Тогда стандартная ошибка будет:

А доверительный интервал составит:

т.е. размах равен уже 0,8946.

Как поступать с малыми выборками?


Центральная предельная теорема может быть использована для доказательства
утверждения о том, что выборочная средняя нормально распределена при условии, что
объем выборки больше 30. В случае с малыми выборками необходимо допустить, что мы
производим выборку из нормально распределенной совокупности для того, чтобы
выборочная средняя была нормально распределена. Кроме того, только при выборках
малого объема наша оценка генеральной дисперсии не будет, надежной. В этом случае t-
распределение позволит сделать поправку на эту дополнительную степень изменчивости.
Так же, как и нормальное распределение, -распределение симметрично, но чуть более
пологое. Действительная форма распределения зависит от числа степеней свободы,
определяемых . С увеличением объема выборки -распределение становится более
похожим на нормальное.
Таким образом, двусторонний доверительный интервал для малой выборки будет
представлен так:

(5.9)

где

Уровень вероятности, относящийся к этому доверительному интервалу, выглядит так:

(5.10)

Для иллюстрации использования t-критерия приведем вычисление средней квартальной


доходности для определенной группы менеджеров, работающих на фондовых рынках.

4
Согласно проведенным 20 наблюдениям (т.е. 20—1 = 19 степеней свободы) выборочная
средняя равна 4,5%. Выборочное среднее квадратическое отклонение составляет 5%. Для
95%-ного уровня доверия доверительный интервал будет:

Уровень вероятности имеет вид:

Доверительный интервал для дисперсии


Выше мы отмечали, что выборочное распределение дисперсии следует, после
соответствующего преобразования, -распределению. Для определения доверительных
интервалов для дисперсии нам важно знать не столько само выборочное распределение
дисперсии, сколько выборочное распределение этой величины, приведенное к стандартной
форме следующим образом:

(5.12)

Для того чтобы найти 95%-ный доверительный


интервал для точечной оценки дисперсии,
мы должны определить значение ,
задающее по 2,5% в каждой из граничных
площадей под кривой распределения (рис. 5.3).
Таким образом, мы должны знать величину
для 97,5% значений, лежащих справа, и
другую величину — для 2,5% значений,
лежащих справа. Если обозначить степень
доверия через , тогда нам необходимы
величины и . Если мы работаем с 95%-ным уровнем
доверительной вероятности, тогда значение а будет 0,05, a значения хи-квадрат будут
соответствовать и

Доверительный интервал определяется так:

(5.13)

и уровень вероятности будет выглядеть следующим образом:

(5.14)

Для иллюстрации расчетов предположим, что согласно выборке объемом в 30


ежемесячных наблюдений дисперсия индекса составляет 0,0225. Для 29 (

5
)степеней свободы критические значения -распределения при 2,5% в
каждой из двух критических областей равны 45,72 и 16,05, тогда

Доверительный интервал для среднего квадратического отклонения находится


извлечением квадратного корня из границ доверительного интервала для дисперсии,
т.е.

Вам также может понравиться