Вы находитесь на странице: 1из 57

АЛМАТИНСКИЙ ФИЛИАЛ НЕГОСУДАРСТВЕННОГО ОБРАЗОВАТЕЛЬНОГО

УЧРЕЖДЕНИЯ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ


«САНКТ-ПЕТЕРБУРГСКИЙ ГУМАНИТАРНЫЙ УНИВЕРСИТЕТ ПРОФСОЮЗОВ»

С.Ж. КАРАТАБАНОВА, Л.А. ХАРАСАХАЛ

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

К ПРАКТИЧЕСКИМ ЗАНЯТИЯМ

Алматы
2013
АЛМАТИНСКИЙ ФИЛИАЛ НЕГОСУДАРСТВЕННОГО ОБРАЗОВАТЕЛЬНОГО
УЧРЕЖДЕНИЯ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«САНКТ-ПЕТЕРБУРГСКИЙ ГУМАНИТАРНЫЙ УНИВЕРСИТЕТ ПРОФСОЮЗОВ»

С.Ж. КАРАТАБАНОВА, Л.А. ХАРАСАХАЛ

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

К ПРАКТИЧЕСКИМ ЗАНЯТИЯМ

Алматы
2013
Рецензенты:
Хомпыш Х., кандидат физико-математических наук,
старший преподаватель Казахского Национального
университета им. Аль-Фараби

Тимошенко В.Ф., кандидат экономических наук, доцент


Алматинского филиала НОУ ВПО «Санкт-Петербургский
Гуманитарный университет профсоюзов»

Авторы-составители:
КАРАТАБАНОВА С.Ж., кандидат физико-математических наук,
доцент Алматинского филиала НОУ ВПО
«Санкт-Петербургский Гуманитарный университет профсоюзов»

ХАРАСАХАЛ Л.А., старший преподаватель


Алматинского филиала НОУ ВПО
«Санкт-Петербургский Гуманитарный университет профсоюзов»

Методические указания к проведению практических занятий


предназначены в помощь студентам для более глубокого практического
освоения дисциплины «Математическая статистика». Они включают краткий
теоретический материал, примеры решения задач, задания для
самостоятельной работы и варианты контрольных заданий

Рекомендовано к печати
Методическим советом Алматинского филиала НОУ ВПО
«Санкт-Петербургский Гуманитарный университет профсоюзов»
от « 22 » мая 2013 г. Протокол № 6.

© Каратабанова С.Ж., Харасахал Л.А., 2013.


© АФ НОУ ВПО «СПбГУП», 2013.

2
СОДЕРЖАНИЕ

ВВЕДЕНИЕ …………………………………………………………………... 4
1. Выборочный метод ………………………………………………… 6
2. Примеры решения задач …………………………………………... 12
3. Задачи для самостоятельной работы …………………………… 22
4. Семестровые задания ………………………………………………. 26
5. Теоретические сведения …………………………………………… 29
ГЛОССАРИЙ………………………………………………………………….. 52
СПИСОК ЛИТЕРАТУРЫ ……………………………………………….…. 54

3
ВВЕДЕНИЕ

Основной задачей математической статистики является разработка


методов получения научно обоснованных выводов о массовых явлениях и
процессах из данных наблюдений и экспериментов. Эти выводы и
заключения относятся не к отдельным испытаниям, из повторения которых
складывается данное массовое явление, а представляют собой утверждения
об общих вероятностных характеристиках данного процесса, то есть о
вероятностях, законах распределения, математических ожиданиях,
дисперсиях и т. д. Такое использование фактических данных как раз и
является отличительной чертой статистического метода.
С другой стороны, говоря о законах распределения случайных величин,
теория вероятностей не затрагивает вопроса о том, откуда берутся или на
каком основании устанавливаются эти законы распределения. Ответ на
вопрос вполне определенен – в основе всех этих характеристик лежит опыт;
каждое исследование случайных явлений, выполняемое методами теории
вероятностей, прямо или косвенно опирается на экспериментальные данные.
Оперируя такими понятиями, как события и их вероятности, случайные
величины, их законы распределения и числовые характеристики, теория
вероятностей дает возможность теоретическим путем определять
вероятности одних событий через вероятности других, законы распределения
и числовые характеристики одних случайных величин через законы
распределения и числовые характеристики других. Такие косвенные методы
позволяют значительно экономить время и средства, затрачиваемые на
эксперимент, но отнюдь не исключают самого эксперимента. Каждое
исследование в области случайных явлений, как бы отвлеченно оно ни было,
корнями своими всегда уходит в эксперимент, в опытные данные, в систему
наблюдений.
Основные требования к входным знаниям и умениям студента - это
знание элементарной математики: алгебры, геометрии, элементарных
функций.
Освоение дисциплины «Математическая статистика» необходимо для
таких дисциплин, как: макроэкономика, микроэкономика, теория
отраслевых рынков, экономика общественного сектора, институционная
экономика, эконометрика, методы оптимальных решений, теория
статистики, исследование операций, математическая экономика,
математические методы в психологии.
Процесс изучения дисциплины направлен на формирование у студента
любой специальности следующих компетенций:

4
ОК-2 - способность логически верно, аргументировано и ясно строить
устную и письменную речь, владеть навыками ведения дискуссии и
полемики;
ОК-5 - способность самостоятельно приобретать и использовать в
практической деятельности новые знания и умения, стремиться к
саморазвитию;
ПК-3 - способность использовать основные законы
естественнонаучных дисциплин в профессиональной деятельности и
эксплуатировать современное электронное оборудование и информационно-
коммуникационные технологии в соответствии с целями образовательной
программы бакалавриата;
Процесс изучения дисциплины направлен на формирование у
студентов специальностей «Экономика» и «Прикладная информатика»
следующих компетенций:
ПК-5 - способность осуществлять и обосновывать выбор проектных
решений по видам обеспечения информационных систем;
ПК-10 - способность применять к решению прикладных задач базовые
алгоритмы обработки информации, выполнять оценку сложности
алгоритмов, программировать и тестировать программы;
ПК-14 - способность принимать участие в реализации
профессиональных коммуникаций в рамках проектных групп, презентовать
результаты проектов и обучать пользователей ИС;
ПК-15 - способность проводить оценку экономических затрат на
проекты по информатизации и автоматизации решения прикладных задач;
ПК-16 - способность оценивать и выбирать современные операционные
среды и информационно-коммуникационные технологии для
информатизации и автоматизации решения прикладных задач и создания ИС;
ПК-17 - способность применять методы анализа прикладной области на
концептуальном, логическом, математическом и алгоритмическом уровнях;
ПК-18 - способность анализировать, выбирать методы и средства
обеспечения информационной безопасности.

5
СОДЕРЖАНИЕ ДИСЦИПЛИНЫ

1.ВЫБОРОЧНЫЙ МЕТОД
Пусть нам нужно обследовать количественный признак в партии
экземпляров некоторого товара. Проверку партии можно проводить двумя
способами:
1) провести сплошной контроль всей партии;
2) провести контроль только части партии.
Первый способ не всегда осуществим, например, из–за большого числа
экземпляров в партии, из–за дороговизны проведения операции контроля,
из–за того, что контроль связан с разрушением экземпляра (проверка
электролампы на долговечность ее работы).
При втором способе множество случайным образом отобранных
объектов называется выборочной совокупностью, или выборкой. Все
множество объектов, из которого производится выборка, называется
генеральной совокупностью. Число объектов в выборке называется объемом
выборки. Обычно будем считать, что объем генеральной совокупности
бесконечен.
Выборки разделяются на повторные (с возвращением) и бесповторные
(без возвращения).
Обычно осуществляются бесповторные выборки, но благодаря
большому (бесконечному) объему генеральной совокупности ведутся
расчеты и делаются выводы, справедливые лишь для повторных выборок.
Выборка должна достаточно полно отражать особенности всех
объектов генеральной совокупности, иначе говоря, выборка должна быть
репрезентативной (представительной).
Выборки различаются по способу отбора.
1. Простой случайный отбор.
Все элементы генеральной совокупности нумеруются и из таблицы
случайных чисел берут, например, последовательность любых 30-ти идущих
подряд чисел. Элементы с выпавшими номерами и входят в выборку.
2. Типический отбор.
Такой отбор производится в том случае, если генеральную
совокупность можно представить в виде объединения подмножеств, объекты
которых однородны по какому–то признаку, хотя вся совокупность такой
однородности не имеет (партия товара состоит из нескольких групп,
произведенных на разных предприятиях). Тогда по каждому подмножеству
проводят простой случайный отбор, и в выборку объединяются все
полученные объекты.
3. Механический отбор.
Отбирают каждый двадцатый (сотый) экземпляр.
4. Серийный отбор.
В выборку подбираются экземпляры, произведенные на каком–то
производстве в определенный промежуток времени.

6
В дальнейшем под генеральной совокупностью мы будем
подразумевать не само множество объектов, а множество значений
случайной величины, принимающей числовое значение на каждом из
объектов. В действительности генеральной совокупности как множества
объектов может и не существовать. Например, имеет смысл говорить о
множестве деталей, которые можно произвести, используя данный
технологический процесс. Используя какие–то известные нам
характеристики данного процесса, мы можем оценивать параметры этого
несуществующего множества деталей. Размер детали – это случайная
величина, значение которой определяется воздействием множества факторов,
составляющих технологический процесс. Нас, например, может интересовать
вероятность, с которой эта случайная величина принимает значение,
принадлежащее некоторому интервалу. На этот вопрос можно ответить, зная
закон распределения этой случайной величины, а также такие ее параметры,
как M и D.
Итак, отвлекаясь от понятия генеральной совокупности как множества
объектов, обладающих некоторым признаком, будем рассматривать
генеральную совокупность как случайную величину , закон распределения и
параметры которой определяются с помощью выборочного метода.
Рассмотрим выборку объема n, представляющую данную генеральную
совокупность. Первое выборочное значение x1 будем рассматривать как
реализацию, как одно из возможных значений случайной величины 1,
имеющей тот же закон распределения с теми же параметрами, что и
случайная величина . Второе выборочное значение x2 – одно из возможных
значений случайной величины 2 с тем же законом распределения, что и
случайная величина . То же самое можно сказать о значениях x3, x4,..., xn .
Таким образом, на выборку будем смотреть как на совокупность
независимых случайных величин 1, 2, ..., n, распределенных также, как и
случайная величина , представляющая генеральную совокупность.
Выборочные значения x1, x2, ..., xn – это значения, которые приняли эти
случайные величины в результате 1-го, 2-го, ..., n-го эксперимента.
Пусть для объектов генеральной совокупности определен некоторый
признак или числовая характеристика, которую можно замерить (размер
детали, удельное количество нитратов в дыне, шум работы двигателя). Эта
характеристика – случайная величина , принимающая на каждом объекте
определенное числовое значение. Из выборки объема n получаем значения
этой случайной величины в виде ряда из n чисел:
x1, x2,..., xn. (*)

Эти числа называются значениями признака.


Среди чисел ряда (*) могут быть одинаковые числа. Если значения
признака упорядочить, то есть расположить в порядке возрастания, написав

7
каждое значение лишь один раз, а затем под каждым значением xi признака
написать, сколько раз данное значение встречается в ряду (*):

x1 x2 x3 ... xk
m1 m2 m3 ... mk
то получится таблица, называемая дискретным вариационным рядом. Число
mi называется частотой i-го значения признака.
Очевидно, что xi в ряду (*) может не совпадать с xi в вариационном
ряду. Очевидна также справедливость равенства
k
 mi  n.
i 1

Если промежуток между наименьшим и наибольшим значениями


признака в выборке разбить на несколько интервалов одинаковой длины,
каждому интервалу поставить в соответствие число выборочных значений
признака, попавших в этот интервал, то получим интервальный
вариационный ряд. Если признак может принимать любые значения из
некоторого промежутка, то есть является непрерывной случайной величиной,
приходится выборку представлять именно таким рядом. Если в
вариационном интервальном ряду каждый интервал [i; i+1) заменить
лежащим в его середине числом (i+i+1)/2, то получим дискретный
вариационный ряд. Такая замена вполне естественна, так как, например, при
измерении размера детали с точностью до одного миллиметра всем размерам
из промежутка [49,5; 50,5), будет соответствовать одно число, равное 50.
Во многих случаях мы располагаем информацией о виде закона
распределения случайной величины (нормальный, бернуллиевский,
равномерный и т. п.), но не знаем таких параметров этого распределения, как
M, D. Для определения этих параметров применяется выборочный метод.
Пусть выборка объема n представлена в виде вариационного ряда.
Назовем выборочной средней величину
x1m1  x2m2 . . . xk mk m m m
x  x1 1  x2 2 . . . k .
n n n n

mi
Величина  i  называется относительной частотой значения
n
признака xi. Если значения признака, полученные из выборки, не
группировать и не представлять в виде вариационного ряда, то для
вычисления выборочной средней нужно пользоваться формулой

1 n .
x  xi
n i 1

8
Установление закономерностей, которым подчинены массовые
случайные явления, основано на изучении методами теории вероятностей
статистических данных – результатов наблюдений.
Современная математическая статистика разрабатывает способы
определения числа необходимых испытаний до начала исследования
(планирование эксперимента), в ходе исследования (последовательный
анализ) и решает многие другие задачи. Современную математическую
статистику определяют как науку о принятии решений в условиях
неопределенности.
Итак, задача математической статистики состоит в создании методов
сбора и обработки статистических данных для получения научных и
практических выводов.
Выборочной совокупностью, или просто выборкой, называют
совокупность случайно отобранных объектов.
Генеральной совокупностью называют совокупность объектов, из
которых производится выборка.
Объемом совокупности (выборочной или генеральной) называют число
объектов этой совокупности.
Например, если из 1000 деталей отобрано для обследования 100
деталей, то объем генеральной совокупности N  1000 , а объем выборки
n  100 .
Пусть из генеральной совокупности извлечена выборка, причем х1
наблюдалось n1 раз, x2 – n2 - раз, xk – nk - раз и  ni  n – объем выборки.
Определение. Наблюдаемые значения xi называют вариантами, а
последовательность вариант, записанных в возрастающем порядке, –
вариационным рядом. Числа наблюдений называют частотами, а их
ni
отношения к объему выборки  Wi – относительными частотами.
n
Определение. Статистическим распределением выборки называют
перечень вариант и соответствующих им частот или относительных частот.
Статистическое распределение можно задать также в виде
последовательности интервалов и соответствующих им частот (в качестве
частоты, соответствующей интервалу, принимают сумму частот, попавших в
этот интервал). Заметим, что в теории вероятностей под распределением
понимают соответствие между возможными значениями случайной
величины и их вероятностями, а в математической статистике – соответствие
между наблюдаемыми вариантами и их частотами, или относительными
частотами.
Пример 1. Задано распределение частот выборки объема n = 20:
xi 2 6 12
ni 3 10 7
Написать распределение относительных частот.
Решение. Найдем относительные частоты, для чего разделим частоты
на объем выборки:
9
3 10 7
W1   0,15 , W2   0,50 , W3   0,35 .
20 20 20
Напишем распределение относительных частот:
xi 2 6 12
Wi 0,15 0,5 0,35
Контроль: 0,15  0,5  0,35  1 .
Пусть известно статистическое распределение частот
количественного признака X . Введем обозначения:
n x – число наблюдений, при которых наблюдалось значение признака
меньшее х; n – общее число наблюдений (объем выборки).
В целях наглядности строят различные графики статистического
распределения и, в частности, полигон и гистограмму.
Полигоном частот называют ломаную, отрезки которой соединяют
точки ( x1 , n1 ) , ( x2 , n2 ) ,..., ( xk , nk ) . Для построения полигона частот на оси
абсцисс откладывают варианты xi , а на оси ординат – соответствующие им
частоты ni . Точки ( xi , ni ) соединяют отрезками прямых и получают полигон
частот.
Полигоном относительных частот называют ломаную, отрезки
которой соединяют точки ( x1 ,W1 ) , ( x2 ,W2 ) ,..., ( xk ,Wk ) . Для построения
полигона относительных частот на оси абсцисс откладывают варианты xi , а
на оси ординат – соответствующие им относительные частоты Wi . Точки
( xi ,Wi ) соединяют отрезками прямых и получают полигон относительных
частот.
В случае непрерывного признака целесообразно строить гистограмму,
для чего интервал, в котором заключены все наблюдаемые значения
признака, разбивают на несколько частичных интервалов длиной h и находят
для каждого частичного интервала ni – сумму частот вариант, попавших в i -
й интервал.
На рис. 1 изображен полигон относительных частот следующего
распределения:
X 1,5 3,5 5,5 7 ,5
W 0,1 0,2 0,4 0,3
Гистограммой частот называют ступенчатую фигуру, состоящую из
прямоугольников, основаниями которых служат частичные интервалы
ni
длиною h , а высоты равны отношению (плотность частоты).
h
Для построения гистограммы частот на оси абсцисс откладывают
частичные интервалы, а над ними проводят отрезки, параллельные оси
ni
абсцисс на расстоянии .
h

10
ni
Площадь i -го частичного прямоугольника равна h  ni – сумме
h
частот вариант i -го интервала; следовательно, площадь гистограммы частот
равна сумме всех частот, т. е. объему выборки.
На рис.2 изображена гистограмма частот распределения n  100 ,
приведенного в таблице 1.

Рис. 1 Рис.2.

Таблица 1
Частичный интервал Сумма частот вариант Плотность
длиною h  5 частичного интервала ni частоты ni
h
5-10 4 0,8
10-15 6 1,2
15-20 16 3,2
20-25 36 7,2
25-30 24 4,8
30-35 10 2,0
35-40 4 0,8
Гистограммой относительных частот называют ступенчатую фигуру,
состоящую из прямоугольников, основаниями которых служат частичные
Wi
интервалы длиною h, а высоты равны отношению (плотность
h
относительной частоты).
Для построения гистограммы относительных частот на оси абсцисс
откладывают частичные интервалы, а над ними проводят отрезки,
Wi
параллельные оси абсцисс на расстоянии . Площадь i -го частичного
h
Wi
прямоугольника равна h  Wi – относительной частоте вариант, попавших
h
в i -й интервал. Следовательно, площадь гистограммы относительных частот
равна сумме всех относительных частот, т.е. единице.

11
2. ПРИМЕРЫ РЕШЕНИЯ ЗАДАЧ

Задача №1. Вычислить центральный момент третьего порядка (3) по


данным таблицы:
Производительность 80.5 – 81.5 – 82.5 – 83.5 – 84.5 –
труда, м/час 81.5 82.5 83.5 84.5 85.5
Число рабочих 7 13 15 11 4
Решение:
Производитель- Число
XI mixi (xi-xср)3 (xi-xср)3mi
ность труда, м/час рабочих, mi
80.5 – 81.5 81 7 567 -6,2295 -43,6065
81.5 – 82.5 82 13 1066 -0,5927 -7,70515
82.5 – 83.5 83 15 1245 0,004096 0,06144
83.5 – 84.5 84 11 924 1,560896 17,16986
84.5 – 85.5 85 4 340 10,0777 40,31078
Итого: 50 4142 6,2304
x ср 
x m i i

4142
 82,84
m i 50

 *

 x i  x  * m1
3


6,2304
 0,1246
m
3
i 50

Ответ: 3=0,1246.

Задача №2. Во время контрольного взвешивания пачек чая


установлено, что средний вес у n=200 пачек чая равен x =26 гр., а S=1гр. В
предположении о нормальном распределении определить, у какого
количества пачек чая вес будет находиться в пределах от ( x  1) до ( x  1) .
Решение:
x  26
(1   1)
Р(25<x<27)=P 1 =2Ф(1)-1=0,3634
m=n*p=200*0,3634  73

Ответ: n=73.

12
Задача №3. На контрольных испытаниях n=17 было определено
x =3000 ч . Считая, что срок службы ламп распределен нормально с  =21 ч.,
определить ширину доверительного интервала для генеральной средней с
надежностью  =0,98.
Решение:
 
P( X  t    X t )   (t )   ,
n n
1
t  Ф (0,98)  2,33

x t  2988
n

x t  3011
n
Ответ: [2988<  <3012].

Задача №4. По данным контрольных испытаний n=9 ламп были


получены оценки x =360 и S=26 ч. Считая, что сроки службы ламп
распределены нормально, определить нижнюю границу доверительного
интервала для генеральной средней с надежностью   0,95 .
Решение:
S S
P( X  t    X t )   (t )   ,
n 1 n 1
t  St (0,95;9)  0,129
S
x t  358
n 1
Ответ: 358.

Задача №5. По результатам n=7 измерений средняя высота


сальниковой камеры равна x =40 мм, а S=1,8 мм. В предположении о
нормальном распределении определить вероятность того, что генеральная
средняя будет внутри интервала (0,98x;1,02x ) .
Решение:
S S 1,02 x  x 0,98x  x
P( x  t    x t )  Ф( )  Ф( )
n n S S
S
x  t2  0,98x
n
t2  1,17
S
x  t1  1,02 x
n
t1  1,17
P  Ф(t2 )  Ф(t1 )  0,516
Ответ: 0,516.

13
Задача №6. На основании выборочных наблюдений за
производительностью труда n=37 рабочих было вычислено x =400 метров
ткани в час, S=12 м/ч. В предположении о нормальном распределении найти
вероятность того, что среднее квадратическое отклонение будет находиться в
интервале от 11 до 13.
Решение:
2n 2n
P  (11    13)  P( S   S)  
2v  1  t 2v  1  t
  Ф 1 (t )
2n
S  11
2v  1  t
t  1,57
  Ф 1 (1,57)  0,8836

Ответ: P(11<<13)=0,8836.

Задача №7. С помощью критерия Пирсона на уровне значимости


=0,02 проверить гипотезу о биноминальном законе распределения на
основании следующих данных.

Mi 85 120 25 10
Mti 117 85 37 9
Решение:
mi miT (mi-miT)2 (mi-miT)2/ miT
85 117 1024 8,752137
120 85 1225 14,41176
25 37 144 3,891892
10 9 1 0,111111
27,1669
2факт.=(mi- miT)/ miT=27,17
2табл.= (=2, =0,02)=7,824
2факт>2табл
Ответ: Выдвинутая гипотеза о нормальном законе распределения
отвергается с вероятностью ошибки альфа.

Задача №8. По результатам n =4 измерений в печи найдено X X = 254


C. Предполагается, что ошибка измерения есть нормальная случайная
величина с  = 6 C. На уровне значимости  = 0.05 проверить гипотезу H0: 
= 250 C против гипотезы H1:  = 260 C. В ответе записать разность между
абсолютными величинами табличного и фактического значений выборочной
характеристики.

14
Решение:
1 > 0  выберем правостороннюю критическую область.
X  0
t набл   N (0;1)

t z2
2
2 0
t кр   (1  2 ), (t ) 
1
e 2
dz

t набл  0,66, t кр  1,64


Ответ: Т.к. используем правостороннюю критическую область и tкр > tнабл,
то на данном уровне значимости нулевая гипотеза не отвергается (|tкр| - |tнабл
|=0,98).

Задача №9. На основании n=5 измерений найдено, что средняя высота


сальниковой камеры равна X  51 мм, а S=1,2 мм. В предположении о
нормальном распределении вычислить на уровне значимости =0,01
мощность критерия при гипотезе H0 :   50 и H1 :   53.
Решение:
1 X  1
1    P(t  t кр )  [Ф()  Ф( n )] 
2 
1   1
 [1  Ф( 0 n  t кр )]  3,2
2 
t кр  Ф 1 (1  2 )  2,33
Ответ: 23.

Задача №10. На основании n = 15 измерений найдено, что средняя


высота сальниковой камеры равна X = 70 мм и S = 3. Допустив, что ошибка
изготовления есть нормальная случайная величина, на уровне значимости
 = 0.1 проверить гипотезу H0:  2  S 2  1 мм2 при конкурирующей гипотезе
 2  S 2  1 . В ответе записать разность между абсолютными величинами
табличного и фактического значений выборочной характеристики.
Решение:
 02   12  построим левостороннюю критическую область.
nS 2
 набл
2
  13,5
 02
P(  2   кр
2
(1   ; n  1))  1  
 кр2  5,368
Ответ :  набл
2
  кр
2
 , на данном уровне значимости нулевая гипотеза не

отвергается ( |  кр |  |  набл | 8,132 ).


2 2

Задача №11. По результатам n = 16 независимых измерений диаметра


поршня одним прибором получено X = 82.48 мм и S = 0.08 мм. Предположив,

15
что ошибки измерения имеют нормальное распределение, на уровне
значимости  = 0.1 вычислить мощность критерия гипотезы H0:  2  0.01 при
конкурирующей гипотезе H1:  2  0.005.
Решение:
 02   12  построим левостороннюю критическую область.
 02 2
1    1  P(   2  кр (1   ; n  1))  0.23
2

1
Ответ: 23.

Задача №12. Из продукции двух автоматических линий взяты


соответственно выборки n1 = 16 и n2 = 12 деталей. По результатам
выборочных наблюдений найдены X 1 = 180 мм и X 2 = 186 мм.
Предварительным анализом установлено, что погрешности изготовления есть
нормальные случайные величины с дисперсиями  1  6 мм2 и  2  11 мм2.
2 2

На уровне значимости  = 0.025 проверить гипотезу H0: 1 = 2 против


H1: 1 < 2.
Решение:
Т.к. H1: 1 < 2, то используем левостороннюю критическую область.
X1  X 2
t набл   4,96
 12  22

n1 n2
t z2
2 
t кр   (1  2 ), (t )  e
1 2
dz
2 0

t кр  1,96
Ответ : | t набл | t кр  , гипотеза отвергается при данном уровне значимости.

Задача №13. Из двух партий деталей взяты выборки объемом n1 = 16 и


n2 = 18 деталей. По результатам выборочных наблюдений найдены X 1 = 260
мм, S1 = 6 мм, X 2 = 266 мм и S2 =7 мм. Предполагая, что погрешности
изготовления есть нормальные случайные величины и  1   2 , на уровне
значимости  = 0.01 проверить гипотезу H0: 1 = 2 против H1: 1  2.
Решение:
X1  X 2 n1 n 2
t набл   2,587
n1 S12  n 2 S 22 n1  n 2
n1  n 2  2
t кр  St 1 ( ;  n1  n 2  2)  2,750

Ответ: | t набл | t кр  , при данном уровне значимости гипотеза не


отвергается.

16
Задача №14. Из n1 = 200 задач первого типа, предложенных для решения,
студенты решили m1 = 152, а из n2 = 250 задач второго типа студенты решили
m2 = 170 задач. Проверить на уровне значимости  = 0.05 гипотезу о том, что
вероятность решения задачи не зависит от того, к какому типу она относится,
т.е. H0: P1 = P2. В ответе записать разность между абсолютными величинами
табличного и фактического значений выборочной характеристики.
Решение:
 mi
pi  , p1  0.76, p 2  0.68
ni
l

 m i
p i 1
l
 0.716
n
i 1
i

1 l  
 набл
2
    ( p  p) i
2
ni  3,55
p (1  p ) i 1

P (  2   кр
2
( , l  1))  
 кр2  3,841
Ответ :  набл   кр  нулевая гипотеза при данном уровне значимости
2 2

принимается ( |  кр |  |  набл | 0,29 ).


2 2

Задача №15. Вычислить центральный момент третьего порядка (3*) по


данным таблицы:
Урожайность
34,5-35,5 34,5-36,5 36,5-37,5 37,5-38,5 38,5-39,5
(ц/га), Х
Число хозяйств,
4 11 20 11 4
mi
Решение:
Урожайность Число колхозов,
Xi mixi (xi-xср)3 (xi-xср)3mi
(ц/га), Х mi
34,5-35,5 4 35 140 -8 -32
34,5-36,5 11 36 396 -1 -11
36,5-37,5 20 37 740 0 0
37,5-38,5 11 38 418 1 11
38,5-39,5 4 39 156 8 32
Итого: 50 - 1850 - 0
x
x m i i

1850
 37
m i 50

17
 *

 x  x  i
3


0
0
m
3
i 50
Ответ: 3*=0.

Задача №16. В результате анализа технологического процесса получен


вариационный ряд:

Число дефектных изделий 0 1 2 3 4

Число партий 79 55 22 11 3

Предполагая, что число дефектных изделий в партии распределено по


закону Пуассона, определить вероятность появления 3 дефектных изделий.
Решение:

m 0 1 2 3 4
p 0.4647 0.3235 0.1294 0.0647 0.0176

m x 0.3235  0.2528  0.1941  0.0704 0.8408
i i
   0.016816
n 50 50
 j   0.016816 3  0.016816 4.755 10 6
P  P( x  j )  e  e   0.9833  7.79 10  7
j! 3! 6
Ответ: P=7.79*10-7.

Задача №17. В предложении о нормальной генеральной совокупности с


=5 сек., определить минимальный объем испытаний, которые нужно
провести, чтобы с надежностью =0.96 точность оценки генеральной средней
 времени обработки зубчатого колеса была равна =2 сек.
Решение:
   
P x  t    x t   Ф(t )  
 n n

 (t )  0.48

t   1 (0.48)  2.05

t 
n
5
2.055 2
n
n=(5.1375)3=26.3927
Ответ: n=27.

18
Задача №18. На основании измерения n=7 деталей вычислена
выборочная средняя и S=8 мк. В предположении, что ошибка изготовления
распределена нормально, определить с надежностью =0.98 точность оценки
генеральной средней.
Решение:
t  St 1 (0.98)  1.131
 S S 
 x  t     x t   
 
 n 1 n 1 
S 8
t  0.131  0.4278
n 1 6

St(t,=n-1)==St(t,6)=0.98

Ответ: =0.4278.

Задача №19. На основании n=4 измерений температуры одним


прибором определена S=9 С. Предположив, что погрешность измерения есть
нормальная случайная величина, определить с надежностью =0.9 нижнюю
границу доверительного интервала для дисперсии.
Решение:
 nS 2 nS 2 

 2    2
2


 2 1   22  7.815
 
  2   22  1 1     1 1  0.9   0.05
2 2
nS 2
49 2
324
   41.4587
2
2
7.815 7.815
Ответ: 41.4587.

Задача №20. Из 400 клубней картофеля, поступивших на контроль, вес


100 клубней превысил 50 г. Определить с надежностью =0.98 верхнюю
границу доверительного интервала для вероятности того, что вес клубня
превысит 50 г.
Решение:
m pq m pq 
  t  p  t    (t )

 n n n n 
 (t )  0.98  0.49
2
t=2.33

19
m pq 1 0.25  0.75
t   2.33  0.3
n n 4 400
Ответ: 0.3.

Задача №21. По результатам 100 опытов установлено, что в среднем для


сборки вентиля требуется Xср=30 сек., а S=7 сек. В предположении о
нормальном распределении определить с надежностью =0.98 верхнюю
границу для оценки  генеральной совокупности.
Решение:
 2n 2n 
 S    S    (t )  
 2  1  t 2  1  t 
 (t )  0.98  0.49
2
t=2.33

2n 2 100
S   7  8.457
2  1  t 2  99  1  2.33
Ответ: 8.457.

Задача №22. Гипотезу о нормальном законе распределения проверить с


помощью критерия Пирсона на уровне значимости =0.05 по следующим
данным:

mi 6 13 22 28 15 3
miT 8 17 29 20 10 3

Решение:
mi miT (mi-miT)2 (mi-miT)2/ miT
6 8 4 0.5
13 17 16 0.941
22 29 49 1.6897
28 20 64 3.2
15 10
25 1.9231
3 3
Итого: - - 8.2537

 кр2  5.991 (  2,   0.05)


 набл
2
  кр2 значит отвергаем

20
  2
набл  8.2537
Ответ: -2.2627.

 набл
2
  кр2  5.991  8.2537  2.2627
Задача №23. Вычислить дисперсию.
Производительность Число рабочих Средняя производительность
труда труда
81,5-82,5 9 82
82,5-83,5 15 83
83,5-84,5 16 84
84,5-85,5 11 85
85,5-86,5 4 86
Итого 55


S 2   xi  x  m /m
2

i i

x
x mi i

82 * 9  83 * 15  84 * 16  85 * 11  86 * 4
 83,75
m i 55
(82  83,75) 2 * 9  (83  83,75) 2 * 15  (84  83,75) 2 * 16  (85  83,75) 2 * 11  (86  83,75) 2 * 4
S2  
55
27,56  8,44  1  17,19  20,25 74,44
   1,35.
55 55
Решение:
Ответ: 1,35.

Задача №24. Используя результаты анализа и предполагая, что число


дефектных изделий в партии распределено по закону Пуассона, определить
теоретическое число партий с тремя дефектными изделиями.

m 0 1 2 3 4 5 Итого
fi 164 76 40 27 10 3 320
Pm 0,34 0,116 0,026 0,004 0,001
Pm*fi 288,75 25,84 4,64 0,702 0,04 0,003 320
fi теор. 288 26 5 1 0 0 320
Решение:
m – число дефектных изделий в партии,
fi – число партий,
fi теор. = теоретическое число партий

21
e   m
Pm 
m!
76  80  81  40  15
x  0,68
320
e 0, 68  0,5
Теоретическое значение числа партий получается округлением Pm*fi.
Соответственно, теоретическое количество партий с тремя дефектными
изделиями равно 1.
Ответ: 1.

3. ЗАДАЧИ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ


y
Задача №1. Найти выборочное уравнение прямой y x  y  r x  x 
x
регрессии Y на X по данной корреляционной таблице.
Х
Y 10 15 20 25 30 35 ny
20 1 5 - - - - 6
30 - 6 4 - - - 10
40 - - 7 40 3 50
50 - - 2 10 8 20
60 - - - 5 6 3 14
nx 1 11 13 55 17 3 n  100

y
Задача №2. Найти выборочное уравнение прямой y x  y  r x  x 
x
регрессии Y на X по данной корреляционной таблице.
X
Y 10 15 20 25 30 35 ny

30 3 3 - - - - 6
40 - 5 4 - - - 9
50 - - 8 40 2 - 50
60 - - 5 10 6 - 21
70 - - - 4 7 3 14
nx 3 8 17 54 15 3 n  100

22
y
Задача №3. Найти выборочное уравнение прямой y x  y  r x  x 
x
регрессии Y на X по данной корреляционной таблице.
Х
Y 25 30 35 40 45 50 ny

35 4 2 - - - - 6
45 - 5 3 - - - 8
55 - - 5 45 5 - 55
65 - - 2 8 7 - 17
75 - - - 4 7 3 14
nx 4 7 10 57 19 3 n  100

Задачи №4-5. Дано распределение признака X (случайной величины X),


полученной по п наблюдениям. Необходимо:
1) построить полигон (гистограмму) и эмпирическую функцию
распределения;
2) найти: а) среднюю арифметическую; б) медиану и моду; в)
дисперсию, среднее квадратическое отклонение и коэффициент вариации.

Задача №4. Х — число сделок на фондовой бирже за квартал; n=400


(инвесторов).
xi 0 1 2 3 4 5 6 7 8 9 10
ni 146 97 73 34 23 10 6 3 4 2 2

Задача №5. X — месячный доход жителя региона (в тенге); n=1000


(жителей).

Менее 2500- 5000- 7500- 10000- Свыше


xi 2500 5000 7500 10000 12500 12500

ni 58 96 239 328 147 132

Примечание: При наличии открытых интервалов значений Х типа


«менее х1» или «свыше x» для проведения расчетов их условно заменяют
интервалами той же ширины k, т.е. (х1 - k, х1)) или (хn, хn+k).

Задача №6. Для исследования доходов населения города,


составляющего 20 тыс. человек, по схеме собственно-случайной выборки
23
было отобрано 1000 жителей. Распределение жителей по месячному доходу
приведено в задаче 5.
1. Найти вероятность того, что средний месячный доход жителя города
отличается от среднего дохода его в выборке не более, чем на 225 тенге (по
абсолютной величине).
2. определить границы, в которых с вероятностью 0,99 заключён
средний месячный доход жителей города.
3. Каким должен быть объём выборки, чтобы те же границы
гарантировать с вероятностью 0,9973?

Задача №7. На уровне значимости 0,05 проверить гипотезу о


нормальном законе распределения признака X, используя критерий согласия
χ2 – Пирсона: а) по данным задачи 1; б) по данным задачи 2.

Задача №8. В таблице дано распределение 100 изделий по стоимости


готового изделия X (тыс. руб.) и стоимости сырья Y (тыс. руб.)
5,5- 10,5- 15,5- 20,5- 25,5- Итого
Y 0,5-5,5 10,5 15,5 20,5 25,5 30,5
x
5-15 7 11 - - - - 18
15-25 - 5 19 3 - - 27
25-35 - - 15 15 2 - 32
35-45 - - 5 6 4 - 15
45-55
5-45 - - - 1 4 3 8
Итого
C-/ 7 16 39 25 10 3 100
l)<^
Необходимо:
1. Вычислить групповые средние xi и yi и построить эмпирические
линии регрессии.
2. Предполагая, что между переменными Х и Y существует линейная
корреляционная зависимость:
а) найти уравнения прямых регрессии и построить их графики на одном
чертеже с эмпирическими линиями регрессии:
б) вычислить коэффициент корреляции, на уровне значимости α=0,05
оценить его достоверность (значимость) и сделать вывод о тесноте и
направлении связи между переменными Х и Y;
в) найти среднюю стоимость сырья при стоимости готового изделия 30
тыс. руб., используя соответствующее уравнение регрессии.

24
Задача №9. В таблице приведено распределение 200 рабочих завода по
стажу работы Х (лет) и затратам времени на обработку одной детали Y (мин.):
Y
Х 15-17 17-19 19-21 21-23 23-25 25-27 Итого
0-4 - - - - 3 5 8
4-8 - - - 12 10 3 25
8-12 - 2 18 25 5 - 50
12-16 - 5 32 18 - - 55
16-20 2 10 38 5 - - 55
20-24 5 2 - - - - 7
Итого 7 19 88 60 18 8 200
0
Необходимо:
1. Вычислить групповые средние xi и yi и построить эмпирические
линии регрессии.
2. Предполагая, что между переменными Х и Y существует линейная
корреляционная зависимость:
а) найти уравнения прямых регрессии и построить их графики на одном
чертеже с эмпирическими линиями регрессии;
б) вычислить коэффициент корреляции, на уровне значимости α=0,05
оценить его значимость и сделать вывод о тесноте и направлении связи
между переменными Х и Y;
в) используя соответствующее уравнение регрессии, оценить средний
стаж рабочих, затрачивающих на обработку детали 20 мин.

Задача №10. По результатам измерений длины n=76 плунжеров было


получено x =50 мм и S=7 мм. Определить с надежностью 0,85 верхнюю
границу для генеральной средней.

25
4. СЕМЕСТРОВЫЕ ЗАДАНИЯ

Задача №1.
а) изобразить графически данную таблицу частот;
б) найти несмещенные оценки математического ожидания и дисперсии
случайной величины Х – дневной выручки магазина;
в) построить эмпирическую функцию распределения случайной
величины Х – выручки магазина в случайно взятый день;
г) найти вероятность того, что в наудачу выбранный день выручка
составит не менее 20 у.е.;
д) с помощью критерия Пирсона проверить гипотезу о нормальном
распределении случайной величины Х – дневной выручки магазина при
уровне значимости ;
е) найти доверительные интервалы для оценки среднего значения и
среднего квадратического отклонения случайной величины Х с надежностью
.
Xi(y.e) 15 16 17 18 19 20 21 22 23 24
Данные к условию задачи:
№ N1 N2 N3 N4 N5 N6 N7 N8 N9 N10  
вар.
1 1 3 5 9 20 22 18 12 7 3 0,05 0,999
2 3 4 5 9 18 20 19 11 6 5 0,01 0,95
3 2 4 6 8 19 21 20 12 6 2 0,01 0,999
4 1 3 5 8 22 20 19 13 6 3 0,025 0,95
5 2 4 6 9 20 20 17 12 7 3 0,025 0,99
6 3 5 6 10 19 18 16 13 6 4 0,05 0,999
7 1 4 7 10 18 21 16 12 7 4 0,01 0,95
8 4 5 7 11 17 19 15 11 8 3 0,025 0,99
9 2 3 7 10 18 19 17 13 7 4 0,01 0,999
10 3 5 6 9 17 21 18 13 6 2 0,05 0,999
11 1 2 5 8 19 21 20 15 6 3 0,025 0,95
12 4 5 6 10 17 19 18 13 6 2 0,01 0,99
13 2 3 5 9 19 20 21 12 7 2 0,05 0,999
14 3 4 6 9 18 20 18 13 6 3 0,025 0,99
15 1 4 5 8 20 21 18 14 5 4 0,01 0,95
16 2 3 5 10 17 22 19 12 6 4 0,025 0,99
17 1 3 6 9 17 21 18 13 7 5 0,05 0,95
18 3 4 7 9 16 20 17 12 8 4 0,05 0,99
19 4 6 7 10 16 19 17 12 6 3 0,01 0,999
20 1 5 7 10 18 20 18 13 5 3 0,01 0,99
21 2 4 7 10 17 21 18 12 6 3 0,05 0,95

26
22 1 3 6 11 18 22 19 11 5 4 0,01 0,99
23 3 5 7 11 17 20 18 11 5 3 0,05 0,999
24 2 5 6 10 17 21 19 12 6 2 0,025 0,99
25 4 6 7 9 16 20 18 12 5 3 0,05 0,95
26 2 5 7 10 18 20 19 11 5 3 0,025 0,999
27 3 6 7 10 17 20 18 11 6 2 0,01 0,95
28 1 5 7 11 18 21 18 12 5 2 0,025 0,95
29 1 4 6 9 18 22 19 13 5 3 0,01 0,999
30 3 6 7 10 17 20 17 12 6 2 0,05 0,99

Задача №2.
Проводится исследование спроса на некоторый вид товара. Пробные
продажи показали следующие данные о зависимости дневного спроса от
цены:
Цена, ден. ед. p1 p2 p3 p4 p5
Спрос, ед. товара q1 q2 q3 q4 q5
Необходимо:
а) определить коэффициент корреляции между ценой P и спросом Q,
построить прямую регрессии Q на P;
б) используя прямую регрессии, определить спрос при цене p=p0 ден.
ед. за ед. товара.
Данные к условию задачи:
№ p1 p2 p3 p4 p5 q1 q2 q3 q4 q5 p0
вар.
1 4 5 6 7 8 19 17 15 15 13 10
2 11 13 15 17 19 90 75 70 58 52 14
3 15 16 17 18 19 32 29 28 25 23 12
4 20 22 24 26 28 11 10 8 7 6 25
5 7 8 9 10 11 41 35 29 23 19 12
6 9 11 13 15 17 76 66 61 52 45 16
7 14 15 16 17 18 45 41 36 30 20 13
8 22 24 26 28 30 35 31 28 25 20 31
9 11 13 15 17 19 85 83 80 68 52 18
10 15 16 17 18 19 39 33 29 23 19 10
11 14 15 16 17 18 45 44 42 39 35 19
12 9 11 13 15 17 91 79 61 52 45 8
13 20 22 24 26 28 17 15 15 12 11 25
14 4 5 6 7 8 38 35 29 28 25 11
15 11 13 15 17 19 76 68 61 55 45 10

27
16 7 8 9 10 11 28 25 21 18 17 6
17 20 22 24 26 28 38 31 29 25 15 30
18 14 15 16 17 18 38 34 30 25 20 12
19 22 24 26 28 30 19 18 18 16 13 25
20 9 11 13 15 17 70 65 59 58 50 10
21 11 13 15 17 19 67 65 59 55 52 16
22 15 16 17 18 19 26 24 20 19 15 14
23 4 5 6 7 8 19 15 13 7 5 3
24 22 24 26 28 30 40 35 32 25 21 18
25 9 11 13 15 17 68 63 55 50 46 19
26 20 22 24 26 28 31 28 25 19 15 15
27 4 5 6 7 8 40 35 27 23 19 9
28 15 16 17 18 19 65 56 54 45 43 21
29 11 13 15 17 19 75 72 70 63 53 25
30 7 8 9 10 11 52 44 37 35 30 4

28
5. ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ

5.1. СВОДНЫЕ ХАРАКТЕРИСТИКИ ВЫБОРКИ


Рассматривая x1 , x2 , ..., xn как независимые случайные
величины X 1 , X 2 , ..., X n , можно сказать, что найти статистическую оценку
неизвестного параметра теоретического распределения – это значит найти
функцию от наблюдаемых случайных величин, которая и дает
приближенно значение оцениваемого параметра.
Итак, статистической оценкой неизвестного параметра
теоретического распределения называют функцию наблюдаемых
случайных величин.
Пусть изучается дискретная генеральная совокупность
относительно количественного признака X .
Определение. Генеральной средней x называют среднее
арифметическое значений признака генеральной совокупности.
Если все значения x1 , x2 , ...., x N признака генеральной совокупности
объема N различны, то
x1  x 2    x N
x 
N
Если же значения признака x1 , x2 ,...., x k имеют соответственно частоты
N1 , N 2 , , N k ,
причем N1  N 2    N k  N , то
x1 N1  x 2 N 2    x k N k
x  ,
N
т.е. генеральная средняя есть средняя взвешенная значений признака с
весами, равными соответствующим частотам.
Если рассматривать обследуемый признак X генеральной
совокупности как случайную величину, то математическое ожидание
признака равно генеральной средней этого признака:
x  M ( X ) .
Пусть для изучения генеральной совокупности отно сительно
количественного признака X извлечена выборка объема n .
Определение. Выборочной средней xâ называют среднее
арифметическое значение признака выборочной совокупности.
Если все значения x1 , x2 , ..., x n признака выборки объема n
различны, то
x1  x2    xn
xв  .
n
Если же значения признака x1 , x2 , ..., x k имеют соответственно частоты
n1 , n2 , ..., n k , причем n1  n2  ....  nk  n, то
k

n1 x1  n2 x 2    nk x k
 ni x i
i 1
xв  , или xâ  ,
n n

29
т.е. выборочная средняя есть средняя взвешенная значений признака с
весами, равными соответствующим частотам.
Пусть из генеральной совокупности (в результате независимых
наблюдений над количественным признаком X ) извлечена повторная
выборка объема n со значениями признака x1 , x2 , ..., x n .
Рассмотрим совокупность, безразлично генеральную или выборочную,
значений количественного признака X объема n :
значение признака x1 x2  xk k
причем  ni n.
частота n1 n2  nk i 1
k
Далее для удобства записи знак суммы  будет заменен знаком .
i 1
Найдем общую среднюю
x
 ni x i
.
n
Отсюда
 ni xi  nx . (*)
Заметим, что поскольку x - постоянная величина, то

 ni x  x  ni  nx . (**)
Отклонением называют разность xi  x между значением признака и
общей средней.
Определение. Генеральной дисперсией D называют среднее
арифметическое квадратов отклонений значений признака генеральной
совокупности от их среднего значения x .
Если все значения x1 , x 2 , ..., x N признака генеральной совокупности
объема N различны, то
k
 ( xi  x  )
2

D  i 1 .
N
Если же значения признака x1 , x 2 , ..., x k имеют соответственно частоты
N 1 , N 2 , ..., N k , причем N1  N 2  ...  N k , то
k
 N i ( xi  x  )
2
i 1
D  ,
N
т. е. генеральная дисперсия есть средняя взвешенная квадратов отклонений с
весами, равными соответствующим частотам.
Пример. Генеральная совокупность задана таблицей распределения:
xi 2 4 5 6
Ni 8 9 10 3.

30
Найти генеральную дисперсию.
Решение. Найдем генеральную среднюю:

8  2  9  4  10  5  3  6 120
x    4.
8  9  10  3 30
Найдем генеральную дисперсию:

8  (2  4) 2  9  (4  4) 2  10  (5  4) 2  3  (6  4) 2 54
D    1,8 .
30 30
Кроме дисперсии для характеристики рассеяния значений признака
генеральной совокупности вокруг своего среднего значения пользуются
сводной характеристикой ‒ средним квадратическим отклонением.
Генеральным средним квадратическим отклонением (стандартом)
называют квадратный корень из генеральной дисперсии:
   D .
Для того чтобы охарактеризовать рассеяние наблюдаемых значений
количественного признака выборки вокруг своего среднего значения x в , вводят
сводную характеристику Dв , т.е. выборочную дисперсию.
Определение. Выборочной дисперсией Dв называют среднее арифмети-
ческое квадратов отклонения наблюдаемых значений признака от их среднего
значения x в .
Если все значения x1 , x 2 , ..., x n признака выборки объема n
различны, то
n
 ( xi  xв )
2

Dв  i 1
n
Если же значения признака x1 , x 2 , ..., xk имеют соответственно частоты
n1 , n 2 , ..., n k , причем n1  n 2  ...  nk  n , то
k
 ni ( xi  xв )
2

Dв  i 1 ,
n
т. е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с
весами, равными соответствующим частотам.
Пример. Выборочная совокупность задана таблицей распределения

xi 1 2 3 4
ni 20 15 10 5.
Найти выборочную дисперсию.
Решение. Найдем выборочную среднюю

20  1  15  2  10  3  5  4 100
xв   2.
20  15  10  5 50

31
Найдем выборочную дисперсию:
20  ( 1  2 ) 2  15  ( 2  2 ) 2  10  ( 3  2 ) 2  5  ( 4  2 ) 2 50
Dв    1.
50 50
Кроме дисперсии для характеристики рассеяния значений признака
выборочной совокупности вокруг своего среднего значения пользуются
сводной характеристикой – средним квадратическим отклонением.
Выборочным средним квадратическим отклонением (стандартом)
называют квадратный корень из выборочной дисперсии:
 в  Dв .
Вычисление дисперсии (безразлично выборочной или генеральной)
можно упростить, используя следующую теорему.
Теорема. Дисперсия равна среднему квадратов значений признака
минус квадрат общей средней
D  x 2  [x ]2 .
Пример. Найти дисперсию по данному распределению:

xi 1 2 3 4
ni 20 15 10 5.
Решение. Найдем общую среднюю:
20  1  15  2  10  3  5  4 100
x   2.
20  15  10  5 50
Найдем среднюю квадратов значений признака:
20  12  15  2 2  10  32  5  4 2
x2  5
50

Искомая дисперсия равна D  x 2  x 2  5  2 2  1 .


Кроме выборочной средней и выборочной дисперсии применяются и
другие характеристики вариационного ряда. Укажем главные из них.
Определение. Размахом варьирования R называют разность между
наибольшей и наименьшей вариантами:
R  xmax  xmin
Например, для ряда 1 3 4 5 6 10 размах равен 10  1  9 .
Размах является простейшей характеристикой рассеяния
вариационного ряда.
Определение. Средним абсолютным отклонением  называют среднее
арифметическое абсолютных отклонений:
 ni xi  xв
 .
 ni
Например, для ряда
xi 1 3 6 16
ni 4 10 5 1

32
среднее абсолютное отклонение служит для характеристики рассеяния
вариационного ряда.
Определение. Коэффициентом вариации V называют выраженное в
процентах отношение выборочного среднего квадратического отклонения к
выборочной средней:
в
V  100 %

Коэффициент вариации служит для сравнения величин рассеяния двух
вариационных рядов: тот из рядов имеет большее рассеяние, у которого
коэффициент вариации больше.
Предположим, что варианты выборки расположены в возрастающем
порядке, т.е. в виде вариационного ряда.
Равностоящими называют варианты, которые образуют
арифметическую прогрессию с разностью h .
Условными называют варианты, определяемые равенством:
xi  C
ui  ,
h
где C – ложный нуль (новое начало отсчета); h – шаг, т. е. разность между
любыми двумя соседними первоначальными вариантами (новая единица
масштаба).
Упрощенные методы расчета сводных характеристик выборки
основаны на замене первоначальных вариант условными.
Покажем, что если вариационный ряд состоит из равноотстоящих
вариант с шагом h , то условные варианты есть целые числа. Действительно,
выберем в качестве ложного нуля произвольную варианту, например, xm .
Тогда
x  xm x1  (i  1)h  [ x1  (m  1)h]
ui  i  im.
h h
Так как i и m – целые числа, то их разность i  m  u1 также есть целое
число.
Замечание 1. В качестве ложного нуля можно принять любую
варианту. Максимальная простота вычислений достигается, если выбрать в
качестве ложного нуля варианту, которая расположена примерно в середине
вариационного ряда (часто такая варианта имеет наибольшую частоту).
Замечание 2. Варианте, которая принята в качестве ложного нуля,
соответствует условная варианта, равная нулю.
Пример. Найти условные варианты статистического распределения
варианты 23,6 28,6 33,6 38,6 43,6
частоты 5 20 50 15 10
Решение. Выберем в качестве ложного нуля варианту 33,6 (она
расположена в середине вариационного ряда).

33
Найдем шаг h  28,6  23,6  5 .
x1  C 23,6  33,6
Найдем условную варианту u1    2 .
h 5
Аналогично получим u2  1 , u3  0 , u4  1 , u5  2 .
Для вычисления сводных характеристик выборки удобно пользоваться
эмпирическими моментами, определения которых аналогичны определениям
соответствующих теоретических моментов. В отличие от теоретических,
эмпирические моменты вычисляют по данным наблюдений.
Обычным эмпирическим моментом порядка k называют среднее
значение k степеней разностей xi  C :
M k 
 ni ( xi  C) k
.
n
где xi – наблюдаемая варианта; ni – частота варианты; n   ni – объем
выборки; C – произвольное постоянное число (ложный нуль).
Определение. Начальным эмпирическим моментом порядка k
называют обычный момент порядка k при C  0
 ni xi
M1   xв ,
n
т. е. начальный эмпирический момент первого порядка равен выборочной
средней.
Определение. Центральным эмпирическим моментом порядка k
называют обычный момент порядка k при C  xâ
mk 
 ni ( xi  xâ ) k
.
n
В частности,
 ni ( xi  xв )
2
m2   Dв ,
n
т. е. центральный эмпирический момент второго порядка равен выборочной
дисперсии.
Вычисление центральных моментов требует довольно громоздких
вычислений. Чтобы упростить расчеты, заменяют первоначальные варианты
условными.
Определение. Условным эмпирическим моментом порядка k называют
начальный момент порядка k , вычисленный для условных вариант:
k
 x C
 ni  i h 
M k* 
 i i 
n u k
 
.
n n
В частности,
 xi  C 
 ni  
M 1*   h   1   ni x i  C  n i   1  x  C  .
  B
n h n n  h

34
Отсюда
x B  M 1*  h  C .
Таким образом, для того чтобы найти выборочную среднюю,
достаточно вычислить условный момент первого порядка, умножить его на h
и к результату прибавить ложный нуль C .
Выразим обычные моменты через условные:
1  ni xi  C 
k M'
M k*    k.
hk n hk
Отсюда
M 'k  M *k h k

Таким образом, для того чтобы найти обычный момент порядка k ,


достаточно условный момент того же порядка умножить на h k .

5.2. ПОСТРОЕНИЕ НОРМАЛЬНОЙ КРИВОЙ ПО ОПЫТНЫМ


ДАННЫМ
Формула для вычисления выборочной дисперсии по условным
моментам первого и второго порядка имеет вид
 2
D  M *   M *   h 2 .
B  2  1 
 
Рассмотрим метод произведений, который дает удобный способ
вычисления условных моментов различных порядков вариационного ряда с
равностоящими вариантами, выборочной средней и выборочной дисперсии.
Целесообразно пользоваться расчетной таблицей, которая составляется так:
1) в первый столбец таблицы записывают выборочные
(первоначальные) варианты, располагая их в возрастающем порядке;
2) во второй столбец записывают частоты вариант: складывают все
частоты, а их сумму (объем выборки n ) помещают в нижнюю клетку
столбца;
xi  C
3) в третий столбец записывают условные варианты ui  , причем в
h
качестве ложного нуля C выбирают варианту с наибольшей частотой и
полагают h равным разности между любыми двумя соседними вариантами;
практически же третий столбец заполняется так: в клетке строки,
содержащей наибольшую частоту, пишут 0 ; в клетках над нулем пишут
последовательно  1,2,3 и т. д., а под нулем - 1,2,3 и т. д.;
4) умножают частоты на условные варианты и записывают их
произведения niui в четвертый столбец; сложив все полученные числа, их
сумму  ni ui помещают в нижнюю клетку столбца;
5) умножают частоты на квадраты условных вариант и записывают их
произведения ni ui 2 в пятый столбец; сложив все полученные числа, их сумму
 ni ui помещают в нижнюю клетку столбца;
2

35
6) умножают частоты на квадраты условных вариант, увеличенных
каждая на единицу, и записывают произведения ni ( ui  1)2 в шестой
контрольный столбец; сложив все полученные числа, их сумму  ni ( ui  1)2
помещают в нижнюю клетку столбца.
После того, как расчетная таблица заполнена и проверена правильность
вычислений, вычисляют условные моменты:
 ni ui  niui2 .
M*  1, M*  2
n n
Наконец, вычисляют выборочные среднюю и дисперсию по формулам:
 2
xB  M1*  h  C, DB  M 2*   M1*   h2 .
   
 
Пример. Найти методом произведений выборочные среднюю и
дисперсию следующего статистического распределения:
варианты 10,2 10 ,4 10 ,6 10 ,8 11,0 11,2 11,4 11,6 11,8 12 ,0
частота 2 3 8 13 25 20 12 10 6 1
Решение. Составим расчетную таблицу, для чего:
1) запишем варианты в первый столбец;
2) запишем частоты во второй столбец; сумму частот (100) поместим в
нижнюю клетку столбца;
3) в качестве ложного нуля выберем варианту 11,0 (эта варианта
имеет наибольшую частоту); в клетке третьего столбца, которая
принадлежит строке, содержащей наибольшую частоту, пишем 0; над нулем
последовательно –1, –2, –3, –4, а под нулем - 1, 2, 3, 4, 5;
4) произведения частот на условные варианты записываем в четвертый
столбец; отдельно находим сумму (–46) отрицательных и отдельно сумму
(103) положительных чисел; сложив эти числа, их сумму (57) помещаем в
нижнюю клетку столбца;
5) произведения частот на квадраты условных вариант запишем в
пятый столбец; сумму чисел столбца (383) помещаем в нижнюю клетку
столбца;
6) произведения частот на квадраты условных вариант, увеличенных на
единицу, запишем в шестой контрольный столбец; сумму (597) чисел
столбца помещаем в нижнюю клетку столбца.
В итоге получим расчетную таблицу 1.
Таблица 1
xi 2
x i u i
niu i niu i n i ( u i +1) 2
10,2 2 -4 -8 32 18
10,4 3 -3 -9 27 12
10,6 8 -2 -16 32 8
10,8 13 -1 -13 13 0
11,0 25 0 A1 =-46 25
11,2 20 1 20 20 80

36
11,4 12 2 24 48 108
11,6 10 3 30 90 160
11,8 6 4 24 96 150
12,0 1 5 5 25 36
A2 =103
n  100  ni ui  57  ni ui  383
2
 ni ( ui  1 )  597
2

Контроль:  ni ui2  2 ni ui  n  383  2  57  100  597 .  ni ( ui  1 )2  597 .


Вычисления произведены правильно.
Вычислим условные моменты первого и второго порядков:
ni ui2 383
M 1   M 2  
ni ui 57
  0,57 ;   3,83 .
n 100 n 100

Найдем шаг: h  10,4  10,2  0,2 .


Вычислим искомые выборочные среднюю и дисперсию:
x  M1  h  C  0,57  0,2  11,0  11,1 ; D  M 2  ( M1 )2  h 2  3,83  ( 0,57 )2  0,2 2  0,14 .

Оценка, определяемая одним числом, называется точечной. При выборке


малого объема точечная оценка может существенно отличаться от истинного
значения неизвестного параметра. Вследствие этого пользуются
интервальными оценками. Оценка, определяемая двумя числами – концами
интервалов, называется интервальной.
Пусть ~ - оценка неизвестного параметра  , полученная по данным
выборки. Очевидно, оценка тем точнее, чем меньше модуль разности   ~ .
Если   0 и   ~   , то чем меньше  , тем точнее оценка ~ ; число 
характеризует точность оценки.
Определение. Доверительной вероятностью, или надежностью, оценки
 параметра  ~ называется вероятность  , с которой осуществляется

неравенство   ~   , т.е.
P   
~     (1)
Обычно надежность  задается заранее, в качестве  берут число,
близкое к единице. Так как неравенство   ~   равносильно неравенствам
 ~   или  ~  ~   , то формулу (1) можно записать в виде
P
~ ~     (2)
Эта формула означает следующее: вероятность того, что интервал
  ,~   заключает в себе (покрывает) неизвестный параметр  , равна  .
~

Определение. Интервал ~  ,~  , который покрывает неизвестный параметр


 с заданной надежностью  , называется доверительным интервалом.
Концы доверительного интервала называют доверительными границами.
Доверительные границы являются случайными величинами (они изменяются от
выборки к выборке).

37
Рассмотрим вопрос о построении доверительного интервала для оценки
математического ожидания а нормального распределения при известном значении
среднего квадратического отклонения  .
Пусть количественный признак X генеральной совокупности имеет
нормальное распределение с заданным  и неизвестным а. Оценим неизвестный
параметр а выборочной средней x B ; найдем доверительный интервал,
покрывающий параметр а с надежностью  . Так как выборочное среднее x B
меняется от выборки к выборке, его можно рассматривать как случайную величину
ХВ.. Выборочные значения х1,,х2,,...,хп также меняются от выборки к выборке. Будем
рассматривать их как одинаково распределенные случайные величины Х1,Х2,,...Хп
(математическое ожидание каждой из этих величин равно а, среднее
квадратическое отклонение равно  ).

Имеем M  X B   a ,  X B   (3)
n
Потребуем, чтобы
P X B  a     (4)
Поскольку случайная величина ХВ. также имеет нормальное распределение,
то равенство

P X  a     2 

Применяя к величинам ХВ. и  X B    , находим
n
 n 
P X B  a     2
  
  2 t  (5), где t   n (6)
  

Из последнего равенства определим   t  и подставим в (5):


n
 t   t t 
P X B  a    2 t  (7) , или P X B  a XB    2 t  ,
 n  n n
где X B - выборочное среднее.
Поскольку вероятность Р задана и равна  , т.е.
 t t 
P X B  a XB     , (8)
 n n

то последнее означает, что доверительный интервал


 t t 
 X B  , XB  
 n n
покрывает неизвестный параметр а с надежностью  . Из формулы (6) нахо-
дим точность оценки
 n .
t

Отметим, что число t определяется равенством 2t    , получающимся
из (7) и (8).
Значение t находится с помощью таблиц функции Лапласа.
38
5.3. ЭЛЕМЕНТЫ ТЕОРИИ КОРРЕЛЯЦИИ
Пусть мы располагаем сведениями (обычно довольно ограниченными),
например, о числе дефектных изделий в изготовленной в определенных
условиях продукции или о результатах испытаний материалов на разрушение
и т. п. Собранные нами данные могут представлять непосредственный
интерес в смысле информации о качестве той или иной партии продукции.
Статистические же проблемы возникают тогда, когда мы на основе той же
информации начинаем делать выводы относительно более широкого круга
явлений. Так, например, нас может интересовать качество технологического
процесса, для чего мы оцениваем вероятность получения в нем дефектного
изделия или среднюю долговечность изделия. В этом случае мы
рассматриваем собранный материал не ради него самого, а лишь как некую
пробную группу или выборку, представляющую только серии из возможных
результатов, которые мы могли бы встретить при продолжении наблюдений
массового процесса в данной обстановке. Выводы и оценки, основанные на
материале наблюдений, отражают случайный состав пробной группы и
поэтому считаются приблизительными оценками вероятностного характера.
Во многих случаях теория указывает, как наилучшим способом использовать
имеющуюся информацию для получения по возможности более точных и
надежных характеристик, указывая при этом степень надежности выводов,
объясняющуюся ограниченностью запаса сведений.
В математической статистике рассматриваются две основные
категории задач: оценивание и статистическая проверка гипотез. Первая
задача разделяется на точечное оценивание и интервальное оценивание
параметров распределения. Например, может возникнуть необходимость по
наблюдениям получить точечные оценки параметров M и D. Если мы
хотим получить некоторый интервал, с той или иной степенью
достоверности содержащий истинное значение параметра, то это задача
интервального оценивания.
Вторая задача – проверка гипотез – заключается в том, что мы делаем
предположение о распределении вероятностей случайной величины
(например, о значении одного или нескольких параметров функции
распределения) и решаем, согласуются ли в некотором смысле эти значения
параметров с полученными результатами наблюдений.

5.4. ОТЫСКАНИЕ ПАРАМЕТРОВ ВЫБОРОЧНОГО


УРАВНЕНИЯ РЕГРЕССИИ ПО СГРУППИРОВАННЫМ ДАННЫМ
Естественно считать величину x выборочной оценкой параметра M.
Выборочная оценка параметра, представляющая собой число, называется
точечной оценкой.
Выборочную дисперсию
k 1 n
 2    xi  x  i    xi  x
2 2

i 1 n i 1

39
можно считать точечной оценкой дисперсии D генеральной совокупности.
Приведем еще один пример точечной оценки. Пусть каждый объект
генеральной совокупности характеризуется двумя количественными
признаками x и y. Например, деталь может иметь два размера – длину и
ширину. Можно в различных районах измерять концентрацию вредных
веществ в воздухе и фиксировать количество легочных заболеваний
населения в месяц. Можно через равные промежутки времени сопоставлять
доходность акций данной корпорации с каким-либо индексом,
характеризующим среднюю доходность всего рынка акций. В этом случае
генеральная совокупность представляет собой двумерную случайную
величину , . Эта случайная величина принимает значения x, y на
множестве объектов генеральной совокупности. Не зная закона совместного
распределения случайных величин  и , мы не можем говорить о наличии
или глубине корреляционной связи между ними, однако некоторые выводы
можно сделать, используя выборочный метод.
Выборку объема n в этом случае представим в виде таблицы, где
i-тый отобранный объект (i= 1,2,...n) представлен парой чисел xi, yi :

x1 x2 ... xn
y1 y2 ... yn
Выборочный коэффициент корреляции рассчитывается по формуле
xy  x y .
rxy 
 x y

Здесь
2
1 n
1 n
xy   xi yi ,  x  x    xi  x ,
2
n i 1 n i 1

2
1 n
y  y    yi  y .
2
n i 1

Выборочный коэффициент корреляции можно рассматривать как


точечную оценку коэффициента корреляции , характеризующего
генеральную совокупность.
Выборочные параметры x, sx , rxy или любые другие зависят от того,
какие объекты генеральной совокупности попали в выборку и различаются
от выборки к выборке. Поэтому они сами являются случайными величинами.
Пусть выборочный параметр  рассматривается как выборочная
оценка параметра  генеральной совокупности и при этом выполняется
равенство
M =.

40
Такая выборочная оценка называется несмещенной.
Для доказательства несмещённости некоторых точечных оценок будем
рассматривать выборку объема n как систему n независимых случайных
величин 1, 2,... n , каждая из которых имеет тот же закон распределения с
теми же параметрами, что и случайная величина , представляющая
генеральную совокупность. При таком подходе становятся очевидными
равенства: Mxi = Mi =M; Dxi = Di =D для всех k = 1,2,...n.
Теперь можно показать, что выборочная средняя x есть несмещенная
оценка средней генеральной совокупности или, тоже самое, математического
ожидания интересующей нас случайной величины  :
x1  x2 . . . xn 1
  M1  M 2 . . . M n   n M  M .
1
Mx  M
n n n

Выведем формулу для дисперсии выборочной средней:


x1  x2 . . . xn D .
2 
D1  D 2  . . . D n1  
1 1
Dx  D  n D 
n n n2 n

Найдем теперь, чему равно математическое ожидание выборочной


дисперсии  2. Сначала преобразуем  2 следующим образом:
1 n 1 n
  xi  x    xi  M  M  x 
2 2
2 
n i 1 n i 1


1 n
n i 1

  xi  M  2 xi  M x  M   x  M 
2 2

1 n
  xi  M   x  M .
2 2

n i 1

Здесь использовано преобразование:


n n
 2 xi  M x  M  2 x  M   xi  M 
i 1 i 1

 n n 
 2 x  M  xi   M  2 x  Mnx  nM  2n x  M .
2
 i 1 i 1 

Теперь, используя полученное выше выражение для величины  2,


найдем ее математическое ожидание:

1 n 2
2
M  M    xi  M   x  M  
2

 n i 1 

41
1 n
 M  xi  M  M  x  M  n D  Dx 
2 2 1

n i 1 n

D n  1
 D   D .
n n

Так как M 2  D, то выборочная дисперсия не является несмещенной


оценкой дисперсии генеральной совокупности.
Чтобы получить несмещенную оценку дисперсии генеральной
n
совокупности, нужно умножить выборочную дисперсию на . Тогда
n1
n
получится величина s2   2 , называемая исправленной выборочной
n1
дисперсией:

1 n
s2    xi  x 2 .
n  1 i 1

Пусть имеется ряд несмещенных точечных оценок одного и того же


параметра генеральной совокупности. Та оценка, которая имеет наименьшую
дисперсию называется эффективной.
Полученная из выборки объема n точечная оценка n параметра 
генеральной совокупности называется состоятельной, если она сходится по
вероятности к . Это означает, что для любых положительных чисел  и 
найдется такое число n, что для всех чисел n, удовлетворяющих
неравенству n > n , выполняется условие P  n      1   .
2
x и s являются несмещёнными, состоятельными и эффективными
оценками величин M и D.
Точечные оценки параметров генеральной совокупности могут быть
приняты в качестве ориентировочных, первоначальных результатов
обработки выборочных данных. Их недостаток заключается в том, что
неизвестно, с какой точностью оценивается параметр. Если для выборок
большого объема точность обычно бывает достаточной (при условии
несмещенности, эффективности и состоятельности оценок), то для выборок
небольшого объема вопрос точности оценок становится очень важным.
Введем понятие интервальной оценки неизвестного параметра
генеральной совокупности (или случайной величины , определенной на
множестве объектов этой генеральной совокупности). Обозначим этот
параметр через . По сделанной выборке по определенным правилам найдем
числа 1 и 2 так, чтобы выполнялось условие:

P(1< < 2) =P ((1; 2)) = .

42
Числа 1 и 2 называются доверительными границами, интервал (1,
2) — доверительным интервалом для параметра . Число  называется
доверительной вероятностью или надежностью сделанной оценки.
Сначала задается надежность. Обычно ее выбирают равной 0.95, 0.99
или 0.999. Тогда вероятность того, что интересующий нас параметр попал в
интервал (1, 2) достаточно высока. Число (1 + 2) / 2 – середина
доверительного интервала – будет давать значение параметра  с точностью
(2 – 1) / 2, которая представляет собой половину длины доверительного
интервала.
Границы 1 и 2 определяются из выборочных данных и являются
функциями от случайных величин x1, x2,..., xn , а следовательно – сами
случайные величины. Отсюда доверительный интервал (1, 2) тоже случаен.
Он может покрывать параметр  или нет. Именно в таком смысле нужно
понимать случайное событие, заключающееся в том, что доверительный
интервал покрывает число .

5.5. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ МАТЕМАТИЧЕСКОГО


ОЖИДАНИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ ПРИ
ИЗВЕСТНОЙ ДИСПЕРСИИ
Пусть случайная величина  (можно говорить о генеральной
совокупности) распределена по нормальному закону, для которого известна
дисперсия D =  2 ( > 0). Из генеральной совокупности (на множестве
объектов которой определена случайная величина) делается выборка объема
n. Выборка x1, x2,..., xn рассматривается как совокупность n независимых
случайных величин, распределенных также, как  (подход, которому дано
объяснение выше по тексту).
Ранее также обсуждались и доказаны следующие равенства:
Mx1 = Mx2 = ... = Mxn = M;
Dx1 = Dx2 = ... = Dxn = D;
M x  M;
D x  D /n.
Достаточно просто доказать (мы доказательство опускаем), что
случайная величина x в данном случае также распределена по нормальному
закону.
Обозначим неизвестную величину M через a и подберем по заданной
надежности  число d > 0 так, чтобы выполнялось условие:

P( x – a < d) =  (1)

Так как случайная величина x распределена по нормальному закону с


математическим ожиданием M x = M = a и дисперсией D x = D /n =  2/n,
то получаем:

43
P( x – a < d) =P(a – d < x < a + d) =

   
 a  d  a  a  d  a  d n
=      2  .
        
   
 n   n 

Осталось подобрать d таким, чтобы выполнялось равенство


 d n  d n 
2     или     .
      2
Для любого  [0;1] можно по таблице найти такое число t, что
( t )=  / 2. Это число t иногда называют квантилем.
Теперь из равенства

d n
t

определим значение d: d   t .
n
Окончательный результат получим, представив формулу (1) в виде:

 t  t
P x  a x   .
 n n

Смысл последней формулы состоит в следующем: с надежностью 


доверительный интервал
 t t
x  ;x 
 n n

покрывает неизвестный параметр a = M генеральной совокупности. Можно


сказать иначе: точечная оценка x определяет значение параметра M с
точностью d= t / n и надежностью .
Задача. Пусть имеется генеральная совокупность с некоторой
характеристикой, распределенной по нормальному закону с дисперсией,
равной 6,25. Произведена выборка объема n = 27 и получено
средневыборочное значение характеристики x = 12. Найти доверительный
интервал, покрывающий неизвестное математическое ожидание исследуемой
характеристики генеральной совокупности с надежностью
 =0,99.
Решение. Сначала по таблице для функции Лапласа найдем значение t
из равенства  (t) =  / 2 = 0,495. По полученному значению
t = 2,58 определим точность оценки (или половину длины доверительного

44
интервала) d: d = 2,52,58 / 27  1,24. Отсюда получаем искомый
доверительный интервал: (10,76; 13,24).

5.6. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ МАТЕМАТИЧЕСКОГО


ОЖИДАНИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ ПРИ
НЕИЗВЕСТНОЙ ДИСПЕРСИИ
Пусть  – случайная величина, распределенная по нормальному закону
с неизвестным математическим ожиданием M, которое обозначим буквой a .
Произведем выборку объема n. Определим среднюю выборочную x и
исправленную выборочную дисперсию s2 по известным формулам.
Случайная величина

t
 x  a n
s

распределена по закону Стьюдента с n – 1 степенями свободы.


Задача заключается в том, чтобы по заданной надежности  и по числу
степеней свободы n – 1 найти такое число t , чтобы выполнялось равенство

 x  a  n 
P  t  , (2)
 s 
 

или эквивалентное равенство

 s s
P x  t  a  x  t   . (3)
 n n

Здесь в скобках написано условие того, что значение неизвестного


параметра a принадлежит некоторому промежутку, который и является
доверительным интервалом. Его границы зависят от надежности  , а также
от параметров выборки x и s.
Чтобы определить значение t по величине , равенство (2) преобразуем
к виду:

  x  a n 
P  t   1   ,
 s 

Теперь по таблице для случайной величины t, распределенной по


закону Стьюдента, по вероятности 1 –  и числу степеней свободы n – 1
находим t . Формула (3) дает ответ поставленной задачи.
Задача. На контрольных испытаниях 20-ти электроламп средняя
продолжительность их работы оказалась равной 2000 часов при среднем
квадратическом отклонении (рассчитанном как корень квадратный из
исправленной выборочной дисперсии), равном 11-ти часам. Известно, что
45
продолжительность работы лампы является нормально распределенной
случайной величиной. Определить с надежностью 0,95 доверительный
интервал для математического ожидания этой случайной величины.
Решение. Величина 1 –  в данном случае равна 0,05. По таблице
распределения Стьюдента при числе степеней свободы равном 19 находим:
t = 2,093. Вычислим теперь точность оценки: 2,093121/ 20 = 56,6. Отсюда
получаем искомый доверительный интервал: (1943,4; 2056,6).

5.7. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ДИСПЕРСИИ


НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
Пусть случайная величина  распределена по нормальному закону, для
которого дисперсия D неизвестна. Делается выборка объема n . Из нее
определяется исправленная выборочная дисперсия s2. Случайная величина

 2

 n  1s2
D

распределена по закону 2 c n –1 степенями свободы. По заданной


надежности  можно найти сколько угодно таких границ 12 и 22
интервалов, что


P 1   2   2  
2 2
 (*)

Найдем 12 и 22 из следующих условий:

P(2  12) = (1 –  )/ 2 (**)

P(2  22) = (1 –  )/ 2 (***)

Очевидно, что при выполнении двух последних условий справедливо


равенство (*).
В таблицах для случайной величины 2 обычно дается решение
уравнения P(2 q2) = q . Из такой таблицы по заданной величине q и по
числу степеней свободы n – 1 можно определить значение q2. Таким
образом, сразу находится значение 22 в формуле (***).
Для определения 12 преобразуем (**):

P(2  12) = 1 – (1 –  )/ 2 = (1 +  )/ 2

Полученное равенство позволяет определить по таблице значение 12.


Теперь, когда найдены значения 12 и 22, представим равенство (*) в
виде:

46
 2 n  1s2 
P  1    2    .
2

 D 

Последнее равенство перепишем в такой форме, чтобы были


определены границы доверительного интервала для неизвестной
величины D:

 n  1s2  n  1s2 
P  D   .
 2
2
 12 

Отсюда легко получить формулу, по которой находится доверительный


интервал для стандартного отклонения:

 n  1 s n  1s
P  D   . (****)
 2 2
 12 
 

Задача. Будем считать, что шум в кабинах вертолетов одного и того же


типа при работающих в определенном режиме двигателях — случайная
величина, распределенная по нормальному закону. Было случайным образом
выбрано 20 вертолетов, и произведены замеры уровня шума (в децибелах) в
каждом из них. Исправленная выборочная дисперсия измерений оказалась
равной 22,5. Найти доверительный интервал, накрывающий неизвестное
стандартное отклонение величины шума в кабинах вертолетов данного типа с
надежностью 98%.
Решение. По числу степеней свободы, равному 19, и по вероятности (1
– 0,98)/2 = 0,01 находим из таблицы распределения 2 величину
2 = 36,2. Аналогичным образом при вероятности (1 + 0,98)/2 = 0,99
2

получаем 12 = 7,63. Используя формулу (****), получаем искомый


доверительный интервал: (3,44; 7,49).

5.8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ


Статистическая проверка гипотез является вторым после
статистического оценивания параметров распределения и в то же время
важнейшим разделом математической статистики.
Методы математической статистики позволяют проверить
предположения о законе распределения некоторой случайной величины
(генеральной совокупности), о значениях параметров этого закона (например,
M, D ), о наличии корреляционной зависимости между случайными
величинами, определенными на множестве объектов одной и той же
генеральной совокупности.

47
Пусть по некоторым данным имеются основания выдвинуть
предположения о законе распределения или о параметре закона
распределения случайной величины (или генеральной совокупности, на
множестве объектов которой определена эта случайная величина). Задача
заключается в том, чтобы подтвердить или опровергнуть это предположение,
используя выборочные (экспериментальные) данные.
Гипотезы о значениях параметров распределения или о сравнительной
величине параметров двух распределений называются параметрическими
гипотезами.
Гипотезы о виде распределения называются непараметрическими
гипотезами.
Проверить статистическую гипотезу – это значит проверить,
согласуются ли данные, полученные из выборки, с этой гипотезой. Проверка
осуществляется с помощью статистического критерия. Статистический
критерий – это случайная величина, закон распределения которой (вместе со
значениями параметров) известен в случае, если принятая гипотеза
справедлива. Этот критерий называют еще критерием согласия (имеется в
виду согласие принятой гипотезы с результатами, полученными из выборки).
Гипотезу, выдвинутую для проверки ее согласия с выборочными
данными, называют нулевой гипотезой и обозначают H0. Вместе с гипотезой
H0 выдвигается альтернативная или конкурирующая гипотеза, которая
обозначается H1. Например:

1) H0: M= 0 2) H0: M= 0 3) H0: M= 0

H1: M 0 H1: M> 0 H1: M= 2


Пусть случайная величина K – статистический критерий проверки
некоторой гипотезы H0. При справедливости гипотезы H0 закон
распределения случайной величины K характеризуется некоторой известной
нам плотностью распределения pK(x).
Выберем некоторую малую вероятность , равную 0,05 , 0,01 или еще
меньшую. Определим критическое значение критерия Kкр как решение
одного из трех уравнений, в зависимости от вида нулевой и конкурирующей
гипотез:

P(K> Kкр) =  (1)

P(K< Kкр) =  (2)

P((K< Kкр1)(K> Kкр2)) =  (3)

Возможны и другие уравнения, но они встречаются значительно реже, чем


приведенные.

48
Решение уравнения (1) (то же самое для уравнений (2) и (3))
заключается в следующем: по вероятности , зная функцию pK(x), заданную
как правило таблицей, нужно определить Kкр.
Что означает условие (1)?
Если гипотеза H0 справедлива, то вероятность того, что критерий K
превзойдет некоторое значение Kкр очень мала – 0,05 , 0,01 или еще меньше,
в зависимости от нашего выбора. Если Kв – значение критерия K,
рассчитанное по выборочным данным, превзошло значение Kкр, это означает,
что выборочные данные не дают основания для принятия нулевой гипотезы
H0 (например, если =0,01, то можно сказать, что произошло событие,
которое при справедливости гипотезы H0 встречается в среднем не чаще, чем
в одной из ста выборок). В этом случае говорят, что гипотеза H0 не
согласуется с выборочными данными и должна быть отвергнута. Если Kв не
превосходит Kкр, то говорят, что выборочные данные не противоречат
гипотезе H0, и нет оснований отвергать эту гипотезу.
Для уравнения (1) область K> Kкр называется критической областью.
Если значение Kв попадает в критическую область, то гипотеза H0
отвергается.
Для уравнения (1) область K < Kкр называется областью принятия
гипотезы. Если значение Kв попадает в область принятия гипотезы, то
гипотеза H0 принимается.
Рисунок 1. иллюстрирует решение
уравнения (1). Здесь pK(x) – известная
плотность распределения случайной
величины K при условии справедливости
гипотезы H0.
Пусть выбрано некоторое малое
значение вероятности , по нему определено
значение Kкр и по выборочным данным
определено значение Kв, которое попало в критическую область. В этом
случае гипотеза H0 отвергается, но она может оказаться справедливой,
просто случайно произошло событие, которое имеет очень малую
вероятность . В этом смысле  есть вероятность отвержения правильной
гипотезы H0.
Отвержение правильной гипотезы называется ошибкой первого рода.
Вероятность  называется уровнем значимости. Таким образом, уровень
значимости – это вероятность совершения ошибки первого рода.

49
Критическая область, полученная для
уравнения (1) и приведенная на рисунке 1,
называется правосторонней.
Уравнение (2) определяет
левостороннюю критическую область. Ее
изображение приводится на рисунке 2.
Отметим, что каждая из
заштрихованных фигур на рисунках 1. и 2.
имеет площадь, равную .
Уравнение (3) определяет
двустороннюю критическую область. Такая
область изображена на рисунке 3. Здесь
критическая область состоит из двух
частей. В случае двусторонней критической
области границы ее частей Kкр1 и Kкр2
определяются таким образом, чтобы
выполнялось условие:

P(K  Kкр) = P(K  Kкр) =  / 2.

На рисунке 3. площадь каждой из заштрихованных фигур равна  / 2.


Вид критической области зависит от того, какая гипотеза выдвинута в
качестве конкурирующей.
Чем меньше уровень значимости, тем меньше вероятность отвергнуть
проверяемую гипотезу H0, когда она верна, то есть совершить ошибку
первого рода. Но с уменьшением уровня значимости расширяется область
принятия гипотезы H0 и увеличивается вероятность принятия проверяемой
гипотезы, когда она неверна, то есть когда предпочтение должно быть отдано
конкурирующей гипотезе.
Пусть при справедливости гипотезы H0 статистический критерий K
имеет плотность распределения p0(x), а при справедливости конкурирующей
гипотезы H1 – плотность распределения p1(x). Графики этих функций
приведены на рисунке 4. При некотором уровне значимости находится
критическое значение Kкр и правосторонняя критическая область. Если
значение Kв, определенное по выборочным данным, оказывается меньше, чем
Kкр, то гипотеза H0 принимается. Предположим, что справедлива на самом
деле конкурирующая гипотеза H1. Тогда вероятность попадания критерия в
область принятия гипотезы H0 есть некоторое число , равное площади
фигуры, образованной графиком функции p1(x) и полубесконечной частью
горизонтальной координатной оси, лежащей слева от точки Kкр. Очевидно,
что  – это вероятность того, что будет принята неверная гипотеза H0.
Принятие неверной гипотезы называется ошибкой второго рода. В
рассмотренном случае число  – это вероятность ошибки второго рода.
Число 1 – , равное вероятности того, что не совершается ошибка второго

50
рода, называется мощностью критерия. На рисунке 4 мощность критерия
равна площади фигуры,
образованной графиком функции
p1(x), и полубесконечной частью
горизонтальной координатной
оси, лежащей справа от точки Kкр.
Выбор статистического
критерия и вида критической
области осуществляется таким
образом, чтобы мощность критерия была максимальной.

51
ГЛОССАРИЙ

№ Новые понятия Содержания


п/п
1 Генеральная совокупность всех однородных объектов,
совокупность подлежащих изучению
2 Выборочная совокупности объектов, случайно
совокупность (выборка) отобранных из генеральной совокупности
3 Объем совокупности число ее объектов
4 Вариационный ряд, последовательность наблюдаемых
варианты значений xi i  1,2,...,n , записанных в
возрастающем порядке. Значение xi
называется вариантами
5 Относительная частота n
i  i , где ni - частота появления значений
n
xi , i  1,2,...,n
6 Статистическое соответствие между вариантами и их
распределение выборки частотами (или относительными
частотами)
7 Генеральная средняя среднее арифметическое значений
(выборочная средняя) генеральной совокупности (выборочной
совокупности) признака Х
8 Генеральная дисперсия 1 k
D и генеральное
D   n i  x i  x 2 ,
n i 1
среднее арифметическое
среднее квадратическое квадратов отклонения значений признака Х
отклонение   среднего значения x ;
   D
9 Выборка – из объема к - часть, состоящая из к
последовательность элементов генеральной совокупности;
значений генеральной репрезентативная - позволяет адекватно
совокупности описать случайную величину
- случайная объема n —
последовательность n независимых
случайных величин из генеральной
совокупности
10 Выборочная дисперсия 1 k
DB   n i  x i  x B 2 , где n - объем выборки,
DB n i 1
варианты, x B - средняя выборочная, ni -
xi -
частота варианты xi
11 Выборочное среднее число, равное сумме значений случайной
величины, деленной на объем выборки
12 Гипотеза альтернативная - основная — гипотеза, которая
– проверяется;
52
гипотеза, - статистическая - предположение
конкурирующая с относительно параметров или закона
основной распределения случайной величины
13 Гистограмма представление статистического ряда на
плоскости
14 Доверительная вероятность с которой осуществляется
вероятность  оценки  неравенство
неизвестного параметра      , т.е. P         

15 Доверительный интервал интервал    ,     , который покрывает
неизвестный параметр  с заданной
доверительной вероятности 
16 Критерий значимости вероятность ошибки 1-го рода

53
СПИСОК ЛИТЕРАТУРЫ

1. Кремер Н.Ш. Теория вероятностей и математическая статистика. -


М.: Юнити, 2004.
2. Общий курс высшей математики для экономистов. Под ред.
В.И.Ермакова. - М.: ИНФРА-М., 2000.
3. Гмурман В.Е. Руководство к решению задач по теории вероятностей
и математической статистике. - М.: ЮРАЙТ, 2010.
4. Гмурман В.Е. Теория вероятностей и математическая статистика. -
М.: ЮРАЙТ, 2010.
5. Колемаев В.А., Калинина В.Н. Теория вероятностей и
математическая статистика. - М: ИНФРА-М., 1997.
6. Зубков А.М., Севастьянов Б.А. Сборник задач по теории
вероятностей и математической статистики. - М.: Наука, 1989.
7. Сборник задач по математике для втузов /под ред. А.В.Ефимова, ч.3.
Теория вероятностей и математическая статистика. - М.: Наука, 1990.
8. Севастьянов Б.А. Курс теории вероятностей и математической
статистики. - М.: Наука, 1982.
9. Белько И.В. Высшая математика для экономистов. - М.: Новое
знание, 2007.

54
Для заметок

55
Подписано в печать 14.06.2013 г. Тираж 50 экз.
Формат изд. 60х84/16. Объем 3,5 усл. печ. л.
Отпечатано в типографии “ИП Волков А.И.”
Райымбека 212/1, оф. 319. Тел.: 330-03-12, 330-03-13

56

Вам также может понравиться