Вы находитесь на странице: 1из 234

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ

ФГОУ ВПО «СИБИРСКИЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»

Т. В. Крупкина, А. И. Пыжев,
С. В. Бабенышев, Е. С. Кирик

ТЕОРИЯ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
В ПРИМЕРАХ И ЗАДАЧАХ

для студентов экономического факультета

Учебное пособие

СФУ 2007
УДК 000.000
ББК 22.17я73
К 84
Рецензенты

Т. В. Крупкина
К 84 Теория вероятностей и математическая статистика в при-
мерах и задачах. : учебное пособие / Т. В. Крупкина, А. И. Пыжев, С.
В. Бабенышев, Е. С. Кирик. Сибирский федеральный университет.
Красноярск: 2007. 171 с.

ISBN 0-0000-0000-0

Посвящено курсу «Теория вероятностей и математическая статисти-


ка». Включает в себя широкий набор разобранных примеров и задачи для
аудиторной и самостоятельной работы, большая часть которых снабжена
ответами, а также необходимые для решения задач теоретические сведения.
Предназначено для студентов экономических направлений и специ-
альностей.

ISBN 0-0000-0000-0

© Сибирский федеральный университет, 2007


© Т. В. Крупкина, А. И. Пыжев, С. В. Бабенышев, Е. С. Кирик, 2007
Содержание

Содержание
Принятые обозначения и сокращения 5

1. Классическое определение вероятности 6

2. Основания теории вероятностей 21


2.1. Основные понятия . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2. Геометрическое определение вероятности . . . . . . . . . . . 28

3. Теоремы исчисления вероятностей 36


3.1. Теоремы сложения и умножения . . . . . . . . . . . . . . . . 36
3.2. Формула полной вероятности. Формула Байеса . . . . . . . 44

4. Схемы испытаний 51
4.1. Схема Бернулли. Полиномиальная схема . . . . . . . . . . . 51
4.2. Асимптотические формулы для схемы Бернулли . . . . . . . 57

5. Одномерные дискретные случайные величины 63

6. Непрерывные случайные величины 70


6.1. Одномерные непрерывные случайные величины . . . . . . . 70
6.2. Многомерные случайные величины . . . . . . . . . . . . . . 77

7. Числовые характеристики одномерной случайной величины 87


7.1. Математическое ожидание . . . . . . . . . . . . . . . . . . . 87
7.2. Другие числовые характеристики случайной величины . . . . 92
7.3. Математические ожидания и дисперсии
некоторых важных распределений . . . . . . . . . . . . . . . 98

8. Линейная зависимость между случайными величинами 100


8.1. Линейная зависимость двух величин . . . . . . . . . . . . . . 100
8.2. Числовые характеристики многомерной случайной величины 103

9. Условные распределения 110


9.1. Условные законы распределения . . . . . . . . . . . . . . . . 110
9.2. Регрессия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

10. Закон больших чисел, центральная предельная теорема 117


10.1. Неравенства и закон больших чисел . . . . . . . . . . . . . . 117
10.2. Центральная предельная теорема . . . . . . . . . . . . . . . 118

3
Содержание

11. Случайная выборка 123


11.1. Основные понятия . . . . . . . . . . . . . . . . . . . . . . . . 123
11.2. Группировка выборки. Графические характеристики . . . . . 125

12. Числовые характеристики выборки 131


12.1. Выборочные характеристики . . . . . . . . . . . . . . . . . . 131
12.2. Статистики . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

13. Статистические оценки 138


13.1. Критерии качества оценок . . . . . . . . . . . . . . . . . . . 138
13.2. Методы нахождения оценок . . . . . . . . . . . . . . . . . . 142

14. Доверительные интервалы. 146

15. Статистические гипотезы. 151

16. Проверка статистических гипотез 156


16.1. Параметрические гипотезы . . . . . . . . . . . . . . . . . . . 156
16.2. Гипотеза о виде распределения. . . . . . . . . . . . . . . . . . 157

Приложение 162

Список литературы 169

4
Содержание

Принятые обозначения и сокращения.


[x] — целая часть числа x.
exp x, exp{x} — экспонента аргумента x (exp x = exp{x} = ex ).
e — основание натурального логарифма, e = 2, 718 281 828 459 . . .
A, B, . . . , X — события.
A, B, . . . X — отрицания событий A, B, . . . , X.
B ⇔ C, B ⇐⇒ C — «из B следует C и из C следует B».
∃ x — «существует x».
∀ x — «для любого x».
@ x — «не существует x».
def
= — «равно по определению».
≡ — «тождественно равно».
J — начало решения.
I — конец решения.
n, m = n, n + 1, . . . , m при том, что n, m ∈ Z и n < m.
N — множество натуральных чисел.
Z — множество целых чисел.
R — множество вещественных чисел.
R+ — множество вещественных чисел.

5
1. Классическое определение вероятности
Рассмотрим некоторый опыт с конечным числом n взаимоис-
ключающих друг друга исходов, которые равновозможны. Пусть A —
некоторое событие, связанное с этими исходами. Вероятность p (A) можно
определить как долю тех исходов, в результате которых это событие осу-
ществляется:
n (A)
p (A) = , (1)
n
где n — число всех исходов, а n (A) — число исходов благоприятных исхо-
дов, т. е. исходов, в результате которых осуществляется событие A.

Вспомним некоторые формулы комбинаторики (более подробно см.


[?]).

Перестановки. Число перестановок n элементов равно

Pn = n! (2)

Составные наборы. Если имеется r групп элементов, причем i-я


группа содержит ni элементов; i = 1, 2, . . . , n, то число способов, кото-
рыми можно выбрать r элементов по одному из каждой группы, равно

N = n1 · n2 · . . . · nr . (3)

Важное значение имеет частный случай (3) при n1 = . . . = nr = n:

N = nr . (4)

Число сочетаний — выбор без возвращения и без учета порядка.


Число способов, которыми можно выбрать m из n различных элементов,
равно
n!
Cnm = . (5)
m! (n − m)!

Число размещений — выбор без возвращения и с учетом поряд-


ка. Число способов, которыми можно выбрать и разместить по различным
местам m из n различных элементов, равно
n!
Am m
n = Cn · m! = . (6)
(n − m)!

6
Число разбиений на группы. Число способов, которыми можно
разбить n различных элементов на k групп, содержащих соответственно
n1 , n2 , . . . , nk элементов, равно
n!
N= . (7)
n1 ! · n2 ! · . . . · nk !

Пример 1. Из 120 сотрудников брокерской конторы 33 получили ме-


сячную премию. Какова вероятность получения месячной премии?

J По классическому определению вероятности


n (A)
p (A) = ,
n
где n — число всех исходов, а n (A) — число исходов благоприятных исхо-
дов.
33
n = 120, n (A) = 32, p (A) = = 0, 275. I
120
В задачах примеров 1—4 испытание состоит в случайном выборе числа
из последовательности 100, 101, . . . , 299, 300, содержащую, очевидно, 201
число. В каждой задаче определено событие A, вероятность которого тре-
буется найти.
Поскольку в последовательности исходов нет одинаковых чисел, для
вычисления вероятности будем пользоваться классическим определением
вероятности, где вероятность события A определяется по формуле (1) при
n = 201. I

Пример 2. A = {Число читается одинаково как слева направо, так


и справа налево}.

J В заданном множестве благоприятными исходами будут числа, первый и


третий разряды которых совпадают и равны либо 1, либо 2, а второй разряд
принимает значения из множества {0, 1, . . . , 9}.
Если первый и третий разряд равны 1, то таких исходов в точности 10:
{101, 111, , . . . , 181, 191}. В случае, если первый и третий разряд равны 3,
исходов тоже 10: {202, 212, . . . , 282, 292}.
Таким образом, благоприятных исходов 20 или в формальной записи
n (A) = 20.
20
p (A) = .I
201
Пример 3. A = {Число кратно 6}.

7
J Числа 100 и 101, очевидно, не кратны 6, а число 102 — кратно. Следова-
тельно, кратны 6 числа 108, 114, . . . , 294, 300.
Итак, последовательность 102, 108, . . . , 294, 300 содержит
300 − 108
+ +1 = 34 элемента. Следовательно, число благоприятных
6
исходов n (A) равно 34.
34
p (A) = .I
201
Пример 4. A = {Число состоит из нечетных цифр}.

J Поскольку число состоит только из нечетных цифр, то его запись вклю-


чает лишь цифры 1, 3, 5, 7 или 9. Третий разряд может принимать только
значение 1, поскольку число 300 — четное.
Т. е. благоприятными исходами будут такие числа из данного по усло-
вию множества, что третий разряд содержит 1, а первый и второй составля-
ют всевозможные комбинации цифр 1, 3, 5, 7 или 9. Первый разряд можно
выбрать пятью способами, второй разряд — также пятью. По формуле (3)

n (A) = 1 · 5 · 5 = 25.
25
Следовательно, p (A) = .I
201
В задачах примеров 5—8 испытание состоит в бросании двух играль-
ных костей. Исходом в задаче будет являться пара чисел hc1 , c2 i, выпавших
на костях. Например, пара h1, 6i означает, что выпали кости 
, пара
h5, 2i —  .
Обращаем внимания читателя на то, что пара hc1 , c2 i является упоря-
доченной, т. е. hc1 , c2 i 6= hc2 , c1 i. Пара h3, 4i означает, что сначала выпала

кость , а затем — . 
Требуется найти вероятность события A.
Число всех исходов n равно 62 = 36.

Пример 5. A = {Сумма выпавших очков равна 7}.

J Перечислим благоприятные исходы: h1, 6i, h6, 1i, h5, 2i, h2, 5i, h4, 3i,
h3, 4i. Как видно, всего их 6.
6 1
p (A) = = .I
36 6
Пример 6. A = {Сумма выпавших очков делится на 3}.

8
J Делятся на три суммы очков 3, 6, 9, 12. Запишем исходы для каждой из
сумм в таблицу:
P
Исходы Количество исходов
3 h1, 2i, h2, 1i 2
6 h2, 4i, h4, 2i, h3, 3i, h5, 1i, h1, 5i 5
9 h6, 3i, h3, 6i, h4, 5i, h5, 4i 4
12 h6, 6i 1

Всего 12 благоприятных исходов.


12 1
p (A) = = .I
36 3
Пример 7. A = {Модуль разности выпавших очков 4}.

J Благоприятные исходы: h6, 2i, h2, 6i, h5, 1i, h1, 5i. Их четыре.
4 1
p (A) = = .I
36 9
Пример 8. A = {На костях выпадет одно и то же число очков}.

J Очевидно, благоприятных исходов 6:

h1, 1i, h2, 2i, h3, 3i, h4, 4i, h5, 5i, h6, 6i.
6 1
p (A) = = .I
36 6

В задачах примеров 9—11 испытание состоит в случайном вынимании


5 карт из колоды в 36 карт. Требуется найти вероятность события A.
5
Число всех исходов равно C36 . Будем пользоваться формулой (5).

Пример 9. A = {Все карты красной масти}.

J Всего карт красной масти 18. Из колоды вынимается 5 карт, поэтому чис-
ло благоприятных исходов — это число сочетаний из 18 по 5:
5
n (A) = C18 .
5
C18
p (A) = 5 . I
C36
Пример 10. A = {Среди вынутых пяти карт два туза}.

9
J Всего тузов в колоде 4. Следовательно, остальные 3 карты будут
вынуты из 32.
n (A) = C42 · C32
3
.
C42 · C32
3
p (A) = 5 .I
C36
Пример 11. A = {Среди пяти карт хотя бы одна дама}.

J Существует два пути решения задачи.


Способ 1 (непосредственный). Дам в колоде 4. Условие означает, что
из пяти карт дамами могут оказаться одна, две, три или четыре карты. Число
исходов, в которых дама одна, равно C41 · C32
4
. Если дамы две, то C42 · C32
3
и т.
д.
Сложив количества исходов всех четырех вариантов, имеем

n (A) = C41 ·C32


4
+C42 ·C32
3
+C43 ·C32
2
+C44 ·C32
3 4
= 4·C32 3
+6·C32 2
+4·C32 3
+1·C32 .
4 3 2 3
4 · C32 + 6 · C32 + 4 · C32 + 1 · C32
p (A) = 5 .
C36
Способ 2 (через противоположное событие). Рассмотрим событие
{Среди пяти карт ни одной дамы}. Благоприятных исходов этого со-
5
бытия C40 · C32 = C32 5
, всего исходов — C36 5
, следовательно, вероятность
5
C
рассматриваемого события равна 32 5 . Тогда событие A произойдет с веро-
C 36
5
 
C32
ятностью 1 − 5 .
C36
N. B. Подобные задачи рекомендуется решать способом 2, посколь-
ку он является более экономичным. I

Для нахождения вероятностей в примерах 12—18 тоже можно ис-


пользовать сочетания.

Пример 12. В кредитном отделе банка работают 5 сотрудников и


3 стажера. Наугад выбирают 3 человек. Найти вероятность того,
что среди них два сотрудника и один стажер.

J Число всех исходов равно C83 = 56.

n (A) = C52 · C31 = 30.


30 15
p (A) = = .I
56 28

10
Пример 13. На полке трудов лауреатов Нобелевских премий по эко-
номике стоят 4 книги Хикса 1 и 3 книги Фридмана2 . Наугад берутся 2
книги. Найти вероятность того, что среди них хотя бы одна книга
Хикса.

J Всего исходов C72 = 21.


Найдем число исходов для событий {Одна из выбранных книг —
Хикса, другая — Фридмана} и {Обе книги — Хикса}, и сложим их.

n (A) = C41 · C31 + C42 · C30 = 18.

Следовательно,
18 6
p (A) = = .I
21 7
Пример 14. В супермаркете продают 12 сортов масла от разных
производителей. Известно, что четверть сортов не соответству-
ет стандарту. Случайно выбирают 3 сорта масла. Какова вероят-
ность, что ровно два из них соответствуют стандарту?
3
J Число всех исходов равно C12 = 220.

n (A) = C31 · C92 = 108.


108 27
p (A) = = .I
220 55
Пример 15. Среди продаваемых в салоне 22 автомобилей 5 имеют
нарушенный комплект поставки. Случайно выбирают 4 автомоби-
ля. Найти вероятность того, что все они недоукомплектованы.
4
J Число всех исходов равно C22 .

n (A) = C54 · C17


0
= 5.
5
p (A) = 4 .I
C22
Пример 16. При подготовке к экзамену Ваня выучил 30 вопросов из
40. В билете 2 вопроса. Найти вероятность того, что ему попадет-
ся билет с двумя известными вопросами.
1
Джон Ричард Хикс (англ. John Richard Hicks; 1904—1989) — американский экономист, лауреат Нобе-
левской премии 1972 г. «за новаторский вклад в общую теорию равновесия и теорию благосостояния».
2
Ми́лтон Фри́дман (англ. Milton Friedman; 1912—2006) — американский экономист, лауреат Нобелев-
ской премии 1976 г. «за достижения в области анализа потребления, истории денежного обращения и раз-
работки монетарной теории, а также за практический показ сложности политики экономической стабилиза-
ции».

11
J Число билетов, содержащих всевозможные комбинации из двух вопро-
2
сов, равно C40 = 780.
2 0
n (A) = C30 · C10 = 435.
435 29
p (A) = = .I
780 52
Пример 17. Перед тем, как выпустить новый товар на рынок, мно-
гие компании проводят опрос потребителей для выяснения будуще-
го успеха товара. Представитель компании, разрабатывающей но-
вый йогурт с биодобавками, зашел в магазин, где в этот момент
присутствовали 20 покупателей, наугад выбрал троих из них и пред-
ложил им попробовать продукт. Если предположить, что из 20 по-
купателей 5 вообще не употребляют йогурт, 7 не любят биодобав-
ки, а 8 покупателям новый продукт понравился бы, какова вероят-
ность того, что не меньше чем двое из троих опрошенных одобрят
продукт?
3
J Всего исходов C20 = 1140.
Если двое из троих опрошенных одобрят продукт, то благоприятных
1
исходов C82 · C12 = 12 · 28 = 336. Если новый йогурт понравится всем троим,
то благоприятных исходов C83 = 56. Следовательно,
n (A) = 336 + 56 = 392.
392 98
p (A) = = .I
1140 285
Пример 18. В коробке лежат 30 конфет, половина из них — с кофей-
ной начинкой. Наугад берутся 3 конфеты. Найти вероятность то-
го, что среди них не более одной конфеты с кофейной начинкой.
3
J Всего исходов C30 = 4060.
Если конфета с кофейной начинкой одна, то благоприятных исходов
1 2
C15 · C15 = 15 · 105 = 1575. Если среди выбранных нет ни одной конфеты с
0 3
кофейной начинкой, то благоприятных исходов C15 · C15 = 1 · 105 = 455.
Следовательно,
n (A) = 1575 + 455 = 2030.
2030 1
p (A) = = .I
4060 2
В задачах примеров 19—22 испытание состоит в том, что из цифр
1, 2, . . . , 9 выбирают без возвращения и записывают в порядке выбора 4
цифры, образующие четырехзначное число. Найти вероятность события A.
Поскольку испытание состоит в выборе без возвращения и с учетом
порядка, всего исходов A49 = 3024.

12
Пример 19. A = {Записано число 9127}.

J Благоприятный исход, очевидно, единственен — 9127, т. е.

n (A) = 1.
1
p (A) = .I
3024
Пример 20. A = {На четырех местах стоят нечетные цифры}.

J Нечетных цифр пять, отсюда

n (A) = A45 = 120.


120 5
p (A) = = .I
3024 126
Пример 21. A = {Цифры 5 и 6 стоят рядом}.

J Существует шесть вариантов соседнего размещения цифр 5 и 6 в четы-


рехзначном числе. Остается лишь разместить оставшиеся 7 цифр на две по-
зиции — это можно сделать A27 = 42 способами.

n (A) = 6 · A27 = 252.


252 1
p (A) = = .I
3024 12
Пример 22. A = {В записи числа отсутствует цифра 2}.

J Запись числа выполняется восемью цифрами, откуда,

n (A) = A48 = 1680.


1680 5
p (A) = = .I
3024 9
Пример 23. В службе безопасности фирмы работают 12 охранни-
ков, 4 из которых являются выпускниками одного и того же учеб-
ного центра. Найти вероятность того, что при случайной группи-
ровке охранников по 3 человека в каждой группе будет выпускник
данного центра.

J При решении задачи будем пользоваться формулой (7). Сначала отыщем


общее количество вариантов группировки:
12! 12!
n= = .
3! · 3! · 3! · 3! (3!)4
13
Для подсчета числа благоприятных исходов найдем отдельно число
n1 (A) способов распределения 4 юношей в 4 группы по одному и число
n2 (A) способов распределения 8 девушек в 4 группы по двое:
4!
n1 (A) = = 4!,
1! · 1! · 1! · 1!
8! 8!
n2 (A) = = .
2! · 2! · 2! · 2! (2!)4
3 · 8!
n (A) = n1 (A) · n2 (A) = .
2!
3 · 8! · (3!)4 9
p (A) = = .I
2! · 12! 55
Пример 24. Преподаватель для выполнения лабораторной работы
разбивает на пары шесть человек, среди которых есть два друга —
Олег и Сергей. Найти вероятность того, что Олег и Сергей окажут-
ся в одной паре.

J Сначала отыщем общее количество вариантов группировки:


6! 6!
n= = = 6 · 5 · 3.
2! · 2! · 2! (2!)3
Если Олег и Сергей окажутся в первой паре, то остальные пары, очевид-
4!
но, можно сформировать = 6 способами. Олег и Сергей могут также
2! · 2!
оказаться во второй или в третьей паре, следовательно,
4!
n (A) = 3 · = 18.
2! · 2!
18 1
p (A) = = .I
6·5·3 5
Пример 25. Какова вероятность, что в четырехзначном номере
(от 0000 до 9999) все цифры различны?

J Выбрать одну из 10 цифр 4 раза можно 104 способами. Выбрать 4 раз-


личных цифры из 10 можно уже A410 способами, поэтому
A410
p (A) = 4 . I
10
Пример 26. Видеосалон располагает 20 фильмами, 6 из которых Се-
мен уже видел. Сеанс включает 2 фильма. Если Семен случайным об-
разом выберет сеанс, какова вероятность того, что оба фильма ему
незнакомы?

14
2
J Всего у Семена C20 = 190 вариантов выбора фильмов. Случаев, когда
2
Семен выберет незнакомые фильмы, C14 = 91.
2
C14
p (A) = 2 . I
C20
Пример 27. Карточки, на которых написаны буквы
Т , Е , Л , Е , С , К , О , П ,
раскладывают в ряд. Какова вероятность, что полученное восьми-
буквенное слово является осмысленным?

J Из означенного ряда букв можно составить 8! различных слов, однако


лишь два из них — «ЛЕПЕСТОК» и «ТЕЛЕСКОП», — являются осмыс-
ленными. Иными словами, всего имеем 8! исходов и лишь два благоприят-
ных.
2
p (A) = . I
8!
Пример 28. Было написано 4 письма и для них подписано 4 конвер-
та. Затем письма наудачу вложили в конверты. Каковы вероятно-
сти того, что число правильно вложенных писем равно: 0, 1, 2, 3, 4?

J Обозначим события:
A0 = {Число правильно вложенных конвертов равно 0},
A1 = {Число правильно вложенных конвертов равно 1},
...
A4 = {Число правильно вложенных конвертов равно 4}.
Всего вариантов вложения писем в конверты 4! = 24. Непосредствен-
ным перебором вариантов устанавливаем, что

i n (Ai ) p (Ai )
3
0 9 8
1
1 8 3
1 I
2 6 4
3 0 0
1
4 1 24

Пример 29. На клавиатуре банковского сейфа 10 цифр. Какова веро-


ятность того, что злоумышленник откроет сейф, если ему априори3
известно, кто комбинация-пароль замка состоит из 8 цифр?
3
Априо́ри (лат. a priori) — букв. «от предшествующего»; знание, полученное до опыта.

15
J Всего злоумышленник может набрать 108 различных комбинаций, из них
искомый пароль может встретиться ровно один раз. Следовательно,
1
p (A) = .I
108
Пример 30. Какова вероятность угадать 5 выигрышных номеров в
тираже «Спортлото», отмечая на карточке пять чисел от 1 до 36?
5
J Всего наборов по 5 номеров C36 штук. Благоприятный исход один.
1
p (A) = 5 .I
C36
Пример 31. В урне имеется три шара: черный, красный и белый. Из
урны 4 раза извлекали шар, причем после каждого извлечения шар
возвращали обратно. Определить вероятность того, что 4 раза из-
влекали черный шар.

J Всего исходов 34 = 81. Благоприятный исход один — тот, который до-


ставляет извлечение черного шара при каждой из четырех попыток.
1
p (A) = .I
81

Пример 32. 100 сотрудников холдинга отвечали на тренинге на во-


прос: «От чего, по Вашему мнению, в первую очередь зависит авто-
ритет руководителя:
1. от его личных качеств;
2. от его компетентности как специалиста;
3. от его формального статуса?»
Первый ответ выбрали 17 сотрудников, второй — 51 сотрудник,
остальные предпочли третий ответ. Какова вероятность, что слу-
чайно выбранный из числа опрошенных сотрудник считает, что ав-
торитет руководителя зависит в первую очередь от формального
статуса?

J Всего 100-17-51=32 сотрудника считают, что авторитет руководителя


определяется его формальным статусом.
32 8
Отсюда очевидно, что p (A) = = .I
100 25

16
 Задачи
В задачах 1—3 испытание состоит в случайном выборе одной буквы
из букв слова «ЭКОНОМИКА»; необходимо найти вероятность события
A.
1. A = {Вынута буква «М»}.
2. A = {Вынута согласная буква, но не «М»}.
3. A = {Вынута гласная буква}.

В задачах 4—7 испытание состоит в случайном выборе числа из по-


следовательности 10, 11, . . . , 99; требуется найти вероятность события A.
4. A = {Сумма цифр числа равна 4}.
5. A = {Число делится на 2 и на 3}.
6. A = {Число состоит из четных цифр}.
7. A = {Число не кратно 12}.

В задачах 8—11 испытание состоит в бросании двух костей. Найти


вероятности событий:
8. A = {Сумма выпавших очков меньше 5}.
9. A = {Произведение выпавших очков делится на 3}.
10. A = {На обеих костях выпадет «6»}.
11. A = {Ни на одной из костей не выпадет «1»}.

12. В розыгрыше лотереи участвуют 100 билетов, среди кото-


рых 25 выигрышных. Какова вероятность остаться без выигрыша,
приобретя 3 билета лотереи?
13. На склад дилера известной марки MP3-плееров поступила
партия из 20 устройств, 6 из которых ввезены в страну нелегаль-
но. Инспекторы службы технического контроля проверяют только
два плеера из партии. С какой вероятностью специалисты компании
выявят хотя бы один «контрафактный» аппарат?
14. В коробке лежат 6 молочных шоколадных конфет и 8 кон-
фет черного шоколада. Наудачу вынимаются 5 конфет. Найти ве-
роятность того, что среди них не меньше 4 конфет молочного шо-
колада.
15. Из 5 студентов-математиков и 6 студентов экономиче-
ского факультета выбирают сначала одного, потом еще двоих. Ка-
кова вероятность, что все трое учатся на одном факультете?
16. В конференции принимали участие 2 первокурсника, 5 вто-
рокурсников, 6 третьекурсников и 5 студентов четвертого курса,

17
причем список выступающих был составлен по алфавиту. Какова ве-
роятность, что 5 первых докладов делали второкурсники?
17. В 25 экзаменационных билетах содержится по два не по-
вторяющихся вопроса. Студент знает ответы только на 40 вопро-
сов. Какова вероятность того, что ему достанется билет, в кото-
ром он оба вопроса знает?
18. В 25 экзаменационных билетах содержится по два не по-
вторяющихся вопроса. Сколько вопросов надо выучить студенту
при подготовке к экзамену, чтобы вероятность того, что ему до-
станется билет, в котором он оба вопроса знает, была бы не меньше
0,9?
19. Из девяти мобильных телефонов три — китайской сборки,
два — венгерской. Какова вероятность, что среди выбранных слу-
чайно четырех телефонов поровну аппаратов китайской и венгер-
ской сборки?
20. Среди двадцати купюр есть две фальшивые. Если взять слу-
чайно две купюры из двадцати, какова вероятность того, что среди
них хотя бы одна фальшивая?
21. Из коробки, в которой лежат 10 испанских апельсинов и 6 —
марокканских, наудачу вынимают 3 фрукта. Найти вероятность
того, что образовалась пара, т. е. вынут один апельсин, выращен-
ный в Испании, и один — из Марокко.

В задачах 22—25 испытание состоит в том, что из цифр 2, 3, . . . , 8


выбирают без возвращения и записывают в порядке выбора 3 цифры, об-
разующие трехзначное число. Найти вероятности событий:
22. {Записано число 545}.
23. {Записано число 546 или 547}.
24. {Все цифры четные}.
25. {В записи числа присутствуют цифры 4 и 8}.

В задачах 26—29 испытание состоит в том, что из цифр 2, 3, . . . , 8


выбирают с возвращением и записывают в порядке выбора 3 цифры, об-
разующие трехзначное число. Найти вероятности событий:
26. {Записано число 545}.
27. {Записано число 546 или 547}.
28. {Все цифры четные}.
29. {В записи числа присутствуют цифры 4 и 8}.

30. При проведении корпоративного обучения для специали-


стов компаний холдинга, группа, состоящая из 12 руководителей и 6

18
специалистов, делится случайным образом на три равные подгруп-
пы. Найти вероятность того, что в каждой части число руководи-
телей и специалистов одинаково.
31. Четыре книги Акунина4 , пять книг Лукьяненко5 и три кни-
ги Роулинг6 случайно раскладывают на 3 бандероли по 4 книги. Како-
ва вероятность, что книги Роулинг окажутся в одной бандероли?
32. Тридцать студентов наудачу расходятся по трем аудито-
риям. Найти вероятность того, что в первой будет 12 человек, а во
второй 5.
33. В автобус зашли 5 человек. Автобус делает 7 остановок.
Найти вероятность того, что все пятеро выйдут на разных оста-
новках.
34. В телефонном номере 6 цифр. Какова вероятность того,
что все цифры различны?
35. В лотерее разыгрывается 1000 билетов. Среди них два вы-
игрыша по 5000 руб., пять выигрышей по 2000 руб., десять выигрышей
по 1000 руб. и 25 по 500 руб. Некто покупает один билет.
а) выигрыша не менее 2000 руб.,
Найти вероятность:
б) какого-либо выигрыша.
36. Семеро сотрудников становятся в очередь для получения
заработной платы. Определить вероятность того, что два опре-
деленных человека стоят рядом.
37. На семинаре «Проблемы невозврата потребительских кре-
дитов» 7 человек, среди которых были два представителя Торгово-
промышленной палаты, случайным образом разместились за круг-
лым столом. Определить вероятность того, что представители
Торгово-промышленной палаты сидят рядом.
38. На полке произвольным образом расставили 6 разных книг
Астафьева7 . Какова вероятность, что две фиксированные книги
окажутся стоящими рядом?
39. На полке стоят 30 книг, среди них шеститомник Каспаро-
8
ва . Какова вероятность, что тома Каспарова расположены в по-
рядке возрастания номеров, но не обязательно рядом?
40. В группе из 15 студентов 7 родились в Красноярске, 4 — в
Томске, 3 — в Новосибирске и 1 — в Норильске. Из группы выбирают 4
студентов. Какова вероятность, что среди них есть уроженцы всех
4
Борис Акунин (псевдоним, настоящее имя — Григорий Чхартишвили; р. 1956) — российский писатель.
5
Сергей Лукьяненко (р. 1968) — российский писатель-фантаст.
6
Джоа́н Ро́улинг (англ. Joanne Rowling ; р. 1965) — английская писательница.
7
Виктор Астафьев (1924—2001) — российский писатель.
8
Каспаров, Г. М. Мои великие предшественники. Новейшая история развития шахматной игры:
В 6 т. / Гарри Каспаров. М.: Рипол классик, 2005.

19
4 городов?
41. Карточки, на которых написаны буквы
А , Ш , Ф , К , Л , Е ,
раскладывают в ряд. Какова вероятность, что получится слово
«ФЛЕШКА»?
42. Карточки, на которых написаны буквы
Г , А , С , Т , Р , О , Н , О , М ,
раскладывают в ряд. Какова вероятность, что они лягут в порядке
«НОРМАГОСТ»?
43. На клавиатуре пишущей машинки 26 букв латинского ал-
фавита. Ребенок 4 раза нажимает клавиши. Какова вероятность,
что он напечатает слово “WORD”?

20
2. Основания теории вероятностей
2.1. Основные понятия

Пространство элементарных событий

Пространством элементарных событий Ω называется


множество, содержащее все возможные результаты данного случайного
эксперимента, из которых в эксперименте происходит ровно один. Элемен-
ты этого множества называют элементарными исходами и обозначают
буквой ω. Событиями мы будем называть некоторые наборы элементарных
исходов, то есть подмножества множества Ω. Говорят, что в результате экс-
перимента произошло событие A, если в эксперименте произошел один из
элементарных исходов, входящих в данное множество.
1. Достоверное событие, наступающее при любом исходе, обозна-
чается Ω.
2. Невозможное событие обозначается ∅.
3. A1 = A2 , если A1 ⊆ A2 и A2 ⊆ A1 .
4. A1 и A2 называются несовместными, если множества элементар-
ных исходов {ωA1 } и {ωA2 } не пересекаются.

Комбинации событий

Суммой или объединением событий A1 , A2 называется собы-


тие A, состоящее в осуществлении хотя бы одного из A1 , A2 :
A = A1 + A2 = A1 ∪ A2 .
S
Аналогично определяется A = Ak .
k

Произведением или пересечением событий A1 , A2 называется со-


бытие A, состоящее в осуществлении и A1 и A2 :
A = A1 · A2 = A1 ∩ A2 .
T
Аналогично определяется A = Ak .
k
N. B. Часто знак умножения «·» опускается. Поэтому, в пособии за-
писи
A B и A · B означают одно и то же — произведение событий A и B.
Разностью событий A1 , A2 называется событие A, которое означает,
что происходит A1 , но не происходит A2 :
A = A1 \ A2 .

21
2.1 Основные понятия

Противоположным или дополнительным к событию A называется


событие A, состоящее в том, что событие A не происходит:
A = Ω \ A.
Симметрической разностью событий A и B называется событие
A1 4A2 = A1 A2 + A2 A1 .

Свойства операций

Сложение (+, ∪) Умножение ( · , ∩)


1. A+B =B+A A·B =B·A (коммутативность)

2. (A + B) + C = A + (B + C) (A · B) · C = A · (B · C) (ассоциативность)
3. A+A=A A·A=A
4. A+∅=A A·∅=∅
5. A+Ω=Ω A·Ω=A
6. A+A=Ω A·A=∅
7. A+B =A·B A·B =A+B (законы двойственности)
(дистрибутивность умножения
8. (A + B) · C = A · C + B · C
относительно сложения)
9. Ω=∅
10. ∅=Ω

В задачах примеров 33—36 описать Ω и подмножество Ω, соответ-


ствующее событию A.
Пример 33. Монету подбрасывают 2 раза, A = {2 раза выпал герб}.
J Выпадение «герба» будем обозначать буквой «Г», выпадение
«решки» — буквой «Р».
Ω = {ГГ, РГ, ГР, РР}.
A = {ГГ}. I
Пример 34. Каждый из двух экспертов независимо присваивает про-
екту ранг от 1 до 6 соответственно его актуальности. A = {сумма
рангов равна 6}.
J Как и раньше, ha, bi — упорядоченная пара.
Ω = {ha, bi | a, b ∈ 1, 6}.
A = {ha, bi | a + b = 6}. I

22
2.1 Основные понятия

Пример 35. Студент 3 раза проходит тест, A = {первый успех был


достигнут при третьей попытке}.

J Успех будем обозначать единицей, неудачу — нулем.

Ω = {ha, b, ci | a, b, c ∈ {0, 1}}.

A = {h0, 0, 1i}. I

Пример 36. Студент 3 раза проходит тест, A = {хотя бы один


успех}.

J Как и прежде, успех будем обозначать единицей, неудачу — нулем.

Ω = {ha, b, ci | a, b, c ∈ {0, 1}}.

A = {ha, b, ci | a + b + c > 1}.


Выпишем множество A явно:

A = {h0, 0, 1i, h0, 1, 0i, h1, 0, 0i, h0, 1, 1i, h1, 1, 0i, h1, 0, 1i, h1, 1, 1i}. I

В задачах примеров 37—42 выразить событие D через


A = {Алексеев получил премию},
B = {Васильев получил премию},
C = {Степанов получил премию}.

Пример 37. D = {ровно один сотрудник из вышеперечисленных полу-


чил премию}.

J D = A B C + A B C + A B C. I

Пример 38. D = {ровно двое получили премию}.

J D = A B C + A B C + A B C. I

Пример 39. D = {хотя бы один получил премию}.

J D = A + B + C = A B C. I

Пример 40. D = {хотя бы один не получил премию}.

J D = A + B + C = ABC. I

Пример 41. D = {не менее двоих получили премию}.

J D = A B C + A B C + A B C + A BC. I

23
2.1 Основные понятия

Пример 42. D = {получили премию не более одного сотрудника}.

J D = A B C + A B C + A B C + A BC. I

Пример 43. Прибор состоит из n блоков. Событие Ai = {исправен i-й


блок}. Описать события
n
[ n
\ n
[ n
\
Ai , Ai , Ai , Ai .
i=1 i=1 i=1 i=1

n
[
J Ai = {Исправен хотя бы один блок}.
i=1
n
\
Ai = {Исправны все блоки}.
i=1
n
[
Ai = {Не исправен хотя бы один блок}.
i=1
n
\
Ai = {Не исправны все блоки}. I
i=1

В задачах примеров 44—45 упростить выражения для событий.

Пример 44. C = A + A B + A + B.

J C = A + A B + A + B = A + A B + A B = A + A(B + B).
Поскольку B + B = Ω, C = A + A = Ω. I

Пример 45. C = (A + B)(A + B) + (A + B)(A + B).

J C = (A + B)(A + B) + (A + B)(A + B) =
= A A + B A + A B + B B + A A + A B + A B + B B.

Поскольку B B = ∅, A A = ∅,

C = B A + A B + B A + B A = B(A + A) + B(A + A) = B + B = Ω. I

В задачах примеров 46—47 доказать тождества.

Пример 46. A + B = (A \ (A B)) + B.

24
2.1 Основные понятия

J Пусть x ∈ (A\(A B))+B ⇒ x ∈ A(A B)+B ⇒ x ∈ A(A+B)+B ⇒


x ∈ A B + B.
Теперь положим x ∈ A + B ⇒ x ∈ A(B + B) + B(A + A) ⇒ x ∈
A B + A B + B A ⇒ x ∈ A B + B(A + A) ⇒ x ∈ A B + B.
Тождество доказано. I

Пример 47. A \ (B C) = (A \ B) + (A \ C).

J Пусть x ∈ A \ (B C) ⇒ x ∈ A(B + C) ⇒ x ∈ A B + A C.
Теперь положим x ∈ (A \ B) + (A \ C) ⇒ x ∈ A B + A C.
Тождество доказано. I

Пример 48. Доказать, что если A ⊂ B, то B ⊂ A.

J Поскольку A ⊂ B, то если взять x ∈ A ⇒ x ∈ B.


Теперь положим x ∈ B ⇒ x ∈ / B ⇒ x ∈ / A ⇒ x ∈ A. Итак, было
показано, что A ⊂ B ⇒ B ⊂ A. I

Пример 49. Показать, что если A и B несовместны, то A C и B C так-


же несовместны.

J A и B несовместны, следовательно, A B = ∅.
Рассмотрим пересечение событий A C и B C:

A C B C = A B C = ∅.

Поэтому, A C и B C несовместны. I

Пример 50. Выразить событие A + B + C как сумму несовместных


событий.

J Распишем сумму A, B и C как сумму трехчленных произведений.

A + B + C = AB + AB + BC + BC + C B + C B =
= A B C + A B C + A B C + A B C + A B C + A B C+
+ ABC + ABC + ABC + ABC + ABC + ABC =
= A B C + A B C + A B C + A B C + A B C + A B C + A B C.

Непосредственной проверкой убеждаемся, что все семь произведений


полученной суммы попарно несовместны. I

Пример 51. Каково условие совместности событий A+B, A+B, A+B?

25
2.1 Основные понятия

J События будут совместными, если их пересечение не пусто, т. е.


(A + B)(A + B)(A + B) 6= ∅.
Упростим это выражение.
(A + B)(A + B)(A + B) = (A + A B + A B)(A + B) = A(A + B) = A B.
Таким образом, условие совместности выглядит следующим образом:
AB =
6 ∅. I
Пример 52. Показать, что события A, AB, A + B образуют полную
группу.
J Для того, чтобы события A, AB, A + B составляли полную группу,
необходимо и достаточно, чтобы выполнялось равенство
A + AB + A + B = Ω
и события попарно не пересекались.
Рассмотрим сумму
A + AB + A + B = A + AB + A + B = A + AB + AB =
= A + A(B + B) = A + A = Ω.
Теперь рассмотрим попарные пересечения событий.
A A B = ∅.
A(A + B) = A A B = ∅.
A B(A + B) = A B A B = ∅.
Итак, события A, AB, A + B образуют полную группу. I

 Задачи
В задачах 44—48 описать Ω и подмножество Ω, соответствующее со-
бытию A.
44. Было совершено 3 сделки, A = {2 оказались прибыльными}.
45. Фирма обращается в банки для получения кредита поооче-
редно, то есть дожидается решения, и в случае отказа в кредито-
вании обращается в следующий банк. A = {только 4-й банк примет
положительное решение о кредитовании}.
46. На каждом из двух постов находятся от 1 до 3 охранников.
A = {На втором посту охранников больше, чем на первом}.
47. Четыре человека задумывают по цифре для шифра, A =
{задуманы одинаковые цифры}.
48. Резюме размещают на двух сайтах, A = {хотя бы на одном
сайте есть отклик}.

26
2.1 Основные понятия

В задачах 49—53 выразить событие C через A = {первый банкомат


работает}, B = {второй банкомат работает}.
49. C = {оба банкомата работают }.
50. C = {ни один банкомат не работает}.
51. C = {из двух банкоматов работает только первый}.
52. C = {из двух банкоматов работает только один}.
53. C = {из двух банкоматов работает хотя бы один}.

В задачах 54—59 требуется описать, в чем состоят события.


54. Событие A = {будет дождь}, событие B = {будет ветер}.
Описать события A + B, AB, A + B, A + B, B A.
55. Бракованные изделия могут иметь различные дефекты. Со-
бытие A состоит в том, что бракованное изделие имеет вмятину,
событие B в том, что имеется царапина, событие C в том, что име-
ется скол. Пояснить, в чем состоят события A+B, AB, A+B+C, A+
C, A + B.
56. Оформлено десять накладных. Событие Ak = { k-я наклад-
ная оформлена неправильно}, k = 1, . . . , 10. Описать события
10
[ 10
\ 8
\ 5
[
A1 + A2 + A3 , A1 A2 A3 , A4 A6 , Ai , Ai , Ai , Ai .
i=1 i=1 i=1 i=1

57. Устройство состоит из 5 элементов. Событие Ai =


{неисправен i-й элемент, i=1, . . . , 5}. Описать события
5
[ 4
\ 3
[ 5
\
Ai , Ai , Ai , Ai .
i=1 i=1 i=1 i=1

58. Три стрелка стреляют по цели. Событие Ai = { i-й стрелок


попадает в цель, i=1, 2, 3}. Описать события
3
\
A1 A2 A3 , A1 + A3 , A1 A3 A3 , A2 + A1 , Ai .
i=1

59. В магазине «Лампы от Евлампии» суточная выручка сильно


колеблется. Событие A состоит в том, суточная выручка магазина
составляет не больше 40 тысяч рублей, событие B состоит в том,
что суточная выручка составляет от 20 до 70 тысяч рублей. Опи-
сать события
A + B, AB, A + B, A + B.

27
2.2 Геометрическое определение вероятности

В задачах 60—62 упростить выражения для событий.


60. C = A + A B + B.
61. C = A + BA + B + ABA + A + B.
62. C = (B A + A B + B A)B.

В задачах 63—64 доказать тождества.


63. A(B + C) = AB + AC.
64. A + B = A B.

В задачах 65—66 проверить, верны ли следующие равенства.


65. (A \ B) = A 4 (A B).
66. A \ B = A \ B.

В задачах 67—70 выяснить, обязаны ли совпадать события A и B,


если:
67. A = B.
68. A + C = B + C, где C — некоторое событие.
69. A C = B C, где C — некоторое событие.
70. A \ B = ∅.

2.2. Геометрическое определение вероятности

Рассмотрим некоторую ограниченную область Ω в евклидовом про-


странстве Rm (на прямой, на плоскости, в пространстве при m = 1, 2, 3 со-
ответственно). Предположим, что «мера» Ω (длина, площадь и объем при
m = 1, 2, 3) конечна. Пусть случайный эксперимент состоит в том, что мы
наудачу бросаем в эту область точку, и событие A заключается в том, что
точка попадает в область Λ ⊆ Ω. Если эксперимент удовлетворяет усло-
виям «геометрического определения вероятности», т. е. его исходы можно
изобразить точками некоторой области Ω в Rm так, что вероятность попа-
дания точки в любую область Λ ⊆ Ω не зависит от формы или расположения
Λ внутри Ω, а зависит лишь от меры области Λ, то:
µ (Λ)
p (A) = , (8)
µ (Ω)
где µ (Λ) — мера области Λ.
В настоящем задачнике в основном используются геометрические
определения вероятности на прямой и на плоскости, где мерой множеств
являются соответственно длина L и площадь S. В этих случаях (8) запи-
шется как
L (Λ)
p (A) = . (9)
L (Ω)
28
2.2 Геометрическое определение вероятности

S (Λ)
p (A) = . (10)
S (Ω)

Пример 53. В центре квадратной площадки со стороной 20 м рас-


положен низкий фонарь, освещающий круг радиуса 10 м. Поздно ве-
чером, когда уже стемнело, где-то на площадке выронили телефон.
Какова вероятность, что телефон не виден?

J Построим математическую модель


задачи. 10 м примем за единицу. Телефон
мал по сравнению с размерами площадки,
и можно считать его «точкой». Тогда зада-
2

ча может быть переформулирована следую-


щим образом. Внутри квадрата со стороной
2 наугад выбирают точку. Найти вероятность
того, что расстояние её от центра квадрата
2 больше 1.
Воспользуемся геометрическим опре-
Рис. 1.
делением вероятности для плоскости. Мно-
жество всех исходов

Ω = {hx, yi | 0 6 x 6 2, 0 6 y 6 2} —

квадрат со стороной 2 (его площадь, очевидно, равна 4). Отыщем вероят-


ность события A ={точка отстоит от центра квадрата более чем
на 1} по формуле
S(Λ)
p (A) = .
S(Ω)
Множество Λ составляют все точки квадрата Ω за исключением тех,
что принадлежат кругу, центр которого совпадает с центром квадрата, а ра-
диус равен 1. На рис. 1 множество Λ заштриховано. Площадь такого круга
равна πr2 = π. Таким образом, площадь

S(Λ) = 4 − π.

Тогда,
4−π π
p(A) = = 1 − ≈ 0, 2146. I
4 4
Пример 54. В круг радиуса 1 вписан квадрат. Найти вероятность
того, что точка, поставленная наудачу в круге, окажется вне квад-
рата.

29
2.2 Геометрическое определение вероятности

J Поскольку
Ω = {hx, yi | x2 + y 2 6 1} —

1
круг радиуса 1,

=
r
S (Ω) = π.
Множество Λ составляет множество Ω
за исключением квадрата, вписанного в круг
радиуса 1.
Рис. 2. По теореме Пифагора
√ находим, что сто-
рона квадрата составляет 2. Следовательно,
S (Λ) = π − 2.
π−2 2
p (A) = = 1 − ≈ 0, 3633. I
π π
Пример 55. Два сотрудника должны сдать отчеты с 10 до 13 часов.
Какова вероятность того, что между моментами сдачи отчетов
пройдет меньше часа?

J Составим математическую модель задачи. Примем час за единицу,


а точку отсчета (10 часов) за 0. Испытание состоит в выборе на отрезке AB
длины 1 двух случайных точек: C и D. Найти вероятность того, что
1
|CD| < .
3
Множества исходов и благоприятных исходов будем изображать на
плоскости (см. рис. 3). Вдоль оси абсцисс на отрезке [0, 1] станем изобра-
жать положение точки C, вдоль оси ординат на том же отрезке — положе-
ние точки D. Множество всех исходов Ω — квадрат со стороной 1, одна из
вершин которого расположена в начале координат.
Его площадь, очевидно, равна 1.
xD Следовательно, вероятность описанно-
1 S (Λ)
го события составляет = S (Λ).
1
Изобразив множество Λ, найдем
его площадь. Из рисунка видно, что
Λ — это квадрат Ω без двух равных рав-
носторонних прямоугольников с кате-
1 2
3 тами . Суммарная площадь этих тре-
3  2
xC 1 2 4
угольников равна 2 · = .
0 1 1 2 3 9
3
30
Рис. 3.
2.2 Геометрическое определение вероятности

5
Тогда S (Λ) = = p (A). I
9

Пример 56. Испытание состоит в выборе на отрезке AB длины 1


двух случайных точек: C и D. Найти вероятность того, что сред-
няя часть отрезка меньше левой части.

J Пусть точка C расположена


y левее точки D на отрезке AB, т. е.
A x C D B |AC| < |AD|.
Рис. 4.
Положим AD = y, AC = x (см. рис. 4).
Тогда условие задачи описывается системой неравенств
 
y − x < x, y < 2x,

y > x. y > x.
Рассмотрим теперь случай, когда
x точка D расположена левее точки C,
т. е.
A y D C B
|AD| < |AC|.

Рис. 5. При этом сохраним обозначения


(см. рис. 5). Здесь условие задачи запи-
шется:
y > 12 x,
 
x − y < y,

y < x. y < x.
Взяв объединение рассмотренных выше систем, получим описание
множества благоприятных исходов:
(  )
1

y < 2x, y > x,

Λ = hx, yi

или 2 ,
y>x y < x.

при условии, что ω ∈ Ω ∀ω ∈ Λ.


Построим геометрическую фигуру,
xD которая соответствует множеству Λ. Будем
1 считать, что вдоль оси абсцисс отложена
xC = |AC| — координата точки C, а вдоль
∆1 оси ординат — xD = |AD| — координата
точки D. В этой системе координат постро-
им квадрат со стороной 1 — множество Ω,
1
внутри него — прямые y = 2x, y = x,
∆2 2
xC
1 1 31
0 2
2.2 Геометрическое определение вероятности

y = x, ограничивающие множество благо-


приятных исходов. Заштрихуем его.
Из рис. 6 видно, что
S (Λ) = 1 − (S (∆1 ) + S (∆2 )).
∆1 и ∆2 — прямоугольные треугольники, поэтому их площади равны
полупроизведению катетов.
1 1 1
·1· = .
S (∆1 ) =
2 2 4
1 1 1
S (∆2 ) = · 1 · = .
2 2 4
1
Таким образом, S (Ω) = .
2
1
p (A) = . I
2
Пример 57. Два судна должны подойти к одному и тому же прича-
лу. Время прихода обоих пароходов независимо и равновозможно от
12:00 до 15:00. Время стоянки первого парохода 30 минут, второ-
го — 1 час. Найти вероятность того, что одному из пароходов при-
дётся ожидать освобождения причала.
J Время будем измерять в минутах,
t2 отсчитывая 0 минут с 12:00. Тогда, момен-
180 ту времени 15:00 соответствует 180 минут.
Если обозначить время прихода первого
∆1 парохода t1 , а второго — t2 , то множество
120
всех исходов задачи можно описать сле-
дующим образом.
Ω = {ht1 , t2 i | 0 6 t1 6 180, 0 6 t2 6 180}.
30 ∆2
t1 Если сначала к причалу приходит
0 60 150 180 второй пароход, первый сможет подойти
к пристани не раньше, чем через 60 ми-
Рис. 7. нут. Во введенных нами определениях это
условие запишется неравенством
t1 − t2 6 60.
Аналогично выписываем условие стоянки второго парохода, если сна-
чала придет первый:
t2 − t1 6 30.

32
2.2 Геометрическое определение вероятности

Теперь мы можем описать множество благоприятных исходов Λ.

Λ = {ht1 , t2 i | t1 − t2 6 60, t2 − t1 6 30}.

На рис. 7 множество Λ представлено заштрихованной фигурой.


Отыщем ее площадь. Из рис. 7 видно, что

S (Λ) = S (Ω) − (S (∆1 ) + S (∆2 )) .

Вычислим площадь фигур Ω, ∆1 , ∆2 .

S (Ω) = 1802 = 32400.


1502
S (∆1 ) = = 11250.
2
1202
S (∆2 ) = = 7200.
2
Теперь ясно, что
S (Λ) = 13950,
а, следовательно,
S (Λ) 13950 31
p (A) = = = .I
S (Ω) 32400 72

 Задачи
71. Расчетное время выполнения проекта 92 ± 7 дней. Найти
вероятность того, что проект будет закончен не более, чем за 90
дней.
72. Если среднедушевой доход населения районов Красноярско-
го края представлен с точностью до 100 рублей, то какова вероят-
ность того, что ошибка округления не превышает 30 рублей?
73. Вдоль улицы через каждые 250 метров расположены реклам-
ные щиты. Каждый щит доступен для обозрения с расстояния 5—50
метров. Какова вероятность, что человеку, стоящему на улице, до-
ступен для обозрения щит?
74. В А́банском9 лесхозе 134 тыс. гектаров занято хвойными
породами и 85 тыс. гектаров занято мягколиственными породами.
9
А́бан — поселок городского типа, административный центр Абанского района Красноярского края.

33
2.2 Геометрическое определение вероятности

На территории, покрытой лесной растительностью, случайно вы-


бирается участок площадью 1 м2 . Какова вероятность при этом по-
пасть на территорию, занятую хвойными деревьями?
75. В протоколе об административном правонарушении плохо
пропечаталось 7 % текста. Какова вероятность, что пострадала
первая буква фамилии?
76. Первоначальная масса моющего средства во флаконе рав-
нялась 140 граммам. Средство тратилось равномерно и было истра-
чено за месяц. Найти вероятность того, что в случайный день меся-
ца во флаконе было от 20 до 35 граммов.
77. Ураган повредил линию электропередачи на участке между
50-м и 55-м километрами. Найти вероятность того, что обрыв ЛЭП
произошел между 51-м и 52-м километрами.
78. Стержень длиной 50 см ломается на две части. Найти ве-
роятность того, что одна часть короче 10 см, если излом равновоз-
можен в любом месте.
79. Через центр окружности случайным образом проводят два
луча. Какова вероятность, что угол между ними меньше 40◦ ?
80. В круге радиуса R случайно выбирается точка. Какова ве-
роятность, что она ближе к центру круга, чем к его границе?
81. На границе прямоугольника со сторонами 6 и 10 выбрана
случайная точка. Найти вероятность того, что расстояние ее от
какой-либо вершины прямоугольника меньше 1.
82. Охранник движется по границе прямоугольного участка со
сторонами 130 м и 50 м. Найти вероятность того, что в случайный
момент времени он будет находиться от любого угла на расстоя-
нии, превышающем 10 м.
83. Чтобы добраться до места учебы, студент может восполь-
зоваться автобусами маршрутов №№ 88 или 68. Интервалы движе-
ния автобусов 7,5 и 9 минут соответственно. Найти вероятность
того, что ждать автобуса придется меньше 5 минут.
84. Испытание состоит в случайном выборе двух чисел x1 и x2
из отрезка [0, 10]. Найти вероятность события {|x1 − x2 | > 2}.
85. Из отрезка [−1, 2] выбирают два числа x1 и x2 . Найти веро-
ятность события {x1 + x2 > 1, x1 x2 < 0}.
86. Испытание состоит в выборе на отрезке AB длины 1 двух
случайных точек: C и D. Найти вероятность события {Точка C бли-
же к точке A, чем к точке D}.
87. Если случайно выбрать на отрезке AB произвольной длины
две случайные точки C и D, то какова вероятность, что {|AD| <

34
2.2 Геометрическое определение вероятности

|CB|}.
88. На 12-километровом участке водопровода между Академ-
городком и Ветлужанкой10 в двух местах происходит утечка воды.
Найти вероятность того, что расстояние между местами повре-
ждений меньше 3 км.
89. Студент заходит в электронный курс «Теория вероятно-
стей и математическая статистика» для студентов экономиче-
ского факультета в любое время между 19:00 и 19:30 и через 5 минут
отправляет преподавателю вопрос по решению задачи. После этого
студент еще 35 минут присутствует на сайте этого электронно-
го курса. Преподаватель заходит в этот же курс в случайное время
между 19.40 и 20.30, немедленно получает сообщение и отвечает че-
рез 10 минут. Какова вероятность, что студент получит сообщение
до своего выхода с курса?
90. Инвестор встречается с двумя клиентами, которые при-
ходят независимо друг от друга в интервале от 14 до 16 часов. Про-
должительность каждой встречи — 30 минут. Найти вероятность
того, что одному из клиентов придется ждать.
91. В диспетчерскую службу городских электрических сетей за
20 минут поступили 2 заявки на устранение аварии из разных рай-
онов города. Найти вероятность того, что промежуток времени
между заявками меньше 3 минут.
92. Игорь Кузнецов и Олег Сергеев — ведущие специалисты кон-
курирующих авиационных фирм, — собираются посетить Между-
народный аэрокосмический салон в один и тот же день, с 10 до 12
часов дня. Каждый из них проведет не меньше 30 минут на презен-
тации новейшего многоцелевого истребителя. Какова вероятность,
что они там встретятся?
93. Если условия предыдущей задачи распространяются на
троих бывших однокурсников: Кузнецова, Сергеева, а также Илью
Пономарева — сотрудника третьей конкурирующей фирмы, — то
какова вероятность встречи всех троих на презентации?
94. Проект состоит из двух этапов, второй этап можно вы-
полнять только по завершении первого. Расчетное время выполне-
ния первого этапа 180 ± 10 дней, второго этапа 60 ± 5 дней. Найти
вероятность того, что проект будет закончен не более, чем за 235
дней.

10
Академгородок и Ветлужанка — микрорайоны г. Красноярска.

35
3. Теоремы исчисления вероятностей
3.1. Теоремы сложения и умножения

События A и B называются независимыми, если


p (A B) = p (A) p (B). (11)

События A1 , . . . , An называются независимыми (в совокупности),


если для всех 1 6 i1 < i2 < . . . < im 6 n, m 6 n,
m
! m
\ Y
p Aik = p (Aik ). (12)
k=1 k=1

Условной вероятностью события A при условии, что произошло


событие B, называется отношение
p (A B)
p (A/B) = , (p (B) > 0).
p (B)

Теорема сложения для двух событий. Для любых событий A и B


p (A ∪ B) = p (A) + p (B) − p (A B). (13)
Теорема сложения для n событий. Для любых событий A1 , . . . , An

n
! n
[ X X
p Ai = p (Ai ) − p (Ai Aj )+
i=1 i=1 16i<j6n
X
+ p (Ai Aj Ak ) − . . . + (−1)n−1 p (A1 . . . An ).
16i<j<k6n

N. B. По определению вероятности, если события A1 , . . . , An по-


парно несовместны, то
n
! n
[ X
p Ai = p (Ai ). (14)
i=1 i=1

Теорема умножения. Пусть p (B) 6= 0. Тогда


p (A B) = p (A/B) p (B). (15)
Теорема умножения для n событий. Пусть p (A1 ) 6=
0, . . . , p (An−1 ) 6= 0. Тогда
p (A1 A2 . . . An ) = p (A1 ) p (A2 /A1 ) . . . p (An /A1 A2 . . . An−1 ). (16)

36
3.1 Теоремы сложения и умножения

Пример 58. При опросе 100 красноярцев оказалось, что у 61 из них


имеется сотовый телефон, у 34 — стационарный телефон, причем
у 25 человек имелись и сотовый и стационарный телефоны. Являют-
ся ли наличие сотового и стационарного телефонов независимыми
событиями?

J Пусть
A ={Наличие сотового телефона},
B ={Наличие стационарного телефона},
тогда
AB = {наличие сотового и стационарного телефонов}.
По условию,

p (A) = 0, 61; p (B) = 0, 34, p (AB) = 0, 25.

p (A B) = 0, 25 6= p (A) p (B) = 0, 61 · 0, 34 = 0, 2074,


следовательно, события зависимы.I

В примерах 59—62 найти вероятность события D, выраженного через


события A, B, C, если

A = {Алексеев получил премию},


B = {Васильев получил премию},
C = {Степанов получил премию},

события A, B, и C независимы и

p (A) = 0, 4; p (B) = 0, 2, p (C) = 0, 7.

Пример 59. D ={Ровно один сотрудник из вышеперечисленных полу-


чил премию}.

J Как установлено в решении задачи примера 37, в данном случае


D = A B C + A B C + A B C. Для вычисления вероятности можно исполь-
зовать два способа.
Способ 1. По теореме сложения для n событий (здесь n = 3),

p (D) = p (A B C) + p (A B C) + p (A B C)−
− p (A B C A B C) − p (A B C A B C) − p (A B C A B C)+
+ p (A B C A B C A B C).

37
3.1 Теоремы сложения и умножения

Поскольку A A = ∅, B B = ∅, C C = ∅, то

p (A B C A B C) = p (A B C A B C) = p (A B C A B C) =
= p (A B C A B C A B C) = p (∅) = 0,

а, следовательно,

p (D) = p (A B C) + p (A B C) + p (A B C).
Так как события A, B и C независимы,

p (A B C) = p (A) p (B) p (C) = p (A) [1 − p (B)] [1 − p (C)] = 0, 096;

p (A B C) = p (A) p (B) p (C) = [1 − p (A)] p (B) [1 − p (C)] = 0, 036;


p (A B C) = p (A) p (B) p (C) = [1 − p (A)] [1 − p (B)] p (C) = 0, 336.
Итак, p (D) = 0, 468.
Способ 2. Заметим, что события A B C, A B C, A B C попарно несов-
местны. По аксиоматическому определению, вероятность суммы несов-
местных событий равна сумме вероятностей этих событий, то есть

p (D) = p (A B C) + p (A B C) + p (A B C) = 0, 468. I

Пример 60. D ={Хотя бы один сотрудник получил премию}.

J Из решения задачи примера 39 известно, что D = A B C.

p (D) = p(A B C) = 1 − p (A B C) =
= 1 − [1 − p (A)][1 − p (B)][1 − p (C)] = 0, 856. I

Пример 61. D ={Хотя бы один сотрудник не получил премию}

J При решении задачи примера 40 было установлено, что событие


D ={из трёх событий A, B, C не произойдёт хотя бы одно событие}
представимо в виде A + B + C = A B + C = A B C.
Тогда
p (D) = 1 − p (A B C).
События A, B, C независимы, поэтому p (A B C) = p (A) p (B) p (C) =
0, 056, и p (D) = 0, 944. I

Пример 62. D ={получили премию не более одного сотрудника}.

38
3.1 Теоремы сложения и умножения

Событие D представимо в виде суммы A B C + A B C + A B C, отсюда

p (D) = p (A B C) + p (A B C) + p (A B C).

Пользуясь аналогией с решение предыдущих задач, получаем


p (A B C) = 0, 084, p (A B C) = 0, 224, p (A B C) = 0, 024.
В итоге, p (D) = 0, 332. I

Пример 63. Отдел технического контроля проверяет изделия на


стандартность. Вероятность того, что изделие стандартно, рав-
на 0,8. Найти вероятность того, что из двух проверенных изделий
хотя бы одно стандартное.

J Проинтерпретируем задачу.
Пусть A ={Первое изделие стандартно};
B ={Второе изделие стандартно};
p (A) = 0, 8; p (B) = 0, 8.

Выразим событие D через A и B. Возможны различные представле-


ния.
Способ 1. D = A + B. Тогда по теореме сложения для двух независи-
мых событий имеем

p (D) = p (A) + p (B) − p (A B) = 0, 8 + 0, 8 − 0, 64 = 0, 96.

Способ 2. D = A B + A B + A B.

p (D) = p (A B) + p (A B) + p (A B) = 0, 16 + 0, 16 + 0, 64 = 0, 96.

Способ 3. D = A B.

p (D) = p(A B) = 1 − 0, 2 · 0, 2 = 0, 96. I

Пример 64. В жюри из трех человек двое независимо друг от дру-


га принимают правильное решение с вероятностью p, а третий для
вынесения решения бросает монету (окончательное решение вы-
носят большинством голосов). Жюри из одного человека выносит
справедливое решение с вероятностью p. Какое из этих жюри вы-
носит справедливое решение с большей вероятностью?

J Требуется найти вероятности событий


A = {Жюри из трех человек принимает правильное решение},
B = {Жюри из одного человека принимает правильное решение}

39
3.1 Теоремы сложения и умножения

и сравнить их.
Введем события Ai = {i-й член жюри принимает правильное
решение}, i = 1, 2, 3. Тогда

A = A1 A2 A3 + A1 A2 A3 + A1 A2 A3 + A1 A2 A3 .

Применив теорему сложения для случая трех независимых событий, полу-


чаем, что
1 1 1 1
p (A) = (1 − p)p + p(1 − p) + p2 + p2 = p.
2 2 2 2
Вероятность события B, очевидно, равна p.
Таким образом, жюри, состоящее из одного человека, и жюри, состо-
ящее из трех человек, выносят правильные решения с одинаковой вероят-
ностью. I

Пример 65. Вероятность изготовить первосортную деталь на пер-


вом станке равна 0,9; на втором — 0,8. На первом станке изгото-
вили 3 детали, на втором — 2. Какова вероятность того, что все
детали первосортные?

J Пусть

Ai = {i-я деталь, изготовленная на первом станке, первосортна},


Bi = {i-я деталь, изготовленная на втором станке, первосортна}.

Событие D ={На первом станке изготовили 3 детали, на втором — 2,


и все они принадлежат к первому сорту} во введенных нами обозначениях
запишется как A1 A2 A3 B1 B2 .
Применив теорему умножения для независимых событий, имеем
p (D) = 0, 93 0, 82 = 0, 5184. I

Пример 66. Фирма одновременно обращается в несколько банков с


заявлениеми о предоставлении кредита. Вероятность положитель-
ного решения 0,5. В какое число банков надо обратиться, чтобы ве-
роятность, что хотя бы один банк примет положительное решение
о кредитовании, была не меньше 0,99?

J A ={Хотя бы один банк примет положительное решение о кредито-


вании}.
Ai ={i-й банк примет положительное решение о кредитовании}.
Тогда
A = A1 + A2 + . . . + An ,

40
3.1 Теоремы сложения и умножения

где n — искомое количество банков.


Как следует из свойств операций над событиями,

A1 + A2 + . . . + An = A1 A2 . . . An .
 n
1
p (A) = 1 − .
2
Число банков определится из неравенства
 n
1
1− > 0, 99.
2
Решим это неравенство.
 n
1
− > −0, 01;
2
 n
1
6 0, 01;
2
2n > 100;
n > log2 100 ≈ 6, 64386;
Таким образом, нужно обратиться по меньшей мере в 7 банков, чтобы
вероятность получить хотя бы одно положительное решение о кредитовании
была не меньше 0,99. I

 Задачи
95. Из 180 студентов 30 не сдали экзамен, 20 не сдали курсовую
работу, 15 не сдали и то и другое. Пусть событие A = {студент
сдал экзамен}, B = {студент сдал курсовую работу}. Являются ли
эти события независимыми?
96. В условиях предыдущей задачи найти вероятность того,
что студент не сдал экзамен, если известно, что он не сдал курсо-
вую работу.
97. Человек имеет текущий счет с вероятностью 0,56, депо-
зитный счет с вероятностью 0,42, и тот и другой с вероятностью
0,30. Являются ли события, состоящие в наличии счетов, независи-
мыми? Какова вероятность, что имеется хотя бы один счёт?
98. В условиях предыдущей задачи найти вероятность того,
что человек имеет текущий счет при наличии депозитного счета.
99. Два аудитора проверили 10 одних и тех же фирм. Первый
аудитор обнаружил нарушения у 6 фирм, второй у 7 фирм, при этом

41
3.1 Теоремы сложения и умножения

у 5 фирм нашли нарушения оба аудитора. Являются ли независимы-


ми события, состоящие в обнаружении нарушений первым и вторым
аудиторами?
100. Вероятность дозвониться в диспетчерскую горэлектро-
сети равна 0,7. Какова вероятность, что удастся за два звонка со-
единиться с диспетчерской?
101. Событие Ai = {определенный товар присутствует в i-
м магазине}, события независимы, p (Ai ) = 0, 8, i = 1, 2, 3. Найти
вероятности событий
3
\
A1 A2 A3 , A1 + A3 , A1 A3 A3 , A2 + A1 , Ai .
i=1

102. Время обслуживания составляет от 10 до 20 минут. Со-


бытие A = {время обслуживания меньше 15 минут}, событие B =
{время обслуживания от 13 до 17 минут}. Найти вероятности со-
бытий
A + B, AB, A + B, A + B.

103. Устройство состоит из 5 элементов. Событие Ai =


{неисправен i-й элемент, i = 1, . . . , 5}. Найти вероятности событий,
если события независимы, и p (Ai ) = 0, 5 ∀i.
5
[ 4
\ 3
[ 5
\
Ai , Ai , Ai , Ai .
i=1 i=1 i=1 i=1

В задачах 104—110 известно, что 60 % зрителей первой телепрограм-


мы и 70% зрителей первой телепрограммы смотрят рекламные блоки. Со-
бытия A и B состоят в том, что зритель соответственно первой и второй
программ увидит рекламный блок. Найти вероятность события C.
104. C = {Произойдут оба события A, B}.
105. C = {Не произойдет ни одного события из A, B}.
106. C = {Из двух событий A, B осуществится только A}.
107. C = {Из двух событий A, B осуществится ровно одно событие}.
108. C = {Из двух событий A, B осуществится хотя бы одно
событие}.
109. C = {Зритель увидит рекламный блок только по второй
программе}.
110. C = {Зритель не увидит рекламный блок хотя бы по одной
программе}.

42
3.1 Теоремы сложения и умножения

В задачах 111—118 события A, B, C обозначают, что сотрудники


Пискунов, Прохоров и Ушаков выполняют дневной план работы. Вероят-
ность каждого из этих событий равна 0,7. Требуется найти вероятности со-
бытия D.
111. D = {Только один из троих сотрудников выполнит план}.
112. D = {Ровно два сотрудника выполнят план}.
113. D = {Хотя бы один сотрудник выполнит план}.
114. D = {Хотя бы один из сотрудников не выполнит план}.
115. D = {Из трех событий A, B, C произойдет не меньше двух
событий}.
116. D = {Не более одного сотрудника выполнит план}.
117. D = {Из трех событий A, B, C не произойдет не больше одного
события}.
118. D = {Только Пискунов и Прохоров выполнят план}.

В задачах 119—124 события A, B, C, D обозначают, что состоялись


выборы глав администрации соответственно в Ачинском, Балахтинском,
Сухобузимском и Дзержинском районах Красноярского края. Известно,
что p (A) = p (B) = 0, 9; p (C) = p (D) = 0, 8. Найти вероятность собы-
тия G.
119. G ={Выборы состоятся во всех районах}.
120. G ={Выборы не состоятся только в Дзержинском районе}.
121. G ={Из четырех событий A, B, C, D осуществится ровно одно
событие}.
122. G ={Выборы состоятся хотя бы в одном районе}.
123. G ={Из четырех событий A, B, C, D произойдёт больше одного
события}.
124. G ={Выборы не состоятся хотя бы в одном районе}.

125. С вероятностью 0,25 здание нуждается в ремонте, с веро-


ятностью 0,38 ремонт планируется. Найти вероятность того, что
здание нуждается в ремонте и планируется ремонт.
126. Система контроля состоит из двух независимых прове-
рок. В результате i-й проверки (i = 1, 2) бракованное изделие прини-
мают с вероятностью αi . Изделие принимают, если оно прошло обе
проверки. Найти вероятность того, что бракованное изделие бу-
дет отбраковано.
127. Система контроля состоит из двух независимых прове-
рок. В результате i-й проверки (i = 1, 2) изделие, удовлетворяющее
стандарту, отбраковывают с вероятностью βi . Изделие принима-
ют, если оно прошло обе проверки. Найти вероятность того, что

43
3.2 Формула полной вероятности. Формула Байеса

стандартное изделие будет принято.


128. В течение дня акция может подорожать с вероятностью
0,6 и подешеветь с вероятностью 0,4. Какова вероятность того, что
акция будет дорожать три дня подряд, если считать ежедневнные
изменения цены независимыми?
129. Студент выучил 25 вопросов из 30. Для получения зачета
достаточно ответить на оба вопроса билета или на один вопрос
билета и один дополнительный. Какова вероятность получения за-
чета?
130. Вероятность того, что накладная оформлена неправиль-
но, равна 0,2. Какова вероятность, что из трех проверяемых на-
кладных хотя бы одна оформлена неправильно?
131. Вероятность того, что накладная оформлена неправиль-
но, равна 0,2. Сколько накладных потребуется взять для проверки,
чтобы вероятность обнаружения неправльно оформленной наклад-
ной была не менее 0,8?
132. При приемке партии изделий подвергается проверке
треть из них. Условие приемки допускает не более 1 % бракованных
изделий. Определить вероятность того, что партия из 100 изделий,
содержащая 5 % брака, будет принята.
133. В телевизионной рекламе из названия фирмы «КОКОС» по-
следовательно выбираются 3 буквы, составляющие название товара
(СОК). Какова вероятность, что это слово образуется при случай-
ном выборе букв?
134. Партия товара состоит из 8 изделий первого сорта и 12
изделий высшего сорта. Первые 5 изделий оказались все высшего сор-
та. Какова вероятность, что следующее взятое изделие тоже выс-
шего сорта?
135. В круге радиуса R случайно выбирают 3 точки. Какова ве-
роятность, что все они ближе к центру круга, чем к его границе?

3.2. Формула полной вероятности. Формула Байеса

Формула полной вероятности. Пусть A — случайное собы-


тие; H1 , H2 , . . . , Hn — попарно несовместные случайные события, p (Hi ) >
n
S
0иA⊆ Hi . Тогда справедлива формула
i=1

n
X
p (A) = p ( Hi ) p (A/Hi ). (17)
i=1

44
3.2 Формула полной вероятности. Формула Байеса

Формула Байеса11 . Пусть A — случайное событие, H1 , H2 , . . . , Hn


n
S
попарно несовместны, p (Hi ) > 0, p (A) > 0 и A ⊆ Hi . В этих условиях
i=1
справедлива формула
p (Hi ) p (A/Hi )
p (Hi /A) = P
n . (18)
p (Hk ) p (A/Hk )
k=1

Пример 67. Клиент с вероятностью 0,8 заключит сделку, если он по-


лучит денежный перевод в ближайшие три дня. Если он получит пе-
ревод позднее, но не позже, чем через неделю, вероятность заклю-
чения сделки равна 0,5. Вероятность того, что денежный перевод
дойдет не дольше, чем за три дня, равна 0,3; не дольше, чем за неде-
лю — 0,8. Какова вероятность заключения сделки?

J Пусть
A ={Заключение сделки},
H1 ={Денежный перевод в ближайшие три дня},
H2 ={Денежный перевод позднее, но не позже, чем через неделю}.

p (H1 ) = 0, 3; p (H2 ) = 0, 8 − 0, 3 = 0, 5;
p (A/H1 ) = 0, 8; p (A/H2 ) = 0, 5.
По формуле полной вероятности

p (A) = p (H1 )p (A/H1 ) + p (H2 )p (A/H2 ) = 0, 3 · 0, 8 + 0, 5 · 0, 5 = 0, 49. I

Пример 68. Магазин получает батоны из трех хлебопекарен: 60 %


батонов поступает из первой, 15 % из второй и 25 % из третьей.
Батоны бывают непропеченными в одном случае из 30 для первой
хлебопекарни, в одном случае из 50 для второй, в одном случае из 10
для третьей. Покупатель купил батон, который оказался непропе-
ченным. Какова вероятность, что это продукция второй хлебопе-
карни?

J Положим
A ={Купленный батон оказался непропеченным},
H1 ={Батон испекли в первой хлебопекарне},
H2 ={Батон испекли во второй хлебопекарне},
H3 ={Батон испекли в третьей хлебопекарне}.
11
То́мас Ба́йес (Бейес, англ. Reverend Thomas Bayes; 1702—1761) — английский математик и священник.

45
3.2 Формула полной вероятности. Формула Байеса

p (H1 ) = 0, 6; p (H2 ) = 0, 15; p (H3 ) = 0, 25;


1 1 1
p (A/H1 ) = ; p (A/H2 ) = ; p (A/H3 ) = .
30 50 10
По формуле Байеса получаем, что
15 1
p (H2 ) p (A/H2 ) 100 · 50
p (H2 /A) = 3 = 60 1 15 1 25 1 =
P 100 · 30 + 100 · 50 + 100 · 10
p (Hi ) p (A/Hi )
i=1
3 3
1000 1000 1
= 2 3 5 = 48 = .I
100 + 1000 + 200 1000
16
Пример 69. Аналитики оценили вероятность возвращения банку
кредита: для финансовых структур эта вероятность составляет
0,99; для физических лиц 0,9; в остальных случаях 0,95. Найти веро-
ятность невозвращения кредита, если кредиты, предоставляемые
банком финансовым структурам, составляют 10 %, а физическим
лицам — 60 % всех кредитов.
J Пусть
A ={Невозвращение кредита},
H1 ={Кредит предоставлен финансовой структуре },
H2 ={Кредит предоставлен физическому лицу},
H3 ={Кредит предоставлен прочим клиентам}.
p (H1 ) = 0, 1; p (H2 ) = 0, 6; p (H3 ) = 1 − 0, 1 − 0, 6 = 0, 3;
p (A/H1 ) = 0, 01; p (A/H2 ) = 0, 1; p (A/H2 ) = 0, 05.
По формуле полной вероятности
p (A) = p (H1 ) p (A/H1 ) + p (H2 ) p (A/H2 ) + p (H3 ) p (A/H3 ) =
= 0, 1 · 0, 01 + 0, 6 · 0, 1 + 0, 3 · 0, 05 = 0, 076. I
Пример 70. В условиях предыдущего примера кредит не был возвра-
щен. Какова вероятность, что кредит был предоставлен финансо-
вой структуре?
J Воспользуемся формулой Байеса.

p (H1 ) p (A/H1 )
p (H1 /A) = .
p (H1 ) p (A/H1 ) + p (H2 ) p (A/H2 ) p (H3 ) p (A/H3 )
0, 1 · 0, 01
p (H1 /A) = ≈ 0, 013. I
0, 1 · 0, 01 + 0, 6 · 0, 1 + 0, 3 · 0, 05

46
3.2 Формула полной вероятности. Формула Байеса

Пример 71. Первый этап проекта будет выполнен в срок с вероят-


ностью 0,7; с задержкой до 10 дней — с вероятностью 0,2; с задерж-
кой от 10 до 15 дней — с вероятностью 0,1. Весь проект будет за-
кончен своевременно с вероятностями 0,9; 0,7; 0,6 соответственно
(т. е. проект будет закончен в срок с вероятностью 0,9, если пер-
вый этап будет выполнен вовремя и т. д.). Найти вероятность того,
что проект не удастся закончить в срок.

J Так же, как и раньше, вначале опишем событие A и гипотезы


H1 , H2 , H3 .

A ={Проект не удалось закончить в срок},


H1 ={Первый этап выполнен вовремя},
H2 ={Первый этап выполнен с задержкой до 10 дней},
H3 ={Первый этап выполнен с задержкой от 10 до 15 дней}.

p (H1 ) = 0, 7; p (H2 ) = 0, 2; p (H3 ) = 0, 1;


p (A/H1 ) = 0, 1; p (A/H2 ) = 0, 3; p (A/H2 ) = 0, 4.
По формуле полной вероятности выходит, что

p (A) = p (H1 ) p (A/H1 ) + p (H2 ) p (A/H2 ) + p (H3 ) p (A/H3 ) =

= 0, 7 · 0, 1 + 0, 2 · 0, 3 + 0, 1 · 0, 4 = 0, 17. I

Пример 72. Предварительные вероятности заключения трех неза-


висимых сделок оценивались как 0,6; 0,4; 0,7. Стало известно, что за-
ключена только одна сделка из этих трех. Какова вероятность то-
го, что это первая сделка?

J A ={Заключена только одна сделка},


H1 ={Заключена только первая сделка},
H2 ={Заключена только вторая сделка},
H3 ={Заключена только третья сделка}.

p (H1 ) = 0, 6 · 0, 6 · 0, 3 = 0, 108;
p (H2 ) = 0, 4 · 0, 4 · 0, 3 = 0, 048;
p (H3 ) = 0, 4 · 0, 6 · 0, 7 = 0, 168.

p (A/H1 ) = p (A/H2 ) = p (A/H3 ) = 1.

47
3.2 Формула полной вероятности. Формула Байеса

p (H1 ) p (A/H1 )
p (H1 /A) = .
p (H1 ) p (A/H1 ) + p (H2 ) p (A/H2 ) p (H3 ) p (A/H3 )

0, 108 · 1
p (H1 /A) = =
0, 108 · 1 + 0, 048 · 1 + 0, 168 · 1
0, 108 1
= = ≈ 0, 3333. I
0, 108 + 0, 048 + 0, 168 3
Пример 73. С вероятностью 0,6 договор находится в одной из трех
папок. После просмотра двух папок договор не обнаружен. Какова
вероятность того, что договор в третьей папке?

J A ={После просмотра двух папок договор не обнаружен};


Hi ={Договор находится в i-й папке}, i = 1, 2, 3;
H4 ={Договор находится не в папке, а в другом месте}.

По условию задачи

p (H1 ) = p (H2 ) = p (H3 ) = 0, 2; p (H4 ) = 0, 4;

p (A/H1 ) = p (A/H2 ) = 0; p (A/H3 ) = p (A/H4 ) = 1.


Тогда, по формуле Байеса,

p (H3 ) p (A/H3 ) 0, 2 · 1
p (H3 /A) = = =
4
P 0, 2 · 0 + 0, 2 · 0 + 0, 2 · 1 + 0, 4 · 1
p (Hi ) p (A/Hi )
i=1
0, 2 1
= = ≈ 0, 3333. I
0, 6 3

 Задачи
136. Если размер детали отклоняется от установленного раз-
мера не более чем на 1 %, она признается стандартной. Если откло-
нение составляет не более 3 %, то вероятность того, что деталь
будет признана стандартной, уменьшается до 0,5. А если отклоне-
ние составляет от 3 % до 5 %, вероятность равна 0,25. Если размер
детали отклоняется от установленного размера более чем на 5 %,
деталь считается нестандартной. Рассчитать вероятность того,

48
3.2 Формула полной вероятности. Формула Байеса

что деталь будет признана стандартной, если размер может с рав-


ной вероятностью отклониться от установленного стандарта до
10 % в обе стороны.
137. В двух урнах находится соответственно 5 и 3 белых, 4 и 6
черных шаров. Из каждой урны вынимают наудачу по одному шару,
а из них наудачу выбирают один. Какова вероятность того, что он
белый?
138. В условиях предыдущей задачи вынутый шар оказался бе-
лым. Какова вероятность того, что его вынули из первой урны?
139. Соотношение числа кредитов, предоставляемых банком
физическим и юридическим лицам, 3:2. Вероятности того, что взя-
тый кредит не будет возвращён, составляют 0,05 для физических
лиц и 0,02 для юридических лиц. Найти вероятность невозвращения
кредита.
140. В условиях предыдущей задачи найти вероятность того,
что невозвращенный кредит был предоставлен юридическому лицу.
141. Вероятность, что потребитель приобретет товар после
того, как увидит его рекламу по телевизору, равна 0,01; а вероят-
ность покупки товара потребителем, который не видел рекламы,
0,001. Если 40 % населения увидит рекламу, какая часть населения
приобретет товар?
142. В условиях предыдущей задачи покупатель приобрел то-
вар. Какова вероятность, что он видел рекламу?
143. Если общая вероятность, что потребитель приобретет
товар, равна 0,03; вероятность покупки товара потребителем, ко-
торый не видел рекламы, 0,001; и 20 % населения видели рекламу, то
какова вероятность покупки товара потребителем, видевшим ре-
кламу?
144. Среди проектов, отправляемых на экспертизу, 60 % при-
годных. Экспертиза проектов иногда допускает ошибки. Неподхо-
дящие проекты экспертиза отвергает с вероятностью 0,8; а веро-
ятность того, что подходящий проект будет назван непригодным,
равна 0,1. Найти вероятность того, что проект будет отвергнут.
145. В условиях предыдущей задачи найти вероятность того,
что проект пригоден, при условии, что экспериза его отвергла.
146. Три сотрудника фирмы (Артем, Зоя, и Илья) независимо
сдают экзамен на получение сертификата. Вероятности добиться
успеха для них соответственно равны 0,7; 0,8; 0,9. Сертификат по-
лучил только один сотрудник. Найти вероятность того, что это

49
3.2 Формула полной вероятности. Формула Байеса

Артем.
147. Пусть B1 , B2 , B3 — несовместные события, составляющие
полную группу: p (B1 ) = 0, 2; p (B2 ) = 0, 15; p (B3 ) = 0, 65. Рассмотрим
событие A : p (A) = 0, 4. Если A не зависит от B1 , B2 , B3 , используя
формулу Байеса, определить, верно ли равенство p (B1 /A) = p (B1 ) =
0, 2?
148. С вероятностью 0,8 преподаватель находится в данный
момент в университете. Эта вероятность распределена следующим
образом: с вероятностью 0,6 преподаватель на кафедре, а с вероят-
ностью 0,2 в деканате. Студент, ищущий преподавателя, обнару-
жил, что на кафедре его нет. Как изменится с учетом этой инфор-
мации вероятность того, что преподаватель в деканате?
149. Два независимых эксперта оценивают эффективность
операции. Оценка эффективности является качественной и прини-
мает 3 значения: «низкая», «средняя», «высокая». В среднем 30 %
операций имеют «низкую» эффективность, 50 % — «среднюю»,
20 % — «высокую». Первый эксперт ошибается в трех случаях из де-
сяти, а второй — в одном случае из пяти. Первый оценил эффектив-
ность конкретной операции как «низкую», а второй, как «среднюю».
Какова вероятность того, что оба они не правы?
150. В ящике лежало 10 шаров, которые могли быть черны-
ми или белыми. Все гипотезы о числе белых шаров равновероятны. В
ящик добавили 1 белый шар. Какова вероятность после этого вынуть
белый шар?
151. В условиях предыдущей задачи вынутый шар оказался бе-
лым. Какова вероятность того, что все шары в ящике белые?
152. На конвейер поступают однотипные детали, изготовля-
емые двумя рабочими. При этом первый поставляет 60 %, второй —
40 % общего числа изделий. Вероятность того, что изделие, изго-
товленное первым рабочим, окажется нестандартным, равна 0,002;
для второго рабочего эта вероятность равна 0,05. Взятое наудачу
с конвейера изделие оказалось нестандартным. Определить вероят-
ность того, что оно изготовлено вторым рабочим.

50
4. Схемы испытаний
4.1. Схема Бернулли. Полиномиальная схема

Схема Бернулли. Схема n независимых испытаний называется


схемой Бернулли, если:
1) испытания одинаковы;
2) каждое испытание имеет два исхода: A (успех) и A (неудача);
3) вероятность успеха в каждом испытании постоянна,

p (Ai ) = p, p (Ai ) = 1 − p = q, i = 1, . . . , n.

Формула Бернулли. Вероятность осуществления ровно m успехов в


n испытаниях равна
pn (m) = Cnm pm q n−m . (19)

Наивероятнейшее число успехов. m0 : pn (m0 ) = max pn (m).


m

{np + p, np + p − 1}, если np + p ∈ Z;
m0 = (20)
[np + p], если np + p ∈
/ Z.

Полиномиальная схема. Схема n независимых испытаний называ-


ется полиномиальной схемой, если:
1) испытания одинаковы;
k
S
2) каждое испытание имеет k исходов A1 , . . . , Ak , Ai = Ω;
i=1
3) вероятность любого исхода в каждом испытании постоянна:
k
X
p (Ali ) = pi , l = 1, . . . , n, i = 1, . . . , k, pi = 1.
i=1

Полиномиальная формула.
n!
pn (m1 , . . . , mk ) = pm m2 mk
1 · p2 · . . . · pk .
1
(21)
m1 ! · m2 ! · . . . · mk !
pn (m1 , . . . , mk ) = p {A1 произошло m1 раз, . . . , Ak произошло mk раз}.
k
X
mi = n.
i=1

51
4.1 Схема Бернулли. Полиномиальная схема

Пример 74. Из карточной колоды в 36 листов три раза подряд слу-


чайным образом вынимают одну карту с возвращением ее в коло-
ду. Какова вероятность того, что два раза удастся вынуть туза
треф?

J Вероятность извлечь туз треф из колоды в 36 карт составляет 1/36,


откуда вероятность противоположного события равна 35/36.
Поскольку всего испытаний три, т. е. m = 3, а число успехов n = 2,
искомая вероятность найдется как
 2  1
2 1 35 3 · 35
p3 (2) = C3 = ≈ 0, 0022. I
36 36 363
Пример 75. По статистике в книжный магазин заходит поровну
мужчин и женщин. Найти вероятность того, что из 10 посетите-
лей магазина, находящихся в зале в данный момент, трое — женщи-
ны.

J По условию задачи вероятность p встретить в магазине женщину


равна 1/2 — ровно столько же шансов увидеть в зале мужчину (q = 1/2).
Всего испытаний по схеме Бернулли десять (n = 10) из них благоприятных
исходов три (m = 3), следовательно,
 3  7  10
3 1 1 1 120 15
p3 (10) = C10 = 120 = = .I
2 2 2 1024 128
Пример 76. Найти вероятность того, что как минимум два студен-
та группы Э-12, состоящей из 24 человек, получит на экзамене по
курсу «Экономическая теория» оценку «хорошо», если считать, что
по 25 % студентов получают оценку «неудовлетворительно», «удо-
влетворительно», «хорошо» и «отлично».

J Испытание состоит в определении, какую оценку получил студент


на экзамене. Успехом будет получение оценки «хорошо», т. е. по условию
задачи p = 1/4, а q = 3/4. Искомая вероятность есть сумма

p24 (2) + p24 (3) + . . . + p24 (24),

вычисление которой представляется трудоемким, поэтому при решении по-


добных задач зачастую пользуются нижеизложенным приемом.
Из свойств операций над событиями следует, что

p24 (2) + p24 (3) + . . . + p24 (24) = 1 − [p24 (0) + p24 (1)].

52
4.1 Схема Бернулли. Полиномиальная схема

Такое представление позволяет легко и быстро получить результат:


 0  24
0 1 3 324
p24 (0) = C24 = 24 ,
4 4 4
 1  23
1 1 3 24 · 323
p24 (1) = C24 = .
4 4 424
Итак,  24
3
p(A) = 1 − 9 · ≈ 0, 998. I
4
Пример 77. В мешке лежат три кубика: синий, оранжевый и белый.
Из мешка кубики по одному извлекали 4 раза, причем после каждого
извлечения кубик возвращался обратно в мешок. Определить веро-
ятность того, что синий и оранжевый кубики извлекали не меньше,
чем по одному разу каждый.

J Определим три события


A1 ={Извлекли синий кубик},
A2 ={Извлекли оранжевый кубик},
A3 ={Извлекли белый кубик}.
Из условия задачи следует, что
1
p (A1 ) = p1 = p (A2 ) = p2 = p (A3 ) = p3 = .
3
Поскольку существует четыре варианта извлечения кубиков согласно
условию задачи, искомая вероятность есть сумма

p (1, 1, 2) + p (2, 1, 1) + p (1, 2, 1) + p (2, 2, 0), где


4!
p (α, β, γ) = pα1 · pβ2 · pγ3 .
α! · β! · γ!
Здесь α, β, γ — количества извлечений синего, оранжевого и белого
кубиков соответственно.
Вычислим вероятность каждого исхода.
 4
4! 1 4·3 4
p (1, 1, 2) = = 4 = .
1! · 1! · 2! 3 3 27
 4
4! 1 4·3 4
p (2, 1, 1) = = 4 = .
2! · 1! · 1! 3 3 27

53
4.1 Схема Бернулли. Полиномиальная схема

 4
4! 1 4·3 4
p (1, 2, 1) = = 4 = .
1! · 2! · 1! 3 3 27
 4
4! 1 2·3 2
p (2, 2, 0) = = 4 = .
2! · 2! · 0! 3 3 27
Тогда искомая вероятность равна
4 4 4 2 14
+ + + = ≈ 0, 518. I
27 27 27 27 27
Пример 78. Менеджер по кадрам подбирает кандидатуры сотруд-
ников, которые могут общаться с иностранными клиентами фир-
мы и будут направлены на работу в центральный офис компании.
Критерием отбора является знание сотрудником английского язы-
ка. Всего в фирме работает 150 человек, причем вероятность встре-
тить среди ее сотрудников тех, кто знает английский язык, со-
ставляет 0,6. Каково наивероятнейшее число работников фирмы,
которым следует ждать повышения?

J Для решения этой задачи воспользуемся определением наивероят-


нейшего числа успехов. Здесь n = 150; p = 0, 6; следовательно,

np + p = 90, 6 ∈
/ Z.

Вероятнее всего, 90 сотрудникам фирмы стоит ждать повышения по


службе. I

 Задачи
153. Студент выполняет тест из 5 вопросов, требующих от-
ветов «да» или «нет». Предположим, студент еще не изучал данную
тему, и отвечает на вопросы случайным образом (вероятность пра-
вильного ответа на каждый вопрос равна 0,5). Найти вероятность
того, что студент правильно ответит на:
а) все вопросы;
б) не меньше 4 вопросов;
в) меньше 4 вопросов;
г) не более 2;
д) не менее 2 и не более 4.

54
4.1 Схема Бернулли. Полиномиальная схема

154. Решите предыдущую задачу в изменённых условиях: сту-


дент уже знаком с данной темой, и вероятность правильного отве-
та на каждый вопрос равна 0,8.
155. Вероятность того, что у студента группы Э-11 есть
учебное пособие по теории вероятностей, равна 0,6. Какова вероят-
ность, что из троих студентов этой группы пособие имеют двое?
156. В течение дня акция может подорожать с вероятностью
0,6 и подешеветь с вероятностью 0,4. Какова вероятность того, что
акция будет дорожать пять дней из семи, если считать ежедневные
изменения цены независимыми?
157. Вероятность того, что сделка окажется прибыльной,
равна 0,8. Какова вероятность, что из 5 совершённых сделок при-
быльными будут не меньше 4?
158. В условиях предыдущей задачи найдите наивероятнейшее
число прибыльных сделок из 5 совершённых.
159. 80 % прибывших в аэропорт пассажиров сдают свой ба-
гаж, который проверяется, а остальные 20 % ожидают проверки в
очереди. Если в час прибыло 4000 пассажиров, каково наивероятней-
шее число пассажиров, которые будут ожидать проверки своего ба-
гажа?
160. Если четверть предприятий допускает нарушения нало-
гового законодательства, то какова вероятность, что из 10 пред-
приятий, проверяемых налоговой инспекцией, найдется хотя бы
один нарушитель законодательства?
161. Каждый пятый компьютер некоторого известного произ-
водителя имеет дефекты. Закуплено семь компьютеров этой фир-
мы. Найдите вероятность того, что более одного из семи компью-
теров будут иметь дефекты.
162. Вероятность того, что накладная оформлена неправиль-
но, равна 0,2. Какова вероятность, что из пяти проверяемых на-
кладных хотя бы одна оформлена неправильно?
163. В условиях предыдущей задачи найдите наивероятнейшее
число неправильно оформленных накладных.
164. Фасовщица развешивает печенье в пакеты по 1 кг в па-
кет. Из каждых 5 пакетов один фасовщица недовешивает. Пакеты
она складывает по 15 штук в коробку. Контролер берет из 3 произ-
вольных коробок по одному пакету на проверку. Какова вероятность
того, что проверка обнаружит недовешенный пакет?
165. Если при каждом спуске с горы на лыжах вероятность

55
4.1 Схема Бернулли. Полиномиальная схема

упасть 0,2; то каково наивероятнейшее число падений за 7 спусков?


166. Если из 10 дней ясных бывает в среднем 6, то какова веро-
ятность того, что из 3 дней, выбранных для проведения ярмарки, по
крайней мере 2 — ясные?
167. Вероятность получить уступку при сделке равна 0,5. Что
вероятнее, получить уступки в 3 сделках из 4 или в 5 из 8?
168. Инновационные проекты подвергаются двухэтапной экс-
пертизе. Вероятность пройти первый этап равна 0,2; для прошед-
ших первый этап вероятность пройти второй этап равна 0,4. В экс-
пертную комиссию было подано 270 проектов. Найти наивероят-
нейшее число проектов, прошедших экспертизу.
169. Известно, что 7 % населения смотрит определенную те-
лепрограмму, и что 30 % зрителей этой программы смотрят и ре-
кламные блоки. Найти наивероятнейшее число лиц, смотрящих ре-
кламные блоки в рамках этой телепрограммы на 1000 жителей.
170. При устной передаче сообщения в одном случае из пяти
появляются ошибки. Какова вероятность того, что из четырех со-
общений ровно два переданы точно?
171. Компьютерная фирма продает настольные компьютеры
и ноутбуки, причем 80 % продаж составляют настольные компью-
теры, и 20 % — ноутбуки. Найти вероятность того, что три из
четырех проданных компьютеров — ноутбуки.
172. Пять договоров раскладывают случайным образом в че-
тыре папки. Какова вероятность, что в первую и третью папки по-
падут по два договора, а вторая папка останется пустой?
173. В магазин поступили женские туфли одной известной
марки размеров 37, 38, 40 (по две пары каждого размера). Если поку-
пательницы спрашивают размер 37 с вероятностью 0,1; размер 38 —
с вероятностью 0,2; размер 43 — с вероятностью 0,2; а с вероятно-
стью 0,5 спрашивают прочие размеры, то какова вероятность, что
две покупательницы подряд найдут в этом магазине туфли нужно-
го им размера?
174. В интернет-магазине можно заказать доставку книг ли-
бо наземной почтой, либо авиапочтой, либо при помощи курьерской
службы. Предположим, вероятности этих способов заказов равны
соответственно 0, 3; 0, 6; 0, 1. Найти вероятность того, что из де-
сяти клиентов двое закажут книги авиапочтой, трое предпочтут
доставку наземным транспортом, пятеро будут ждать звонка ку-
рьера.
175. Проект состоит из пяти одновременно выполняемых эта-

56
4.2 Асимптотические формулы для схемы Бернулли

пов, расчетное время выполнения каждого этапа от 65 до 75 дней, в


этих пределах любое время окончания этапа равновероятно. Най-
дите вероятность того, что два этапа будут закончены за 65—67
дней, один — за 68 дней, и последние два этапа закончатся в срок от
69 до 75 дней.
176. 30 % студентов набирают по курсу «Теория вероятно-
стей и математическая статистика» не меньше 85 баллов из 100,
что соответствует оценке «отлично», 35 % — от 70 до 85 баллов
(оценка «хорошо»), 20 % — от 55 до 70 баллов (оценка «удовлетво-
рительно»), 15% студентов набирают менее 55 баллов из 100 (оцен-
ка «неудовлетворительно»). Какова вероятность того, что из пя-
ти случайно выбранных студентов двое сдадут экзамен на «отлич-
но», а трое — на «хорошо»?

4.2. Асимптотические формулы для схемы Бернулли

При больших n и малых p можно использовать приближение


Пуассона.

Приближенная формула Пуассона.


λm e−λ
pn (m) ≈ pλ (m) = , (22)
m!
где λ = np. Приближенную формулу Пуассона применяют при
n > 30; p 6 0, 1; 0, 1 6 λ = np 6 10.
При больших n и не малых p, q можно использовать приближение Муав-
ра — Лапласа.

Локальная приближенная формула Муавра — Лапласа.


ϕ (xm )
pn (m) ≈ √ ,
npq
m − np (23)
xm = √ ,
npq
1 x2
где ϕ(x) = √ e− 2 .

Интегральная приближенная формула Муавра — Лапласа.


 
m − np
p x1 6 √ 6 x2 ≈ Φ (x2 ) − Φ (x1 ), (24)
npq

57
4.2 Асимптотические формулы для схемы Бернулли

Zx Zx
1 2
− t2
где Φ(x) = √ e dt = ϕ(t) dt.

−∞ −∞

Следствия интегральной приближенной формулы.


   
b − np a − np
p ( a 6 m 6 b) ≈ Φ √ −Φ √ . (25)
npq npq

 r   r 
 m  n n
p α1 6 6 α2 ≈ Φ (α2 − p) − Φ (α1 − p) . (26)
n pq pq
 r   r 
 m  n n
p β1 6 − p 6 β2 ≈ Φ β2 − Φ β1 . (27)
n pq pq

Формулы Муавра — Лапласа применяют при


n > 30; 0, 1 6 p 6 0, 9; npq > 9.

Пример 79. Продукцию каждый час проверяют на наличие брака,


случайно выбирая 100 изделий. Какова вероятность, что в выборке
ровно 2 бракованных изделия, если вероятность того, что изделие
бракованное, равна 0,01?
J Здесь, очевидно, испытание состоит в проверке единицы продукции
на наличие брака. Всего испытаний 100, вероятность успеха (обнаружения
брака) равна 0,01.
Поскольку n достаточно велико (n = 100), а p мало (p = 0, 01), для
решения этой задачи можно применить приближенную формулу Пуассона
при λ = 100 · 0, 01 = 1:
12 e−1 1
p100 (2) ≈
= .I
2! 2e
Пример 80. В условиях предыдущей задачи найти вероятность то-
го, что в выборке меньше 2 бракованных изделий.
J Эта задача отличается от предыдущей лишь тем, что ее решени-
ем будет сумма вероятностей исходов, при которых обнаружено одно и два
бракованных изделия, — p100 (0) + p100 (1).
Вычислим члены этой суммы.
10 e−1 1
p100 (0) ≈ = .
0! e
58
4.2 Асимптотические формулы для схемы Бернулли

11 e−1 1
p100 (1) ≈ = .
1! e
Итак, вероятность того, что в выборке окажется меньше двух брако-
ванных изделий, составляет 2/e. I
Пример 81. Замерщик пластиковых окон за год обслуживает 1 000
заказов. Вероятность того, что он ошибся в замерах одного окна
составляет 0,01. Какова вероятность того, что по замерам это-
го работника будет за год изготовлено не меньше 3 бракованных
окон?
J Как и раньше, воспользуемся приближением Пуассона.
Чтобы решить эту задачу, нужно найти сумму
p1000 (3) + p1000 (4) + . . . + p1000 (1000), (28)
однако, очевидно, что это очень трудоемкая процедура. Если же предста-
вить (28) в виде
1 − [p1000 (0) + p1000 (1) + p1000 (2)],
вычисления не составят большого труда.

100 e−10 1
p1000 (0) ≈ = 10 .
0! e
1 −10
10 e 10
p1000 (1) ≈ = 10 .
1! e
2 −10
10 e 50
p1000 (2) ≈ = 10 .
2! e .
Таким образом, искомая вероятность равна 1 − 61 e10 ≈ 0, 997. I
Пример 82. Диспетчеру таксопарка за каждые 5 минут поступают
в среднем 6 заказов. Найти вероятность того, что за три минуты
не поступит ни одного заказа.
J Здесь λ — среднее число событий, появляющихся в единицу вре-
мени. За 6 минут диспетчер принимает в среднем 5 заказов, следовательно,
λ = 6/5.
Будем пользоваться приближенной формулой Пуассона:
(λt)m e−λt
pt (m) ≈ .
m!
Требуется найти вероятность того, что за три минуты не поступит ни
одного заказа:
(3 · 6/5)0 e−3·6/5 1
p3 (0) ≈ = e−36/5 = 36/5 . I
0! e

59
4.2 Асимптотические формулы для схемы Бернулли

Пример 83. Вероятность того, что книга, выпущенная тиражом


100 экземпляров, сброшюрована неправильно, составляет 0,1. Найти
вероятность того, что тираж не содержит бракованных книг.
J Здесь n = 100 > 30; 0, 1 6 p = 0, 1 6 0, 9; npq = 45 > 9;
поэтому для решения задачи можно применить локальную приближенную
формулу Муавра — Лапласа.
Требуется найти вероятность того, что тираж не содержит бракован-
ных книг, т. е. m = 0.
   
ϕ √100·0,1·0,9 def ϕ √109
0−10

p500 (0) = √ = √ ≈ 0, 0015. I


100 · 0, 1 · 0, 9 9
Пример 84. Некий милллиардер разделил свое состояние на равные
доли, пожертвовав на благотворительность неделимый остаток, и
положил деньги в 50 разных банков. Вероятность того, что любой
из банков в скором времени ликвидируется, равна 0,3. Найти веро-
ятность того, что миллионер лишится не более 20 долей своего ка-
питала.
J Здесь n = 50; p = 0, 3; q = 0, 7; np = 15; npq = 10, 5. В
этих условиях справедлива формула (25) — следствие теоремы Муавра —
Лапласа. Подсчитаем p (m 6 20).

   
20 − 15 −15
p (m 6 20) = p (0 6 m 6 20) ≈ Φ √ −Φ √ =
10, 5 10, 5
= Φ (1, 54303) − Φ (−4, 6291) ≈ 0, 9382. I
Пример 85. Сделки на электронной бирже осуществляются не ча-
ще, чем раз в секунду. Каждую секунду в течение часа главный ком-
пьютер фиксирует одно из двух состояний: «проходит сделка» или
«компьютер свободен». Вероятность зафиксировать сделку в любой
момент времени равна 0,8. Найти вероятность того, что относи-
тельная частота регистрации сделки, вычисленнная за час, откло-
нится от ее вероятности не более, чем на 0,01.
J Поскольку сделки на бирже осуществляются не чаще, чем раз в секунду
в течение часа, всего испытаний 60 · 60 = 3 600. Следовательно,
n = 3 600;p = 0, 8; q = 0, 2; np = 2 880; npq = 576.
m
Для подсчета p n − p 6 0, 01 = p −0, 01 6 m
 

n − p 6 0, 01 вос-
пользуемся формулой (27).

60
4.2 Асимптотические формулы для схемы Бернулли

 r   r 
 m  3 600 3 600
p −0, 01 6 − p 6 0, 01 = Φ 0, 01 − Φ −0, 01 =
n 0, 16 0, 16
 r 
3 600
= 2Φ 0, 01 − 1 = 2Φ (1, 5) − 1 ≈ 0, 9332. I
0, 16

 Задачи
177. Вероятность нарушения герметичности упаковки при пе-
ревозке равна 0,001. Найти вероятность того, что среди 1 000 пере-
везенных упаковок 3 окажутся негерметичными.
178. Если в фирме по организации праздников заказывают в
среднем два конных свадебных экипажа в день, то какова вероят-
ность, что за день поступит больше двух заказов?
179. На факультете 750 студентов. Найти вероятность того,
что у 2 студентов день рождения придется на 1 января, cчитая, что
вероятность рождения в фиксированный день равна 1/365.
180. В партии из 40 000 купюр 8 фальшивых. Из партии берут
1 000 купюр. Какова вероятность, что среди них хотя бы одна фаль-
шивая?
181. На конвейер поступают однотипные детали, производи-
мые автоматом. Вероятность того, что деталь, изготовленная ав-
томатом, окажется нестандартной, равна 0,002. Какова вероят-
ность, что из тысячи деталей более двух нестандартны?
182. В течение минуты оператору поступает в среднем 60 вы-
зовов. Найти вероятность того, что за 2 секунды не поступит ни
одного вызова.
183. Корректура в 400 страниц содержит 1 200 опечаток. Най-
ти вероятность того, что число опечаток на странице отклонит-
ся от 3 не более чем на 1.
184. В среднем бракованные изделия составляют 0,5 %. Найти
вероятность того, что из 100 изделий не будет ни одного бракован-
ного.
185. Компания разрабатывает новую диетическую еду и про-
водит в сетевом магазине опрос 100 произвольно выбранных потре-
бителей, в котором выявляются 2 наиболее ходовых товара. Обо-
значим x количество тех человек из 100, которые выбрали другой
товар, кроме двух наиболее ходовых. Пусть при одном из опросов
x = 40. Какова вероятность, что при таком же опросе, проводимом

61
4.2 Асимптотические формулы для схемы Бернулли

параллельно в другом магазине этой сети, величина x примет значе-


ние больше 50?
186. Из группы в 1 000 человек были опрошены 100 человек, и
оказалось, что 70 из них имеют депозитные счета. Какова вероят-
ность, что в группе из 1 000 человек депозитные счета имеют от
680 до 720 человек?
187. Пусть известно, что среди выпускаемых заводом авто-
мобилей 20 % некомплектны. Осмотрено 625 выпущенных автомо-
билей. Найти вероятность того, что наблюдаемая частота ком-
плектных автомобилей отклонится по абсолютной величине от ве-
роятности не более чем на 0,04.
188. Банк предоставил кредиты 400 клиентам. Для каждого
клиента вероятность того, что взятый кредит будет возвращён
в срок, равна 0,8. Найти вероятность того, что частота возвраще-
ния кредита будет находиться в пределах 0,8± 0,05.
189. Банк предоставил кредиты 400 клиентам. Для каждого
клиента вероятность того, что взятый кредит будет возвращён в
срок, равна 0,8. Найти такое положительное ε, что с вероятностью
0,995 абсолютная величина отклонения частоты возвращения кре-
дита от вероятности 0,8 не превысит ε.
190. Новый клиент интернет-магазина с вероятностью 0,5 де-
лает заказ. В некоторый день зарегистрировалось 100 человек. Най-
ти вероятность того, что от них поступит от 45 до 55 заказов.
191. Новый клиент интернет-магазина делает заказ с веро-
ятностью 0,5. Сколько новых клиентов должно зарегистрировать-
ся, чтобы с вероятностью 0,92 можно было ожидать отклонение
частоты заказов новых клиентов от теоретической вероятности
0,5 на абсолютную величину, меньшую чем 0,01?

62
5. Одномерные дискретные случайные величины
Определение случайной величины и функции распределения

Пусть (Ω, F, P) — вероятностное пространство.


Случайной величиной ξ называется измеримая функция ξ = ξ (ω),
отображающая Ω в R.
Определение означает, что прообраз любого борелевского множества
B
{ω : ξ(ω) ∈ B} = ξ −1 (B)
является множеством из σ-алгебры F.

Простейшим примером случайной величины является индикатор


события A: 
1, ω ∈ A;
IA (ω) =
0, ω ∈
/ A.

Пусть B — σ-алгебра на R. Говорят, что задано распределение веро-


ятностей случайной величины ξ, если ∀B ∈ B определены вероятности
Pξ (B) = P (ξ ∈ B). Распределение вероятностей порождает вероятностное
пространство (R, B, Pξ ).

Функцией распределения случайной величины ξ называется функ-


ция
Fξ (x) = p ( ξ < x), ∀x ∈ R . (29)
Свойства функции распределения.
1) Если x1 < x2 , то F (x1 ) 6 F (x2 ).
2) lim F (x) = 1, lim F (x) = 0.
x→∞ x→−∞

3) 0 6 F (x) 6 1.
4) p ( x 6 ξ < y) = Fξ (y) − Fξ (x).

Дискретные случайные величины

Случайная величина ξ имеет дискретное распределение, если


ξ принимает конечное или счетное число различных значений с соответству-
ющими вероятностями
X
p ( ξ = x i ) = pi , pi = 1.
i

63
Дискретные случайные величины часто задаются рядом распределе-
ния
ξ x1 x2 . . . xn
p p1 p 2 . . . pn

Для дискретных случайных величин


X
Fξ (x) = p ( ξ < x) = pi . (30)
i : xi <x

Пример 86. Случайная величина ξ равна числу попаданий в цель при


двух выстрелах. Вероятность попадания при одном выстреле равна
0,7. Записать ряд распределения случайной величины ξ, найти Fξ (x).

J Здесь ξ — это число попаданий за два выстрела, поэтому


ξ ∈ {0, 1, 2}, следовательно, случайная величина ξ имеет дискретное рас-
пределение.
Пусть A1 = {Пуля попала в цель при первом выстреле},
A2 = {Пуля попала в цель при втором выстреле}.
Из условия задачи известно, что
p (A1 ) = p (A2 ) = 0, 7;
p (A1 ) = p (A2 ) = 0, 3.

Тогда p (ξ = 0) = p A1 A2 = 0, 09;
p (ξ = 1) = p A1 A2 + A1 A2 = 0, 42;
p (ξ = 2) = p (A1 A2 ) = 0, 49.
Получили ряд распределения ξ:
ξ 0 1 2
p 0, 09 0, 42 0, 49
Выпишемфункцию распределения ξ.

 0 при x 6 0;
0, 09 при 0 < x 6 1;

Fξ (x) = I

 0, 51 при 1 < x 6 2;
1 при x > 2.

Пример 87. Проводят один опыт, в результате которого событие


может произойти с вероятностью 0,4. Случайная величина ξ прини-
мает значение 1, если событие произошло, и 0, если оно не произошло.
Записать ряд распределения ξ, найти Fξ (x).

64
J В этой задаче мы будем иметь дело с дискретным распределени-
ем Бернулли B (1; 0, 4), ряд распределения ξ которого выглядит следующим
образом:
ξ 0 1
p 0, 6 0, 4

 0 при x 6 0;
Очевидно, что Fξ (x) = 0, 6 при 0 < x 6 1; I
1 при x > 1.

Пример 88. Один раз бросают две игральные кости. Случайная вели-
чина ξ — сумма выпавших очков. Построить ряд распределения слу-
чайной величины ξ.
J Сумма очков, выпадающих при броске двух игральных костей при-
надлежит множеству {2, 3, . . . , 12}, следовательно, ξ принимает значения
из этого множества. Запишем ряд распределения случайной величины ξ,
расчитывая pi при помощи классического определения вероятности:
ξ 2 3 4 5 6 7 8 9 10 11 12
I
p 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Пример 89. Из урны, содержащей три белых и два черных шара, три
раза вынимают (с возвращением) шар. Случайная величина ξ — чис-
ло вынутых черных шаров. Построить ряд распределения ξ, найти
Fξ (x).
J В данном случае случайная величина соответствует числу успехов в
трех испытаниях, проводимых по схеме Бернулли, поэтому ξ имеет биноми-
альное распределение B (3; 0, 4).
Построим ряд распределения ξ, расчитывая pi при помощи формулы
Бернулли.
ξ 0 1 2 3
p 0, 216 0, 432 0, 288 0, 064
Тогда функция
 распределения ξ запишется следующим образом.

 0 при x 6 0;
 0, 216 при 0 < x 6 1;


Fξ (x) = 0, 648 при 1 < x 6 2; I
0, 936 при 2 < x 6 3;




1 при x > 3.

Пример 90. Проводят три опыта, в результате каждого из кото-


рых событие может произойти с вероятностью p. Случайная вели-
чина ξ — число осуществлений события. Построить ряд распределе-
ния ξ.

65
J Здесь ξ вновь имеет биномиальное распределение B (3, p), поэтому
задача решается аналогично предыдущей.

ξ 0 1 2 3
I
p (1 − p) 3p (1 − p) 3p (1 − p) p3
3 2 2

Пример 91. При помощи поисковой системы хакер12 нашел в Интер-


нете 15 сайтов по интересующей его тематике, причем злоумыш-
ленник обладает достаточными навыками, чтоб взломать 11 из
них. Хакер последовательно проверил 5 сайтов на устойчивость к
тем видам атак, на которые он способен, но затем в районе выклю-
чили электроэнергию. Записать ряд распределения случайной вели-
чины ξ — число взломанных сайтов из проверенных.

J Легко видеть, что ξ имеет гипергеометрическое распределение с па-


раметрами

N = 15; M = 11; n = 5; ξ = 0, 1, . . . , 5.

По формуле
m
C11 · C45−m
p (m) = p11, 15 (m, 5) = 5
C15
расчитаем pi и запишем ряд распределения ξ:
ξ 0 1 2 3 4 5
.I
p 0 1/273 20/273 90/273 120/273 42/273

 Задачи
192. Найдите функцию распределения величины ξ ≡ c (вырож-
денное распределение).
193. Найдите функцию распределения индикатора события A,
вероятность которого равна 0,3.
194. Найдите функцию распределения индикатора события A,
состоящего в том, что точка, поставленная наудачу в круге ради-
уса 1, окажется вне квадрата, вписанного в круг.
195. Испытание состоит в бросании двух костей. Запишите
ряд распределения индикатора события A ={Произведение выпавших
12
Здесь «хакер» — компьютерный злоумышленник, хотя этот термин имеет и более широкое толкование:
специалист, обладающий доскональными сведениями в каких-либо вопросах.

66
очков делится на 3}, и найдите его функцию распределения.
196. Пусть случайная величина ξ обозначает число прочитан-
ных книг за последний месяц, и её функция распределения имеет вид:



 0 при x 6 0,



 1/9 при 0 < x 6 1,
 1/3 при 1 < x 6 2,


Fξ (x) = 2/3 при 2 < x 6 3,
7/9 при 3 < x 6 5,




8/9 при 5 < x 6 9,





 1 при x > 9.

Найдите ряд распределения и вероятность того, что случайным


студентом прочитано 2 книги.
197. Пусть (Ω, F, P) — вероятностное пространство, ξ(ω) —
вещественная функция, определенная на Ω. Обязательно ли ξ явля-
ется случайной величиной, если случайной величиной является:
а) ξ 2 ; б) ξ 3 ; в) sin ξ; г) eξ ; д) |ξ|?
198. Определить, могут ли следующие функции быть функция-
ми распределения каких-либо случайных величин:

0, 2 при x 6 2,
а) Fξ (x) = б) Fξ (x) ≡ 1.
1 при x > 2;


 0 при x 6 0, 
0, 2 при 0 6 x < 1, 0 при x 6 3,

в) Fξ (x) = г) Fξ (x) =

 0, 7 при 1 < x 6 2, 1 при x > 3.
1 при x > 2;

199. Определить, могут ли следующие таблицы задавать ря-


ды распределения некоторой случайной величины. В случае положи-
тельного ответа найти подходящие значения константы c и функ-
ции распределения полученной случайной величины:
ξ −10 0 5
a) ;
p 2c c(1 − c) (1 − c)2
2

ξ 0 π 2 1000
б) .
p c 1 − c c2 3c
200. Найдите функцию распределения случайной величины
ξ (ω), определенной на классическом вероятностном пространстве
(Ω, F, P), если Ω = {−3, 1, 3} и ξ = ω.
201. Решите предыдущую задачу, если:

67
а) ξ = ω 2 ;
б) ξ = ω −1 ;
2ω ;
в) ξ = 
0 при ω = −3,
г) ξ = 1 при ω = 1,
0 при ω = 3;

 2
ω при ω = ±3,
д) ξ =
ω при ω = 1.
202. Найдите функцию распределения случайной величины
ξ (ω) = 2 ω, определенной на дискретном вероятностном простран-
стве (Ω, F, P) с Ω = {1, 2, 3}, если
p (1) = 0, 2; p (2) = 0, 3; p (3) = 0, 5.

203. Случайная величина ξ принимает значение 1, если экзамен


сдан, и 0, если не сдан. Предположим, вероятность сдать экзамен
равна 0,8. Какое распределение имеет случайная величина ξ? Запи-
сать ряд распределения ξ, найти Fξ (x).
204. Какое распределение имеет случайная величина η, если η
равняется числу тузов среди двух карт, вынутых без возвращения
из колоды в 36 карт? Запишите ряд распределения.
205. Решите предыдущую задачу в условиях выбора с возвра-
щением.
206. Игра состоит в набрасывании колец на колышек. Вероят-
ность попадания при одном броске 0,6. Случайная величина ξ равна
числу колец, израсходованных до первого попадания. Найдите закон
распределения ξ.
207. Студент в поисках нужной информации заходит пооче-
рёдно на три сайта. Найдя информацию, он прекращает поиски.
Вероятность найти информацию на любом из этих сайтов равна
0,5. Случайная величина равна числу посещённых сайтов. Построить
ряд распределения случайной величины ξ, найти Fξ (x).
208. В условиях предыдущей задачи число сайтов не ограниче-
но. Каково распределение случайной величины, равной числу посещён-
ных сайтов?
209. Один раз бросают две игральные кости. Случайная вели-
чина ξ — вычет суммы выпавших очков по модулю три. Построить
ряд распределения случайной величины ξ, найти вероятность, что
ξ = 2.
210. Число вызовов ξ, поступающих оператору в течение ми-

68
нуты, имеет пуассоновское распределение с параметром λ = 3. Най-
дите p (ξ > 2).
211. Если при наборе существует вероятность p = 0, 00001 то-
го, что любая буква будет набрана неправильно, и случайная величи-
на ξ равна числу опечаток в книге, имеющей 100 000 печатных зна-
ков, то каково точное и приближённое распределение ξ?
212. Вероятность нарушения герметичности упаковки при пе-
ревозке равна 0,01; случайная величина ξ равна числу негерметич-
ных упаковок среди 200 перевезённых. Как приближённо распределе-
на случайная величина ξ?
213. Если при перевозке случится авария, вероятность наруше-
ния герметичности упаковки равна 0,2. Случайная величина ξ равна
числу негерметичных упаковок среди 10 перевезённых. Как распреде-
лена случайная величина ξ?
214. В условиях предыдущей задачи большое количество упако-
вок проверяют по очереди. Случайная величина ξ равна числу прове-
ренных упаковок до первой встретившейся негерметичной. Каково
распределение ξ?
215. Если в предыдущих условиях случайная величина ξ равна
числу проверенных упаковок до третьей встретившейся негерме-
тичной, как распределена случайная величина ξ?
216. В компьютерной игре для прохождения на следующий уро-
вень необходимо сбить n мишеней. Вероятность попадания в цель
при одном выстреле равна p. Случайная величина ξ — число произ-
веденных выстрелов. Найдите закон распределения ξ.
217. В урне находится 5 белых и 10 красных шаров. Двое пооче-
редно вынимают (с возвращением) шары до появления белого шара.
Случайная величина ξ — число вынутых шаров. Найдите закон рас-
пределения ξ.
218. Из четырех ключей только один подходит к замку. Слу-
чайная величина ξ — число попыток при открывании замка. Найди-
те закон распределения ξ.

69
6. Непрерывные случайные величины
6.1. Одномерные непрерывные случайные величины

Случайная величина ξ непрерывно распределена, если ее


функция распределения допускает представление в виде
Zx
Fξ (x) = fξ (t) dt. (31)
−∞

Подынтегральная функция fξ (x) называется плотностью распре-


деления случайной величины ξ.
Свойства плотности распределения.
1) Почти всюду fξ (x) = Fξ0 (x).
2) Почти всюду fξ (x) > 0.
R∞
3) fξ (t) dt = 113 .
−∞
Rb
4) fξ (t) dt = Fξ (b) − Fξ (a) = p ( a 6 ξ < b).
a
x+4x
R
5) fξ (t) dt = f (θ)4x, θ ∈ [x; x + 4x).
x

Пример 92. Случайная величина ξ задана функцией распределения



 0, x 6 0;
Fξ (x) = x2 , 0 < x 6 1;
1, 1 < x.

Найти: а) плотность fξ (x);


б) p (0, 25 6 ξ < 0, 75).
J Пользуясь свойством 1) плотности распределения, дифференциру-
ем Fξ (x) на полуотрезках (−∞; 0], (0; 1] и интервале (1, +∞):

 0 при x 6 0;
fξ (x) = 2x при 0 < x 6 1;
0 при 1 < x.

Согласно свойству 4)

p (0, 25 6 ξ < 0, 75) = Fξ (0, 75) − Fξ (0, 25) =


= 0, 752 − 0, 252 = 0, 5. I

70
6.1 Одномерные непрерывные случайные величины

Пример 93. Случайная величина ξ задана плотностью fξ (x) :



 0, x 6 0,
fξ (x) = sin x, 0 < x 6 C,
0, C < x.

Найти: а) постоянную C;
б) Fξ (x);
в) p (1, 2 6 ξ < 1, 6).
J По свойству 3) плотности распределения случайной величины
Z+∞
fξ (x) dx = 1.
−∞

Поскольку на промежутках (−∞; 0] и (C, +∞) функция fξ (x) = 0,


ZC
sin x dx = 1.
0

Интегрируя левую часть этого равенства, получим


ZC C
sin x dx = − cos x = − cos C + 1

0
0

Теперь подставим полученное выражение в исходное равенство:


π
− cos C + 1 = 1 ⇒ C = .
2
Пользуясь тем, что функция распределения случайной величины ξ
представима в виде
Zx
Fξ (x) = fξ (t) dt,
−∞
а fξ (t) известна, без труда найдем Fξ (x):

 Rx


 0 dt при x 6 0;
−∞



Z x

 R0 Rx π
Fξ (x) = fξ (t) dt = 0 dt + sin t dt при 0 < x 6 ;
−∞  −∞ 0 2
 π/2

 R0 R Rx π
0 dt при x > .


 0 dt + sin t dt +

−∞ 0 π/2 2

71
6.1 Одномерные непрерывные случайные величины

После необходимых вычислений имеем



 0 при x 6 0;

 π
Fξ (x) = 1 − cos x при 0 < x 6 ;
 π 2
1 при x > .


2
Теперь найдём
p (1, 2 6 ξ < 1, 6) = Fξ (1, 6) − Fξ (1, 2) =
= 1 − [1 − cos 1, 2] ≈ 0, 3624.
Заметим, что эту вероятность можно было найти и напрямую с помощью
плотности:
Z1,6
p (1, 2 6 ξ < 1, 6) = sin x dx ≈ 0, 3624. I
1,2

Пример 94. Случайная величина ξ имеет плотность fξ (x) :


c
fξ (x) = x , x ∈ R.
e + e−x
Найти: а) постоянную c;
б) Fξ (x);
в) p (0 6 ξ < 1).
J Для решения этой задачи вновь воспользуемся свойством 3) плот-
ности распределения случайной величины; в данном случае
Z+∞
c
dx = 1.
ex + e−x
−∞

По свойствам интеграла
Z+∞ Z0 Z+∞
c c c
dx = dx + dx.
ex + e−x ex + e−x ex + e−x
−∞ −∞ 0

Вычислим два интеграла, стоящие в правой части вышеприведенного


равенства.
Z0
c 0
x
0
x
dx = lim c arctg e = lim c arctg e =
ex + e−x ζ→−∞ ζ ζ→−∞ ζ
−∞
= c lim arctg 1 − arctg eζ =
 
ζ→−∞
π
= c lim [arctg 1 − arctg 0] = c .
ζ→−∞ 4

72
6.1 Одномерные непрерывные случайные величины

Z+∞
c ζ
x
ζ
x
dx = lim c arctg e = lim c arctg e =
ex + e−x ζ→+∞ 0 ζ→+∞ 0
0
= c lim arctg eζ − arctg 1 =
 
ζ→+∞
hπ πi π
= c lim − =c .
ζ→−∞ 2 4 4
Тогда
Z+∞
c π
dx = c .
ex + e−x 2
−∞

и по свойству 3) плотности распределения


π 2
c =1⇒c= .
2 π
Теперь стало возможным найти функцию распределения случайной
величины ξ.
Zx
2 1 2 x 2
Fξ (x) = x −x
dx = lim arctg e = arctg ex .
x
π e +e π ζ→−∞ ζ π
−∞

В заключение, найдем p (0 6 ξ < 1):


2 2
p (0 6 ξ < 1) = Fξ (1) − Fξ (0) = arctg e1 − arctg e0 ≈ 0, 2756. I
π π
Пример 95. Время ожидания автобуса равномерно распределено на
промежутке [1, 21]. Студент ждёт автобус уже 12 минут. Если ав-
тобус не придёт в ближайшие 4 минуты, студент опоздает на за-
нятия. Какова вероятность, что он не опоздает?

J Обозначим время ожидания автобуса ξ; по условию, ξ ∈ R[1, 21].


Известно, что ξ > 12, требуется при этом условии найти вероятность p (ξ 6
16).
p (AB)
По определению условной вероятности, p (A/B) = , то есть
p (B)
 p (ξ 6 16, ξ > 12) p (12 < ξ 6 16) Fξ (16) − Fξ (12)
p (ξ 6 16 ξ > 12) = = = .
p (ξ > 12) p (ξ > 12) 1 − Fξ (12)

73
6.1 Одномерные непрерывные случайные величины

Функция распределения R[1, 21] имеет вид



 0, x 6 1;
Fξ (x) = (x − 1)/20, 1 < x 6 21;
1, x > 21.

Тогда
15
 20 − 11
20 4
p (ξ 6 16 ξ > 12) = = .
1 − 11
20
9

 Задачи
219. Автобусы приходят на остановку каждые 30 минут. Они
могут опаздывать, но никогда не приходят раньше. Время задерж-
ки автобуса распределено равномерно и не превышает 20 минут.
Найти вероятность того, что последний за день автобус опоздает
более, чем на 19 минут.
220. Случайная величина ξ задана функцией распределения

 0, x 6 0,
Fξ (x) = x3 , 0 < x 6 1,
1, 1 < x.

Найти: а) плотность fξ (x),


б) p (0, 5 6 ξ < 1).
221. Случайная величина ξ задана плотностью

 0, x 6 −C,
fξ (x) = 0, 5 cos x, −C < x 6 0,
0, C < x.

Найти: а) постоянную C;
б) Fξ (x);
в) p (−0, 5C 6 ξ < −0, 5C).
222. Случайная величина ξ имеет плотность распределения
fξ (x) = A x exp ( −h2 x2 ), x > 0 (закон Рэлея14 ).
Найти: а) постоянную A,
б) Fξ (x),
в) p (0 6 ξ < 1).
223. Случайная величина ξ задана плотностью распределения
fξ (x) = A exp(−x/x0 ), x > 0, x0 — параметр.

74
6.1 Одномерные непрерывные случайные величины

Найти: а) постоянную A,
б) Fξ (x).
224. Случайная величина ξ имеет плотность распределения
c
fξ (x) = , x ∈ R.
1 + x2
Найти: а) постоянную c,
б) Fξ (x),
в) p (0 6 ξ < 1).
225. Случайная величина ξ задана плотностью распределения


 0, при x 6 −1,
c (x + 1) при −1 < x 6 0,

fξ (x) =

 c при 0 < x 6 1,
0 при 1 < x.

Найти: a) постоянную c,
б) Fξ (x),
в) p (−0, 2 6 ξ 6 0, 2).
226. Определить, могут ли следующие функции быть функци-
ями распределения каких-либо случайных величин:


 0 при x 6 0,
а) Fξ (x) = x при 0 < x 6 1,
0 при x > 1;



 0 при x 6 −1,
−cx при −1 6 x 6 0,

б) Fξ (x) =

 cx при 0 6 x < 1,
1 при x > 1;

в) Fξ (x) = 1 − e−5x , x > 0;



0 при x 6 3,
г) Fξ (x) =
1 при x > 3;

 0 при x 6 3;
д) Fξ (x) = (x − 4)/4 при 3 < x 6 7;
1 при x > 7.

227. Случайная величина ξ задана функцией распределения

Fξ (x) = c + b · arctg x, x ∈ R.

75
6.1 Одномерные непрерывные случайные величины

Найдите постоянные b, c и плотность.


228. В задании функции распределения


 0 при x 6 −α,

1 1 x

Fξ (x) = + arcsin при −α < x 6 α,

 2 π α

1 при α < x.

α является параметром или постоянной величиной? Найдите плот-


ность этого распределения и p (−α/2 6 ξ 6 α/2).
229. Пачки печенья упаковывают автоматически. Масса пач-
ки распределена по нормальному закону и имеет среднее значение
200 г, среднеквадратичное отклонение 5 г. Найти вероятность то-
го, что вес случайно взятой пачки меньше 195 г.
230. Количество задач в параграфе имеет нормальное распре-
деление N (25, 5) (со средним значением 25). Какова вероятность,
что в параграфе будет не больше 30 задач?
231. Число посетителей сайта представляет собой случайную
величину, распределённую по нормальному закону с параметрами
a = 50, σ = 5. Найти вероятность того, что сайт посетит от 40 до
60 пользователей.
232. Случайная величина ξ распределена по нормальному зако-
ну с математическим ожиданием, равным 0, и дисперсией σ 2 . Каковы
а) (−σ, σ);
вероятности ее попадания в интервалы: б) (−2σ, 2σ);
в) (−3σ, 3σ)?
233. Случайная величина ξ имеет распределение N (1, 2). Что
больше, p (0 6 ξ < 1) или p (2 6 ξ < 4)?
234. Нормальное распределение с параметрами (0; σ) усечено
значением 0, то есть


 0 при x 6 0,
fξ (x) = x2
 
A
 √ exp −
 при x > 0.
σ 2π 2
Найти коэффициент A.
235. Рост человека имеет распределение N (a, σ). Если извест-
но, что рост больше, чем a + σ, какова вероятность, что рост мень-
ше, чем a + 2σ?
236. Продолжительность междугородного разговора име-
ет приближенно показательное распределение с параметром

76
6.2 Многомерные случайные величины

1/3 (мин−1 ). Найдите вероятность того, что очередной разго-


вор будет продолжаться более 2 минут.
237. Время безотказной работы принтера является случайной
величиной, распределенной по показательному закону с параметром
1/700 (1/час). Найдите вероятность того, что принтер прорабо-
тает больше 700 часов.
238. Случайная величина ξ имеет показательное распределе-
ние с параметром 1. Что больше, p (1 6 ξ < 2) или p (2 6 ξ < 4)?
239. Длительность работы электрической лампочки подчиня-
ется показательному закону с параметром λ = 0, 01 (1/день). Най-
ти вероятность того, что лампочка проработает 100 дней.
240. В условиях предыдущей задачи, если лампочка проработа-
ла 100 дней, какова вероятность, что она перегорит за следующие
100 дней?
241. Будем считать, что длительность консультации распре-
делена по показательному закону с параметром 1 (1/ч). Обычная
длительность консультации — академический час (45 мин). Если
консультация не закончилась за это время, какова вероятность то-
го, что она закончится в ближайшие 15 мин?
242. Месячный доход налогоплательщика имеет распределение
Парето с параметром p = 3. Найти вероятность того, что доход
случайного налогоплательщика более, чем в два раза выше нижнего
предела.

6.2. Многомерные случайные величины

n-мерной случайной величиной называется вектор


ξ(ω) = (ξ1 (ω), ξ2 (ω), . . . , ξn (ω)) ,
отображающий Ω в R n .
Дискретные двумерные случайные величины часто задают таблицей
распределения:
η \ ξ x1 . . . xn
y1 p11 . . . p1n
.. .. .. ..
. . . .
ym pm1 . . . pmn

Совместной функцией распределения n-мерной случайной вели-


чины ξ называется функция
Fξ1 , ..., ξn (x1 , . . . , xn ) = p ( ξ1 < x1 , . . . , ξn < xn , ), ∀x ∈ Rn . (32)

77
6.2 Многомерные случайные величины

n-мерная cлучайная величина ξ непрерывно распределена, если ее


функция распределения допускает представление в виде
Zx1 Zxn
Fξ1 , ..., ξn (x1 , . . . , xn ) = ... fξ1 , ..., ξn (t1 , . . . , tn ) dt1 . . . dtn . (33)
−∞ −∞

Подынтегральная функция fξ1 , ..., ξn (x1 , . . . , xn ) называется плотно-


стью распределения n-мерной случайной величины ξ = (ξ1 , . . . , ξn ).
Случайные величины ξ1 , . . . , ξn называются независимыми, если
p ( ξ1 ∈ B1 , . . . , ξn ∈ Bn ) = p ( ξ1 ∈ B1 ) . . . p ( ξn ∈ Bn ), (34)
где B1 , . . . , Bn — борелевские множества из R .
Свойства независимых случайных величин.
1) Fξ1 , ..., ξn (x1 , . . . , xn ) = Fξ1 (x1 ) . . . Fξn (xn ).
2) Для дискретных случайных величин
pξ1 , ..., ξn (x1 , . . . , xn ) = p ( ξ1 = x1 , . . . , ξn = xn ) =
= p ( ξ1 = x1 ) . . . p ( ξn = xn ).
3) Для непрерывных случайных величин
fξ1 , ..., ξn (x1 , . . . , xn ) = fξ1 (x1 ) . . . fξn (xn ).
Вышеперечисленные свойства являются необходимыми и достаточ-
ными условиями независимости случайных величин.
Система двух случайных величин.
y Пусть (ξ, η) — двумерная непрерыв-
(X, Y ) но распределенная случайная величина, а
Fξ, η (X, Y ) — ее функция распределения.
x Геометрически Fξ, η (X, Y ) интепрети-
0 руется как как вероятность попадания слу-
чайной точки (ξ, η) в квадрант с вершиной
(X, Y ), заштрихованный на рисунке 8.
Плотность распределения выражает-
ся формулой
Рис. 8.
∂ 2 F (x, y)
fξ, η (x, y) = .
∂x ∂y
Вероятность попадания случайной точки (ξ, η) в произвольную об-
ласть D может быть найдена по формуле
ZZ
p ((ξ, η) ∈ D) = fξ, η (x, y) dx dy.
D

78
6.2 Многомерные случайные величины

y Вероятность попадания случайной точки


d (ξ, η) в прямоугольник R со сторонами, парал-
R лельными осям координат, включающий свою
c нижнюю и левую границы, но не включащий
x верхнюю и правую, можно найти по формуле
0 a b
p ((ξ, η) ∈ R) = F (b, d)−F (a, d)−F (b, c)+F (a, c),

Рис. 9. где a, b, c, d — координаты вершин прямо-


угольника R (см. рис. 9).

Функция распределения двумерной слу-


чайной величины может быть выражена через ее плотность по формуле
Zx Zy
Fξ, η (x, y) = fξ, η (u, v) du dv
−∞ −∞

(интегрируют сначала по v, затем — по u).


Плотности распределения одномерных величин ξ и η, составляющих
двумерную величину (ξ, η), находятся по формулам:
Z+∞
fξ (x) = fξ, η (x, y) dy, (35)
−∞

Z+∞
fη (y) = fξ, η (x, y) dx. (36)
−∞

Пример 96. Дискретная двумерная случайная величина задана таб-


лицей распределения
η \ ξ x1 . . . xn
y1 p11 . . . p1n
.. .. .. ..
. . . .
ym pm1 . . . pmn
Найти одномерные законы распределения ξ, η.
J Поскольку p (ξ = x1 ) не зависит от η, то
m
X m
X
p (ξ = x1 ) = p (ξ = x1 /η = yi ) = pi1 .
i=1 i=1

Пользуясь аналогичными соображениями для x2 , x3 , . . . , xn и


y1 , y2 , . . . , ym , получим одномерные ряды распределения ξ и η:

79
6.2 Многомерные случайные величины

ξ x1 x2 . . . xn
m
P m
P m
P
p pi1 pi2 . . . pin
i=1 i=1 i=1

η y1 y2 . . . ym
n n n
P P P I
p p1i p2i . . . pmi
i=1 i=1 i=1

В задачах примеров 97—98 с помощью совместной плотности заданы


двумерные случайные величины (ξ, η). Требуется найти
а) совместную функцию распределения Fξ, η (x, y),
б) одномерные плотности fξ (x) и fη (y).
2
+y 2 )
Пример 97. fξ, η (x, y) = 4xye−(x ; x, y ∈ R + ∪ {0}.

J Пользуясь формулой (33), вычислим Fξ, η (x, y).


Zx Zy
2
+v 2 )
Fξ, η (x, y) = 4uve−(u du dv.
0 0

Рассмотрим двойной интеграл


Zx Zy Zy
 
Zx
2
+v 2 ) 2 2
4uve−(u du dv = 4ue−u  ve−v dv  du.
0 0 0 0

v2
При помощи подстановки t = − вычислим неопределенный инте-
2
грал, соответствующий внутреннему:
 2
t = − v2 ,
Z  Z Z
−v 2 2t 1 1
e dv = = − e dt = − e2t d(2t) = − e2t .
dt = −v dv 2 2
Тогда
Zy  y 2
1 −2 v2 1 h −y2 1 e−y
 i
−v 2
0
ve dv = e 2 = − e −e = − .
2
0 2 2 2
0

Вернемся к повторному интегралу:


Zx −y 2
!
−y 2 Z
x
2 1 e 1 − e 2
4ue−u − du = 4 · ue−u du.
2 2 2
0 0

80
6.2 Многомерные случайные величины

Как доказано выше,


Zx 2
2 1 e−x
ue−u du = − ,
2 2
0
следовательно,
2 2
Fξ, η (x, y) = (1 − e−y )(1 − e−x ), x, y ∈ R + ∪ {0}.
Теперь найдем плотность распределения случайной величины ξ по
формуле (35).
Z+∞ Z+∞  y2

2 2 2 2 t = − ,
fξ (x) = 4xye−x −y dy = 4xe−x ye−y dy = 2 =
dt = −y dy
0 0
Z+∞ Z+∞  2  a
2 1 2 2 −2 y2
= −4xe−x e2t dt = − · 4xe−x e2t d(2t) = −2xe−x lim e =
2 a→+∞
0
0
2
h0 2 i 2 2
= −2xe−x −a
lim e − e = −2xe−x [0 − 1] = 2xe−x .
0
a→+∞

Аналогично, по формуле (36) находим, что


Z+∞
2 2 2
fη (y) = 4xye−x −y dx = . . . = 2ye−y . I
0

Пример 98. fξ, η (x, y) = 1/3 при 0 6 x 6 3, 0 6 y 6 1 (плотность


равна 0 при остальных x, y).
J Разобьем координатную
y плоскость на 5 подобластей:
1) x 6 0 или y 6 0;
3) 2)
2) x > 3 и y > 1;
1 3) 0 < x 6 3 и y > 1;
5) 4)
x 4) x > 3 и 0 < y 6 1;
0 3
5) 0 < x 6 3 и 0 < y 6 1.
1)
Это разбиение представлено на
рисунке 10.
Рис. 10. Будем находить совместную
функцию распределения Fξ, η (x, y) на каждом из этих 5 множеств отдельно,
обозначая FM (x, y) — функцию распределения случайной величины (ξ, η)
на множестве M ).

81
6.2 Многомерные случайные величины

1) Функция распределения (ξ, η) в каждой точке этой области равна ну-


лю, поскольку
Zx Zy
F1 (x, y) = 0 du dv = 0.
−∞ −∞

2) Так как плотность распределения (ξ, η) равна нулю на всех множествах


разбиения, кроме пятого, то
Z0 Z0 Z3 Z+∞ Z+∞Z1
F2 (x, y) = 0 du dv + 0 du dv + 0 du dv+
−∞ −∞ 0 1 3 0
Z3 Z1 Zx Zy Z3 Z1
1 1
+ du dv + 0 du dv = du dv.
3 3
0 0 3 1 0 0

Этот интеграл легко вычисляется:


 
Z3 Z1 Z3 Z1
1 1 
du dv = dv  du =
3 3
0 0 0 0
Z3 Z3
1 1 1
= ([1 − 0] dv) du = du = · 3 = 1 = F2 (x, y).
3 3 3
0 0

3) Здесь F3 = p (ξ < x, η < +∞) = p (ξ < x) = Fξ (x).

Zx
def
Fξ (x) = fξ (t) dt.
−∞
Найдём fξ (x).
Z1
1 1
fξ (x) = dy = , 0 6 x 6 3.
3 3
0
Тогда
Z0 Zx
(35) 1 x
Fξ (x) = 0 dt + dt = .
3 3
−∞ 0

4) F4 = p (ξ < +∞, η < y) = p (η < y) = Fη (y).


Z3
1
fη (y) = dx = 1, 0 6 y 6 1.
3
0

82
6.2 Многомерные случайные величины

Zy Z0 Zy
def (36)
Fη (y) = fη (t) dt = 0 dt + 1 dt = y.
−∞ −∞ 0

5) В данном случае
Zx Zy
1 xy
F5 (x, y) = du dv = . . . = .
3 3
0 0

Таким образом,


 0 при x 6 0 или y 6 0;
 (xy)/3

 при 0 < x 6 3 и 0 < y 6 1;
Fξ, η (x, y) = x/3 при 0 < x 6 3 и y > 1;
y при x > 3 и 0 < y 6 1;




при x > 3 и y > 1.

1

Z1
1 1
fξ (x) = dy = .
3 3
0

Z3
1
fη (y) = dx = 1. I
3
0

 Задачи
243. Дискретная двумерная случайная величина (ξ, η) задана
таблицей распределения

η\ξ −1 0 1
0 0, 1 x 0
1 0 3x 0
2 0 0, 1 0, 4

Найти x, одномерный закон распределения ξ, p (η > 0, 5).


244. Являются ли одномерные случайные величины ξ, η из
предыдущей задачи независимыми?
245. По заданному совместному закону распределения двумер-
ной случайной величины (ξ, η) найдите совместную функцию распре-

83
6.2 Многомерные случайные величины

деления Fξ, η (x, y) и выясните, являются ли одномерные случайные ве-


личины ξ, η независимыми.
η\ξ 3 4
1 0, 3 0, 4
2 0, 1 0, 2

246. Дискретная двумерная случайная величина ξ, η задана


таблицей распределения

η\ξ 0 1 2
−1 0, 3 0 0
0 0 0, 3 0
1 0 0 0, 4

Докажите по определению, что ξ, η зависимы. Докажите тот


же факт, используя функции распределения.
247. Дискретная двумерная случайная величина ξ, η задана
таблицей распределения

η\ξ 3 4
1 1/6 1/3
2 1/6 1/3

Докажите по определению, что ξ, η независимы. Докажите


тот же факт, используя функции распределения.
248. Один раз бросают игральную кость. Случайная величина
ξ — число выпавших единиц, а случайная величина η — число выпав-
ших шестёрок. Построить таблицу распределения случайной вели-
чины (ξ, η). Что можно сказать про зависимость ξ, η?
249. Один раз бросают две игральные кости. Случайная вели-
чина ξ — число выпавших единиц, а случайная величина η — число
выпавших шестерок. Найти вероятность p (ξ = 0, η = 0). Постро-
ить таблицу распределения случайной величины (ξ, η).
250. Два раза бросают игральную кость. Случайная величина
ξ — сумма, а случайная величина η — модуль разности выпавших
очков. Построить таблицу распределения случайной величины (ξ, η),
найти вероятность p (ξ = 7, η 6 4).
251. Двумерная случайная величина задана с помощью сов-
местной плотности fξ, η (x, y). Выразить через неё одномерные
плотности компонент ξ, η.
252. Двумерная случайная величина задана с помощью сов-

84
6.2 Многомерные случайные величины

местной плотности:
Cxy 2 при 0 < y < 1, 0 < x < 1;

fξ, η (x, y) =
0 — иначе.
Найти постоянную C и одномерную плотность fξ (x).
253. В условиях предыдущей задачи найдите p (ξ + η > 1) и
p (1/2 < ξ < 3/4).
254. Определить плотность вероятности двумерной случай-
ной величины (ξ, η) по заданной функции распределения:
(1 − e−2x )(1 − e−3y ) при x > 0, y > 0;

Fξ, η (x, y) =
0 — иначе.

В задачах 255—259 с помощью совместной плотности заданы дву-


мерные случайные величины (ξ, η). Требуется выяснить зависимы ли ξ, η, и
найти
а) неизвестную постоянную C;
б) совместную функцию распределения Fξ, η (x, y);
в) одномерные плотности fξ (x), fη (y).

255. fξ, η (x, y) = C|x||y| exp −(x2 + y 2 ) .
Cxy exp −(4x2 + y 2 ) при 0 < y < 1, 0 < x < 1;

256. fξ, η (x, y) =
0 — иначе.

Cxy при 0 < y < 1, 0 < x < 2;
257. fξ, η (x, y) =
0 — иначе.
1
258. fξ, η (x, y) = C .
1 + x2 + y 2 + x2 y 2
π π
259. fξ, η (x, y) = C cos x · cos y при 0 6 x 6 , 0 6 y 6 (плот-
2 2
ность равна нулю при остальных x, y).
260. В круге радиуса R случайно выбирают точку (ξ, η). Запи-
шите плотность случайной величины (ξ, η).
261. В квадрате [0, 1] × [0, 1] случайно выбирают точку (ξ, η).
Запишите функцию распределения случайной величины (ξ, η) и най-
дите p (2ξ > η).
262. Двумерная случайная величина (ξ, η) равномерно распре-
делена в треугольнике D = {(x, y) : x > 0, y > 0, x + y 6 2.} Найдите
p (ξ < η).
263. В условиях предыдущей задачи выясните, зависимы ли ξ, η.
264. Двумерная случайная величина (ξ, η) имеет плотность ве-
роятности
A 1
fξ, η (x, y) = 2 · .
π (3 + x2 )(1 + y 2 )
85
6.2 Многомерные случайные величины

Найти величину A и p (0 < ξ < 1, 0 < η < 1).

86
7. Числовые характеристики
одномерной случайной величины
7.1. Математическое ожидание

Математическим ожиданием случайной величины ξ называ-


ется число
Z Z∞
Mξ = ξ(ω) dP (ω) = x dFξ (x), (37)
Ω −∞
при условии, что интеграл сходится абсолютно.
Смысл математического ожидания — среднее значение случайной ве-
личины. Из определения (37) вытекают формулы (38) для дискретной слу-
чайной величины и (39) для непрерывной случайной величины.
Формулы для вычисления математического ожидания.
Математическое ожидание одномерной дискретной случайной вели-
чины ξ:
X∞
Mξ = xi · p ( ξ = xi ). (38)
i=1
Математическое ожидание непрерывной одномерной случайной вели-
чины ξ:
Z∞
Mξ = xfξ (x) dx. (39)
−∞

Свойства математического ожидания.


1) M c = c, c = const.
2) M cξ = cM ξ.
3) M (ξ1 + ξ2 ) = M ξ1 + M ξ2 .
4) M (η1 · η2 ) = M (η1 ) · M (η2 ), если η1 и η2 — независимые случайные вели
5) |M ξ| 6 M |ξ|.

Пример 99. Найти математическое ожидание случайной величины,


заданной законом распределения:

ξ 0 1 2 3
P 0, 2 0, 3 0, 4 0, 1
J Воспользовавшись формулой (38), легко получим
M ξ = 0 · 0, 2 + 1 · 0, 3 + 2 · 0, 4 + 3 · 0, 1 = 1, 4. I

87
7.1 Математическое ожидание

Пример 100. Найти математическое ожидание геометрического


распределения Gp .

J Геометрическое распределение Gp задается следующим рядом.

ξ 0 1 2 ... k ...
2 k ,
p p p(1 − p) p(1 − p) . . . p(1 − p) . . .

где p (ξ = k) = (1 − p)k p. Обозначив q = 1 − p, вновь обратимся к формуле


(38):
X∞ ∞
X X∞
k
Mξ = xk pk = kq p = pq kq k−1 =
k=0 k=0 k=0
∞ ∞ ∞
!0
X X X
= pq kq k−1 = pq (q k )0 = pq qk .
k=1 k=1 k=1
Используя формулу для суммы геометрической прогрессии

X q
qk =
1−q
k=1

со знаменателем q(|q| < 1), находим


 0
q 1(1 − q) − q(−1) 1 pq q
M ξ = pq = pq = pq = = .I
1−q (1 − q)2 (1 − q)2 p2 p
Пример 101. Найти математическое ожидание отрицательного
биномиального распределения B(r, p).

J По условию задачи случайная величина ξ распределена так, что


m
p (ξ = m) = Cm+r−1 pr q m для ξ = 0, 1, . . . , r.
Случайная величина ξ ∈ B(r, p) представима в виде суммы r величин,
r
P
имеющих геометрическое распределение: ξ = ξi , ξi ∈ Gp .
i=1
Из свойств математического ожидания получаем
r r
X X q rq
Mξ = M ξi = = .I
i=1 i=1
p p

Пример 102. Найти математическое ожидание случайной величи-


ны, заданной с помощью плотности fξ (x)
 2
cx при x ∈ [0, 2];
fξ (x) =
0 при x ∈
/ [0, 2].

88
7.1 Математическое ожидание

J Пользуясь свойством нормировки плотности распределения слу-


чайной величины, найдем постоянную c.
Z+∞ Z0 Z2 Z+∞ Z2 3 2

t 8
fξ (t) dt = 0 dt + ct2 dt + 0 dt = ct2 dt = c = c.
3 0 3
−∞ −∞ 0 2 0

Из уравнения 8c/3 = 1 находим, что c = 3/8.


По определению математического ожидания непрерывной случайной
величины
Z+∞ Z2 2
3 3 3 x4 3 · 24 3
Mξ = xfξ (x) dx = x dx = · = = .I
8 8 4 0 8·4 2
−∞ 0

Пример 103. Найти математическое ожидание гамма-распределе-


ния Γα, β .

J Выпишем функцию плотности гамма-распределения.


αβ −αx β−1
fξ (x) = e x при x > 0, где
Γ (β)
Z∞
Γ (β) = xβ−1 e−x dx.
0

Z+∞ Z+∞
Mξ = xfξ (x) dx = xfξ (x) dx =
−∞ 0
Z+∞ +∞
αβ α β Z
= xe−αx xβ−1 dx = e−αx xβ dx.
Γ(β) Γ(β)
0 0

Сделаем замену переменной t = αx, dt = αdx:


Z+∞ Z+∞
αβ tβ
dt α β
1 1
Mξ = e−t β = e−t β
t dt = Γ(β + 1).
Γ(β) α α Γ(β) αβ+1 αΓ(β)
0 0

Используем свойство гамма-функции: Γ(x + 1) = xΓ(x).


βΓ(β) β
Mξ = = .I
αΓ(β) α

89
7.1 Математическое ожидание

Пример 104. Доказать, что математическое ожидание распределе-


ния Коши не существует. Ka, λ .
J Функция плотности распределения Коши имеет вид
λ 1
fξ (x) = 2 .
λ + (x − a)2 π
Рассмотрим величину
Z+∞ Z+∞
|x| λ
|x|fξ (x) dx = · 2 dx =
π λ + (x − a)2
−∞ −∞
Z+∞ Z+∞
λ |x| λ dx
· 2 dx = (x−a)2
.
π λ + (x − a)2 π λ2
+
−∞ −∞ |x| |x|

Полученный интеграл расходится, так как в знаменателе


λ2 (x − a)2
+
|x| |x|
старшая степень x не превосходит 1. Следовательно, математическое ожи-
дание не существует. I

 Задачи
В задачах 265—272 требуется найти математические ожидания ука-
занных случайных величин.
265. Вероятность попадания при одном выстреле равна 0,7.
Случайная величина ξ равна числу попаданий в цель при двух выстре-
лах.
266. Проводят один опыт, в результате которого событие мо-
жет произойти с вероятностью 0,4. Случайная величина ξ принима-
ет значение 1, если событие произошло и 0, если оно не произошло.
267. Игра состоит в набрасывании колец на колышек. Игрок по-
лучает 3 кольца и бросает их до первого попадания. Вероятность
попадания при одном броске 0,5. Случайная величина равна числу из-
расходованных колец.
268. В лотерее имеется ni выигрышей стоимостью mi , где i =
1, . . . , k. Всего билетов N . Случайная величина ξ — стоимость выиг-
рыша на один билет.
269. Из четырех ключей только один подходит к замку. Слу-
чайная величина ξ — число попыток при открывании замка.
270. Партия из 8 деталей содержит 2 нестандартные. Науда-
чу отобраны 3 детали. Случайная величина ξ — число стандартных

90
7.1 Математическое ожидание

среди трех отобранных.


271. Найти математическое ожидание биномиального распре-
деления B (N, p).
272. Найти математическое ожидание распределения Пуассо-
на Pλ .
В задачах 273—287 требуется найти неизвестные постоянные коэф-
фициенты и математическое ожидание случайных величин, заданных с по-
мощью плотности fξ (x) или функции распределения Fξ (x) (или указать, что
математическое ожидание
 не существует).
1/3 при x ∈ [1; 4],
273. fξ (x) =
0 при x ∈ [1; 4].
 3
cx при x ∈ [0; 1]
274. fξ (x) =
0 при x ∈ [0; 1].

 0 при x 6 0,
275. Fξ (x) = x2 при 0 < x 6 1,
1 при 1 < x.


 0 при x 6 0,
276. fξ (x) = sin x при 0 < x 6 C,
0 при C < x.

x2
 
277. fξ (x) = A exp − 2 , где x > 0, σ = const.

a
278. fξ (x) = exp {−a|x − b|} , где a > 0.
2
279. Fξ (x) = c+ b · arctg x, где x ∈ R.
 0 при x 6 −a
280. Fξ (x) = 1/2 + (1/π) arcsin (x/a) при −a < x 6 a
1 при a < x.

 m
x
281. fξ (x) = A exp − , где x > 0, x0 = const.
x0
3x2 (x3 − a)2

282. fξ (x) = √ exp − .
σ 2π 2σ 2
A
283. fξ (x) = x , где x ∈ R.
e + e−x
284. Найти среднюю скорость молекул газа, если скорость под-
чиняется закону Максвелла:
 3
 4h 2 −v2 h2
√ v e при v > 0,
f (v) = π
0 при v 6 0.

285. Найти математическое ожидание распределения Рэлея:


f (x) = Ax exp −h2 x2 , где x > 0.


91
7.2 Другие числовые характеристики случайной величины

286. Найти математическое ожидание распределения


Лапласа.
287. Найти математическое ожидание распределения
Парето.

7.2. Другие числовые характеристики случайной величины

Дисперсией ξ называется число

Dξ = M (ξ − M ξ)2 . (40)

Начальным моментом порядка k случайной величины ξ называется


число
αk = M (ξ)k . (41)

Центральным моментом порядка k случайной величины ξ называ-


ется число
µk = M (ξ − M ξ)k . (42)

Среднеквадратическим отклонением ξ называется число


p
σ = Dξ. (43)

Коэффициентом асимметрии называется число


µ3 M (ξ − M ξ)3
A= 3 = p . (44)
σ (Dξ)3

Коэффициентом эксцесса называется число


µ4 M (ξ − M ξ)4
E = 4 −3= − 3. (45)
σ (Dξ)2

Модой непрерывной случайной величины ξ называется значение


mo , при котором плотность fξ (x) достигает максимума:

fξ (m0 ) = max fξ (x). (46)


x

Модой дискретной случайной величины ξ называется значение mo ,


при котором
p ( ξ = mo ) = max pi . (47)
i

92
7.2 Другие числовые характеристики случайной величины

Медианой непрерывной случайной величины ξ называется значе-


ние me , при котором
Zme
fξ (x) dx = 1/2, (48)
−∞

то есть F (me ) = 1/2.


Медианой дискретной случайной величины ξ называется значение
me , при котором

F (me ) 6 1/2, F (me + 0) > 1/2. (49)

Квантилью порядка q (0 < q < 1) непрерывной случайной вели-


чины ξ называется значение xq , при котором
Zxq
fξ (x) dx = q, (50)
−∞

то есть F (xq ) = q.
Квантилью порядка q (0 < q < 1) дискретной случайной величи-
ны ξ называется значение xq , при котором

F (xq ) 6 q, F (xq + 0) > q. (51)

Пример 105. Случайная величина задана законом распределения:

ξ 0 1 2 3
p 0, 2 0, 3 0, 4 0, 1

Требуется найти ее дисперсию.

J Легко найти M ξ = 1, 4.
По формуле (40)

Dξ = M ξ 2 − (M ξ)2 =
= 02 · 0, 2 + 12 · 0, 3 + 22 · 0, 4 + 32 · 0, 1 − 1, 42 = 0, 84. I

Пример 106. Найти дисперсию случайной величины, заданной с по-


мощью плотности fξ (x):
 2
cx при x ∈ [0, 2];
fξ (x) =
0 при x ∈
/ [0, 2].

93
7.2 Другие числовые характеристики случайной величины

J Как установлено ранее, c = 3/8, M ξ = 3/2. Теперь вычислим M ξ 2 .

Z+∞ Z2 5 2
3 · 25

2 2 3 4 3 x 12
Mξ = x fξ (x) dx = x dx = · = = .
8 8 5 0 8·5 5
−∞ 0

Зная M ξ и M ξ 2 , легко получим


 2
12 3 3
Dξ = − = .I
5 2 20
Пример 107. Найти медиану и моду случайной величины, заданной с
помощью плотности

 0 при x 6 0,
fξ (x) = sin x при 0 < x 6 C,
0 при C < x.

J Воспользуемся тем, что


Z+∞
fξ (t) dt = 1
−∞

(свойство нормировки функции плотности распределения случайной


величины ξ).

Z+∞ Z0 ZC Z+∞ ZC
fξ (t) dt = 0 dt + sin t dt + 0 dt = sin t dt =
−∞ −∞ 0 C 0
= − cos t|C0 = − cos C + cos 0 = 1 − cos C.

π
1 − cos C = 1 ⇔ cos C = 0 ⇔ C = + πk, k ∈ Z.
2
Поскольку функция fξ (t) > 0 почти всюду, то C = π/2.
По определению мода — это число m0 такое, что

fξ (m0 ) = max fξ (x).


x
π  π
Здесь max fξ (x) = 1 = fξ , т. е. m0 = .
x 2 2

94
7.2 Другие числовые характеристики случайной величины

В силу того, что fξ (x) обращается в ноль во всех точках R, за исклю-


чением полуинтервала (0, π/2], медиана me случайной величины ξ располо-
жена внутри указанного интервала. Поэтому
Z+∞ Zme
fξ (t) dt = sin t dt = − cos t|m
0 = 1 − cos me .
e

−∞ 0

Решая уравнение 1 − cos me = 1/2 на (0, π/2] получаем, что

me = π/3. I

Пример 108. Найти коэффициенты асимметрии и эксцесса равно-


мерного распределения R[0; 1].

J Найдем сначала в общем виде центральные моменты µk .


k+1 1
 k Z 1  k
1 1 (y − 1/2)
µk = M (η − M η)k = M η − = y− dy = =
2 0 2 k + 1
0

(1/2)k+1 (−1/2)k+1 (−1)k+1 1 − (−1)k+1


 
1 1
= − = k+1 − = .
k+1 k+1 2 k+1 k+1 (k + 1)2k+1
µ3
Коэффициент асимметрии A = 3 .
σ
Поскольку µ3 = 0, A = 0.
µ4
Коэффициент эксцесса E = 4 − 3.
σ
1 − (−1)4+1 2 1
µ4 = = = ,
(4 + 1)24+1 5 · 32 80
1 1 1
√ σ4 =
= = .
(2 3)4 16 · 9 144
144 144 − 240 −96 6
E= −3= = = − = −1, 2 I
80 80 80 5
Пример 109. Найти моду, медиану и децили15 случайной величины η,
имеющей равномерное распределение R[0; 1].
15
Децилями назваются квантили x0,1 , . . . , x0,9 .

95
7.2 Другие числовые характеристики случайной величины

J Мода m0 : fη (m0 ) = maxx fη (x). Так как fη (x) = const, то f 0 (x) = 0.


Значит, любая точка x ∈ [0, 1] будет точкой локального максимума. В этом
случае считают, что моды нет (распределение амодальное).
Медиана me : надо решить уравнение Fη (me ) = 21 . Fη (x) = x, значит,
x = 1/2, me = 21 .
Квантили xq : решая уравнение Fη (xq ) = q, получаем xq = q. Следова-
тельно, квантили принимают такие значения:

Квантиль Значение
x0,1 0, 1
x0,2 0, 2
x0,3 0, 3
x0,4 0, 4
x0,5 0, 5
x0,6 0, 6
x0,7 0, 7
x0,8 0, 8
x0,9 0, 9

Замечание. Этот пример можно было решить без вычислений, исходя


из смысла определений. I

 Задачи
288. Докажите, что
k
X
k
µk = M (ξ − M ξ) = (−1)k−i · Cki αi α1k−i .
i=0

289. Найти дисперсию случайной величины, распределенной по


закону Пуассона.
290. Найти α3 = M ξ 3 для случайной величины, имеющей бино-
миальное распределение с параметром p.
291. Найти моду и медиану распределения Коши.

В задачах 292—303 требуется найти моду, медиану и дисперсию слу-


чайных величин, заданных с помощью плотности fξ (x) или функции распре-

96
7.2 Другие числовые характеристики случайной величины

деления Fξ (x) (или 


указать, что они не существуют).
1/3 при x ∈ [1; 4],
292. fξ (x) =
0 при x ∈ [1; 4].
 3
cx при x ∈ [0; 1],
293. fξ (x) =
0 при x ∈ [0; 1].

 0 при x 6 0,
294. Fξ (x) = x2 при 0 < x 6 1,
1 при 1 < x.


0 при x 6 0,
295. fξ (x) = −x
e при x > 0.
x2
 
296. fξ (x) = A exp − 2 , где x > 0, σ = const.

a
297. fξ (x) = exp {−a|x − b|} , где a > 0.
2
298. Fξ (x) = c+ b · arctg x, где x ∈ R.
 0 при x 6 −a
299. Fξ (x) = 1/2 + (1/π) arcsin (x/a) при −a < x 6 a
1 при a < x.

 m
x
300. fξ (x) = A exp − , где x > 0, x0 = const.
x0
301.  3
 4h 2 −x2 h2
√ xe при x > 0,
f (x) = π
0 при x 6 0.

3x2 (x3 − a)2


 
302. fξ (x) = √ exp − .
σ 2π 2σ 2
A
303. fξ (x) = x , где x ∈ R.
e + e−x
304. Найти коэффициенты асимметрии и эксцесса равномер-
ного распределения R[a; b].
305. Докажите рекуррентную формулу для моментов показа-
тельного распределения Eλ :
k+1
µk+1 = (−1)k+1 (M ξ)k+1 + µk .
λ

306. Найдите коэффициенты асимметрии и эксцесса показа-


тельного распределения Eλ .
307. Найти коэффициент асимметрии случайной величины,
распределенной по закону Пуассона.
308. Найдите квантиль порядка 0,75 распределения Коши с па-

97
7.3 Математические ожидания и дисперсии
некоторых важных распределений

раметром a.
309. Найдите отношение квантилей порядков 0,8 и 0,2 случай-
ной величины, имеющей равномерное распределение R[a; b].
310. Случайная величина ξ распределена нормально с M ξ = 100.
Известно, что x0,05 = 90. Найти σ.

7.3. Математические ожидания и дисперсии


некоторых важных распределений

При решении задач этого подпараграфа удобно пользоваться


таблицей 7 Приложения.

Пример 110. Проводят три испытания по схеме Бернулли с вероят-


ностью появления события в одном испытании p. Случайная величи-
на ξ — число появления события в трех испытаниях. Известно, что
Dξ = 0, 75. Найти p.
J Случайная величина ξ имеет биномиальное распределение B (3, p),
поэтому
Dξ = 3pq = 3p(1 − p).
Решая квадратное уравнение
3p(1 − p) = 0, 75;
получим два равных корня p = p1 = p2 = 0, 5. I

 Задачи
311. Производят 5 выстрелов по мишени. Вероятность попа-
дания при одном выстреле p = 0, 4. Найти математическое ожида-
ние и дисперсию числа промахов.
312. Число вызовов ξ, поступающих оператору в течение ми-
нуты, имеет пуассоновское распределение с параметром λ = 3. Най-
дите M ξ, Dξ.
313. Если при наборе существует вероятность p = 0, 00001 то-
го, что любая буква будет набрана неправильно, и случайная вели-
чина ξ равна числу опечаток в книге, имеющей 400000 печатных зна-
ков, то каково M ξ?
314. Вероятность нарушения герметичности упаковки при пе-
ревозке равна 0,001, и случайная величина ξ равна числу негерметич-
ных упаковок среди 1000 перевезенных. Найдите M ξ, Dξ.
315. В условиях предыдущей задачи упаковки проверяют по
очереди. Случайная величина ξ равна числу проверенных упаковок до

98
7.3 Математические ожидания и дисперсии
некоторых важных распределений

первой встретившейся негерметичной. Найдите M ξ, Dξ.


316. Если в предыдущих условиях случайная величина ξ равна
числу проверенных упаковок до третьей встретившейся негерме-
тичной, найдите среднее значение ξ и дисперсию ξ.
317. В компьютерной игре для прохождения на следующий уро-
вень необходимо сбить n мишеней. Вероятность попадания в цель
при одном выстреле равна p. Случайная величина ξ — число произ-
веденных выстрелов. Найдите M ξ, Dξ.
318. В урне находится 5 белых и 10 красных шаров. Двое пооче-
редно вынимают (с возвращением) шары до появления белого шара.
Случайная величина ξ — число вынутых шаров. Найдите M ξ, Dξ.
319. В условиях предыдущей задачи шары вынимают без воз-
вращения. Найдите M ξ, Dξ.
320. Число посетителей сайта представляет собой случайную
величину, распределенную по нормальному закону с параметрами
a = 50, σ = 5 Каково среднее число посетителей?
321. Средняя продолжительность междугородного разговора
равна 3 минутам. Если считать, что продолжительность междуго-
родного разговора имеет приближенно показательное распределе-
ние, какова вероятность того, что очередной разговор будет про-
должаться более 2 минут?

99
8. Линейная зависимость между случайными величи-
нами
8.1. Линейная зависимость двух величин

Ковариацией двумерной случайной величины (ξ, η) называется


центральный смешанный момент второго порядка
cov (ξ, η) = M [(ξ − M ξ) · (η − M η)] = M (ξ · η) − M ξ · M η. (52)

Коэффициентом корреляции между случайными величинами ξ, η


называется число
cov (ξ, η) M [(ξ − M ξ) · (η − M η)]
ρξ, η = = p . (53)
σξ ση D(ξ)D(η)

Свойства коэффициента корреляции.


1. |ρ| 6 1.
2. Если ξ, η независимы, то ρξ, η = 0.
3. ρξ,η = ±1 ⇐⇒ ξ, η линейно зависимы16
Из свойств 1—3 следует, что коэффициент корреляции есть мера ли-
нейной зависимости между ξ, η.
Уравнением линейной регрессии η на ξ называется линейное урав-
нение η̂ = aξ +b, параметры которого минимизируют остаточную дисперсию
M (η − η̂)2 :
ση
η̂ − M η = ρξ, η (ξ − M ξ). (54)
σξ
2
Остаточная дисперсия равна Sост ση2 (1 − ρ2ξ, η ).

Пример 111. Дискретная двумерная случайная величина (ξ, η) зада-


на таблицей распределения:
ξη 1 3 5
0 0 0, 1 0, 4
2 0, 1 0, 3 0
4 0 0, 1 0
Найти коэффициент корреляции, уравнение линейной регрессии
η на ξ, остаточную дисперсию.
16
Случайные величины ξ, η линейно зависимы, если существуют такие a 6= 0 и b, что ξ = aη + b с вероят-
ностью 1.

100
8.1 Линейная зависимость двух величин

J Найдем одномерные законы распределения.

ξ 0 2 4 η 1 3 5
p 0, 5 0, 4 0, 1 p 0, 1 0, 5 0, 4
Вычислим числовые характеристики.
M ξ = 1, 2; M η = 3, 6;
Dξ = 3, 2 − 1, 2 = 0, 61; Dη = 14, 6 − 3, 62 = 1, 64;
2
√ √
σξ = 1, 76 ≈ 1, 33; ση = 1, 64 ≈ 1, 28.
Ряд распределения ξ · η выглядит следующим образом:
ξ·η 0 2 6 12
p 0, 5 0, 1 0, 3 0, 1

M (ξ · η) = 2 · 0, 1 + 6 · 0, 3 + 12 · 0, 1 = 3, 2.
По формуле (53) вычисления коэффициента корреляции имеем
3, 2 − 1, 2 · 3, 6
ρξ,η = ≈ −0, 659.
1, 33 · 1, 28
Используя формулу (54), получим уравнение линейной регрессии
1, 28
η̂ − 3, 6 = −0, 659 · (ξ − 1, 2);
1, 33
η̂ = −0, 634 · ξ + 4, 361.
Наконец вычислим остаточную дисперсию
2
Sост = 1, 64(1 − 0, 6592 ) ≈ 0, 928. I

Пример 112. Найти ρξ, ξ 4 , если случайная величина ξ задана законом


распределения
ξ −1 0 1
p 0, 2 0, 6 0, 2

J Очевидно, M ξ = 0. Выпишем формулу для вычисления ρξ, ξ 4 .

M (ξ · ξ 4 ) − M (ξ) · M (ξ 4 ) M (ξ 5 ) − M (ξ) · M (ξ 4 )
ρξ, ξ 4 = = .
σξ σξ 4 σξ σξ 4
Найдем закон распределения ξ 5 :
ξ 5 −1 0 1
p 0, 2 0, 6 0, 2

101
8.1 Линейная зависимость двух величин

M ξ 5 = M (ξ) · M (ξ 4 ) = 0, так как M ξ = 0. Поэтому


M (ξ 5 ) − M (ξ) · M (ξ 4 )
ρξ,ξ 4 = = 0. I
σξ σξ 4

 Задачи
В задачах 322—324 заданы совместные законы распределения дву-
мерных случайных величин (ξ, η).
Требуется найти:
а) коэффициент корреляции ρξ, η ;
б) уравнение линейной регрессии η на ξ и остаточную дисперсию;
в) уравнение линейной регрессии ξ на η и остаточную дисперсию.
322.
ξη 1 2 3
−2 0 0, 2 0
0 0, 1 0, 2 0, 1
2 0 0, 1 0, 1
4 0 0, 1 0, 1
323.
ξη 0 1 2
−1 0, 2 0, 1 0
0 0 0, 1 0, 1
2 0 0, 3 0, 2
324.
ξη 0 1 2
−1 0, 3 0 0
0 0 0, 3 0
1 0 0, 4 0

325. Найти коэффициент корреляции между числом выпаде-


ний «единиц» и числом выпадений «шестерок» при одном бросании
игральной кости.
326. Найти коэффициент корреляции между числом выпадений
«единиц» и числом выпадений «шестерок» при n независимых броса-
ниях игральной кости.
327. Найти коэффициент корреляции между случайными вели-
чинами ξ и 7 − 4ξ; 5 − 2ξ и 5 + 3ξ.
328. Случайные величины ξ1 , ξ2 , ξ3 независимы, одинаково рас-
пределены и имеют конечную дисперсию. Найти коэффициент кор-

102
8.2 Числовые характеристики многомерной случайной величины

реляции между случайными величинами ξ1 + ξ2 и ξ2 + ξ3 .


329. Случайные величины ξ1 , ξ2 , ξ3 , ξ4 , ξ5 независимы, одинако-
во распределены и имеют конечную дисперсию. Найти коэффици-
ент корреляции между случайными величинами ξ1 + ξ2 + ξ3 + ξ4 и
ξ2 + ξ3 + ξ4 + ξ5 .
330. Случайные величины ξ и η независимы и одинаково распре-
делены с математическим ожиданием a и дисперсией σ 2 . Найти ко-
эффициент корреляции случайных величин 2ξ + 3η, 2ξ − 3η.
331. Может ли двумерная случайная величина (ξ, η) иметь сле-
дующие характеристики: Dξ = 4, Dη = 6, cov (ξ, η) = 5?
332. Двумерная случайная величина (ξ, η) имеет характери-
стики:
1
M ξ = 0, M η = 2, Dξ = 2, Dη = 1, ρ = −√ .
2
Найти математическое ожидание и дисперсию случайной величины
2ξ − 3η.
333. Пусть ξ — случайная величина с симметричным относи-
тельно нуля распределением и конечной дисперсией. Найти коэффи-
циент корреляции случайных величин ξ и |ξ|.

8.2. Числовые характеристики


многомерной случайной величины

Уравнение множественной линейной регрессии.


Ковариационной матрицей случайных величин ξ1 , . . . , ξn
называется матрица K размерности n × n с конечными элементами
cov (ξi , ξj ):

σ12
 
cov (ξ1 , ξ2 ) . . . cov (ξ1 , ξn )
 cov (ξ2 , ξ1 ) σ22 . . . cov (ξ2 , ξn ) 
K= . (55)
 ... ... ... ... 
cov (ξn , ξ1 ) cov (ξn , ξ2 ) . . . σn2

Наряду с ковариационной матрицей рассматривают и корреляцион-


ную матрицу R, составленную из коэффициентов корреляции ρij = ρξi , ξj :
 
1 ρ12 ρ13 . . . ρ1n
 ρ21 1 ρ22 . . . ρ2n 
R=  ... ... ... ... ... .
 (56)
ρn1 ρn2 ρn3 . . . 1

103
8.2 Числовые характеристики многомерной случайной величины

Корреляционная матрица R симметрична, (то есть ρij = ρji ).

Рассмотрим случайные величины ξ0 , ξ1 , . . . , ξn с математическими


ожиданиями

M ξ0 = a0 , M ξi = ai , ai < ∞, i = 0, 1, . . . , n,

дисперсиями

Dξ0 = σ02 , Dξi = σi2 , i = 1, 2, . . . , n

и корреляционной матрицей R.
Уравнением линейной регрессии ξ0 на ξ1 , . . . , ξn называется урав-
нение
ξb0 = b0 + b1 ξ1 + · · · + bn ξn ,
где bo , b1 , . . . , bn — параметры, минимизирующие остаточную диспер-
сию
M (ξ0 − ξb0 )2 .

Центрированная форма множественной линейной регрессии


задается уравнением
n
X
ξb0 = a0 + bi (ξi − ai ), (57)
i=1

где
R0i σ0 |R0i | σ0
bi = − · = (−1)i+1 · . (58)
R00 σi |R00 | σi
Здесь и далее через Rij обозначено алгебраическое дополнение эле-
мента aij матрицы R, |Rij | — определитель Rij .
2
Остаточная дисперсия Sост = M (ξ0 − ξb0 )2 равна

2 |R|
Sост = σ02 · . (59)
R00
Виды коэффициентов корреляции.
Частный коэффициент корреляции используется как мера
линейной зависимости между двумя какими-либо случайными величинами
из ξ1 , . . . , ξn после вычитания эффекта, обусловленного взаимодействием
этих двух величин с некоторым непустым подмножеством из оставшихся
n − 2 случайных величин.
Пусть l и h — две какие-либо величины из набора ξ1 , . . . , ξn и c —
некоторое непустое подмножество из оставшихся n − 2 величин. Опреде-
лим величины τ1 = l − µl.c и τ2 = h − µh.c . Здесь µl.c = l(c) , µh.c = h(c) —

104
8.2 Числовые характеристики многомерной случайной величины

соответственно условные ожидаемые значения l и h при данном c. Частный


коэффициент корреляции между τ1 и τ2 при фиксированных значениях пе-
ременных из c есть
ρlh.c = ρτ1 τ2 , (60)
где ρτ1 τ2 — парный коэффициент корреляции между τ1 и τ2 . Если в c содер-
жится k переменных, то соответствующий частный коэффициент корреля-
ции называется коэффициентом k-го порядка.
Частные коэффициенты корреляции могут быть вычислены на основе
рекуррентных соотношений следующим образом:
ρlh − ρld · ρhd
ρlh.d = p , (61)
(1 − ρ2ld )(1 − ρ2hd )
где все величины в правой части — парные коэффициенты корреляции. Да-
лее, последовательно применяя рекуррентную формулу
ρlh.c − ρld.c · ρhd.c
ρlh.cd = p , (62)
(1 − ρ2ld.c )(1 − ρ2hd.c )
где c — любое подмножество оставшихся переменных, можно получить
частные коэффициенты корреляции любого порядка.
При рассмотрении линейной регрессии ξ0 на ξ1 , . . . , ξn особое значе-
ние имеет частный коэффициент корреляции между ξ0 и ξi за вычетом
влияния остальных n − 1 величин из набора ξ1 , . . . , ξn , исключая ξi . Он
равен
−R0i (−1)i+1 |R0i |
ρ0i.1, ..., n = √ = p . (63)
R00 Rii |R00 ||Rii |

Множественным коэффициентом корреляции ρξ0 (ξ1 , ..., ξn ) называ-


ется парный коэффициент корреляции между ξ0 и линейной регрессией ξ0 на
ξ1 , . . . , ξn . Этот коэффициент является мерой линейной зависимости между
ξ0 и набором переменных (ξ1 , . . . , ξn ), причем 0 6 ρξ0 (ξ1 , ..., ξn ) 6 1. Нулевое
значение множественного коэффициента корреляции указывает на отсут-
ствие линейной зависимости, а значение 1 — на то, что переменная ξ0 точно
равна линейной комбинации переменных ξ1 , . . . , ξn .
Множественный коэффициент корреляции, как и парный, инвариан-
тен относительно невырожденных линейных преобразований исходных пе-
ременных. Множественный коэффициент корреляции вычисляется с помо-
щью корреляционной матрицы следующим образом:
s
|R|
ρ0(1, ..., n) = 1 − . (64)
|R00 |

105
8.2 Числовые характеристики многомерной случайной величины

Пример 113. Для случайных величин ξ0 , ξ1 , ξ2 известна корреляцион-


ная матрица  
1 0, 3 0, 9
R =  0, 3 1 0, 2  ,
0, 9 0, 2 1
а также известны
M ξ0 = 2, M ξ1 = 4, M ξ2 = 1, Dξ0 = 5, Dξ1 = 3, Dξ2 = 7.
Найти уравнение линейной регрессии ξ0 на ξ1 , ξ2 и остаточную дис-
персию.

J Уравнение линейной регрессии ξ0 на ξ1 , ξ2 здесь запишется как


2
X
ξb0 = M ξ0 + bi (ξi − M ξi ), (*)
i=1

|R0i | σ0
где bi = (−1)i+1 · .
|R00 | σi
Вычислим параметры b1 , b2 .

0, 3 0, 9
√ √
|R01 | σ 0
0, 2 1 5 0, 12 5
b1 = (−1)1+1 · = ·√ = · √ ≈ 0, 161.
|R00 | σ1 1 0, 2
3 0, 96 3
0, 2 1


0, 3 0, 9
√ √
2+1 |R 02 | σ 0
1 0, 2 5 −0, 84 5
b2 = (−1) · = − ·√ =− · √ ≈ 0, 7395.
|R00 | σ2
1 0, 2 7 0, 96 7
0, 2 1

Возвращаясь к (*), получим


ξb0 = 2 + 0, 161(ξ1 − 4) + 0, 7395(ξ2 − 1)
или, что то же,
ξb0 = 0, 6165 + 0, 161ξ1 + 0, 7395ξ2 .
Остаточная дисперсия равна

2 |R| 0, 168
Sост = σ02 · =5· ≈ 0, 875. I
|R00 | 0, 96

106
8.2 Числовые характеристики многомерной случайной величины

Пример 114. Для случайных величин ξ0 , ξ1 , ξ2 известна корреляцион-


ная матрица  
1 0, 3 0, 9
R =  0, 3 1 0, 2  ,
0, 9 0, 2 1
а также
M ξ0 = 2, M ξ1 = 4, M ξ2 = 1, Dξ0 = 5, Dξ1 = 3, Dξ2 = 7.
Найти частный коэффициент корреляции ρ01.2 и множественнный
коэффициент корреляции ρ0(1, 2) .
J Чтобы вычислить частный коэффициент корреляции ρ01.2 , восполь-
зуемся формулой (63).

0, 3 0, 9

(−1)1+1 |R01 | 0, 2 1 0, 12
ρ01.2 = p = s = √0, 96 · 0, 19 ≈ 0, 281.
|R00 ||R11 |

1 0, 2 1 0, 9
0, 2 1 · 0, 9 1

А в нахождении множественного коэффициента корреляции ρ0(1, 2)


нам поможет формула (64):
s r
|R| 0, 168
ρ0(1, 2) = 1 − = 1− ≈ 0, 908. I
|R00 | 0, 96

 Задачи
334. Может ли матрица K быть ковариационной матрицей?
 
10 11
K= .
11 12

335. По заданной ковариационной матрице K найти корреля-


ционную матрицу R.
 
9 8 10
K =  8 16 18  .
10 18 25

336. По заданной корреляционной матрице R и известным дис-


персиям случайных величин Dξ1 = 4, Dξ2 = 9, Dξ3 = 16 найти ковари-
ационную матрицу K.
 
1 −0, 4 0, 9
R =  −0, 4 1 −0, 5  .
0, 9 −0, 5 1

107
8.2 Числовые характеристики многомерной случайной величины

В задачах 337—338 для случайных величин ξ0 , ξ1 , ξ2 известна корре-


ляционная матрица R, а также M ξ0 , M ξ1 , M ξ2 , Dξ0 , Dξ1 , Dξ2 .
Найти: а) уравнение линейной регрессии ξ0 на ξ1 , ξ2 ;
б) остаточную дисперсию.
337.  
1 0, 2 0, 6
R =  0, 2 1 0, 4  ,
0, 6 0, 4 1
M ξi = i, Dξi = i + 1, i = 0, 1, 2.

338.  
1 −0, 1 0, 5
R =  −0, 1 1 0, 7  ,
0, 5 0, 7 1
M ξi = 0, Dξi = 1, i = 0, 1, 2.

В задачах 339—340 для случайных величин ξ0 , ξ1 , ξ2 известна корре-


ляционная матрица R, а также M ξ0 , M ξ1 , M ξ2 , Dξ0 , Dξ1 , Dξ2 .
Найти: а) уравнение линейной регрессии ξ2 на ξ0 , ξ1 ;
б) остаточную дисперсию.
339.  
1 −0, 4 0, 9
R =  −0, 4 1 −0, 5  ,
0, 9 −0, 5 1
M ξ0 = 1, M ξ1 = M ξ2 = 2, Dξ0 = 4, Dξ1 = Dξ2 = 1.

340.  
1 0, 5 0, 8
R =  0, 5 1 0, 7  ,
0, 8 0, 7 1
M ξ0 = 0, M ξ1 = 1, M ξ2 = 3, Dξ0 = 1, Dξ1 = 4, Dξ2 = 9.

341. По заданной ковариационной матрице K найти уравнение


линейной регрессии ξ0 на ξ1 , ξ2 и остаточную дисперсию, если
 
4 −2, 4 7, 2
K =  −2, 4 9 −6  ;
7, 2 −6 16

108
8.2 Числовые характеристики многомерной случайной величины

M ξ0 = 1, M ξ1 = 2, M ξ2 = 2.

342. По заданной ковариационной матрице K найти все част-


ные коэффициенты корреляции.
 
9 8 10
K =  8 16 18  .
10 18 25

В задачах 343—344 для случайных величин ξ0 , ξ1 , ξ2 известна корре-


ляционная матрица R.
Найти: а) частный коэффициент корреляции ρ01.2 ;
б) множественнный коэффициент корреляции ρ0(1, 2) .
343.  
1 0, 2 0, 6
R =  0, 2 1 0, 4  .
0, 6 0, 4 1

344.  
1 −0, 1 0, 5
R =  −0, 1 1 0, 7  .
0, 5 0, 7 1

В задачах 345—346 известна корреляционная матрица R случайных


величин ξ0 , ξ1 , ξ2 .
Найти: а) частный коэффициент корреляции ρ21.0 ;
б) множественнные коэффициенты корреляции ρ0(1, 2) и ρ2(1, 0) .
345.  
1 −0, 4 0, 9
R =  −0, 4 1 −0, 5  .
0, 9 −0, 5 1

346.  
1 0, 5 0, 8
R =  0, 5 1 0, 7  .
0, 8 0, 7 1

109
9. Условные распределения
9.1. Условные законы распределения

Условная функция распределения определяется как


Ry
fξ,η (x, y) dy
−∞
Fη/ξ=x (y) = , (65)
fξ (x)
где fξ (x) — частная плотность распределения, причем
Z∞
fξ (x) = fξ,η (x, y) dy
−∞

Условная плотность распределения


∂Fη/ξ=x (y) fξ,η (x, y)
fη/ξ=x (y) = = .
∂y fξ (x)

Условное математическое ожидание


Z∞ Z∞
M (η/x) = M (η/ξ = x) = y dF (y/x) = yfη/ξ=x (y) dy. (66)
−∞ −∞

Для дискретной случайной величины условное математическое ожи-


дание равно X
M (η/x) = yi p (η = yi /ξ = x). (67)
i

Пример 115. Дискретная двумерная случайная величина (ξ, η) зада-


на таблицей распределения:

ξη −1 0 1
0 0, 1 0, 1 0
1 0 0, 3 0
2 0 0, 1 0, 4

Найти условные законы распределения η/ξ = 0 и ξ/η = 0.

110
9.1 Условные законы распределения

J Легко видеть, что

η /ξ = 0 −1 0
p 0, 5 0, 5

ξ /η = 0 0 1 2
I
p 0, 2 0, 6 0, 2

Пример 116. Случайная величина (ξ, η) распределена равномерно в


треугольнике {(x, y) : 0 < y < 1 − |x|}.
Найти fξ, η (x, y), fξ (x), fη (y), fξ/η=y (x), fη/ξ=x (y).

J Обозначим через T множество точек


y (x, y), лежащих в треугольнике:
1
T = {(x, y) : 0 < y < 1 − |x|}.

T Поскольку случайная величина (ξ, η)


x
распределена в T равномерно,
−1 0 1
1 1
fξ, η (x, y) = = = 1, (x, y) ∈ T.
S (T ) 1
Рис. 11.
Найдем одномерные функции распределения случайных величин η и ξ,
пользуясь формулами (36) и (35) соответственно.
Z∞
fξ (x) = fξ,η (x, y) dy =
−∞
x+1

R


 dy = x + 1 при −1 < x 6 0,
0
= 1−x
R = 1 − |x|.
dx = −x + 1 при 0 < x < 1



0

Z1−y
fη (y) = dx = 1 − y − (−1 + y) = 2 − 2y.
−1+y

Вычислим условные плотности распределения η/ξ = x и ξ/η = y.

fξ, η (x, y) 1
fη/ξ=x (y) = = , (x, y) ∈ T ;
fξ (x) 1 − |x|
fξ, η (x, y) 1
fξ/η=y (x) = = , (x, y) ∈ T. I
fη (y) 2(1 − y)
111
9.1 Условные законы распределения

 Задачи
В задачах 347—350 дана совместная плотность распределения
fξ, η (x, y) двумерной случайной величины (ξ, η). Найти обе условные плот-
ности fη/ξ=x (y) и fξ/η=y (x).
1 1
347. fξ, η (x, y) = · .
π 2 1 + x2 + y 2 + x2 y 2
−(x2 +y 2 )
348. fξ, η (x, y) = 4xye
 , x > 0, y > 0.
1/3 при 0 6 x 6 3, 0 6 y 6 1;
349. fξ, η (x, y) =
0 — иначе.

cos x · cos y при 0 6 x 6 π/2, 0 6 y 6 π/2;
350. fξ, η (x, y) =
0 — иначе.

В задачах 351—354 найти условные плотности fη/ξ=x (y) и fξ/η=y (x).


351. Двумерная случайная величина (ξ, η) представляет из себя
координаты точки, случайно выбранной в квадрате [0, 1] × [0, 1].
352. Точку (ξ, η) случайно выбирают в круге радиуса R.
353. Двумерная случайная величина (ξ, η) равномерно распре-
2 2
делена в эллипсе xa2 + yb2 = 1.
354. Двумерная случайная величина (ξ, η) равномерно распре-
делена в треугольнике D = {(x, y) : x > 0, y > 0, x + y 6 2.}
355. Случайные величины ξ и η независимы и одинаково распре-
делены: p (ξ = m) = p (η = m) = (1 − p)m−1 p, m = 1, 2, . . .
Найти: а) p (ξ = η); б) p (ξ > η);
в) p (ξ < η); г) p (ξ = k/ξ > η);
д) p (ξ = k/ξ < η); е) p (ξ = k/ξ = η).
356. Случайная величина ξ имеет геометрическое распределе-
ние. Найти p (ξ = n + k/ξ > k), k, n = 0, 1, . . .
357. Случайные величины ξ и η независимы и имеют одно и то-
же геометрическое распределение.
Найти p (ξ = k/ξ + η = n), k = 0, 1, . . . , n.
358. Случайные величины ξ и η независимы и имеют распределе-
ния Пуассона с параметрами λ1 , λ2 .
Найти p (ξ = k/ξ + η = n), k = 0, 1, . . . , n.

112
9.2 Регрессия

9.2. Регрессия

Регрессией η на ξ называется случайная величина r (ξ), равная


условному математическому ожиданию случайной величины η относительно
ξ
r (ξ) = M (η/ξ). (68)

Линия регрессии — кривая y = r (x), где r (x) = M (η/ξ = x).

Основное свойство регрессии.


Регрессия r (ξ) минимизирует среднеквадратичное отклонение:

min M (η − g(ξ))2 = M (η − r(ξ))2 . (69)


g

2
Корреляционным отношением θη, ξ называется выражение

2 M (r (ξ) − M η)2
θη, ξ = . (70)
ση2

Свойства корреляционного отношения.


2
1. 0 6 θη, ξ 6 1.
2 2
2. θη, ξ >ρ .
2 2
3. θη, ξ = ρ ⇐⇒ r (ξ) = âξ + b̂.
2
4. θη, ξ = 0 ⇐⇒ r (ξ) = b = const.

Пример 117. Дискретная двумерная случайная величина (ξ, η) зада-


на таблицей распределения

ξη −1 0 1
0 0 0, 1 0
1 0, 3 0 0
2 0, 2 0 0, 4
Найти регрессию r(ξ).

J Найдем условные законы распределения η/ξ.


η /ξ = 0 −1 0 1
p 0 1 0

M (η/ξ = 0) = 0.

113
9.2 Регрессия

η /ξ = 1 −1 0 1
p 1 0 0

M (η/ξ = 1) = −1.

η /ξ = 2 −1 0 1
p 1/3 0 2/3

M (η/ξ = 2) = 1/3.

0 при ξ = −1,
r (ξ) = −1 при ξ = 0,
1/3 при ξ = 1.

Запишем ряд распределения r (ξ), пользуясь тем, что r (ξ) принимает


значение 0 ровно тогда, когда ξ = 0, следовательно,
p (r (ξ) = 0) = p (ξ = 0);
и аналогичными утверждениями для r (ξ) = −1 и r (ξ) = 1/3.
r (ξ) 0 −1 1/3
I
p 0, 1 0, 3 0, 6
Пример 118. Дан закон распределения случайной величины (ξ, η).
2
Найти корреляционное отношение θη, ξ.

ηξ 10 20 30
1 0, 2 0, 3 0
2 0 0, 2 0, 1
3 0, 1 0 0, 1
J Найдем условные законы распределения η/ξ.

η/ξ = 10 1 2 3
p 2/3 0 1/3
2 1 5
M (η/ξ = 10) = 1 · +3· = .
3 3 3
η/ξ = 20 1 2 3
p 3/5 2/5 0
3 4 4
M (η/ξ = 20) = 1 · +2· = .
5 5 5
114
9.2 Регрессия

η/ξ = 30 1 2 3
p 0 1/2 1/2
1 1 5
M (η/ξ = 30) = 2 ·
+3· = .
2 2 2
Теперь вычислим регрессию η на ξ.

 5/3 при ξ = 10,
r (ξ) = 7/5 при ξ = 20,
5/2 при ξ = 30.

Так как r (ξ) принимает значение 5/3 ровно тогда, когда ξ = 10,
p (r (ξ) = 5/3) = p (ξ = 10). Аналогичное утверждение справедливо для
r (ξ) = 7/5 и r (ξ) = 5/2, следовательно, ряд распределения r (ξ) запишется
следующим образом.
r (ξ) 5/3 7/5 5/2
p 0, 3 0, 5 0, 2
Из формулы (70) следует, что для нахождения корреляционного отно-
шения необходимо вычислить M η и ση2 .
Запишем ряд распределения случайной величины η.

η 1 2 3
p 0, 5 0, 3 0, 2

M η = 1, 7; M η 2 = 3, 5; ση2 = Dη = 0, 61.

M (r (ξ) − M η)2 =
= 0, 3 · (5, 3 − 1, 7)2 + 0, 5 · (7/5 − 1, 7)2 + 0, 2 · (5/2 − 1, 7)2 = 0, 173(3).

Итак,
2 0, 173(3)
θη, ξ = ≈ 0, 284. I
0, 61

 Задачи
В задачах 359—361 заданы совместные законы распределения дву-
мерных случайных величин (ξ, η).
Требуется найти: а) регрессии η на ξ и ξ на η;
б) корреляционные отношения η на ξ и ξ на η.

115
9.2 Регрессия

359.
ξ\η 1 2 3
−2 0 0, 2 0
0 0, 1 0, 2 0, 1
2 0 0, 1 0, 1
4 0 0, 1 0, 1

360.
ξ\η 0 1 2
−1 0, 2 0, 1 0
0 0 0, 1 0, 1
2 0 0, 3 0, 2

361.
ξ\η 0 1 2
−1 0, 3 0 0
0 0 0, 3 0
1 0 0, 4 0

362. Может ли двумерная случайная величина (ξ, η) иметь сле-


дующие характеристики:
2
Dξ = 4, Dη = 16, cov (ξ, η) = 4, θξ,η = 0, 2?

116
10. Закон больших чисел, центральная предельная
теорема
10.1. Неравенства и закон больших чисел

Неравенство Маркова. Для любой случайной величины ξ и для лю-


бых k > 0, ε > 0
M |ξ|k
p (|ξ| > ε) 6 .
εk
Неравенство Чебышева. Для любой случайной величины ξ и для
любого ε > 0

p (|ξ − M ξ| > ε) 6 2 .
ε
p
Последовательность {ξn } сходится по вероятности к ξ (ξn → ξ),
если для любого ε > 0
lim p (|ξn − ξ| > ε) = 0.
n→∞

Пусть ϕ(x) — непрерывная функция. Тогда, если последовательность


{ξn } сходится по вероятности к ξ, то и последовательность {ϕ(ξn )} сходится
по вероятности к ϕ(ξ):
p p
ξn → ξ ⇒ ϕ(ξn ) → ϕ(ξ).
Закон больших чисел. Говорят, что для последовательности случайных ве-
личин {ξn } с математическими ожиданиями M ξi = ai , ai < ∞ и дисперсия-
ми Dξi = σi2 , i = 1, 2, . . . выполняется закон больших чисел, если
Pn P n
ξi ai
i=1 p i=1
→ .
n n
Согласно определению сходимости по вероятности, это означает, что для
любого ε > 0  Pn Pn 
i=1 ξi i=1 a i
lim p − > ε = 0.
n→∞ n n
Закон больших чисел в форме Чебышева. Если ξ1 , ξ2 , . . . – после-
довательность независимых случайных величин, дисперсии которых огра-
ничены в совокупности
σi2 6 C = const, i = 1, 2, . . . ,
то для нее выполняется закон больших чисел:
Pn Pn
ξi ai
i=1 p i=1
→ .
n n
117
10.2 Центральная предельная теорема

Закон больших чисел в форме Бернулли. Пусть осуществляется се-


рия из n независимых опытов, проводимых по схеме Бернулли с параметром
p. Пусть m – число успехов, m n – частота успехов в данной серии испытаний.
Тогда
m p
→ p.
n
Закон больших чисел в форме Пуассона. Пусть осуществляется се-
рия из n независимых опытов, причем вероятность успеха в k-м опыте равна
pk . Пусть m – число успехов, m n – частота успехов в данной серии испыта-
ний. Тогда
n
P
pk
m p k=1
→ .
n n
Закон больших чисел в форме Хинчина. Пусть ξ1 , ξ2 , . . . – после-
довательность независимых одинаково распределенных случайных величин
с M ξn = a. Тогда
Pn
ξk
k=1 p
→ a.
n
Закон больших чисел в форме Маркова. Пусть последовательность
случайных величин ξ1 , ξ2 , . . . такова, что
n
!
1 X
D ξi → 0 при n → ∞.
n2 i=1

Тогда
n
P n
P
ξk M ξk
k=1 p k=1
→ .
n n

10.2. Центральная предельная теорема

Центральная предельная теорема для независимых одинаково


распределенных случайных величин. Если случайные величины ξ1 , ξ2 , . . .
независимы, одинаково распределены и имеют конечные математические
ожидания и дисперсии M ξi = a, Dξi = σ 2 , то при n → ∞
P n 
ξ − na
 i=1 i 
P σ n √ < x  → Φ(x),

где Φ(x) – функция стандартного нормального распределения.

118
10.2 Центральная предельная теорема

 Задачи
363. Пусть ξ такова, что p(0 < ξ < 1) = 1. Доказать, что

Dξ < M ξ.

364. Пусть ξ, η независимы и имеют конечные дисперсии. Дока-


зать, что
Dξη > Dξ · Dη.

365. Пусть ξ, η имеют конечные дисперсии. Доказать, что


p p p p
( Dξ − Dη)2 6 D(ξ + η) 6 ( Dξ + Dη)2 .

366. Среднее потребление энергии за месяц равно 360000 квт·ч.


Оценить вероятность того, что среднее потребление энергии за
месяц превзойдет 1000000 квт·ч. Оценить эту же вероятность, если
известно, что среднее квадратичное отклонение равно 40000 квт·ч.
367. Оценить вероятность того, что частота появления гер-
ба при ста бросаниях монеты отклонится от вероятности не более,
чем на 0,1; сравнить с вероятностью, полученной с помощью приме-
нения интегральной теоремы Муавра-Лапласа.
В задачах 368–373 исследовать последовательность независимых
случайных величин {ξn }, заданных законами распределения на cходимость
по вероятности.
368.
ξn 1 0
p 1 − √n √1n
1

369.
ξn 0 1
1
p nα 1 − n1α

370. √ √
ξn − n 0 n
1 2 1
p n 1− n n

371.
ξn −nα 0 nα
1
p 2n2 1 − n12 2n1 2

119
10.2 Центральная предельная теорема

372. √ √
ξn − ln n ln n
1 1
p 2 2

373.
ξn en 0
1 1
p n 1− n
p p
374. Пусть ξn −→ a, ηn −→ b. Доказать, что
p
ξn + ηn −→ a + b.

В задачах 375–382исследовать, подчиняется ли закону больших чи-


сел последовательность независимых случайных величин ξ1 , ξ2 , . . . , задан-
ных законами распределения.
375.
ξn 0 1
.
1
p 1 − √2 √12

376.
ξn 0 1
1 .
p n3 1 − n13

377. √ √
ξn − n 0 n
1 2 1 .
p n 1− n n

378.
ξn −3n 0 2n
.
p 2n1 2 1 − n12 2n1 2

379. √ √
ξn − ln n ln n
1 1 .
p 2 2

380.
ξn 0 2n
1 1 .
p 1− n n

381.
ξn 0 2n
.
p n1 1 − n1

120
10.2 Центральная предельная теорема

382.
ξn 100 1000
.
p 1/2 1/2

383. Дисперсия каждой из 4500 независимых, одинаково рас-


пределенных случайных величин равна 5. Найти вероятность того,
что среднее арифметическое этих случайных величин отклонится
от своего математического ожидания не более чем на 0,04.
384. Случайная величина η является средней арифметической
3200 независимых и одинаково распределенных случайных величин с
математическим ожиданием, равным 3, и дисперсией, равной 2. Най-
ти вероятность того, что η примет значение в промежутке (2,95;
3,075).
385. В результате медицинского осмотра 900 призывников
установлено, что средний вес призывников на 1,2 кг больше веса
призывников за один из предшествующих периодов. Можно ли это
отклонение объяснить случайностью, если среднее квадратическое
отклонение веса призывников равно 8 кг?
386. Случайная величина η является средней арифметической
независимых и одинаково распределенных случайных величин, дис-
персия каждой из которых равна 5. Сколько нужно взять таких
величин, чтобы случайная величина η с вероятностью, не меньшей
0,9973, имела отклонение от своего математического ожидания, не
превосходящее 0,01?
387. Случайная величина η является средней арифметической
независимых и одинаково распределенных случайных величин, сред-
нее квадратическое отклонение каждой из которых равно 2. Какое
максимальное отклонение величины η от ее математического ожи-
дания можно ожидать с вероятностью, не меньшей 0,9544?
388. Найти приближенное значение для вероятности того,
что число успехов при n = 100 испытаниях Бернулли с вероятностью
успеха = 0, 4 лежит в пределах 35 и 45; 38 и 53. При каких значени-
ях n вероятность того, что частота успеха находится в пределах
[0, 35, 0, 45], будет больше 0,998?
389. В условиях предыдущей задачи каково должно быть число
испытаний n, чтобы с вероятностью 1 − α частота успеха отлича-
лась от вероятности успеха не более, чем на ε > 0? Решить задачу
при α = 0, 05, ε = 0, 01.
390. Цех завода производит шарики для подшипников. За смену
производится n = 20000 шариков. Вероятность того, что один ша-

121
10.2 Центральная предельная теорема

рик окажется дефектным, равна 0,01. Причины дефектов для от-


дельных шариков независимы. Продукция проходит контроль сразу
после изготовления, причем дефектные шарики бракуются и ссыпа-
ются в бункер, а небракованные отправляются в цех сборки. Опре-
делить, на какое количество шариков должен быть рассчитан бун-
кер, чтобы с вероятностью 0,99 после смены он не оказался перепол-
ненным.
391. Условия предыдущей задачи изменены в том отношении,
что причины брака являются в значительной степени общими для
различных шариков, так что вероятность одному шарику, изготов-
ленному в течение данной смены, быть дефектным, при условии, что
другой шарик (любой) уже был дефектным, равна 0,08. Считаем,
что известно, что закон распределения суммарного числа дефект-
ных шариков является приближенно нормальным.

122
11. Случайная выборка
11.1. Основные понятия

Генеральная совокупность рассматривается как случайная вели-


чина ξ, а выборкаX = (X1 , . . . , Xn ) — как n-мерная случайная величи-
на (ξ1 , . . . , ξn ), компоненты которой независимы и одинаково распределены
(так же, как ξ).
Статистическая модель hFi — это класс допустимых функций
распределения исходной случайной величины. Если функции распределе-
ния из класса hFi заданы с точностью до значений параметра θ с множе-
ством возможных значений Θ, то такая модель обозначается hFθ i и называ-
ется параметрической.
Если модель hFθ i такова, что можно дифференцировать по θ инте-
гралы на выборчном пространстве X , меняя порядок дифференцирования
и интегрирования, то она называется регулярной. Одно из наиболее суще-
ственных условий регулярности — то, что выборочное пространство X не
должно зависеть от параметра θ.
Вариационный ряд конкретной реализации выборки x = (x1 , . . . , xn )
— последовательность упорядоченных по возрастанию значений
x∗1 , x∗2 , . . . , x∗n (x∗1 6 x∗2 6 . . . 6 x∗n ). Если через Xk∗ обозначить случай-
ную величину, которая для каждой реализации x выборки X принимает
значение x∗k , k = 1, . . . , n, то Xk∗ называется k-ой порядковой стати-
стикой выборки, а X1∗ и Xn∗ – экстремальными значениями выборки.
Порядковые статистики удовлетворяют неравенствам X1∗ 6 X2∗ 6 . . . 6 Xn∗ .
Последовательность X1∗ , X2∗ , . . . , Xn∗ называют вариационным рядом вы-
борки.
Эмпирической функцией распределения Fn (x), соответствующей
выборке X, называется случайная функция от x, вычисляемая по форму-
ле
νn
Fn (x) = ,
n
где νn — число элементов выборки X = (X1 , . . . , Xn ), значения которых
меньше x.

Пример 119. Какая статистическая модель применима для выборки,


полученной следующим образом: 10 раз измерялось число вызовов ξ,
поступающих оператору АТС в течение минуты?

J Поскольку число абонентов АТС велико, а вероятность для каждого из


них позвонить в данную минуту мала, можно применить модель пуассонов-
ского распределения hPλ i. I

123
11.1 Основные понятия

Пример 120. Какая статистическая модель применима для выборки


цен на один и тот же товар в 100 различных магазинах в один и тот
же момент времени?

J Поскольку выборка достаточно велика, то можно пробовать применить


нормальную модель hN (a, σ)i. Если при этом цены меняются мало, возмож-
но и применение равномерной модели. I

Пример 121. По данной выборке X = (2, 1, 1, 2, −1, 2, 2, 4, 1) построить


вариационный ряд, найти эмпирическую функцию распределения.

J Для нахождения вариационного ряда надо упорядочить элементы выбор-


ки по возрастанию:

X ∗ = (−1, 1, 1, 1, 2, 2, 2, 2, 4).


 0 при x 6 −1,
 1/9 при −1 < x 6 1,


F9 (x) = 4/9 при 1 < x 6 2,
8/9 при 2 < x 6 4,




1 при

x > 4.

I  Задачи
392. Какая статистическая модель применима для выборки, по-
лученной следующим образом: 10 раз измерялось число попаданий в
цель при трех независимых выстрелах, произведенных одним и тем
же стрелком?
393. Какая статистическая модель применима для выборки, по-
лученной следующим образом: 8 раз измерялось число черных шаров,
вынутых за три вынимания с возвращением из урны, которая содер-
жит два белых и два черных шара?
394. Какая статистическая модель применима для выборки, по-
лученной следующим образом: у 100 студенток первого курса изме-
рен рост?
395. Какая статистическая модель применима для выборки, по-
лученной измерением на 10 опытных делянках урожайности культу-
ры, если известно, что урожайность культуры составляет 35 цент-
неров с гектара?
396. Какая статистическая модель применима для выборки, по-
лученной измерением 100 раз времени ожидания автобуса?

124
11.2 Группировка выборки. Графические характеристики

В задачах 397–400 по данной выборке X = (X1 , . . . , Xn ) построить


вариационный ряд, найти эмпирическую функцию распределения.
397. X = (1, 1, 2, 1, 2, 4).
398. X = (−1, 1, 2, 1, 2, 3, 4, 1).
399. X = (1, 0, 0, 2, 2, 1).
400. X = (5, 6, 1, 4, 5, 7, 3, 5, 5, 6).
401. Дан статистический ряд величины X:

X 0 2 4 6
.
ni 3 8 10 2

Построить вариационный ряд.


402. Можно ли восстановить по эмпирической функции рас-
пределения, приведенной на рис. 12, вариационный ряд, если n = 60?
Можно ли восстановить выборку?
403. Существует ли выборка (X1 , . . . , Xn ) объёма 10 с графиком
эмпирической функции распределения, изображённым на рис. 12? Ка-
кому условию должен удовлетворять объём выборки?
404. Пусть на рис. 12 представлен график эмпирической функ-
ции распределения выборки (X1 , . . . , Xn ). Нарисуйте график эмпири-
ческой функции распределения выборки а) (X1 + 2, . . . , Xn + 2); б)
(2X1 , . . . , 2Xn ).
Fn∗ (x)
1 6 




-
1 2 3 4 5 6 x
Рис. 12. Эмпирическая функция распределения

11.2. Группировка выборки. Графические характеристики

Метод группировки выборки объема n. Число интервалов k ре-


комендуется брать из условия 2k−1 ∼ n. Длина интервала h = xmax −xk
min
.
Границы интервалов группировки: x0 = xmin , xi = x0 + hi, i = 1, ..., k,
далее подсчитываается, сколько элементов выборки попало в каждый ин-
тервал, и в группировочной таблице заполняется столбец "Численность ni ".
Остальные столбцы рассчитываются по столбцу численностей. Они приго-

125
11.2 Группировка выборки. Графические характеристики

дятся при построении графических характеристик.


ni Pi nj
№ ni nni nh 1 n
1 [x0 − x1 )
2 [x1 − x2 )
... ...

Таблица 1. Таблица группировки

Гистограмма — это фигура, состоящая из прямоугольников, по-


строенных на интервалах группировки как на основаниях, и имеющих пло-
щади nni , для чего берут высоту прямоугольника равную nh ni
. Полигон — это
ломаная линия, проходящая через середины верхних границ прямоуголь-
ni
ников гистограммы (соединяющая точки (x∗i ; nh , где x∗i — середина i−го
интервала). Полигон и гистограмма являются статистическими аналогами
теоретической плотности. Для удобства при построении можно брать еди-
1
ницу масштаба, равную nh . Кумулята — это ломаная линия, соединяющая
i−1
P nj
точки (xi ; n ). Кумулята дает представление о графике функции распре-
1
деления.

Пример 122. Произвести группировку выборки:


87, 8 104, 5 90, 9 92, 4 74, 3 71, 7 75, 0 92, 0 76, 0 82, 2
86, 3 85, 0 75, 0 91, 5 105, 7 112, 4 80, 8 74, 5 86, 6 95, 8
100, 4 109, 7 52, 7 96, 6 87, 6 101, 4 103, 4 90, 6 88, 0 79, 9
91, 6 84, 2 108, 6 77, 5 89, 2 82, 6 90, 0 86, 1 80, 3 92, 8
103, 8 84, 5 90, 6 113, 5 101, 1 113, 7 94, 3 90, 7 70, 7 93, 5
96, 8 111, 5 103, 8 106, 8 80, 5 91, 8 82, 2 86, 9 100, 3 100, 1
89, 4 84, 7 93, 4 101, 3 118, 7 99, 3 105, 0 92, 7 96, 7 82, 8
100, 9 81, 3 96, 1 84, 6 86, 3 83, 7 84, 6 80, 7 102, 3 104, 2
89, 4 90, 9 89, 6 66, 5 120, 4 100, 4 86, 8 70, 4 91, 9 98, 3
111, 7 90, 2 87, 9 81, 1 88, 1 103, 3 85, 0 69, 1 82, 2 101, 8
80, 4 77, 7 79, 3 96, 2 94, 1 87, 6 104, 2 81, 4 81, 6 115, 7
84, 2 93, 2 112, 7 86, 8 79, 8 89, 8 88, 1 110, 9 109, 0 84, 8
82, 6 89, 1 88, 9 97, 9 78, 0 87, 5 68, 1 107, 7 95, 5 88, 6

J 1. Упорядочим выборку (получим вариационный ряд).

126
11.2 Группировка выборки. Графические характеристики

52, 7 66, 5 68, 1 69, 1 70, 4 70, 7 71, 7 74, 3 74, 5 75, 0
75, 0 76, 0 77, 5 77, 7 78, 0 79, 3 79, 8 79, 9 80, 3 80, 4
80, 5 80, 7 80, 8 81, 1 81, 3 81, 4 81, 6 82, 2 82, 2 82, 2
82, 6 82, 6 82, 8 83, 7 84, 2 84, 2 84, 5 84, 6 84, 6 84, 7
84, 8 85, 0 85, 0 86, 1 86, 3 86, 3 86, 6 86, 8 86, 8 86, 9
87, 5 87, 6 87, 6 87, 8 87, 9 88, 0 88, 1 88, 1 88, 6 88, 9
89, 1 89, 2 89, 4 89, 4 89, 6 89, 8 90, 0 90, 2 90, 6 90, 6
90, 7 90, 9 90, 9 91, 5 91, 6 91, 8 91, 9 92, 0 92, 4 92, 7
92, 8 93, 2 93, 4 93, 5 94, 1 94, 3 95, 5 95, 8 96, 1 96, 2
96, 6 96, 7 96, 8 97, 9 98, 3 99, 3 100, 1 100, 3 100, 4 100, 4
100, 9 101, 1 101, 3 101, 4 101, 8 102, 3 103, 3 103, 4 103, 8 103, 8
104, 2 104, 2 104, 5 105, 0 105, 7 106, 8 107, 7 108, 6 109, 0 109, 7
110, 9 111, 5 111, 7 112, 4 112, 7 113, 5 113, 7 115, 7 118, 7 120, 4

2.Минимальный элемент выборки равняется xmin = 52, 7, а макси-


мальный xmax = 120, 4.
Определим сначала число интервалов k. Рекомендуется брать k такое,
k−1
что 2 ∼ n.
В данном примере n = 130.
27 = 128 ∼ 130; k − 1 = 7, k = 8.
Выберем число интервалов k = 8.
3. Определим длину интервала h.
xmax − xmin
h= .
k
Находим
120, 4 − 52, 7
h= ≈ 8, 4567.
8
4. Найдем границы интервалов группировки x0 = xmin , xi = x0 +
hi, i = 1, ..., k:
x0 = 52, 7, x1 = 61, 2, x2 = 69, 6, x3 = 78, 1, x4 = 86, 5,
x5 = 95, 0, x6 = 103, 4, x7 = 111, 9, x8 = 120, 4.
5. Составим таблицу группировки и внесем границы интервалов в
столбец «Интервал»:
Pi nj
№ Интервал ni nni 1 n
1 [52, 7 − 61, 2)
2 [61, 2 − 69, 6)
3 [69, 6 − 78, 1)
4 [78, 1 − 86, 5)
5 [86, 5 − 95, 0)
6 [95, 0 − 103, 4)
7 [103, 4 − 111, 9)
8 [111, 9 − 120, 4)

127
11.2 Группировка выборки. Графические характеристики

6. Подсчитаем, сколько элементов выборки попало в каждый интер-


вал и заполним в таблице столбец «Численность ni »:
Pi nj
№ Интервал ni nni 1 n
1 [52, 7 − 61, 2) 1
2 [61, 2 − 69, 6) 3
3 [69, 6 − 78, 1) 11
4 [78, 1 − 86, 5) 31
5 [86, 5 − 95, 0) 40
6 [95, 0 − 103, 4) 22
7 [103, 4 − 111, 9) 15
8 [111, 9 − 120, 4) 7

По столбцу численностей рассчитаем остальные столбцы таблицы:


ni Pi nj
№ Интервал ni n 1 n
1 [52, 7 − 61, 2) 1 0, 008 0, 008
2 [61, 2 − 69, 6) 3 0, 023 0, 031
3 [69, 6 − 78, 1) 11 0, 085 0, 115
4 [78, 1 − 86, 5) 31 0, 238 0, 354
5 [86, 5 − 95, 0) 40 0, 308 0, 662
6 [95, 0 − 103, 4) 22 0, 169 0, 831
7 [103, 4 − 111, 9) 15 0, 115 0, 946
8 [111, 9 − 120, 4) 7 0, 054 1
I

 Задачи
405. Произвести группировку выборки:

20, 2; 19, 2; 16, 9; 19, 3; 17, 1; 17, 8; 16, 6; 16, 3; 15, 2; 18, 0; 16, 8; 20, 0; 17, 7; 16, 6;
19, 0; 17, 5; 17, 8; 20, 6; 17, 2; 18, 0; 17, 1; 18, 4; 17, 4; 15, 8; 19, 4; 17, 8; 19, 8; 19, 6;
16, 3; 20, 0; 17, 4; 19, 3; 19, 3; 16, 5; 18, 8; 17, 2; 18, 7; 18, 6; 19, 2; 16, 2; 18, 2; 17, 4.

406. По выборке, данной в виде статистического ряда, по-


стройте гистограмму, полигон и кумуляту.

X 0 − 6 6 − 12 12 − 18 18 − 24
.
ni 1 8 10 6

128
11.2 Группировка выборки. Графические характеристики

В задачах 407, 408постройте по выборке гистограмму и полигон, и по


их виду подберите статистическую модель.
407.
ni ni P ni
№ ni n nh n
1 0, 01 − 0, 98 260 0, 260 0, 252 0, 260
2 0, 98 − 1, 94 340 0, 340 0, 329 0, 600
3 1, 94 − 2, 91 192 0, 192 0, 186 0, 792
4 2, 91 − 3, 88 101 0, 101 0, 098 0, 893
5 3, 88 − 4, 85 63 0, 063 0, 061 0, 956
.
6 4, 85 − 5, 81 20 0, 020 0, 019 0, 976
7 5, 81 − 6, 78 16 0, 016 0, 015 0, 992
8 6, 78 − 7, 75 3 0, 003 0, 003 0, 995
9 7, 75 − 8, 72 4 0, 004 0, 004 0, 999
10 8, 72 − 9, 68 0 0, 000 0, 000 0, 999
11 9, 68 − 10, 65 1 0, 001 0, 001 1, 000

408.
ni ni P ni
№ ni n nh n
1 0, 00 − 0, 09 80 0, 080 0, 007 0, 080
2 0, 09 − 0, 18 81 0, 081 0, 007 0, 161
3 0, 18 − 0, 27 93 0, 093 0, 008 0, 254
4 0, 27 − 0, 36 85 0, 085 0, 008 0, 339
5 0, 36 − 0, 45 87 0, 087 0, 008 0, 426
.
6 0, 45 − 0, 54 87 0, 087 0, 008 0, 513
7 0, 54 − 0, 63 87 0, 087 0, 008 0, 600
8 0, 63 − 0, 72 106 0, 106 0, 010 0, 706
9 0, 72 − 0, 81 99 0, 099 0, 009 0, 805
10 0, 81 − 0, 90 89 0, 089 0, 008 0, 894
11 0, 90 − 0, 99 106 0, 106 0, 010 1, 000

409. По двумерной выборке найти выборочные распределения


компонент, построить для каждой из них гистограмму и полигон,
подобрать статистическую модель.

XY [−0.9; 0) [0; 0.9) [0.9; 1.8) [1.8; 2.7) [2.7; 3.6) [3.6; 4.5) [4.5; 5.4]
[−1.53; −0.75) 0 0 4 0 0 0 0
[−0.75; 0.03) 0 5 1 3 3 2 0
[0.03; 0.81) 0 2 6 7 6 0 1
[0.81; 1.59) 2 3 9 10 6 1 1
[1.59; 2.37) 0 0 4 5 4 4 1
[2.37; 3.15) 1 0 5 1 0 1 0
[3.15; 3.93) 0 0 0 0 1 1 0

129
11.2 Группировка выборки. Графические характеристики

410. Могут ли графики (1) и (2) (рис. 13) являться гистограм-


мами одной и той же выборки?

6 6

8/75
0.1

- -
0 1 2 3 4 5 6 7 8 9 10 x 0 1 2 3 4 5 6 7 8 9 10 x

Рис. 13. Гистограммы (1) и (2)

411. Приведите (если это возможно) примеры выборок, для ко-


торых а) приведенный на рис. 13 график (1) является гистограммой,
а график (2) не является; б) график (1) не является гистограммой,
а график (2) является гистограммой.

130
12. Числовые характеристики выборки
12.1. Выборочные характеристики

Пусть X = (X1 , . . . , Xn ) – выборка объема n из распределения F и


x = (x1 , . . . , xn ) — наблюдавшееся значение X. ВыборочнымPn начальным
1
моментом порядка k называют случайную величину ak = n i=1 Xik . Вели-
чину
Pn a1 называют выборочным средним и обозначают символом X : X =
i=1 Xi . ВыборочнымP центральным моментом порядка k называют случай-
ную величину mk = n ni=1 (Xi − X)k , (см. табл. 2).
1

При k = 2 величину m2 называют выборочной дисперсией и обозна-


чают S 2 .
Выборочную дисперсию часто рассчитывают по формуле
1X 2 1 X 2
S2 = Xi − X̄ = Xi − X̄ 2 ,
n n
2 1
P 2
а исправленная выборочная дисперсия равна S = n−1 Xi − X̄ . Вы-

борочное среднеквадратичное отклонение S = S 2 .
Теоретические характеристики Выборочные характеристики
X = n1 ni=1 Xi
P
a = Mξ
математическое ожидание выборочное среднее
2
S 2 = n1 ni=1 (Xi − X)2
P
σ = Dξ
дисперсия выборочная дисперсия
k
ak = n1 ni=1 Xik
P
αk = M ξ
начальный k-й момент начальный выборочный k-й момент
µk = M (ξ − ξ)k mk = n1 ni=1 (Xi − X)k
P
центральный k-й момент центральный выборочный k-й момент
A = σµ33 Ab = m33
S
коэффициент асимметрии выборочный коэффициент асимметрии
E = σµ44 − 3 Eb = m44 − 3
S
коэффициент эксцесса выборочный коэффициент эксцесса

Таблица 2. Соответствие выборочных и теоретических характеристик

Свойства выборочного среднего и выборочной дисперсии.

M X = M ξ = α1 ;
1 µ2 σ2
DX = Dξ = = ;
n n n
2 (n − 1)µ2 (n − 1)σ 2
MS = == ;
n n
131
12.1 Выборочные характеристики

(n − 1)2
 
2 (n − 3) 2
DS = µ4 − µ .
n3 n−1 2
Выборочной модой называется значение mo , чаще всего наблюдающееся:

ni (m0 ) = max ni .
i

Выборочной медианой называется значение me , равное среднему члену ва-


риационного ряда:
me = x∗[ n ]+1 .
2

Выборочной квантилью порядка q, 0 < q < 1, называется значение xq , рав-


ное члену вариационного ряда с номером [nq] + 1.
Нахождение выборочных медианы, моды и квантилей по груп-
пированной выборке.
Медианным называется интервал, в котором накопленная сумма ча-
стот впервые достигает 12 .
Выборочной группированной медианойназывается значение m∗e :
n/2 − (n1 + . . . + nme −1 )
m∗e = xe + · h,
nme
где n — объем выборки, h — длина интервала группировки, xe — левая
граница медианного интервала, ni — численность i-го интервала, nme —
численность медианного интервала.
Модальным называется интервал, имеющий наибольшую числен-
ность.
Выборочной группированной модойназывается значение m∗0 :
nm0 − nm0 −1
m∗0 = x0 + h · ,
2nm0 − nm0 −1 − nm0 +1
где x0 — левая граница модального интервала, nm0 — численность модаль-
ного интервала, nm0 −1, , nm0 +1 — численности интервалов слева и справа от
модального.
Квантильным порядка q интервалом называется интервал, в кото-
ром сумма накопленных частот впервые достигает значения q.
Выборочной группированной квантилью называется значение x∗q :

nq − (n1 + · · · + n(q)−1
x∗q = x(q) + h · ,
n(q)
где x(q) — левая граница квантильного интервала, n(q) — численность кван-
тильного интервала, n1 , · · · , n(q)−1 — численности интервалов, предшеству-
ющих квантильному.

132
12.1 Выборочные характеристики

Пример 123. По выборке {3, 1, 2, 0, 2, 4} найти выборочное среднее и


моду.
J
n
1X 1 12
X= Xi = (3 + 1 + 2 + 0 + 2 + 4) = = 2.
n i=1 6 6
Выборочная мода mo = 2, так как значение «2» имеет наибольшую частоту.
I
Пример 124. По выборке {3, 1, 2, 0, 2, 4} найти выборочную диспер-
сию, выборочное среднеквадратичное отклонение и исправленную
выборочную дисперсию.
 1
 10 5
J S2 = (3 − 2)2 + (1 − 2)2 + 2 · (1 − 2)2 + (0 − 2)2 + (4 − 2)2 =
6 = .
6 3
Другой способ нахождения S 2 :
1X 2 1 17 5
S2 = Xi − X̄ 2 = · 34 − 22 = −4= .
n 6 3 3

Выборочное среднеквадратичное отклонение S = S 2 ≈ 1, 3.
Исправленная выборочная дисперсия равна
2 n 6 5
S = S 2 = · = 2.
n−1 5 3
I
Пример 125. По группированной выборке, полученной в примере
(122) найти выборочную моду.
ni Pi nj
№ Интервал ni n 1 n
1 [52, 7 − 61, 2) 1 0, 008 0, 008
2 [61, 2 − 69, 6) 3 0, 023 0, 031
3 [69, 6 − 78, 1) 11 0, 085 0, 115
4 [78, 1 − 86, 5) 31 0, 238 0, 354
5 [86, 5 − 95, 0) 40 0, 308 0, 662
6 [95, 0 − 103, 4) 22 0, 169 0, 831
7 [103, 4 − 111, 9) 15 0, 115 0, 946
8 [111, 9 − 120, 4) 7 0, 054 1
J Медианным является интервал № 5, так как в нем впервые накопленная
1
сумма частот, равная 0,662, достигает .
2

130/2 − (1 + 3 + 11 + 31)
m∗e = 86, 5 + · 8, 4567 ≈ 90, 517.
40
133
12.2 Статистики

I  Задачи
412. Выборочная дисперсия, рассчитанная по выборке объема
25, равна 9. Найдите исправленную выборочную дисперсию.
413. По выборке {1, 1, 2, 1, 2, 4} найти выборочную дисперсию.
414. По выборке {−1, 1, 2, 1, 2, 3, 4, 1} найти моду, выборочное
среднеквадратичное отклонение.
415. По выборке {1, 0, 0, 2, 2, 1} найти выборочные центральные
моменты 2-го и 3-го порядков.
416. Дан статистический ряд величины X:
X 0 2 4 6
.
ni 3 8 10 2
Найти выборочное среднее и выборочную дисперсию.
417. Дан статистический ряд величины X:
X −1 0 1 2
.
ni 5 7 4 1
найти выборочные начальные моменты 2-го и 3-го порядков.
418. Дан группированный статистический ряд величины Х:
X 0 − 6 6 − 12 12 − 18 18 − 24
.
ni 2 7 5 6
Найти приближенно моду, медиану, выборочную дисперсию.
419. Найти a3 по выборке (5, 6, 1, 4, 5, 7, 3, 5, 5, 6).
420. По эмпирической функции распределения найдите выбо-
рочное среднее.


 0 при x 6 1,
1/3 при 1 < x 6 2,

Fn (x) =

 1/2 при 2 < x 6 3,
1 при x > 3.

12.2. Статистики

Статистикой можно назвать любую функцию элементов выборки


T (X) = T (X1 , . . . , Xn ), которая не зависит от параметров распределения.
Распределением хи-квадрат χ2n с n степенями свободы называется
гамма-распределение с параметрами α = 12 , β = n2 .

134
12.2 Статистики

Сумма квадратов n независимых случайных величин, распределенных


по нормальному закону N (0, 1), имеет распределение χ2n .
Распределением Стьюдента Tn с n степенями свободы называется
распределение случайной величины
ξ ξ
tn = q = q Pn 2
,
χ2n i=1 ξi
n n

где ξ, ξi ∈ N (0, 1) и независимы.


Распределением Фишера (Фишера–Снедекора, F-
распределением) с n, m степенями свободы называется распределение
случайной величины
χ2n
n
fn,m = χ2m
.
m
Пусть X √1
, . . . , Xn — выборка из распределения N (a, σ). Тогда 1) ве-
(X−a) n nS 2
личина σ имеет нормальное распределение N (0, 1); 2) величина σ2
2 2
имеет распределение χn−1 ; 3) X, S независимы (теорема Фишера); t =

n − 1 X−a
S имеет распределение Tn−1 .
Пусть X1 , . . . , Xn и Y1 , . . . , Ym – независимые выборки из распределе-
X, Ȳ , S 2 (X), S 2 (Y ) – выборочные средние и дисперсии, тогда
ния N (a, σ), а q
величина t = mn(m+n−2) m+n
√ 2 X−Ȳ 2 имеет распределение Стьюдента с
nS (X)+mS (Y )
m + n − 2 степенями свободы.
Если же имеются две выборки X1 , . . . , Xn и Y1 , . . . , Ym из различ-
ных нормальных распределений N (a1 , σ1 ), N (a2 , σ2 ), то случайная величина
2 2
F = n(m−1)σ 2 S (X)
m(n−1)σ12 S 2 (Y )
распределена по закону Фишера-Снедекора Fn−1, m−1 . В
частном случае, когда дисперсии совпадают, величина F не зависит от неиз-
вестного параметра σ и имеет распределение Fn−1, m−1 .

Пример 126. Найти распределение статистики Z:

Z = X12 + X22 , X ∈ N (, 1).

J Поскольку сумма квадратов n независимых случайных величин, распре-


деленных по нормальному закону N (0, 1), имеет распределение χ2n , имеем
распределение χ22 . I

Пример 127. Найти распределение статистики Z:

Z = 2X1 + 3X4 , X ∈ N (a, σ).

135
12.2 Статистики

J Линейное преобразование нормально распределенной величины дает


опять нормальное распределение. Сумма независимых нормально распре-
деленных величин также распределена по нормальному закону. Параметры
этого закона мы можем найти с помощью математического ожидания и дис-
персии.
M Z = 2M X1 + 3M X4 = 5a.
DZ = 4DX1 + 9DX4 = 13σ 2 .

Таким образом, Z ∈ N (5a, σ 13). I

 Задачи
421. Нарисовать на одном чертеже графики плотности рас-
пределения N (0, 1) и плотности распределения Стьюдента.
422. Нарисовать на одном чертеже графики плотности рас-
пределений Стьюдента Tn1 , Tn2 при n1 < n2 .
423. Доказать, что t2n = f1,n ; χ21 = u2 , где u ∈ N (0, 1).
424. Найти распределение статистик: Z1 = X1 , Z2 = X1∗ , X ∈
N (a, σ).
425. Найти распределение статистики Z = Xi −X, X ∈ N (a, σ).
426. Найти распределение статистики Z:
X1 + X 2
Z= , X ∈ N (a, σ).
2

427. Найти распределение статистики Z = aX1 + bXn , X ∈


N (a, σ).
428. Найти распределение статистик: Z1 = Xn∗ ; Z2 = X1∗ , X ∈
R[a, b].
429. Найти распределение статистики: Z1 = X1∗ , если выборка
взята из совокупности с плотностью f (x) = eα−x , x > α.
430. Найти распределение статистики Z:
Z = X − Y − (aX − aY ),
X ∈ N (aX , σ), Y ∈ N (aY , σ), X и Y независимы.
431. Найти распределение статистики Z:
2 2
(n1 − 1)S X + (n2 − 1)S Y
Z= ,
n1 + n2 − 2
X ∈ N (a1 , σ), Y ∈ N (a2 , σ), X и Y независимы.
432. Пусть X1 , . . . , Xn — выборка из распределения N (a, σ) и
функция от выборочных среднего и дисперсии Z определена равен-

136
12.2 Статистики


ством Z = n X−a S̄
. Докажите, что величина Z имеет распределение
Tn−1 .
433. hF i — непрерывная модель. Найти распределение стати-
стики n
X
G=− ln F (xi ).
i=1
n
1 n−1 2
434. Доказать, что если s2 = (Xi − X̄)2 , то M s2 =
P
n n σ .
i=1
435. Найдите плотность распределения Стьюдента.
436. Найдите плотность распределения Фишера.
437. Найдите k-й начальный момент распределения Фишера.

137
13. Статистические оценки
13.1. Критерии качества оценок

Выборочная числовая характеристика (статистика) θ̂ =


g(X1 , . . . , Xn ), применяемая для оценивания неизвестного параметра θ
генеральной совокупности, называется его точечной оценкой.
Статистика θ̂ = g(X1 , . . . , Xn ) называется несмещенной оценкой для
параметра θ, если ∀θ ∈ Θ
M θ̂ = θ.
Статистика θ̂ = g(X1 , . . . , Xn ) называется состоятельной оценкой
θ, если ∀θ ∈ Θ
p
θ̂ −→ θ.
Если α̂ – состоятельная оценка α, а f – непрерывная функция, то f (α̂) –
состоятельная оценка f (α).
Несмещенная оценка θb параметра θ называется оптимальной оцен-
∼ ∼
кой, если Dθb 6 Dθ, ∀θ ∈ Θ, где θ — произвольная несмещенная оценка
θ.
Информационным количеством Фишера называется величина I, рав-
ная  2
∂ ln f (x1 , x2 , . . . , xn , θ)
I=M .
∂θ
В регулярной модели для дисперсий несмещенных оценок параметра θ
справедливо неравенство Рао-Крамера:
1
Dθ̂ > .
I
Несмещенная оценка θ̂ параметра θ называется эффективной оцен-
кой θ, если ∀θ ∈ Θ Dθ̂ = I1 .
Эффективная оценка является оптимальной. Обратное, вообще гово-
ря, не верно.
Для проверки эффективности оценок удобно использовать следую-
щие формулы информационного количества Фишера I:
 2
∂ ln f (x, θ)
I = nM ;
∂θ
 2 
∂ ln f (x, θ)
I = −nM ,
∂θ2
где f (x, θ) — одномерная плотность. Для дискретной случайной величины
вместо f (x) используется p (ξ = x).

138
13.1 Критерии качества оценок

Пример 128. Предположим, время, проведенное покупателем в мага-


зине, имеет нормальное распределение N (a, σ) с неизвестными пара-
метрами. Требуется оценить параметр a. Два стажера решают эту
задачу так: первый отмечает время, проведенное в магазине для
каждого покупателя, и находит среднее арифметическое. Второй
(более ленивый) отмечает время только у десяти покупателей, вы-
бранных случайно, и тоже находит среднее арифметическое. Будут
ли эти оценки параметра а) несмещенными; б) состоятельными?
J Оценка â1 , полученная первым стажером, представляет собой сред-
нее выборочное X̄. Это несмещенная оценка, так как M â1 = M X̄ =
n
1
P
nM Xi = a. Найдем математическое ожидание оценки, полученной вто-
i=1
рым стажером:
10
1 X
M â2 = M Xi = a.
10 i=1
Таким образом, обе эти оценки несмещены. Проверим состоятельность. За-
метим, что оценка â1 = X̄ зависит от n. â1 — состоятельная оценка a, если
p
â1 сходится по вероятности к a (â1 → a), то есть если для любого ε > 0
lim p (|â1 − a| > ε) = 0.
n→∞

По неравенству Чебышева
Dâ1
p (|â1 − a| > ε) 6 , (71)
ε2
но как мы знаем,
1 µ2 σ2
DX̄ = Dξ = = .
n n n
Таким образом, правая часть (71) стремится к нулю, и оценка â1 состоя-
тельна.
Оценка â2 , полученная вторым стажером, не зависит от n и поэтому
p (|â2 − a| > ε) тоже не зависит от n, соответственно, не может стремиться
к нулю при стремлении n к бесконечности. Оценка â2 не является состоя-
тельной. I

Пример 129. Число поломок банкоматов имеет распределение Пуас-


сона Pλ . Предлагается следующая оценка параметра λ : λ̂ = X̄.
Доказать, что эта оценка эффективна.

J Надо проверить выполнение равенства:


1
Dλ̂ = .
I
139
13.1 Критерии качества оценок

DX λ
Dλ̂ = DX̄ = = .
n n
Для нахождения информационного количества Фишера I используем фор-
мулу:  2 
∂ ln p (ξ = x)
I = −nM .
∂λ2
λx e−λ
Поскольку p (ξ = x) = pλ (x) = , то ln p (ξ = x) = x ln λ − λ − ln x! и
x!
∂ 2 ln p (ξ = x) x
2
= − 2.
∂λ λ
Тогда  
x n
I = −nM − 2 = .
λ λ
Получили, что Dλ̂ = I1 , то есть оценка X̄ является эффективной.I

 Задачи
438. Исследовать на несмещенность оценки параметров a, σ
нормального распределения N (a, σ) : â = X̄, σb2 = s2 .
439. Исследовать на несмещенность оценку параметра λ рас-
пределения Пуассона Pλ : λ̂ = X.
440. Исследовать на несмещенность оценку параметра p бино-
миального распределения с параметрами N, p :
Pn
Xi X
p̂ = i=1 = .
nN N

441. Исследовать на несмещенность оценку параметра a нор-


мального распределения N (a, σ) : â = 1/5(X1 + 2X2 + 3X3 ).
442. Исследовать на несмещенность оценку параметра λ рас-
пределения Пуассона Pλ : λ̂ = X + 1/7(X1 + 2X5 + 4X6 ).
443. Исследовать на несмещенность оценку параметра a нор-
мального распределения N (a, σ) : â = aX1 + bX2 , a + b = 1.
444. Исследовать на несмещенность оценки параметров a, b
равномерного распределения R[a, b] : b̂ = Xn∗ ; â = X1∗ .
445. В статистической модели h R[a, b] i исследовать на несме-
X1∗ +Xn∗
= Xn∗ − X1∗ ; a+b
[
щенность оценки функций параметров: b[ −aP 2 = 2 .
n
446. Найти k, при котором оценка σ̂ = k i=1 |Xi −a| параметра

140
13.1 Критерии качества оценок

σ является несмещенной в N (a, σ).


447. Найти k, при котором оценка σ̂ = k|X1 − a| параметра σ
является несмещенной в N (a, σ).
448. Найти k, при котором оценка σ̂ = k ni=1 |Xi − X| парамет-
P
ра σ является несмещенной в N (a, σ).
2
449. Найти k, при котором оценка σb2 = (k ni=1 |Xi − a|) явля-
P
ется несмещенной в N (a, σ).
450. Найти k, при котором оценка σ b = k|X1 − X2 | параметра σ
является несмещенной в N (a, σ), если n = 2.
451. Исследовать на несмещенность оценку α̂ = X1∗ , если f (x) =
eα−x , x > α.
452. Предложить три несмещенные оценки параметра a в рас-
пределении N (a, σ).
453. Предложить три различные несмещенные оценки пара-
метра p биномиального распределения с параметрами N, p.
454. Предложить четыре различные несмещенные оценки па-
раметра λ распределения Пуассона.
455. Доказать, что если M α̂ = α и Dα̂ → 0 при n → ∞, то α̂ –
состоятельная оценка α.
456. Доказать, что если M α̂ → α при n → ∞ и Dα̂ → 0 при
n → ∞, то α̂ – состоятельная оценка α.
457. Исследовать на состоятельность оценку â = X в N (a, σ).
458. Исследовать на состоятельность оценку σb2 = s2 в N (a, σ).
459. Исследовать на состоятельность оценку λ̂ = X в распре-
делении Пуассона Pλ .

460. Исследовать на состоятельность оценку p̂ = N в биноми-
альном распределении B(N, p).
461. Исследовать на состоятельность оценку b̂ = Xn∗ в R [a, b].
462. Исследовать на эффективность оценку â = X в N (a, σ).
463. Исследовать на эффективность оценку σb2 = s2 в N (a, σ).
464. Исследовать на эффективность оценку λ̂ = 1/2(X1 + X2 ) в
распределении Пуассона Pλ .
X
465. Исследовать на эффективность оценку p̂ = N в биноми-
альном распределении B(N, p).
466. Исследовать на эффективность оценку b̂ = Xn∗ в R [a, b].
467. Исследовать на оптимальность оценку â = X в N (a, σ).
468. Исследовать на оптимальность оценку λ̂ = X в распреде-
лении Пуассона Pλ .
469. λ̂ = X1 в распределении Пуассона Pλ . Доказать, что оценка
является несмещенной, но не является эффективной и состоятель-

141
13.2 Методы нахождения оценок

ной.

13.2. Методы нахождения оценок

Метод максимального правдоподобия.


Для непрерывной случайной величины функция

L(x1 , . . . , xn , θ) = f (x1 , θ) · . . . · f (xn , θ)

рассматриваемая при фиксированных (x1 , . . . , xn ) как функция параметра


θ, называется функцией правдоподобия.
Функция правдоподобия для дискретной случайной величины опреде-
ляется в виде

L(x1 , . . . , xn , θ) = p (ξ = x1 ) · . . . · (ξ = xn ).

Оценка θ∗ , обеспечивающая по параметру θ максимум функции прав-


доподобия, называется оценкой максимального правдоподобия пара-
метра θ (о.м.п.)
Вместо отыскания максимума функции L часто удобнее находить мак-
симум функции ln L и решать уравнение правдоподобия
∂ ln L
= 0.
∂θ
В результате решения уравнения правдоподобия мы найдем критическую
точку, необходимо еще убедиться, что это точка максимума.
Свойства оценок максимального правдоподобия
1. Cвойство инвариантности. Если оценивается некоторая взаимно одно-
значная параметрическая функция τ (θ), то ее оценка максимального
правдоподобия τd
(θ) = τ (θ).
b

2. Оценки максимального правдоподобия асимптотически несмещены,


состоятельны и обычно асимптотически нормальны.
3. Если оценки максимального правдоподобия асимптотически нормаль-
ны, то они и асимптотически эффективны, то есть Dθ̂ → I1 .
Метод моментов.
Приравнивая выборочные и теоретические моменты, получаем урав-
нения относительно θ. Решая эти уравнения, получаем оценку параметра θ̂.
Эта оценка называется
emphоценкой метода моментов и обозначается
emphо.м.м. Оценки метода моментов состоятельны.

142
13.2 Методы нахождения оценок

Пример 130. Найдем о.м.п. параметра распределения Пуассона.

J
n P
Y e−λn λ xi
L= Pλ (xi ) = Q .
i=1
(x i !)
X Y
ln L(X, λ) = −λn + xi lnλ − ln (xi !).
Найдем max ln L(X, λ).
P
∂ ln L(X, λ) xi
= −n + = 0.
∂λ λ
P
xi
Получаем λ̂ = n = x̄. Очевидно, это точка максимума, так как

∂ 2 ln L
<0 =⇒ x̄ — о.м.п. λ. I
∂λ2
Пример 131. Найдем в условиях предыдущего примера оценку макси-
мального правдоподобия функции параметра λ2 .

J По свойству инвариантности
b 2 = (x̄)2 . I
λb2 = (λ)

Рассмотрим нахождение оценки параметра методом максимального


правдоподобия в нерегулярной модели.
Пример 132. Найдем о.м.п. параметра θ = (a, b) в распределении
R[a, b].
J
n n
Y Y 1 1
L= f (xi ) = = .
i=1 i=1
b − a (b − a)n
∂ ln L
∂θ не обращается в 0. Но функция L монотонна по a и b. Поэтому она до-
стигает своего наибольшего значения при минимально возможном значении
b и максимально возможном значении a. Таким образом, о.м.п. будут

â = ymin = x∗1 , b̂ = xmax = x∗n . I

Пример 133. Найти методом моментов оценки параметров распре-


деления Γα, β .

143
13.2 Методы нахождения оценок

J
β β
Mξ = , Dξ =
.
α α2

β = αM ξ =⇒ Dξ =
α
Тогда
Mξ (M ξ)2
α= ,β= .
Dξ Dξ
Мы получили оценки
X x̄2
α̂ = 2 , β̂ = 2 . I
S S
Пример 134. Найти методом моментов оценки параметров распре-
деления R[a, b].

J
a+b (b − a)2
Mξ = , Dξ =
2 12
(b − M ξ)2
a = 2M ξ − b =⇒ Dξ = .
3
√ √
Отсюда b = M ξ + σ 3, a = M ξ − σ 3. Окончательно:
√ √
â = X − s 3, b̂ = X + s 3. I

 Задачи
470. Найти оценки максимального правдоподобия параметров
a, σ в N (a, σ).
471. Найти оценку максимального правдоподобия функции a2 +
a в N (a, σ).
472. Найти оценку максимального правдоподобия параметра p
в B(N, p).
P3 473. Найти оценку максимального правдоподобия функции
i
i=0 p в B(N, p).
474. Найти оценку максимального правдоподобия параметра λ
в Pλ .
475. Найти оценки максимального правдоподобия параметров
a, b в R[a, b].
476. Найти оценку максимального правдоподобия параметра
α, если f (x) = eα−x , x > α.
477. Найти оценку максимального правдоподобия параметра

144
13.2 Методы нахождения оценок

−|x|
e
α, если f (x) = 2(1−e −α ) , |x| 6 α.

478. Найти оценку максимального правдоподобия параметра α


в Γ(α, β).
√ Найти оценку максимального правдоподобия параметра a
479.
в N (a, 2a). Исследовать полученную оценку на состоятельность.
480. Найти методом моментов оценки параметров a, σ в
N (a, σ).
481. Найти методом моментов оценку параметра λ в Pλ .
482. Найти методом моментов оценки параметров a, b в R[a, b].
483. Найти методом моментов оценку параметра p в B(N, p)
при известном N .
484. Найти методом моментов оценки параметров N, p в
B(N, p).
Pn 485. Найти методом моментов оценку параметра n в χ2n . (χ2n =
2
i=1 ξi , ξi ∈ N (0, 1), ξi независимы.)

145
14. Доверительные интервалы.
Две статистики I1 (X), I2 (X) (I1 (X) < I2 (X)) называют довери-
тельным интервалом значимости α для параметра θ (0 < α < 1), если
выполняется условие

p (I1(X) < θ < I2(X ) = 1 − α. (72)

Число 1 − α называется доверительной вероятностью, а I1 (X), I2 (X)


— нижней и верхней доверительными границами.
Для построения доверительного интервала параметра θ надо взять
статистику G(X, θ), такую, что она сама монотонно зависит от параметра
θ, а ее распределение от θ не зависит, записать уравнение p (g1 < G(X, θ) <
g2 ) = 1 − α, и разрешить неравенство под знаком вероятности относительно
параметра θ.
Доверительные интервалы для параметров нормального распределе-
ния:  
S S
Ia = X − √ · tn−1, 1− α2 , X + √ · tn−1, 1− α2 ;
n n
!
2 2
nS nS
Iσ2 = 2 , 2 .
χn−1,1− α χn−1, α
2 2

Доверительный интервал для параметра a нормального распределения


N (a, σ) при известном σ:
 
σ σ
Ia = X − √ · u1− α2 , X + √ · u1− α2 .
n n
Параметр произвольного распределения можно оценить так же, как пара-
метр нормального распределения, если известно распределение некоторой
статистики, зависящей от параметра и его оценки. Другой способ связан
с использованием асимптотического метода. Если θ̂ асимптотически нор-
мальна и несмещена, (например, является о.м.п.), то

θ̂ − θ d
p → u ∈ N (0, 1).
Dθ̂
!
θ̂ − θ
1 − α = p u α2 < p < u1− α2 .
Dθ̂
Разрешая относительно θ, получим доверительный интервал значимости α.

146
Пример 135. Федеральные Центры оздоровительного питания изу-
чают потребление населением биологически активных добавок
(БАД). Было опрошено 4 группы по 100 покупателей каждая. В сред-
нем из ста опрошенных встречалось 60 человек употребляющих БАД,
причем σ = 10. Каков доверительный интервал значимости α = 0, 05
для числа людей, употребляющих БАД на сто опрошенных?
J Требуется найти доверительный интервал значимости α = 0, 05 для па-
раметра a нормального распределения N (a, σ) при известном σ = 10; вос-
пользуемся вышеприведенной формулой:
 
σ σ
Ia = X − √ · u1− α2 ; X + √ · u1− α2 =
n n
 
10 10
= 60 − √ · u0,975 ; 60 − √ · u0,975 =
4 4
 
10 10
= 60 − · 1, 96; 60 − · 1, 96 =
2 2
= (60 − 9, 8; 60 + 9, 8) = (50, 2; 69, 8). I

Пример 136. В условиях предыдущего примера как изменился бы до-


верительный интервал, если бы те же данные были получены по 25
группам, численностью в 100 человек каждая?
J  
σ σ
Ia = X − √ · u1− α2 ; X + √ · u1− α2 =
n n
 
10 10
= 60 − √ · u0,975 ; 60 − √ · u0,975 =
25 25
 
10 10
= 60 − · 1, 96; 60 − · 1, 96 =
5 5
= (60 − 3, 92; 60 + 3, 92) = (56, 08; 63, 92).
Длина интервала равна 3, 92 · 2 = 7, 84, а в предыдущем примере длина до-
верительного интервала равнялась 9, 8 · 2 = 19, 6, то есть новый интервал в
2,5 раза короче. I
Пример 137. Найти доверительный интервал значимости α = 0, 01
для курса английского фунта стерлингов по данным за 100 дней17 .
17
Курс английского фунта стерлингов за период 18.11.2005 г. – 25.02.2006 г.

147
№ Значения № Значения № Значения № Значения
1 48,9231 26 49,5273 51 49,7769 76 50,1459
2 49,0009 27 49,5319 52 49,8113 77 50,1484
3 49,0009 28 49,5642 53 49,8743 78 50,1792
4 49,0009 29 49,5757 54 49,8743 79 50,1969
5 49,0676 30 49,5757 55 49,8743 80 50,2041
6 49,1057 31 49,5757 56 49,8806 81 50,2253
7 49,1104 32 49,5908 57 49,8913 82 50,2253
8 49,1591 33 49,6426 58 49,9032 83 50,2253
9 49,1915 34 49,6436 59 49,908 84 50,2366
10 49,1957 35 49,6949 60 49,9485 85 50,2681
11 49,1957 36 49,7218 61 49,9562 86 50,2743
12 49,1957 37 49,7218 62 49,961 87 50,3392
13 49,2786 38 49,7218 63 49,9704 88 50,4789
14 49,2786 39 49,7218 64 49,9861 89 50,5537
15 49,2892 40 49,7218 65 49,9921 90 50,5914
16 49,2892 41 49,7218 66 50,029 91 50,5914
17 49,2892 42 49,7218 67 50,0655 92 50,5914
18 49,3908 43 49,7218 68 50,0655 93 50,6346
19 49,3933 44 49,7218 69 50,0655 94 50,6346
20 49,4365 45 49,7218 70 50,0779 95 50,6346
21 49,449 46 49,7218 71 50,0779 96 50,6985
22 49,5006 47 49,7297 72 50,0779 97 50,7337
23 49,5191 48 49,7297 73 50,1117 98 50,7971
24 49,5273 49 49,7297 74 50,1117 99 50,816
25 49,5273 50 49,7301 75 50,1117 100 50,9521
J Для нахождения доверительного интервала необходимо сначала рассчи-
тать выборочные характеристики X и S: X = 49, 8388 и S = 0, 4703. Ис-
пользуем формулу:
 
S S
Ia = X − √ · tn−1, 1− α2 , X + √ · tn−1, 1− α2 ;
n n
найдем по таблице квантилей распределения Стьюдента tn−1, 1− α2 =
t99, 0,995 = 2, 58. Тогда
 
0, 4703 0, 4703
Ia = 49, 8388 − √ · 2, 58; 49, 8388 + √ · 2, 58 = (49, 717; 49, 960) . I
100 100

 Задачи
486. Найти доверительный интервал для a в N (a, σ) при извест-

148
ном σ.
487. Найти доверительный интервал для a в N (a, σ) при неиз-
вестном σ.
488. Пусть по 16 измерениям величины ξ, имеющей нормальное
распределение, найдено среднее значение X = 4, 1. Оценить неиз-
вестное математическое ожидание случайной величины ξ по выбо-
рочной средней при помощи доверительного интервала с довери-
тельной вероятностью 0,95, если среднее квадратическое отклоне-
ние величины ξ известно и равно единице.
489. В условиях предыдущей задачи найти доверительный ин-
тервал для неизвестного математического ожидания случайной ве-
личины ξ с доверительной вероятностью 0,95, если среднее квадра-
тическое отклонение неизвестно, а выборочное среднее квадрати-
ческое отклонение величины S = −1.
490. Найти в нормальной модели доверительные интервалы для
a и σ по данным: x̄ = 103, S 2 = 16, n = 26, α = 0, 1.
491. Найти доверительный интервал для σ в модели N (2, σ) по
выборке: 2, 3, 3, 1, 1, 2, 4, 2, 1, 3 при α = 0, 1.
492. При проведении рекламной акции за первые четыре дня
распространители раздали соответственно 2470, 2490, 2580 и 2520
рекламных проспектов. Считая применимой нормальную модель,
найти доверительные интервалы для дисперсии и для среднего квад-
ратического отклонения числа раздаваемых в день рекламных про-
спектов.
493. Найти 95%-ый доверительный интервал для числа пасса-
жиров пригородного поезда, если среднее число пассажиров, рассчи-
танное за 25 рабочих дней, равно 500, а σ = 20.
494. По результатам 25 наблюдений цены товара в различных
магазинах был определен доверительный интервал для математи-
ческого ожидания цены при α = 0, 3 : Ia = [23, 84; 24, 37] (σ не извест-
но). Найдите доверительный интервал при доверительной вероят-
ности 0,95.
495. Средняя длительность оборота (в днях) оборотных
средств, рассчитанная по 36 торговым фирмам, составляет 47 дней,
причем σ = 2, 1. Найти 95%-ый и 99%-ый доверительные интервалы
для средней длительности оборота.
496. Найти доверительный интервал для p в B(N, P ) при из-
вестном N .
497. Найти доверительный интервал для λ в Pλ .

498. Показать, что интервал (Xn∗ , nX√nα ) является доверитель-

149
ным интервалом для b значимости α в модели R[0, b].
499. В равномерном распределении R[a, 0] найти доверитель-
ный интервал для a.
500. Найти доверительный интервал для θ в N (θ, θ).

150
15. Статистические гипотезы.
Статистической гипотезой (или просто гипотезой) называется
любое утверждение о виде или свойствах распределения наблюдаемых в
эксперименте случайных величин.
Статистическая гипотеза называется простой, если однозначно фик-
сирует распределение наблюдений. Иначе это сложная гипотеза. Прове-
ряемая гипотеза называется нулевой (H0 ). Любая гипотеза о распределе-
нии наблюдаемой случайной величины, которая может оказаться истинной,
но отличается от основной гипотезы, называется альтернативной гипо-
тезой. Правило, согласно которому проверяют гипотезу H0 (принимают или
отвергают), называется статистическим критерием проверки гипотезы
H0 .
Статистическая гипотеза называется параметрической, если она
представляет из себя предположение о том, что неизвестный параметр рас-
пределения (дисперсия, математическое ожидание и т.п.) имеет наперед за-
данное значение или множество значений.
В процессе проверки H0 можно принять правильное решение или со-
вершить ошибку.
Вероятностью ошибки первого рода называется вероятность откло-
нить H0 , когда H0 верна.
Эта вероятность совпадает с уровнем значимости критерия α. Оче-
видно,
α = p (Hd = H1 /H0 ) = p (T (x) ∈ V /H0 ),
(α равняется вероятности того, что значение статистики T принадле-
жит критической области V при условии, что верна H0 ).
Вероятностью ошибки второго рода называется вероятность при-
нять H0 , когда H0 не верна.
Вероятность ошибки второго рода обозначается β. Очевидно,

β = p (Hd = H0 /H1 ) = p (T (x) ∈ V /H1 ),

(β равняется вероятности того, что значение статистики T не принадлежит


критической области V при условии, что верна H1 ).
Величину 1 − β будем называть мощностью критерия K и обозна-
чать M (K).
Понятие мощности критерия введено для случая простых H0 , H1 ; су-
щественно, что множество Θ1 состоит из единственной точки θ1 .
Наилучшие критические области (НКО).
Теорема Неймана - Пирсона. Пусть H0 : θ = θ0 , H1 : θ = θ1 . Тогда
НКО заданного уровня значимости α состоит из точек выборочного про-

151
странства, удовлетворяющих неравенству
L(x, θ1 )
> cα ,
L(x, θ0 )
где cα – константа, зависящая от α, L – функция правдоподобия.
Теорема Неймана–Пирсона применима и к простым гипотезам о виде
распределения.
Пример 138. Найти наилучшую критическую область для проверки
гипотезы H0 : R[−a, a] против гипотезы H1 : N (0, σ) по одному на-
блюдению (n = 1) при уровне значимости α = 0, 1.
J  2
x
√1 e− 2σ2 : 1
x ∈ [−a, a],
L(x, H1 ) 2a ,

= σ 2π (73)
x2
L(x, H0 )  √1 e − 2σ
: 0 = ∞, x ∈
2
/ [−a, a].
σ 2π
НКО V заданного уровня значимости α состоит из точек выборочного про-
странства, удовлетворяющих неравенству (??):
L(x, θ1 )
> cα ,
L(x, θ0 )
следовательно, надо разрешить (73) относительно x. Разрешая, получаем:

V = {x : |x| > a} ∪ {x : |x| 6 d},

где d – некоторая константа. Значение константы d найдем из определения


α: α = P (Z ∈ V /H0 ).

P (Z ∈ V /H0 ) = P (|x| 6 d/H0 )


и, поскольку H0 : R[−a, a], эта вероятность равна площади прямоугольника
1
с высотой, равной плотности равномерного распределения 2a , и с основани-
ем 2d. Таким образом,
d
α = P (|x| 6 d/H0 ) = .
a
Отсюда d = aα, и получен окончательный вид НКО:

V = {x : |x| > a} ∪ {x : |x| 6 aα}.

Следовательно, если наблюдаемое значение x больше a, или не больше aα,


гипотеза о равномерном распределении отвергается (в пользу нормального
распределения); если же x ∈ (aα; a], гипотеза о равномерном распределе-
нии не отвергается.I

152
Пример 139. В условиях предыдущего примера найти мощность по-
лученного критерия.
J Мощность критерия численно равна площади над критической об-
ластью, рассчитанной на основе распределения Z при альтернативной ги-
потезе H1 . Решение принимается по одному наблюдению, то есть распреде-
ление Z совпадает с распределением X. Таким образом, M (K) равна пло-
щади криволинейной трапеции с основанием V , ограниченной сверху гра-
фиком плотности N (0, σ). Основание трапеции состоит из трех несвязан-
ных интервалов: (−∞; −a) ∪ [−aα; aα] ∪ (a; ∞). Площадь под графиком
плотности выражается через функцию распределения, и
M (K) = Φ0,σ (−a) + (Φ0,σ (aα) − Φ0,σ (−aα)) + (1 − Φ0,σ (a).
Замечание. Последнее выражение легко упрощается. M (K) можно
(и нужно) выразить через функцию Φ(x). При решении задач с числовыми
данными подставляются табличные значения функции Φ(x). I

 Задачи
В задачах 501–503 даны оценки за контрольную работу первой и вто-
рой групп X = (x1 , . . . , xn ), Y = (y1 , . . . , ym ), которые можно рассматривать
как выборки из генеральных совокупностей оценок. Сформулировать нуле-
вую и альтернативную гипотезы для получения ответа на вопрос:
501. «Учится ли первая группа по этому предмету лучше вто-
рой?»
502. «Одинаково ли успешно учатся по этому предмету первая
и вторая группа?»
503. «Можно ли считать, что первая и вторая группа учатся
по этому предмету одинаково ровно?»
В задачах 504–506 даны числа ежедневных покупок, совершенных в
магазине в течение одного месяца до раздачи рекламных листовок и в тече-
ние месяца после раздачи рекламных листовок. Сформулировать нулевую и
альтернативную гипотезы для получения ответа на вопрос:
504. «Изменяет ли раздача листовок число покупок?»
505. «Увеличивает ли раздача листовок число покупок?»
506. «Уменьшился ли разброс числа покупок?»
В задачах 507–509 даны результаты измерений артериального давле-
ния у одних и тех же людей до и после приема лекарства. Сформулировать
нулевую и альтернативную гипотезы для получения ответа на вопрос:
507. «Повышает ли это лекарство давление?»
508. «Понижает ли это лекарство давление?»
509. «Это лекарство увеличивает разброс давления у пациен-

153
тов?»
510. Имеются данные о солнечной активности и о заболевае-
мости дифтеритом за ряд лет. Сформулировать нулевую и альтер-
нативную гипотезы для проверки содержательной гипотезы: «Уве-
личение солнечной активности понижает заболеваемость дифте-
ритом18 ».
511. Для каждой из двух книг имеются данные о частотах, с
которыми встречаются в тексте различные служебные слова и зна-
ки препинания. Сформулировать нулевую и альтернативную гипо-
тезы для проверки содержательной гипотезы: «Эти две книги на-
писаны одним автором».
512. Найти наилучшую критическую область в модели N (a, σ)
для проверки гипотезы H0 : a = a0 против гипотезы H1 : a = a1 по
выборке объема n = 25, если σ = 5, a0 = 1, a1 = 3, уровень значимости
α = 0, 05. Найти мощность критерия.
513. В статистической модели f (x) = λe−λx , x > 0 найти наи-
лучшую критическую область для проверки гипотезы H0 : λ = 1
против гипотезы H1 : λ = 4 по выборке объема n = 1 при уровне
значимости α = 0, 1. Найти мощность критерия.
514. В статистической модели N (a, σ) найти наилучшую кри-
тическую область для проверки гипотезы H0 : σ 2 = 4 против гипо-
тезы H1 : σ 2 = 9, если объем выборки n = 25, а уровень значимости
α = 0, 05.
515. Найти наилучшую критическую область для проверки ги-
потезы H0 : f (x) = 12 при |x| 6 1 против гипотезы H1 : ξ ∈ N (0, 1) по
одному наблюдению (n = 1), α = 0, 05. Найти мощность критерия.
516. Найти наилучшую критическую область для проверки ги-
потезы H0 : ξ ∈ N (0, 1) против гипотезы H1 : f (x) = 21 при |x| 6 1 по
одному наблюдению (n = 1), если α = 0, 05. Найти мощность крите-
рия.
517. Найти наилучшую критическую область для проверки ги-
потезы H0 : R[− 21 , 12 ] против гипотезы H1 : N (0, 0, 16) по одному на-
блюдению n = 1 при уровне значимости α = 0, 1. Найти мощность
критерия.
518. В статистической модели B(N, p) найти наилучшую кри-
тическую область для проверки гипотезы H0 : p = 14 против гипоте-
зы H1 : p = 12 , N = 10, если объем выборки n = 25, уровень значимости
α = 0, 1.
519. В статистической модели Γ(α, 1) найти наилучшую кри-
18
Гипотеза Чижевского.

154
тическую область для проверки гипотезы H0 : α = 1 против гипо-
тезы H1 : α = 3 при n = 16, α = 0, 05.
520. Найти наилучшую критическую область для проверки ги-
потезы H0 : λ = 1 против гипотезы H1 : λ = 2 в статистической
модели Pλ , n = 9, α = 0, 05.
521. Сколько наблюдений необходимо, чтобы мощность крите-
рия для проверки гипотезы H0 : a = 0 против гипотезы H1 : a = 2
в статистической модели была не меньше 0, 9, если уровень значимо-
сти α = 0, 05?

155
16. Проверка статистических гипотез
16.1. Параметрические гипотезы

Алгоритм проверки параметрической гипотезы.


1. Сформулировать статистическую параметрическую модель, нуле-
вую и альтернативную гипотезы, задать уровень значимости α.
2. Выбрать статистику Z(x), такую, что она сама зависит от параметра
θ, а ее распределение при верной H0 от θ не зависит, и различается при H0 и
при H1 .
3. Найти критическую область V .
4. Рассчитать по выборке значение статистики Zв .
5. Если Zв попадает в критическую область V , то нулевая гипотеза
отвергается (в пользу альтернативной). Если Zв не попадает в критическую
область V , то нулевая гипотеза не отвергается.
6. Сформулировать ответ в терминах вопроса.
Замечание. Гипотеза H0 отвергается или не отвергается с уровнем
значимости α.
Критерии для гипотез о параметрах нормального распределе-
ния.
Гипотеза о дисперсии. H0 : σ = σ 0 .

Статистическая модель Статистика Z Z/H0


(xi −a0 )2
P
hN (a0 , σ)i (σ 0 )2 χ2n
nS 2
hN (a, σ)i (σ 0 )2 χ2n−1

Гипотеза о среднем. H0 : a = a0

Статистическая модель Статистика



Z Z/H0
0
(x̄−a ) n
hN (a, σ0 )i σ0 √ N (0, 1)
(x̄−a0 ) n
hN (a, σ)i s̄ Tn−1

Критерии для гипотез о параметрах двух независимых нормаль-


ных распределений.
Гипотеза о дисперсии. H0 : σ1 = σ2 .

Статистическая модель Статистика Z Z/H0


(s̄1 )2
hN (a0 , σ)i, hN (a, σ)i (s̄2 )2 , s1 > s2 . Fn1 −1,n2 −1

156
16.2 Гипотеза о виде распределения.

Замечание. Критерий, использующий данную статистику для провер-


ки данной гипотезы, называется критерием Фишера.
Гипотеза о средних. H0 : a1 = a2

Статистическая модель Статистика Z Z/H0


hN (a, σ0 )i (известны r x̄−ȳ
2 2
N (0, 1)
σ1 σ2
σ1 , σ2 ) n1 + n2
x̄−ȳ √
hN (a, σ)i(σ1 , σ2 неиз- r 2 Tn1 +n2 −2
s̄1 (n1 −1)+s̄2
2 (n2 −1) ( 1 + 1 )
вестны, но гипотеза n1 +n2 −2 n1 n2

H0 : σ1 = σ2 не
отвергается)
hN (a, σ)i(σ1 , σ2 неиз- r x̄−ȳ Tν, где ν ≈
s̄2
1 s̄2
2
 2
n1 + n2 s̄2 s̄2
вестны, и гипотеза H0 : 1
n1 + n2
2

σ1 = σ2 отвергается) s̄2
!2
s̄2
!2 −2
1 2
n1 n2
n1 +1 + n2 +1

Замечание. Критерий, использующий статистику, отмеченную галочкой



( ), называется критерием Стьюдента.
Гипотеза о средних для парных совокупностей.
Гипотеза H0 : a1 = a2 . ∼ H0 : ad = 0.

Статистическая модель Статистика


P √
Z Z/H0

d¯ n P i n−1
d
hN (a, σ)i s̄d = n d2 −( di )2
P Tn−1
i

Замечание. Этот критерий называется критерием Стьюдента для пар-

ных выборок.

16.2. Гипотеза о виде распределения.

H0 : F (x) = F0 (x).
Критерии, проверяющие гипотезу о виде распределения, называются
критериями согласия.
Критерий согласия Колмогорова.
Пусть x = (x1 , . . . , xn ) – выборка из генеральной совокупности с
неизвестной функцией распределения F (x). Выдвинута простая гипотеза
H0 : F (x) = F0 (x), где F0 (x) задана. Критерий согласия Колмогорова при-
меняют для непрерывных функций распределения F (x).
В качестве статистики критерия выбирают величину

Dn = Dn (x) = sup |(Fn (x) − (F (x)|, (74)


x

157
16.2 Гипотеза о виде распределения.

а в качестве критической области – область вида


V = (t∗ , ∞), (75)
где t∗ табулировано. Так, t∗ = t∗α = 1, 3581 при α = 0, 05; t∗α = 1, 6276
при α = 0, 01. Таким образом, при заданном уровне значимости α правило
проверки гипотезы H0 при n > 20 сводится к следующему:
если значение статистики t̂ = Dn (x) = maxx |Fn∗ (x) − F0 (x)| удовле-
творяет неравенству √
n · t̂ > t∗ ,
то H0 отвергают, в противном случае делают вывод, что статистические дан-
ные не противоречат гипотезе.
Критерий согласия χ2 Пирсона.
Критерий согласия χ2 Пирсона также проверяет гипотезу H0 : F (x) =
F0 (x), но его можно применять для любых распределений. Чтобы восполь-
зоваться этим критерием, выборочные данные предварительно группируют.
Пусть ni – число значений, попавших в i-й интервал, i = 1, . . . , k, n – объем
выборки, pi — теоретическая вероятность попадания одного элемента вы-
борки в i-й интервал. Однако в теоретическом распределении могут быть
неизвестные параметры (θ1 , . . . , θr ), что обычно и встречается на практике.
Тогда по выборке (x1 , . . . , xn ) первоначально находят оценки (θ1∗ , . . . , θr∗ ) и
затем по F (x, θ1∗ , . . . , θr∗ ) вычисляют теоретические вероятности pi .
Статистика критерия:
k
X (ni − npi )2
Z= ∼ χ2ν , (76)
i=1
npi
где ν = k − r − 1 – число степеней свободы. Ограничения: n > 50 и npi > 4.
Критическую область задаем в виде V = (t∗ , ∞), значение t∗ – квантиль
распределения χ2ν порядка (1 − α).
Таким образом, вид критерия согласия χ2 :
если значение статистики Zв удовлетворяет неравенству
Zв > t∗ ,
гипотезу H0 отвергают, в противном случае гипотеза H0 не противоречит
условиям испытаний.
Пример 140. Проверить гипотезу о том, что среднеквадратичное
отклонение цены на товар σ = 1, 4, если по 101 наблюдению S = 1, 2.
J 1. Можно использовать нормальную модель, а уровень значимости α за-
дадим равным 0,05. Сформулируем гипотезы:
H0 : σξ = σ0 = 1, 4; H1 : σξ = σ1 < 1, 4

158
16.2 Гипотеза о виде распределения.

2. Воспользуемся статистикой
nS 2
Z= 2 ,
σ0
при условии H0 статистика Z имеет распределение χ2n−1 .
3. Найдем критическую область V . Так как σ1 < σ0 , то при верной
2
гипотезе H1 статистика Z = nS 2
σ0
принимает меньшие значения, чем при
верной гипотезе H0 , следовательно, критическая область левосторонняя:
V = {x : Z(x) 6 χ2α }. Из таблиц находим граничное значение Zкрит. =
χ2100;0,05 = 77, 929. Таким образом, критическая область V = [0, 77, 929].
4. Рассчитаем по выборке значение статистики Zв :

nS 2 101 · (1, 2)2


Zв = 2 = ≈ 74, 2
σ0 (1, 4)2
5. Поскольку Zв = 74, 2 < 77, 929 = Zкрит. , то Zв попадает в кри-
тическую область V , следовательно нулевая гипотеза отвергается в пользу
альтернативной с уровнем значимости α = 0, 05.
6. Таким образом, нельзя считать, что среднеквадратичное отклонение
цены на товар σ = 1, 4. Следует признать, что оно меньше.I
Пример 141. Было проведено 1000 измерений случайной величины η,
равной времени ожидания ответа на запрос, измеренному в долях
от теоретически возможного максимального времени, принятого
за единицу. Требуется выяснить распределение этой величины.
J Сгруппируем данные:
ni ni P ni
№ Интервал Численность ni n nh n
1 0, 00 − 0, 09 80 0,080 0,007 0,080
2 0, 09 − 0, 18 81 0,081 0,007 0,161
3 0, 18 − 0, 27 93 0,093 0,008 0,254
4 0, 27 − 0, 36 85 0,085 0,008 0,339
5 0, 36 − 0, 45 87 0,087 0,008 0,426
6 0, 45 − 0, 54 87 0,087 0,008 0,513
7 0, 54 − 0, 63 87 0,087 0,008 0,600
8 0, 63 − 0, 72 106 0,106 0,010 0,706
9 0, 72 − 0, 81 99 0,099 0,009 0,805
10 0, 81 − 0, 90 89 0,089 0,008 0,894
11 0, 90 − 0, 99 106 0,106 0,010 1,000
По рассмотрению таблицы группировки можно выдвинуть гипотезу о
равномерном распределении. Параметры этого распределения найдем с по-
мощью оценивания:
â = ymin = x∗1 = 0, b̂ = xmax = x∗n ≈ 1.

159
16.2 Гипотеза о виде распределения.

H0 : Fη (y) = FR[0,1] (y).


Применим критерий согласия χ2 Пирсона.
В качестве статистики критерия возьмем величину
k
X (ni − npi )2
Z= ,
i=1
npi

где pi — теоретическая вероятность попадания одного элемента выборки в


i-й интервал, равная 0,1. После вычислений получаем Zв = 9, 25.
Критическая область Vk = (χ2k−r−1,1−α , +∞), где r — число парамет-
ров, оцененных в выборке. У нас r = 2, в таблице значений квантилей рас-
пределения χ2 находим χ28,0.95 = 15, 51. Так как значение Zв не попало в
критическую область, то гипотеза H0 не отвергается, то есть статистические
данные не противоречат гипотезе о том, что величина η имеет распределение
R[0, 1]. I.

Пример 142. В условиях предыдущего примера проверим гипотезу с


помощью критерия согласия Колмогорова.

J
H0 : Fη (y) = FR[0,1] (y).
В качестве статистики критерия возьмем величину

Dn = n · max Fn∗ (y) − FR[0,1] (y)

y

После вычислений мы получили Dn = 1, 22. Так как критическая область


для α = 0, 05 равна Vk = (1, 36; +∞), a значение Dn не попадает в крити-
ческую область, то гипотеза H0 не отвергается, то есть можно считать, что
величина η имеет распределение R[0, 1] I.

 Задачи
Замечание. Если в условиях не указан уровень значимости α, следует
задать его самим.
522. Средние по отрасли издержки на производство единицы
некоторого товара составляют a0 = 13, а по 26 предприятиям кор-
порации выборочное среднее издержек равно x̄ = 11, S = 2. Можно ли
считать, что издержки в данной корпорации ниже, или отклонение
следует считать случайным? (α = 0, 05).
523. В условиях примера 137 проверить гипотезу о том, что
математическое ожидание курса английского фунта стерлингов за

160
16.2 Гипотеза о виде распределения.

упомянутый период равно a = 50.


524. Урожайность культуры составляет 35 центнеров с гек-
тара; на 10 опытных делянках x̄ = 38 центнеров с гектара, s2 = 49.
Случайно ли превышение урожайности?
525. При измерении производительности двух агрегатов полу-
чены следующие результаты:
A : 14, 1 10, 1 14, 7 13, 7 14, 0; B : 14.0 14, 5 13, 7 12, 7 14, 1.
Различна ли их производительность?
526. Одинаково ли потребление сырья для производства про-
дукта при двух технологиях, если n1 = 16, S̄12 = 8, x̄ = 6; n2 =
36, S̄22 = 15, ȳ = 7?
527. Указаны выборочные дисперсии размеров прибыли при про-
изводстве товаров двух групп: n1 = 21, S̄12 = 25; n2 = 31, S̄22 = 16.
Можно ли считать, что прибыль при производстве товаров первой
группы колеблется сильнее, или различия следует считать случай-
ными? (α = 0, 1).
528. Производительность труда в дневную смену описана дан-
ными
n1 = 16, x̄ = 14, 5, S̄12 = 4;
в ночную смену
n2 = 16, ȳ = 13, S̄22 = 3.
Можно ли считать, что ночная работа менее эффективна?
529. Пусть X — производительность при работе с перерывом,
Y — производительность при работе без перерыва, измеренная у од-
них и тех же 8 человек: H1 : ay < ax .
X 40 35 41 55 46 60 51 43
.
Y 30 30 38 21 49 53 31 27

530. Можно ли считать равномерным распределение студен-


тов по знакам Зодиака?
№ знака 1 2 3 4 5 6
ni 12 13 23 11 9 10
№ знака 7 8 9 10 11 12
ni 15 7 15 9 7 3

531. Проверить гипотезу H0 : F = Pλ ;


m 0 1 2 3 4 5
ni 13 17 12 5 3 1

161
Приложение.

1 x2
Таблица 3. Значения функции ϕ (x) = √ e− 2

x Сотые доли x
0 1 2 34 5 6 7 8 9
0, 0 39894 39892 39886 39876
39862 39844 39822 39797 39767 39733
0, 1 39695 39654 39608 39559
39505 39448 39387 39322 39253 39181
0, 2 39104 39024 38940 38853
38762 38667 38568 38466 38361 38251
0, 3 38139 38023 37903 37780
37654 37524 37391 37255 37115 36973
0, 4 36827 36678 36526 36371
36213 36053 35889 35723 35553 35381
0, 5 35207 35029 34849 34667
34482 34294 34105 33912 33718 33521
0, 6 33322 33121 32918 32713
32506 32297 32086 31874 31659 31443
0, 7 31225 31006 30785 30563
30339 30114 29887 29659 29431 29200
0, 8 28969 28737 28504 28269
28034 27798 27562 27324 27086 26848
0, 9 26609 26369 26129 25888
25647 25406 25164 24923 24681 24439
1, 0 24197 23955 23713 23471
23230 22988 22747 22506 22265 22025
1, 1 21785 21546 21307 21069
20831 20594 20357 20121 19886 19652
1, 2 19419 19186 18954 18724
18494 18265 18037 17810 17585 17360
1, 3 17137 16915 16694 16474
16256 16038 15822 15608 15395 15183
1, 4 14973 14764 14556 14350
14146 13943 13742 13542 13344 13147
1, 5 12952 12758 12566 12376
12188 12001 11816 11632 11450 11270
1, 6 11092 10915 10741 10567
10396 10226 10059 09893 09728 09566
1, 7 09405 09246 09089 08933
08780 08628 08478 08330 08183 08038
1, 8 07895 07754 07614 07477
07341 07207 07074 06943 06814 06687
1, 9 06562 06438 06316 06195
06077 05960 05844 05730 05618 05508
2, 0 05399 05292 05186 05082
04980 04879 04780 04682 04586 04492
2, 1 04398 04307 04217 04128
04041 03955 03871 03788 03706 03626
2, 2 03548 03470 03394 03319
03246 03174 03103 03034 02966 02899
2, 3 02833 02768 02705 02643
02582 02522 02463 02406 02349 02294
2, 4 02240 02186 02134 02083
02033 01984 01936 01889 01842 01797
2, 5 01753 01710 01667 01625
01585 01545 01506 01468 01431 01394
2, 6 01358 01323 01289 01256
01223 01191 01160 01130 01100 01071
2, 7 01042 01014 00987 00961
00935 00910 00885 00861 00837 00814
2, 8 00792 00770 00748 00727
00707 00687 00668 00649 00631 00613
2, 9 00595 00578 00562 00545
00530 00514 00499 00485 00471 00457
3, 0 00443 00430 00417 00405
00393 00381 00370 00358 00348 00337
x Десятые доли x
0 1 2 3 4 5 6 7 8 9
3 00443 00327 00238 00172 00123 00084 00061 00043 00029 00020

Замечание. В таблице даны значения, округленные до пятого знака после запятой.

Указание. Пусть необходимо получить значение ϕ (0, 62). На пересечении столб-


ца 2 («Сотые доли x») и строки 0, 6 («x») получаем значение 32918, т. е.

ϕ (0, 62) = 0, 32918.

162
Zx
1 t2
Таблица 4. Значения функции Φ0 (x) = √ e− 2 dt

0

x Сотые доли x
0 1 2 3 4 5 6 7 8 9
0, 0 0, 0000 00399 00798 01197 01595 01994 02392 02790 03188 03586
0, 1 03983 04380 04776 05117 05567 05962 06356 06749 07142 07535
0, 2 07920 08317 08700 09095 09483 09871 10257 10642 11026 11409
0, 3 11791 12172 12552 12930 13307 13683 14058 14431 14803 15173
0, 4 15542 15910 16276 16640 17003 17365 17724 18082 18439 18793
0, 5 19146 19497 19847 20194 20540 20884 21226 21566 21904 22241
0, 6 22575 22907 23237 23565 23891 24215 24537 24857 25175 25490
0, 7 25804 26115 26424 26731 27035 27337 27637 27935 28230 28524
0, 8 28814 29103 29389 29673 29955 30234 30511 30785 31057 31328
0, 9 31594 31859 32121 32381 32639 32894 33147 33398 33646 33891
1, 0 34134 34375 34614 34850 35083 35314 35543 35769 35993 36214
1, 1 36433 36650 36864 37076 37286 37493 37698 37900 38100 38298
1, 2 38493 38686 38877 39065 39251 39435 39617 39796 39973 40148
1, 3 40320 40490 40658 40824 40988 41149 41309 41466 41621 41774
1, 4 41924 42073 42220 42634 42507 42647 42786 42922 43056 43189
1, 5 43319 43447 43574 43699 43822 43943 44062 44179 44295 44408
1, 6 44520 44630 44738 44845 44950 45053 45154 45254 45352 45449
1, 7 45543 45637 45728 45819 45907 45994 46080 46164 46246 46327
1, 8 46407 46485 46562 46638 46712 46784 46856 46926 46995 47062
1, 9 47128 47193 47257 47320 47381 47441 47500 47558 47615 47671
2, 0 47725 47778 47831 47882 47932 47982 48030 48077 48124 48169
2, 1 48214 48257 48300 48341 48382 48422 48461 48499 48537 48574
2, 2 48610 48645 48679 48713 48745 48778 48809 48839 48870 48899
2, 3 48928 48956 48983 49010 49036 49061 49086 49111 49134 49158
2, 4 49180 49202 49224 49245 49266 49286 49305 49324 49343 49361
2, 5 49379 49396 49413 49430 49446 49461 49477 49491 49506 49520
2, 6 49535 49547 49560 49573 49586 49598 49609 49621 49632 49643
2, 7 49653 49664 49674 49683 49693 49702 49711 49720 49728 49737
2, 8 49744 49752 49760 49767 49774 49781 49788 49795 49801 49807
2, 9 49813 49819 49825 49830 49836 49841 49846 49851 49856 49861
3, 0 49865 49869 49874 49878 49882 49886 49889 49893 49897 49899
x Десятые доли x
0 1 2 3 4 5 6 7 8 9
3 49865 49903 49931 49952 49966 49977 49984 49989 49993 49995

Замечание. В таблице даны значения, округленные до пятого знака после запятой.

Указание. Пусть необходимо получить значение Φ0 (1, 57). На пересечении столб-


ца 7 («Сотые доли x») и строки 1, 5 («x») получаем значение 44179, т. е.

Φ0 (1, 57) = 0, 44179.

163
Таблица 5. Некоторые важные дискретные распределения
Обозначение Значения Закон распределения Интерпретация
Вырожденное ξ≡c p (ξ = c) = 1 Случайная величина — постоянная c
ξ = xi ; 1
Дискретное равномерное p (ξ = xi ) = Величина с равновероятными значениями
i = 1, 2, . . . , n n
B (1, p) — Бернулли ξ = 0, 1 p (ξ = 0) = 1 − p, p (ξ = 1) = p Число успехов в одном испытании

p (ξ = m) = CNm pm (1 − p)N −m .
Число успехов в N испытаниях, проводи-
B (N, p) — Биномиальное ξ = 0, 1, . . . , N
m = 0, 1, . . . , N ; N ∈ N; мых по схеме Бернулли
0<p<1

λm e−λ Число маловероятных успехов в бесконеч-


Pλ — Пуассона ξ = 0, 1, . . . p (ξ = m) = pλ (m) = , ном ряду испытаний (λ — среднее число

164
m!
λ>0 успехов)

p (ξ = m) = pM, N (m, n); Из совокупности N предметов, среди кото-


рых M предметов первого вида и (N − M )
m n−m
GG (N, M, n) — CM CN −M предметов второго вида, производят выбор-
ξ = 0, 1, . . . , min (M, n) pM, N (m, n) = ,
Гипергеометрическое CNn ку без возвращения n предметов, где
1 6 n 6 N . Случайная величина — число
n 6 N, m6M предметов первого вида в выборке

Gp — Геометрическое ξ = 0, 1, . . . p (ξ = m) = p(1 − p)m , Число неудач до первого успеха


0<p<1

B (r, p) — Отрицательное m
ξ = 0, 1, . . . p (ξ = m) = Cr+m−1 pr (1 − p)m , Если r ∈ Z, то m — число неудач до r-го
биномиальное (Паскаля) успеха
m = 0, 1, . . . ; r > 0; 0 < p < 1
Таблица 6. Некоторые важные непрерывные распределения

Обозначение Параметры Плотность распределения



/ [a, b],
0 при x ∈
R [a, b] — Равномерное a<b
1/(b − a) при x ∈ [a, b]
N (a, a, σ>0 n o
 σ) — Нормальное  1 (x−a)2
N (0, 1) — стандартное нормальное распределение, √ · exp − 2σ2 = ϕa, σ (x)
причем fξ (x) = ϕ (x), Fξ (x) = Φ (x) σ 2π

0 при x < 0,
Eλ — Показательное (экспоненциальное) λ>0 −λx
λe при x > 0
1 λ
Ca, λ — Коши a > 0, λ>0 · 2
π λ + (x − a)2

0 при x < 0
Γα, β — Γ-распределение α > 0, β>0

165
Γ−1 (β)αβ xβ−1 e−αx при x > 0
2
g 0 (x) n o
Кэптейна a, σ>0 √ exp − (g (x)−a) 2σ 2
σ 2π
1 n o
Логарифмически нормальное x−a)2
a, σ>0 √ exp − (ln 2σ 2 , x>0
[частный случай распределения Кэптейна при g (x) = ln x] σ 2πx
λ
Лапласа λ>0 exp {−λ|x − α|}
2

0 при x < 1,
Парето p>0 −(p+1)
px при x > 1.
n o
x−α
1 exp − β
Логистическое β>0 · n o2
β
1 + exp − x−αβ
Таблица 7. Матем. ожидания и дисперсии некоторых важных распределений

Распределение Mξ Dξ

Бернулли B (1, p) p q

Биномиальное B (N, p) Np N pq

Пуассона Pλ λ λ

M nM (N − M )(N − n)
Гипергеометрическое Gm, n (M, N ) n
N N 2 (N − 1)

q q
Геометрическое Gp
p p2

rq rq
Паскаля19 B (r, p)
p p2

Равномерное R[a, b]
a+b (b − a)2
2 12

Нормальное N (a, σ) a σ2

1 1
Показательное Eλ
λ λ2

Коши Ca, λ не ∃ не ∃

β β
Γ (Гамма) Γα, β
α α2

2
Лапласа α
λ2

166
Таблица 8. Греческий алфавит

Буква Название
A α альфа
B β бета
Γ γ гамма
∆ δ дельта
E ε эпсилон
Z ζ дзета
H η эта
Θ ϑ тета
I ι йота
K κ каппа
Λ λ лямбда
M µ мю
N ν ню
Ξ ξ кси
O o омикрон
Π π пи
P ρ ро
Σ σ сигма
T τ тау
Υ υ ипсилон
Φ ϕ фи
X χ хи
Ψ ψ пси
Ω ω омега

167
Таблица 9. Таблица случайных чисел

5686 4215 5470 4452 4841 0477 9567 7496 1297 3594 1020 3531 4296
3106 9375 4545 0447 0754 6377 1127 7126 1021 4070 4488 2365 9633
9359 1271 7562 0122 8112 4863 1022 0731 8446 2302 8433 3299 5987
2057 0762 1429 8535 9029 9745 3458 5023 3502 2436 6435 2646 0295
6177 2755 3080 3275 0521 6623 1133 3278 0500 7573 7426 3188 0187
7707 3047 4901 3519 7888 6411 1631 6981 1972 4269 0022 3860 1580
6751 4022 6540 7804 5528 4690 3586 9839 6641 0404 0735 0888 3504
2651 9051 5764 7155 6489 2660 3341 8784 0605 4640 8692 7712 9832
6607 0480 2557 3461 9755 4398 8857 0221 3844 1823 4407 5914 7545
2362 2428 7899 2623 9965 7366 0486 8185 5896 3985 3105 7210 5375
2213 8481 0919 2350 7310 7106 0046 1683 6269 1120 5436 8921 6457
8361 9849 9902 4244 2377 9213 4625 5978 5266 7521 8488 6854 9203
2598 2673 2399 5112 4318 5003 3532 6430 5679 5041 2108 1813 4235
3915 9380 3918 5957 3603 6553 6247 8907 5282 1106 9223 5629 6982
4138 2901 7592 1650 2580 5676 6470 0122 0820 2140 5291 8499 3653

168
1727 0453 3032 2902 4114 2462 2820 0414 7197 3854 2940 3500 8685
6131 0774 7788 5011 4971 0848 0748 7103 3262 5182 1185 1493 3425
0114 4662 0802 1125 8745 5513 9750 0695 5727 7577 8631 0759 5430
9953 1426 0405 2109 2304 5329 2475 8555 8172 1376 3459 6778 6917
0159 9635 7058 4886 2373 5937 9383 5763 8004 8602 2457 9134 0099
2200 2369 8140 4865 4874 4867 5206 0434 3845 0659 0499 3671 2771
2104 9275 2118 8024 1033 0528 3665 9721 6339 3377 3780 0366 4746
Список литературы
[1] Булдык, Г. М. Теория вероятностей и математическая статистика: Учебное посо-
бие. — /Г. М. Булдык. — Минск: Вышейш. шк., 1989.

[2] Вентцель, Е. С. Теория вероятностей: Учебное пособие. — Изд. 6-е, перераб. и доп.
/ Е. С. Вентцель, Л. А. Овчаров. — М.: Наука. Гл. ред. физ.-мат. лит., 1969.

[3] Володин, Б. Г. Сборник задач по теории вероятностей, математической стати-


стике и теории случайных функций. Учебное пособие. / Б. Г. Володин, М. П. Ганин,
И. Я. Динер, Л. Б. Комаров, А. А. Свешников, К. Б. Старобин; под ред. А. А. Свешни-
кова. — М.: Наука. Гл. ред. физ.-мат. лит., 1970.

[4] Емельянов, Г. В. Задачник по теории вероятностей и математической статистике:


Учебное пособие. / Г. В. Емельянов, В. П. Скитович. — Ленинград: Изд-во Ленинград-
ского университета, 1967.

[5] Гнеденко, Б. В. Курс теории вероятностей: Учебник. — Изд. 6-е, перераб. и доп. /
Б. В. Гнеденко. — М.: Наука. Гл. ред. физ.-мат. лит., 1988.

[6] Кибзун, А. И. Теория вероятностей и математическая статистика. Базовый курс


с примерами и задачами: Учебное пособие. / А. И. Кибзун, Е. Р. Горяинова, А. В.
Наумов, А. Н. Сиротин. — М.: ФИЗМАТЛИТ, 2002.

[7] Колемаев, В. А. Теория вероятностей и математическая статистика: Учебное посо-


бие. —/В. А. Колемаев, В. Н. Калинина. — М.: ИНФРА-М, 2000.

[8] Козлов, М. В. Элементы теории вероятностей в примерах и задачах: Учебное по-


собие. / М. В. Козлов. — М.: Изд-во МГУ, 1990.

[9] Крупкина, Т. В. Теория вероятностей, математическая статистика и эконометри-


ка: Учеб. пособие. В 2-х кн. Кн. 1. / Т. В. Крупкина, А. К. Гречкосеев. — Красноярск:
Красноярский гос. ун-т, 1999.

[10] Крупкина, Т. В. Теория вероятностей и математическая статистика: Учеб. посо-


бие. В 2-х ч. Ч. 1. / Т. В. Крупкина, В. П. Малый. — Красноярск: Красноярский гос.
ун-т, 1991.

[11] Пугачев, В. С. Теория вероятностей и математическая статистика: Учебное по-


собие. / В. С. Пугачев. — М.: ФИЗМАТЛИТ, 2002.

[12] Феллер, В. Введение в теорию вероятностей и ее приложения: Учебник. — Изд.


2-е, перераб. и доп. В 2-х т. Т. 1. / Вильям Феллер. — М.: Мир, 1964.

169
Учебное издание

Татьяна Валерьевна КРУПКИНА


Антон Игоревич ПЫЖЕВ
Сергей Валерьевич БАБЕНЫШЕВ
Екатерина Сергеевна КИРИК

ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В ПРИМЕРАХ И


ЗАДАЧАХ

Учебное пособие

Редактор — А. А. Назимова
Корректор — Т. Е. Бастрыгина
Лицензия ЛР № 020372 от 29.01.1997

Печать офсетная. Подписано в печать 00.00.07. Формат 60 × 84 / 16.


Бумага типографская. Гарнитура литературная.
Усл. печ. л. 0,0. Уч.-изд. л. 0,0. Тираж 000 экз.
Заказ № 0000.
Цена договорная.

Издательский центр Института естественных и гуманитарных наук Сибирского


федерального университета.
660041 Красноярск, пр. Свободный, 79.
Модуль 2 Основы эконометрики
Тема 2.1 Методологические основы курса

Семинар 2.1.1. Расчет основных описательных статистик.


Знакомство с пакетом STATISTICA.

Задача 1 «Стоимость жилья»


В результате обследования 20 квартир, получены следующие
данные:
Таблица 1
Характеристики и цена на 1-комнатные квартиры
№ Общая Жилая Кухня Цена, у.е. ,
площадь, площадь, м , площадь, м2 ,
2

м2, Х1 Х2 Х3 Y
1 30 17,8 6,7 65
2 32,3 12,3 9 57
3 32 17 7 55
4 29 13 7 50
5 38 20 9 70
6 39 19 6 65
7 29 15 6 55
8 32 18,8 6 58
9 33 15,5 6 50
10 31,6 18,7 5,8 70
11 34 18 6 68
12 35,4 17,5 9,2 80
13 30 18 7 70
14 21,1 16,9 5,5 80
15 29 16 6 58
16 29 16 6 57
17 30 18 6 65
18 33 19 8 52
19 32 21 6 45
20 29 18 6 62
Задания:
1. Подумайте, какой из представленных показателей наиболее
существенно влияет на цену? Какие, важные по Вашему мнению,
факторы остались без внимания исследователя?
2. Рассчитайте основные описательные статистики для первых
десяти наблюдений Y: среднюю, дисперсию, среднеквадратическое

1
отклонение, коэффициент вариации, коэффициент ассиметрии,
коэффициент эксцесса.
3. Сделайте выводы об однородности выборки и о близости ее к
нормальному закону распределения.

Задания для самостоятельной работы


Упражнения
1. Задан ряд наблюдений за переменной Х=(3;0;4;2;1).
Подсчитать основные статистики данного ряда: среднее
арифметическое, медиану, моду, дисперсию, показатель асимметрии и
эксцесса, размах вариации выборки.
2. Мода больше медианы. Где лежит среднее?
3. Утверждается, что среди всех характеристик центра
распределения средняя арифметическая является той точкой, сумма
квадратов отклонения которой от элементов совокупности
минимальна. Обоснуйте данное утверждение.

Семинар 2.1.2
Работа в пакете STATISTICA. Визуализация данных.
Определение степени однородности выборки. Проверка данных
на близость к нормальному закону распределения. Построение
корреляционной матрицы

Задача 2
По данным задачи 1 «Стоимость жилья».(семинар 2.1.1):
Задания для работы в пакете STATISTICA:
1. создайте новый файл;
2. введите данные;
3. рассчитайте основные описательные статистики,
4. использование графического редактора для построения
гистограмм и функций распределения данных.
5. Визуализация данных. Определение степени
однородности выборки. Проверка данных на близость к нормальному
закону распределения.
6. Построение поля корреляции.
7. Построение корреляционной матрицы.

Задача 3.
По приведенным ниже данным вычислите оценку парного
линейного коэффициента корреляции между переменными X и Y.

2
10 10 10 10 10
∑ xi = 9; ∑ xi2 = 908;
i =1 i =1
∑ yi = 68,
i =1
∑x y
i =1
i i = 664. ∑ y i2 = 496.
i =1

Задача 4.
По результатам обследования n = 8 промышленных
предприятий получена следующая информация ( X 1 — себестоимость
продукции, X 2 — объем выработки, X 3 — фондоотдача.):
Таблица 2
X1 30 20 40 35 45 25 50 30
X2 20 30 50 70 80 20 90 25
X3 20 25 20 15 10 30 10 20
Определите:
1. значения средних квадратических отклонений ( S х ), где j= 1, j

2, 3;
2. значения парных коэффициентов корреляции r12 , r13 и r23 .
Генеральная совокупность, предполагается нормально
распределенной.

Задания для самостоятельной работы.

Задача 5.
По данным n=10 машиностроительных предприятий, методами
корреляционного анализа исследуется взаимосвязь между
следующими показателями:
Х1 — рентабельность (%);
Х2 — премии и вознаграждения на одного работника;
Х3 — фондоотдача.
Таблица 3
№ п/п Х1 Х2 Х3
1 13,26 1,23 1,45
2 10,16 1,04 1,30
3 13,72 1,80 1,37
4 12,82 0,43 1,65
5 10,63 0,88 1,91
6 9,12 0,57 1,68
7 25,83 1,72 1,94
8 23,39 1,70 1,89
9 14,68 0,84 1,94
10 10,05 0,60 2,06
Постройте матрицу выборочных парных линейных
коэффициентов корреляции.

3
Задача 6
Ниже приведены данные о количестве потребляемого пива(Q) и
ценах на этот продукт(P).
Таблица 4
год 1 2 3 4 5 6 7 8 9 10
Q 34.4 35.8 36.7 38.3 39.1 40.1 40.7 40.3 41.4 41.7
P 90.6 85.3 81.8 78.9 73.9 74.3 71.5 68.4 66.4 65.9
Задания:
1. Вычислите среднюю, дисперсию для каждого ряда,
ковариацию и коэффициент корреляции между ними.
2. Сделайте выводы о характере и тесноте связи.

Тема 2.2 Корреляционный анализ

Семинар 2.2.1.
Работа в пакете STATISTICA.
Анализ адекватности корреляционных связей.
Формирование более однородной выборки.
Оценка адекватности результатов по скорректированной
выборке. Формирование отчета в программе Excel

Задача 7 «Успеваемость»
Провести анализ корреляционных связей между успеваемостью
студента в средней школе и его успеваемостью в высшей школе.
В группе проводится сбор информации по каждому студенту:
Х1 — средний балл успеваемости по школьному аттестату;
Х2 — сумма набранных баллов при поступлении в университет;
Х3 — средний балл успеваемости за первый курс;
Х4 – пол студента (мужской – 0, женский – 1)
Х5 – тип среднеобразовательного учебного заведения, которое
окончил студент ( школа – 0, гимназия – 1)

Работа в пакете STATISTICA:


1. ввод данных;
2. визуализация данных;
3. построение корреляционной матрицы, анализ
адекватности корреляционных связей.
4. Корректировка данных: формирование более однородной
выборки.
5. Оценка адекватности результатов по скорректированной
выборке.
6. Формирование отчета в программе Excel.

4
Задания для самостоятельной работы.

Задача 8.
Исследуйте взаимосвязи между средним душевым доходом,
индексом человеческого развития и индексом человеческой бедности.
Имеются следующие данные:
Таблица 5
Страна Душевой Индекс Индекс
доход*, человеческого человеческой
долл., развития (ИЧР), бедности (ИЧБ),
у х1 х2
ОАЭ 1600 0,866 14,9
Таиланд 7100 0,833 11,7
Уругвай 6750 0,883 11,7
Ливия 6130 0,801 18,8
Колумбия 6110 0,848 10,7
Иордания 4190 0,730 10,9
Египет 3850 0,514 34,8
Марокко 3680 0,566 41,7
Перу 3650 0,717 22,8
Шри-Ланка 3280 0,711 20,7
Филиппины 2680 0,672 17,7
Боливия 2600 0,589 22,5
Китай 2600 0,626 17,5
Зимбабве 2200 0,513 17,3
Пакистан 2150 0,445 46,8
Уганда 1370 0,328 41,3
Нигерия 1350 0,393 41,6
Индия 1350 0,446 36,7
* По паритету покупательной способности валют

5
Задания:
1. Проведите визуализацию данных. Сделайте заключение об
однородности и близости выборки к нормальному распределению.
2. Постройте поля корреляций Y, X1 и Y, X2.
Сформулируйте гипотезу о форме связи.
3. Постройте корреляционную матрицу, дайте анализ связям.

Семинар 2.2.2.
Проверка статистической значимости парного коэффициента
корреляции. Построение корреляционной матрицы с расчетными
уровнями значимости. Выполнение расчетно-графического задания
(РГЗ) №1: п. I.,п. II.

Задача 9
По данным n=10 машиностроительных предприятий, методами
корреляционного анализа исследуется взаимосвязь между
следующими показателями:
Х1 — рентабельность (%);
Х2 — премии и вознаграждения на одного работника;
Х3 — фондоотдача.
Таблица 6
№ п/п Х1 Х2 Х3
1 13,26 1,23 1,45
2 10,16 1,04 1,30
3 13,72 1,80 1,37
4 12,82 0,43 1,65
5 10,63 0,88 1,91
6 9,12 0,57 1,68
7 25,83 1,72 1,94
8 23,39 1,70 1,89
9 14,68 0,84 1,94
10 10,05 0,60 2,06
Задания:
1. Проверьте при α=0,05 значимость парного коэффициента
корреляции ρ12 ;
2. найдите его интервальную оценку с доверительной
вероятностью γ=0,95.

Задача 10.

6
Ниже приведены данные об объемах продаж Кока-колы (Q) и
ценах на этот продукт (P).

Таблица 7
год 1 2 3 4 5 6 7 8 9 10
Q 34.4 35.8 36.7 38.3 39.1 40.1 40.7 40.3 41.4 41.7
P 90.6 85.3 81.8 78.9 73.9 74.3 71.5 68.4 66.4 65.9
Определите, начиная с какого уровня значимости можно
утверждать, что связь между ценой и количеством потребляемой
Кока-колы существует?

Задача 11
По данным задачи 1 «Стоимость жилья» (семинар 2.1.1):
1. Подумайте, какой из представленных показателей
наиболее существенно влияет на цену?
2. Какие, важные по Вашему мнению, факторы остались без
внимания исследователя?
3. Постройте корреляционную матрицу.
4. Проанализируйте корреляционные связи. Оправдались ли
Ваши ожидания (п.1)?

Задача 12
По данным задачи 7 «Успеваемость» (семинар 2.2.1).
1. Проверьте значимость коэффициентов корреляции на
уровнях: 1% ,5% ,10%.
2. Постройте корреляционную матрицу с расчетными
уровнями значимости, используя пакет STATISTICA.
3. Отчета сформируйте в программе Excel.

Выполнение расчетно-графического задания (РГЗ) №1:


п. I.,п. II.

Расчетно-графическое задание №1.

Содержание работы:

I. Визуализация данных.
1.1. Постройте диаграмму рассеивания для исследуемого
показателя (Y).
1.2. Проверьте исходные данные на близость к нормальному
закону распределения. Постройте гистограмму (Y) и график (Y) на
нормальной вероятностной бумаге.

II. Корреляционный анализ.

7
2.1. Постройте поля корреляций показателя (Y) с каждым из
факторов Хj . Сделайте предположение о характере связи между
показателями.
2.2. Постройте корреляционную матрицу, определите уровни
значимости коэффициентов корреляции.
2.3. Выделите факторы, оказывающие значимое (на уровне
≤0,05) влияние на результирующий показатель (Y).
2.4. Проанализируйте наличие мультиколлинеарности между
объясняющими переменными.
2.5. Дайте экономическую интерпретацию корреляционным
связям.

III. Регрессионный анализ.


3.1. Постройте парное линейное регрессионное уравнение.
Отбор фактора обоснуйте с помощью корреляционной матрицы.
3.1. 1. Приведите в отчете полученную модель.
Охарактеризуйте её качество, используя критерии Фишера и
Стьюдента, R2, R2adj .
3.1. 2. Приведите графики остатков в зависимости от
объясняющей переменной, а также графики остатков на нормальной
вероятностной бумаге. Проанализируйте выполнение условий Гаусса-
Маркова.
3.2. Постройте адекватное нелинейное регрессионное
уравнение. Отбор факторов осуществите с помощью пошаговых
процедур.
3.2. 1. Приведите в отчете полученную модель.
Охарактеризуйте её качество, используя критерии Фишера и
Стьюдента, , R2, R2adj .
3.2. 2. Приведите графики остатков в зависимости от
объясняющей переменной, а также графики остатков на нормальной
вероятностной бумаге. Проанализируйте выполнение условий Гаусса-
Маркова.

IV.Экономическая интерпретация полученных результатов.


4.1. Рассчитайте коэффициенты эластичности факторов,
входящих в модели линейно.
4.2. Дайте экономическую интерпретацию соответствующих
линейных коэффициентов регрессии.

Таблица 8

пп У1 У2 У3 Х4 Х5 Х6 Х7 Х8 Х9
1 9,26 204,2 13,26 0,23 0,78 0,4 1,37 1,23 0,23
2 9,38 209,6 10,16 0,34 0,75 0,26 1,49 1,04 0,39

8
12,1
3 1 222,6 13,72 0,19 0,68 0,4 1,44 1,8 0,43
10,8
4 1 236,7 12,85 0,17 0,7 0,5 1,42 0,43 0,18
5 9,35 62 10,63 0,23 0,62 0,4 1,35 0,88 0,15
6 9,87 53,1 9,12 0,43 0,76 0,19 1,39 0,57 0,34
7 8,17 172,1 25,83 0,31 0,73 0,25 1,16 1,72 0,38
8 9,12 56,5 23,39 0,26 0,71 0,44 1,27 1,7 0,09
9 5,88 52,6 14,68 0,49 0,69 0,17 1,16 0,84 0,14
10 6,3 46,6 10,05 0,36 0,73 0,39 1,25 0,6 0,21
11 6,22 53,2 13,99 0,37 0,68 0,33 1,13 0,82 0,42
12 5,49 30,1 9,68 0,43 0,74 0,25 1,1 0,84 0,05
13 6,5 146,4 10,03 0,35 0,66 0,32 1,15 0,67 0,29
14 6,61 18,1 9,13 0,38 0,72 0,02 1,23 1,04 0,48
15 4,32 13,6 5,37 0,42 0,68 0,06 1,39 0,66 0,41
16 7,37 89,8 9,86 0,3 0,77 0,15 1,38 0,86 0,62
17 7,02 62,5 12,62 0,32 0,78 0,08 1,35 0,79 0,56
18 8,25 46,3 5,02 0,25 0,78 0,2 1,42 0,34 1,76
19 8,15 103,5 21,18 0,31 0,81 0,2 1,37 1,6 1,31
20 8,72 73,3 25,17 0,26 0,79 0,3 1,41 1,46 0,45

п/п Х10 Х11 Х12 Х13 Х14 Х15 Х16 Х17
2600 167,6
1 1,45 6 9 47750 6,4 166,32 10,08 17,72
2393
2 1,3 5 186,1 50391 7,8 92,88 14,76 18,39
2258 220,4
3 1,37 9 5 43149 9,76 158,04 6,48 26,46
2122
4 1,65 0 169,3 41089 7,9 93,96 21,96 22,37
5 1,91 7394 39,53 14257 5,35 173,88 11,88 28,13
1158
6 1,68 6 40,41 22661 9,9 162,3 12,6 17,55
2660 102,9
7 1,94 9 6 52509 4,5 88,56 11,52 21,92
8 1,89 7801 37,02 14903 4,88 101,16 8,28 19,52
1158
9 1,94 7 45,74 25587 3,46 166,32 11,52 23,99
10 2,06 9475 40,07 16821 3,6 140,76 32,4 21,76
1081
11 1,96 1 45,44 19459 3,56 128,52 11,52 25,68
12 1,02 6371 41,08 12973 5,65 177,84 17,28 18,13
13 1,85 2676 136,1 50907 4,28 114,48 16,2 25,74

9
1 4
14 0,88 4210 42,39 6920 8,85 93,24 13,32 21,21
15 0,62 3557 37,39 5736 8,52 126,72 17,28 22,97
1414 101,7
16 1,09 8 8 26705 7,19 91,8 9,72 16,38
17 1,6 9872 47,55 20068 4,82 69,12 16,2 13,21
18 1,53 5975 32,61 11487 5,46 66,24 24,84 14,48
1666 103,2
19 1,4 2 5 32029 6,2 67,68 14,76 13,38
20 2,22 9166 38,95 18946 4,25 50,4 7,56 13,69

У1 — производительность труда
У2 — индекс снижения себестоимости продукции
У3— рентабельность
Х4 — трудоемкость единицы продукции
Х5 — удельный вес рабочих в составе промышленно-
производственного персонала
Х6 — удельный вес покупных изделий
Х7 — коэффициент сменности оборудования
Х8 — премии и вознаграждения на одного работника
Х9 — удельный вес потерь от брака
Х10 — фондоотдача
Х11 — среднгодовая численность промышленно-
производственного персонала
Х12 — среднегодовая стоимость основных производственных
фондов
Х13 — среднегодовой фонд заработной платы промышленно-
производственного персонала
Х14 — фондовооруженность труда
Х15 — оборачиваемость нормируемых оборотных средств
Х16 — оборачиваемость ненормируемых оборотных средств
Х17 — непроизводственные расходы

Задания для самостоятельной работы.

Задача 13. При приеме на работу семи кандидатам было


предложено два теста. Результаты тестирования приведены в таблице:
Таблица 9
Тест Результаты тестирования кандидатов (в
баллах)
1-й 2-й 3-й 4-й 5-й 6-й 7-й

10
1 31 82 25 26 53 30 29
2 21 55 8 27 32 42 26
1. Вычислить коэффициент ранговой корреляции Спирмена
между результатами тестирования по двум тестам.
2. На уровне α=0,05 оценить его значимость.

Задача 14.
По данным n=15 предприятий, каждое из которых
характеризуется по трем показателям: х1 – объем сменной выработки,
х2 – себестоимость продукции и х3 – фондоотдача; получена матрица
парных коэффициентов корреляции:

⎡ 1 −0, 6 0,8 ⎤
R = ⎢ −0, 6 1 −0, 6 ⎥⎥

⎢⎣ 0,8 −0, 6 1 ⎥⎦
1. Определите оценку частного коэффициента корреляции
r23.1.
2. Проверьте при α=0,05 значимость частного
коэффициента корреляции r23.1.
3. Найдите точечную оценку множественного
коэффициента корреляции, характеризующего тесноту связи между
себестоимостью и остальными переменными.
4. При α=0,05 проверить значимость множественного
коэффициента корреляции r2.13.
5. Определите, какая доля дисперсии х2 объясняется
влиянием показателей х1 и х3.

Тема 2.3 Модели и методы регрессионного анализа

Семинар 2.3.1. Парная линейная регрессионная модель.

Пример 1
Покажите, что b 1 = r X Y *S Y /S X , где r X Y — выборочный
коэффициент корреляции между X и Y, а S Y , S X —
стандартные отклонения Y и X соответственно.

Пример 2
Для наблюдений:
Таблица 10

11
Y X
2 1
5 3
3 2
4 3
6 4
Вычислите следующие величины:
1. коэффициент детерминации R 2 в регрессии Y t на X t
при наличии свободного члена;
2. коэффициент детерминации R 2 в регрессии Y t на X t
при отсутствии свободного члена;
3. коэффициент детерминации R 2 в регрессии y t на x t
при наличии свободного члена, где y t и x t — отклонения
переменных Y t и X t от их средних значений;
4. коэффициент детерминации R 2 в регрессии y t на x t
при отсутствии свободного члена.

Пример 3.
Рассмотрим модель регрессии на константу
Y t = β 0 + ε t . t = 1,…,n.
1. Найдите оценки метода наименьших квадратов для β 0
2
и σ (дисперсии ошибок).
2. Чему равен коэффициент детерминации R 2 ?

Пример 4.
Рассмотрим модель регрессии без константы
Y t = β 1 *Y t + ε t . , t = 1,…,n.
Формула для МНК-оценки в регрессии без константы:
∑ X tYt
b1 =
∑ X t2
Приведите примеры данных, для которых:
1. значение коэффициента R 2 , рассчитанное по формуле
R 2 = RSS/TSS, отличается от значения R 2 , рассчитанного по
формуле R 2 = 1 — ESS/TSS;
2. значение коэффициента R 2 , рассчитанное по формуле
R 2 = RSS/TSS, больше 1;
3. значение R 2 , рассчитанное по формуле R 2 = 1 —
ESS/TSS, меньше 0.

Пример 5.

12
Исследуйте зависимость между производительностью труда
одного занятого Y и фондом оплаты труда X по n = 10 косметическим
салонам.
Таблица 11
№ 1 2 3 4 5 6 7 8 9 10
п/п
X 8 11 12 9 8 8 9 9 8 12
Y 5 10 10 7 5 6 6 5 6 8

Пример 6.
По данным примера 5 оцените производительность труда
одного занятого для салонов с фондом оплаты труда 8 (у.е);

Пример 7
Наблюдения 5 пар (X,Y) дали следующие результаты:

∑Y 2 = 90; ∑Х 2 = 39, ∑ХY = 59,


∑Y = 20, ∑Х = 13

Оцените регрессию Y t = β 0 + β 1 *X t + ε t .

Пример 8.
По приведенным ниже данным:
n = 12 Χ = 200
∑X = 2400 Υ = 173,92
∑Y = 2087 ∑Y 2 = 364741
∑X 2 = 483236 ∑XY = 419782
Вычислите парную регрессию Y на Х

Пример 9.
По данным годовых отчетов, десяти (n=10)
машиностроительных предприятий, оцените линейную
регрессионную модель зависимости производительности труда Y
(млн. руб. на чел.), от объёма производства X (млрд. руб.): Y = β0 +
β1X + ε.
Таблица 12
Nп/п (i) Y X
1 2,1 3
2 2,8 4
3 3,2 5
4 4,5 5
5 4,8 5
6 4,9 5

13
7 5,5 6
8 6,5 7
9 12,1 15
10 15,1 20

Задача 15 «Производительность».
Имеются следующие данные:
Таблица 13
№ п/п Фонд оплаты труда (Х) Производительность труда (Y)
1 1 1,6
2 3 2,4
3 6 2,8
4 8 3,2
Задания:
1. Найдите точечную оценку условного
математического ожидания производительности труда при
фонде оплаты труда равном 10, если генеральное уравнение
регрессии — линейное.
2. Проверьте значимость генерального коэффициента
корреляции ρХУ на уровнях 1%, 5%, 10%.
3. Проверьте качество уравнения регрессии с
помощью:
• Средней ошибки аппроксимации;
• Стандартной ошибки регрессии;
• Коэффициента детерминации.
4. Сформулировать задачу, обратную данной ( Х —
результирующий показатель, У — объясняющая переменная).
5. Выполнить п. 2-3 для обратной задачи. Какие
статистики в прямой и обратной задачах совпадают, а какие
разные?

Работа в пакете STATISTICA:

Задача 16
По данным задачи 15 «Производительность» выполните:
1. Ввод данных;
2. Расчеты в модуле Multiple Regression.
3. Анализ таблиц: Regression Summary, ANOVA.
4. Анализ таблиц: Regression Summary, ANOVA в
задачи, обратной к задаче «Производительность».
5. Отчет в программе Excel.

14
Задача 17
По данным задачи 7 «Успеваемость» (семинаре 2.2.1):
1. Постройте регрессионную модель зависимости
среднего балла успеваемости студента за первый курс (Х3) от
среднего балла по аттестату (Х1).
2. Проведите анализ качества уравнения.

Задача 18
По данным задачи 1 «Стоимость жилья» (семинар 2.1.1).
1. Постройте регрессионную модель зависимости
стоимости квартиры (У) от размера жилой площади (Х2).
2. Проведите анализ качества уравнения.

Задания для самостоятельной работы.

Упражнения.

1. Построить уравнения прямой, обратной и


ортогональной регрессии:
а) Х: 1 2 3 Y: 1 0 5
б) Х: 0 2 0 2 Y: 0 0 2 2
в) Х: 0 1 1 2 Y: 1 0 2 1
г) Х: 0 2 0 2 0 Y: 0 0 2 2 2
д) Х: 0 3 0 3 Y: 0 0 2 2
е) Х: 1 2 5 7 Y: 5 7 1 3 1 7
2. Пусть в наблюдениях упражнения №1 единицы
измерения Y уменьшились в 10 раз. Как изменятся уравнения
прямой и обратной регрессии?
3. Могут ли матрицы:
⎡ 2 3⎤ ⎡4 3⎤
а) ⎢ ⎥ ; б) ⎢2 3⎥
⎣ 3 4⎦ ⎣ ⎦
являться ковариационными матрицами переменных, для
которых строятся уравнения регрессии? Ответ обоснуйте.

4. Дисперсии двух переменных совпадают, корреляция


отсутствует. Изобразить на графике — в пространстве
переменных — линии прямой, обратной и ортогональной
регрессий. Ответ обосновать.
5. Дисперсии выпуска продукции и количества
занятых по предприятиям равны 10 и 20, их ковариация равна 12.
чему равен коэффициент детерминации в регрессии выпуска по
занятым, коэффициент зависимости выпуска от занятых по
прямой, обратной регрессии.

15
6. Дисперсии временных рядов индекса денежной
массы и сводного индекса цен равны 150 и 200, их ковариация
равна 100. Чему равен параметр влияния денежной массы на
цены по модели прямой регрессии и доля объясненной дисперсии
в дисперсии индекса цен?
7. По заданной матрице ковариации двух переменных
⎡14 / 3 5 / 3⎤
⎢ 5 / 3 2 / 3⎥ найти остаточную дисперсию уравнения регрессии
⎣ ⎦
первой переменной по второй.
8. В регрессионной модели Y = b0 + b1X + e, где Y = (5,
3, 7, 1) получены оценки b1 = 2, b0 = 1, а коэффициент
детерминации оказался равным 100%. Найдите X.
9. В регрессии Y = b0 + b1X + e, где Y = (5, 3, 7, 1)
коэффициент детерминации оказался равным 50%. Найдите
сумму квадратов остатков Σ еi² .
10. Две регрессии построены на одних и тех же данных:
Y = aX + b, X = cY + d. Т — коэффициент детерминации в
первой регрессии, S — во второй. Напишите соотношение между
Т и S.
11. Возможна ли ситуация, когда угловые
коэффициенты в уравнениях прямой и обратной регрессии
соответственно равны 0,5 и 3,0. Почему?
12. Докажите, что линия ортогональной регрессии
находится между линиями прямой и обратной регрессии.
13. Какая из двух оценок коэффициента зависимости
выпуска продукции от количества занятых в производстве
больше другой: по прямой или ортогональной регрессии. Ответ
обосновать.
14. Какая из двух оценок коэффициента зависимости
спроса от цены больше другой: по прямой или ортогональной
регрессии. Ответ обосновать.
15. Оценка парной регрессии ведется в
стандартизированной шкале. Как связан коэффициент
детерминации и коэффициент регрессии (угловой)?
16. Какой вид будет иметь оценка уравнения регрессии
Y = β0 + β1 * Х + ε, если фактическое значение коэффициента
детерминации равно нулю, среднее значение у и х,
соответственно равны 1 и 3?
17. В модели Y = b0 + b1 * Х + e фактор Х равен (1, 3, 7,
1). Могут ли остатки быть равными (1, -2, 2, -1). Обосновать.
18. В модели Y = b0 + b1 * Х + e фактор Х равен (1, 3, 7,
2). Могут ли остатки быть равными (1, -2, 1, -1). Обосновать.
19. Оцените модель Y = b0 + b1 * Х + e используя
следующие данные:

16
Таблица 14
Y 3 1 8 3 5
X 3 1 5 2 4
Вычислите остатки (еt) и покажите, что:
а) Σ et = 0 б) Σ Хtet = 0
20. Что геометрически означает R2 = 0 и R2 = 1?
21. Докажите, что коэффициент детерминации не
зависит от выбора масштаба измерения переменных.

Задача 19. Имеются следующие данные об уровне механизации


работ Х (%) и производительности труда Y (т/ч) для 14 однотипных
предприятий:
Таблица 15
N 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Xi 32 30 36 40 41 47 56 54 60 55 61 67 69 76
Уi 20 24 28 30 31 33 34 37 38 40 41 43 45 48
Необходимо:
а) оценить тесноту и направление связи между переменными с
помощью линейного парного коэффициента корреляции;
б) оценить линейную модель У по X.

Задача 20. При исследовании корреляционной зависимости


между ценой на нефть X и индексом нефтяных компаний Y получены
следующие данные:
X = 16,2; Y = 4000 (усл. ед.); S x2 = 4; S y2 = 500;
Cov(X, Y)=40.
Необходимо:
а) построить линейное уравнение регрессии Y по X;
б) найти среднее значение индекса при цене на нефть 16,5 ден.
ед.

Задача 21.
На основании данных о темпе прироста (%) внутреннего
национального продукта (У) и промышленного производства (Х),
десяти развитых стран мира за 1992 г., приведенных в таблице и
предположения, что генеральное регрессии имеет вид:
Yˆ = β 0 + β 1 х.
Таблица 16
страны У Х
Япония 3,5 4,3
США 3,1 4,6
Германия 2,2 2,0

17
Франция 2,7 3,1
Италия 2,7 3,0
Великобритания 1,6 1,4
Канада 3,1 3,4
Австралия 1,8 2,6
Бельгия 2,3 2,6
Нидерланды 2,3 2,4
Требуется определить оценки вектора b и остаточной
дисперсии S ост 2 .

Задача 22.
1. В регрессии Χ = αΖ + β + ε матрица вторых начальных
моментов регрессоров равна
9
2
2
1
Найти матрицу вторых центральных моментов.

Семинар 2.3.2.
Проверка значимости уравнения регрессии. Проверка
значимости коэффициентов регрессии. Проверка выполнения
условий Гаусса — Маркова (предпосылок регрессионного
анализа).

Пример 10.
Наблюдения 5 пар (X,Y) дали следующие результаты:

∑Y 2 = 90; ∑Х 2 = 39, ∑ХY = 59,


∑Y = 20, ∑Х = 13

Используя результаты примера 7 из семинара 5,


проверьте гипотезу, что коэффициент β 1 (Y t = β 0 + β 1 *X t + ε t )
равен 1.

Пример 11.

18
По приведенным ниже данным и результатам примера 8
(семинар 5):
n = 12 Χ = 200
∑X = 2400 Υ = 173,92
∑Y = 2087 ∑Y 2 = 364741
∑X 2 = 483236 ∑XY = 419782
Вычислите S ост , S b , S b
2 2
0
2
1

Пример 12.
По условию и результатам примера 2 (семинар 6):
1. Проверьте на 5%-уровне значимость
коэффициентов β 0 и β 1 .
2. Вычислите коэффициент детерминации,
используя равенство
R = RSS/TSS и R 2 = 1 – ESS/TSS.
2

Пример 13.
По условию и результатам примера 9 (семинар 5) проведите
статистический анализ полученного уравнения регрессии:
1. Определите абсолютные и относительные ошибки
аппроксимации.
2. Проверьте значимость уравнения регрессии на 5%
уровне.
3. Проверьте значимость коэффициентов регрессии на
1%, 5%, 10% уровнях значимости.

Пример 14.
По следующим данным о производительности труда одного
занятого Y и фонде оплаты труда X по n = 10 косметическим салонам.
Таблица 17
№ п/п 1 2 3 4 5 6 7 8 9 10
X 8 11 12 9 8 8 9 9 8 12
Y 5 10 10 7 5 6 6 5 6 8
построено уравнение регрессии Y по X: yˆ = 2,75 + 1,016 x .
(Результаты примера 5, семинар 5)
1. Оцените на уровне α = 0,05 значимость
уравнения регрессии Y по X.
2. Найдите коэффициент детерминации и
поясните его смысл.

19
Задача 23
По результатам задачи 16 «Производительность» (семинар
2.3.1):
1. Проверить качество уравнения регрессии с
помощью:
• средней ошибки аппроксимации;
• коэффициента детерминации;
• стандартной ошибки регрессии.
2. Проверить значимость коэффициента
корреляции на 5% уровне.
3. Проверить значимость уравнения регрессии на
5% уровне.
4. Проверить значимость параметров уравнения
регрессии на 5% уровне.
5. Проверить выполнение условий Гаусса-
Маркова (в программе STATISTICA).
6. Постройте задачу, обратную данной.
7. Выполните пункты 1-5 для обратной задачи.

Выполнение РГЗ №1 (формулировка заданий и данные


приведены в семинаре 2.2.2) п. III, 3.1. (в программе
STATISTICA).

Задания для самостоятельного решения.

Задача 24
На основании данных о темпе прироста (%) внутреннего
национального продукта (У) и промышленного производства (Х),
десяти развитых стран мира за 1992 г., приведенных в таблице и
предположения, что генеральное регрессии имеет вид:
Y€ = β 0 + β1 х.
Таблица 18
страны У Х
Япония 3,5 4,3
США 3,1 4,6
Германия 2,2 2,0
Франция 2,7 3,1
Италия 2,7 3,0
Великобритания 1,6 1,4
Канада 3,1 3,4
Австралия 1,8 2,6
Бельгия 2,3 2,6

20
Нидерланды 2,3 2,4
Требуется:
а) определить оценки вектора b и остаточной дисперсии
S ост ;
2

б) при α =0,05 проверить значимость уравнения регрессии;


в) при α =0,05 проверить значимость коэффициентов
уравнения;

Задача 25 Четырёхфакторное уравнение регрессии оценено по


20 наблюдениям. В каком случае отношение оценки коэффициента
регрессии к её стандартной ошибке имеет распределение t-
Стьюдента? Сколько степеней свободы (в этом случае) имеет эта
статистика.

Задача 26 Оценки МНК в регрессии по 20-ти наблюдениям


равны (2, -1), а ковариационная матрица этих оценок равна
9
2
2
1
Найти статистики Стьюдента для этих коэффициентов.

Задача 27 В регрессии Χ = αΖ + β + ε переменная Ζ равна (1, 2,


3), сумма квадратов остатков равна 6. Найдите ковариационную
матрицу оценок параметров регрессии.

Задача 28 В регрессии Χ = αΖ + β + ε по 5-ти наблюдениям


коэффициент детерминации равен 0,5. Проверьте гипотезу Η 0 : α = 0 .

Задача 29 Оценка углового коэффициента регрессии равна 4, а


дисперсия этой оценки равна 4. Начиная с какого уровня коэффициент
значим, если 5%-я критическая граница равна 2.4, а 10%-я
критическая граница равна 1.9?

Задача 30. МНК-оценка параметра регрессии, полученная по 16


наблюдениям, равна 4, оценка его стандартной ошибки – 1. Можно ли
утверждать с вероятностью ошибки не более 5%, что истинное
значение параметра равно 5.93? Ответ обосновать.

Задача 31. По 5-ти наблюдениям построена линейная 2-х


факторная регрессия с константой. При этом коэффициент

21
детерминации равен 0.5. Чему равна F-статистика Фишера для
уравнения регрессии?

Семинар 2.3.3
Построение нелинейного регрессионного уравнения.
Проверка качества и адекватности нелинейного уравнения
регрессии. Проверка выполнения условий Гаусса — Маркова для
нелинейной регрессионной модели. Множественная
регрессионная модель.

Пример 15.
Могут ли следующие уравнения быть преобразованы в
уравнения, линейные по параметрам?

а) Y i = α * exp(βX i )*ε i ,

б) Y i = α * exp(-βX i ) + ε i ,

в) Y i = exp(α + βX i + ε i ),

г) Y i = α / (β - X i ) + ε i .
Обозначения α и β введены вместо традиционных β 0 и
β 1 соответственно.

Пример 16. Имеются данные (условные) о сменной добыче угля


на одного рабочего Y(т), мощности пласта Χ 1 (м) и уровне
механизации работ Χ 2 (%), характеризующие процесс добычи угля в
10 шахтах.
Таблица 19
i x i1 xi 2 yi i x i1 xi 2 yi
1 8 5 5 6 8 8 6
2 11 8 10 7 9 6 6
3 12 8 10 8 9 4 5
4 9 5 7 9 8 5 6
5 8 7 5 10 12 7 8
Предполагая, что между переменными Y, Χ 1 и Χ 2 существует
линейная корреляционная зависимость, найти ее аналитическое
выражение (уравнение регрессии Υ по Χ 1 и Χ 2 ).

22
Пример 17. По данным примера 2 оценить сменную добычу
угля на одного рабочего для шахт с мощностью пласта 8 м и уровнем
механизации работ 6%.

Пример 18.
По данным примера 2 определить множественный коэффициент
детерминации и проверить значимость полученного уравнения
регрессии Y по X 1 и X 2 на уровне
α =0,05.

Пример 19.
Регрессия зависимой переменной Y на три независимые
переменные на основе n = 30 наблюдений дала следующие
результаты:
Таблица 20
Ŷ= 25,1 + 1,2Х 1 + 1,0Х 2 - 0,50Х 3
Стандартные ошибки (2,1) (1,5) (1,3) (0,060)
Sbj
t-значения (11,9) ( ) ( ) ( )
95%-доверительные (±4,3) ( ) ( ) ( )
границы

A. Заполните пропуски.
B. Истинный или ложны следующие утверждения (
если ложны, исправьте их):
1. Оценка коэффициента при Х1 есть 1,2. Другие исследователи
могут собрать другие данные и построить другие оценки этого
коэффициента.
2. Распределение этих оценок сосредоточенно вокруг
истинного значения 1,2. Поэтому оценка называется несмещенной.
3. Если есть априорная уверенность в том, что Х1 не влияет на
Y, то представляется разумным отвергнуть нулевую гипотезу H0: β1 =
0 на 5%-уровне значимости.
4. Если есть априорная уверенность в том, что Х2 влияет на Y,
то представляется более разумным использовать оценку 1,0, чем
принимать нулевую гипотезу H0: β2 = 0.

Пример 20.

23
Бюджетное обследование 5 случайно выбранных семей
дало следующие результаты (в тыс.руб.):
Таблица 21
Семья Накоплен Доход, Имущест
ия, S Y во, W
1 3,0 40 60
2 6,0 55 36
3 5,0 45 36
4 3,5 30 15
5 1,5 30 90

1. Оцените регрессию S на Y и W.
2. Спрогнозируйте накопления семьи, имеющей
доход 40тыс.руб. и имущество стоимостью 25тыс.руб.
3. Предположим, что доход семьи возрос на
10тыс.руб., в то время как стоимость имущества не
изменилась. Оцените, как возрастут её накопления.
4. Оцените, как возрастут накопления семьи,
если её доход вырос на 5тыс. руб., а стоимость
имущества увеличилась на 15тыс.руб.
5. Найдите сумму квадратов остатков и
постройте оценку дисперсии регрессии.

Пример 21.
Рассмотрим регрессию S t = β 1 + β 2 y t + β 3 ω t + ε t из
предыдущего примера
А) Постройте 95%-доверительный интервал для
1. β2;
2. β3;
Б) Проверьте с 5%-уровнем значимости следующие
гипотезы:
1. β 3 = 0 (стоимость имущества несущественна);
2. β 2 = 0 (величина дохода несущественна);
3. β 2 = 1 (таким мог быть ответ вашего коллеги
на вопрос о зависимости накопления от дохода).
4. β 2 = 1.57 (такое значение коэффициента β 2
могло быть с высокой степенью надежности
установлено для другой стороны, и вас интересует
вопрос, верно ли это для вашей страны).
В) Пусть некоторая семья имеет доход Y = 30тыс.руб. и
имущество стоимостью V = 52,5тыс.руб.
1. Чему равна прогнозная величина её
накопления?

24
2. В каком смысле эта семья может
рассматриваться как средняя между семьями 4 и 5
(задача 3.5)? Почему прогнозная величина её
накоплений не есть среднее между 3,5 и 1,5тыс.руб.?
3. Постройте 95 %-доверительный интервал для
прогнозной величины накопления этой семьи.

Работа в программе STATISTICA

Задача 32
По данным задачи 1 «Стоимость жилья». (семинар 2.1.1):
1. Подберите нелинейное уравнение
регрессии, описывающие связь Y и Х 2 .
2. Проанализируйте качество
нелинейного уравнения и сравните с
качеством линейной модели.
3. Проверьте значимость параметров
уравнения регрессии и значимость
уравнения в целом на уровне 5%.

Задача 33
По данным задачи 7 «Успеваемость». (семинар 2.2.1):
1. Подберите нелинейное уравнение
регрессии, описывающие связь Х 1 и Х 3 .
2. Проанализируйте качество
нелинейного уравнения и сравните с
качеством линейной модели.
3. Проверьте значимость параметров
уравнения регрессии и значимость
уравнения в целом на уровне 5%.

Выполнение РГЗ №1 (формулировка заданий и данные


приведены в семинаре 2.2.2) п. III, 3.2. (в программе
STATISTICA).

Задания для самостоятельного решения

Упражнения
22. Оценить линейную регрессию Х = Z1α1 + Z2α2 + β + ε по
МНК для каждой из следующих групп данных (ниже расположенные
величины показывают, что данные находятся в отклонениях от
среднего значения)

25
а) Х: 3 2 8 3 5 Z1: 3 1 5 2 4 Z2: 5 4 6 4 6
2 2
б) Σ Z1 = 10; Σ Z2 = 5; Σ Z1Z2 = 5; Σ Z1X = 8; Σ Z2X = 6;
2
ΣX = 10; N = 23
в) Σ Z12 = 20; Σ Z22 = 10; Σ Z1Z2 = 15; Σ Z1X = -10; Σ Z2X =
15; Σ X2 = 102,5; N= 33

23. Регрессия X = α0 + α1Z1 + α2Z2 + ε оценивается по 3-м


наблюдениям. Чему равен коэффициент детерминации?
24. На основании ежегодных данных за 10 лет с помощью МНК
была сделана оценка параметров производственной функции типа
Кобба — Дугласа. Чему равна несмещённая оценка дисперсии
ошибки, если вектор остатков это e.
25. Четырёхфакторное уравнение регрессии оценено по 20
наблюдениям. В каком случае отношение оценки коэффициента
регрессии к её стандартной ошибке имеет распределение t-
Стьюдента? Сколько степеней свободы (в этом случае) имеет эта
статистика.
26. На основе годовых отчётов за 1973—1992 годы о затратах на
продукты питания (Q), располагаемом доходе(Y), индексе цен на
продукты питания (PF) и индексе цен на непродовольственные
товары (PNF) группа исследователей получила различные
регрессионные уравнения для функции спроса на продукты питания:
log Q = 3.87 – 1.34 log PF
(1.45) (-4.54)
R 2 = 0.56
log Q = 2.83 – 0.92 log PF + 1.23 logY
(1.25) (-2.70) (1.99)
R = 0.76
2

log Q = 2.35 – 0.52 log PF + 0.95 logY + 1.54 log PNF


(1.54) (-1.80) (0.79) (1.45)
R = 0.84
2

В скобках приведены значения t-статистики.


Прокомментируйте полученные оценки коэффициентов и
t-статистики, объясните, почему значения могут различаться в
трёх уравнениях. Можете ли вы предложить решение проблемы
статистической незначимости коэффициентов в последнем
уравнении?
27. Используя приведённые ниже данные, которые являются
суммами квадратов и ковариации величин отклонений от средних
значений, оцените параметры модели и, делая все необходимые
предположения, проверьте статистическую значимость
коэффициента α 2 .
Χ t = β + α 1 Ζ1t + α 2 Ζ 2t + et

26
а) ∑ z12 = 10 ; ∑ z 22 = 5 ; ∑ z1 z 2 = 5 ; ∑ z1 x = 5 ; ∑ z 2 x = 6
б) ∑ z12 = 20 ; ∑ z 22 = 10 ; ∑ z1 z 2 = 10 ; ∑ z1 x = 15 ; ∑ z 2 x = −10

28. По 5-ти наблюдениям построена линейная регрессия с 2-


мя факторами и константой. При этом коэффициент детерминации
равен 0,5. Чему равна F-статистика Фишера для уравнения
регрессии?

Задача 34.
Анализ годовых данных (21 наблюдений) о спросе на некоторый
товар привёл к результатам, указанным в следующей таблице:
Таблица 22
Средние Стандартное Коэффициент
отклонение корреляции
x = 51.843 S X = 9.205 R XY = −0.9158
y = 8.313 S Y = 1.780 RYT = −0.8696
T = 0.000 S T = 6.057 R XT = 0.9304
где x — потребление на душу населения,
y — цена с учётом дефлятора,
T — время (годы).
а) Найдите коэффициент при времени в оценённой регрессии y
по x и T.
б) Проверьте, будет ли этот коэффициент значимо отличен от
нуля.
в) Кратко объясните экономический смысл включения в
регрессию времени в качестве объясняющей переменной.

Задача 35
Имеются следующие данные о выработке литья на одного
работающего х1(т), браки литья х2(т) и себестоимости х1т литья у
(руб.) по 25 литейным цехам заводов:
Таблица 23
I X1i X2i Yi i X1i X2i Yi i X1i X2i Yi
1 14.6 4.2 239 10 25.3 0.9 198 19 17.0 9.3 282
2 13.5 6.7 254 11 56.0 1.3 170 20 33.1 3.3 196
3 21.5 5.5 262 12 40.2 1.8 173 21 30.1 3.5 186
4 17.4 7.7 251 13 40.6 3.3 197 22 65.2 1.0 176
5 44.8 1.1 158 14 75.8 3.4 172 23 22.6 5.2 238
6 111.9 2.2 101 15 27.6 1.1 201 24 33.4 2.3 204
7 20.1 8.4 259 16 88.4 0.1 130 25 19.7 2.7 205
8 28.1 1.4 186 17 16.6 4.1 251
9 22.3 4.2 204 18 33.4 2.3 195

27
Необходимо:
а). найти множественный коэффициент детерминации и
пояснить его смысл;
б). найти уравнение множественной регрессии y по x1 и x2?
Оценить значимость этого уравнения и его коэффициентов на уровне
а =0,05;
в) сравнить раздельное влияние на зависимую переменную
каждой из объясняющих переменных, используя стандартизованные
коэффициенты регрессии и коэффициенты эластичности;
г) найти 95%-ные доверительные интервалы для коэффициентов
регрессии, а так же для среднего и индивидуальных значений
себестоимости 1т литья в цехах, в которых выработка литья на одного
работающего составляет 40 т, а брак литья — 40%

Задача 36
Имеются следующие данные о годовых ставках месячных
доходов по трем акциям за шестимесячный период:
Таблица 24
Акция Доходы по месяцам, %
А 5.4 5.3 4.9 4.9 8.4 6.0
B 6.3 6.2 6.1 5.8 5.7 5.7
C 9.2 9.2 9.1 9.0 8.7 8.7
Есть основания предполагать, что доходы y по акции с зависят
от доходов х1 и х2 по акциям А и В. Необходимо:
а) составить уравнение регрессии у по х1 и х2;
б) найти множественный коэффициент детерминации R2 и
пояснить его смысл;
в) проверить значимость полученного уравнения регрессии на
уровне а=00,5;
г) оценить средний доход по акции С если доходы по акциям A
и B составили соответственно 5,5 и 6,0%

Семинар 2.3.4.
Экономический смысл линейных коэффициентов регрессии.
Коэффициент эластичности. Доверительный интервал для линии
регрессии. Доверительный интервал для прогнозного значения.

Пример 22.
Таблица 25
№ п/п 1 2 3 4 5 6 7 8 9 10
X 8 11 12 9 8 8 9 9 8 12
Y 5 10 10 7 5 6 6 5 6 8
По данным таблицы 25:

28
А также используя результаты примера 5 из семинара 5:
1) оцените производительность труда одного занятого
для салонов с фондом оплаты труда 8 (у.е);
2) найдите 95% -ные доверительные интервалы для
индивидуального и среднего значений производительности
труда для таких же салонов;
3) найдите с надежностью 0,95 интервальные оценки
коэффициента регрессии β 1 и дисперсии σ².

Пример 23.
По результатам примера 9 (семинар 5) и примера 4 (семинар 6)
определите интервальные оценки коэффициентов регрессии с
доверительной вероятностью γ=0,95.

Задача 37
По результатам задач 16 и 23 «Производительность»
(семинары 2.3.1 и 2.3.2):
1. Дайте экономическую интерпретацию
коэффициентам регрессии.
2. Определите коэффициент средней
эластичности производительности труда от
изменения фонда оплаты труда.
3. Постройте доверительный интервал
среднего значения производительности труда , если
ФОТ составит 10 ед.
4. Постройте доверительный интервал
индивидуального значения производительности
труда , если ФОТ составит 10 ед.

Выполнение РГЗ №1 (формулировка заданий и данные


приведены в семинаре 2.2.2) п. IV. (в программе STATISTICA)

Задания для самостоятельного решения.

Задача 38
По данным 30 нефтяных компаний получено следующее
уравнение регрессии между оценкой Y (ден. ед.) и фактической
стоимостью X (ден. ед.) этих компаний: ух = 0,8750* + 295. Найти:
95%-ные доверительные интервалы для среднего и индивидуального
значений оценки предприятий, фактическая стоимость которых
составила 1300 ден. ед., если коэффициент корреляции между
переменными равен 0,76, а среднее квадратическое отклонение S x =

29
270 ден. ед.

Задача 39
На основании данных о темпе прироста (%) внутреннего
национального продукта (У) и промышленного производства (Х),
десяти развитых стран мира за 1992 г., приведенных в таблице и
предположения, что генеральное регрессии имеет вид:
Y€ = β 0 + β1 х.
Таблица 26
страны У Х
Япония 3,5 4,3
США 3,1 4,6
Германия 2,2 2,0
Франция 2,7 3,1
Италия 2,7 3,0
Великобритания 1,6 1,4
Канада 3,1 3,4
Австралия 1,8 2,6
Бельгия 2,3 2,6
Нидерланды 2,3 2,4

Требуется:
1. с доверительной вероятностью γ =0,9 построить интервальные
оценки β 0 и β1 ;
2. с доверительной вероятностью γ =0,9 построить
интервальные оценки уравнения регрессии в точках,
⎛1 ⎞ ⎛1 ⎞
определяемых вектором начальных условий x 0 = ⎜⎜ ⎟⎟ ; x 0 = ⎜⎜ ⎟⎟ .
⎝ 3⎠ ⎝5⎠

Задача 40
По 10 наблюдениям дана оценка 4 одному из коэффициентов
двухфакторной регрессии. Дисперсия ошибки этого коэффициента
рана 4. Построить 99% доверительный интервал для этого
коэффициента.

Задача 41
МНК-оценка параметра регрессии, полученная по 16
наблюдениям, равна 4, оценка его стандартной ошибки – 1. Можно ли
утверждать с вероятностью ошибки не более 5%, что истинное
значение параметра равно 5.93? Ответ обосновать.

30
Семинар 2.3.5
Защита расчетно-графического задания №1.

Семинар 10.
Построение трендовых моделей. Построение линейного
тренда. Построение нелинейного тренда. Анализ качества и
адекватности трендовых моделей.

Пример 1.
Провести сглаживание временного ряда Y по данным :
Таблица 27
Год, t 1 2 3 4 5 6 7 8
Спрос, 213 171 291 309 317 362 351 361
Y
методом скользящих средних, используя простую
среднюю арифметическую с интервалом сглаживания m = 3
года.

Пример 2.

Выявить на уровне значимости 0,05 наличие автокорреляции


возмущений e t для временного ряда Y t по данным:

Таблица 28
Год, t 1 2 3 4 5 6 7 8
Спрос,Y 213 171 291 309 317 362 351 361

Пример 3.
По данным и результатам предыдущего примера, полагая, что
тренд линейный, а возмущения удовлетворяют требованиям
классической модели:
1. Дайте точечную оценку прогноза среднего значения
спроса на момент t=9 (девятый год).
2. Дайте интервальную (с надежностью 0,95) оценку
прогноза среднего значения спроса на некоторый товар на
момент t=9 (девятый год).
3. Постройте доверительный интервал (с надежностью
0,95) для индивидуального значения Yt=9.

Работа в пакете STATISTICA

Задача «Потребление Кока-колы».

31
Имеются ежегодные данные о ценах и объемах потребления
кока-колы.
Таблица 29
T 1 2 3 4 5 6 7 8 9 10
Q 34,4 35,8 36,7 38,3 39,1 40,1 40,7 40,3 41,4 41,7
P 90,6 85,3 81,8 78,9 73,9 74,3 71,5 68,4 66,4 65,9
1. Проведите визуализацию данных;
2. Постройте трендовые модели разных видов;
3. Проведите анализ качества и адекватности
моделей.

Выполнение расчетно-графического задания №2 п.I, п.III.

Расчетно-графическое задание №2.

Содержание работы:

1. Визуализация данных.
1.1. Постройте диаграмму рассеивания для исследуемого
показателя (Yt).
1.2. Проверьте исходные данные на близость к
нормальному закону распределения. Постройте гистограммы и
графики на нормальной вероятностной бумаге.

2. Автокорреляция уровней временного ряда.


2.1. Для указанных в варианте задания лабораторной
работы показателей вычислите коэффициенты автокорреляции
с различными лагами τ = 1, 2, ……q, величину q определите
самостоятельно.
2.2. Приведите в отчете полученные коррелограммы и
по виду графика сделайте заключение о структуре временных
рядов. Объясните вид полученных коррелограмм с
экономической точки зрения. Сделайте рекомендации
относительно того, какие модели целесообразно использовать
для описания каждого временного ряда.

3. Построение трендовой модели.


3.1. Для исследуемого временного ряда (Yt) подберите
несколько трендовых моделей. Одна из них должна быть
линейной. В качестве второй модели выберите одну из
нелинейных зависимостей. Для третьей модели подберите
полином соответствующей степени.

32
3.2. Приведите в отчете все три модели. Выберите из них
наиболее адекватную. Обоснуйте свой выбор, используя
критерии Фишера и Стьюдента. Приведите графики квадратов
остатков в зависимости от объясняющей переменной, а также
графики остатков на нормальной вероятностной бумаге.
Проверьте выполнение условий Гаусса-Маркова.
3.3. Рассчитайте средние уровни Yt на 3 последних
периода и сравните с реальными данными. Сделайте точечный
и интервальный прогноз среднего уровня показателя Yt на
перспективный период, а также постройте доверительный
интервал для прогнозного значения. Интерпретируйте
результаты.

4. Корреляция и лаговая корреляция временных рядов.


4.1. Приведите ряды к стационарному виду. Примените
необходимые для этого преобразования, однако, следите, чтобы
преобразований было как можно меньше.
4.2. Исследуйте корреляционные связи между
показателями. Выделите, какие факторы и с каким периодом
запаздывания влияют на ваш исследуемый признак (Yt).
4.3. Приведите в отчете коррелограммы рядов после
преобразований, а также графики перекрестной корреляции.

5. Регрессия временных рядов.


5.1. Постройте модель, адекватно описывающую
исследуемый показатель Yt. При необходимости включите в
уравнение, помимо объясняющих переменных, трендовые и
лаговые компоненты.
5.2. Приведите в отчете полученную модель.
Охарактеризуйте ее качество, используя критерии Фишера и
Стьюдента. Приведите графики квадратов остатков в
зависимости от объясняющей переменной, а также графики
остатков на нормальной вероятностной бумаге. Проверьте
выполнение условий Гаусса-Маркова.
5.3. Спрогнозируйте средние уровни объясняющих
переменных (Х) по адекватным трендам на 3 последних
периода и на перспективу. Рассчитайте средний уровень Yt по
уравнению регрессии на 3 последних периода и на перспективу,
учитывая расчетные значения объясняющих переменных.
Постройте доверительные интервалы для прогнозного значения
и для среднего уровня Yt. Сравните с расчетами, полученными
по трендовой модели и с реальными данными.

Варианты работ:

33
Вариант 1. Рассмотрите показатели, приведенные в табл. 1.
Проанализируйте Инвестиции в основной капитал (Yt), Объем
промышленного производства (X1t), Оборот розничной торговли
(X2t), Внешнеторговый оборот (Х3t), Среднемесячная начисленная
заработная плата (Х4t) по предложенной выше схеме.

Таблица 30
Период, Инвестици Объем Оборот Внешнетор Общая Среднемеся
месяц ив промышле розничной го-вый численност чная
основной нн. торговли, оборот, ь начисленна
капитал, производст млрд. руб. млрд. $ безработны я
млрд. руб. ва, млрд. х, млн. чел. заработная
руб. плата, руб
на 1
занятого
1 41,9 169,5 110,0 8,9 9,3 116
4
2 64,2 204,8 136,5 10,8 9,6 148
2
3 28,5 187,6 119,7 7,3 10,0 116
7
4 31,8 197,8 120,9 7,9 10,4 119
9
5 36,5 238,7 132,0 9,3 10,0 138
5
6 36,9 236,6 133,1 9,8 9,6 142
3
7 41,4 225,9 136,5 8,0 9,1 147
2
8 52,8 246,7 139,8 9,3 8,8 162
6
9 56,2 256,8 143,3 9,5 8,7 161
8
10 61,8 272,8 154,9 9,3 8,7 160
8
11 67,6 291,7 158,5 9,7 8,8 168
4
12 66,5 308,5 164,4 10,3 8,9 171
6
13 72,0 321,6 167,4 11,1 9,1 178
9
14 118,4 365,5 196,7 13,7 8,9 228
3
15 46,1 331,7 167,0 9,9 8,7 183
0
16 55,8 350,8 164,9 11,5 8,6 183
9
17 63,9 387,5 176,6 13,0 8,2 201
8
18 64,5 359,2 174,8 11,5 7,8 203

34
9
19 75,8 361,1 176,6 11,8 7,4 210
1
20 95,7 384,5 181,6 12,2 7,3 229
4
21 99,0 391,6 186,5 12,2 7,2 230
2
22 112,9 407,7 198,9 12,9 7,1 228
9
23 118,3 417,6 201,6 12,6 7,1 236
7
24 114,6 442,7 209,8 13,2 7,0 242
5
25 123,1 451,9 215,5 14,5 7,0 250
8
26 195,5 476,2 252,9 15,1 7,0 302
5
27 70,9 436,4 209,4 11,6 7,1 273
3
28 82,3 430,2 211,0 11,8 7,1 265
5
29 91,7 482,0 229,3 13,2 6,8 296
4
30 93,4 467,2 232,6 13,1 6,4 292
3
31 112,8 468,1 239,1 13,3 6,1 305
4
32 132,7 477,5 242,7 14,0 6,1 328
4
33 135,7 491,8 245,2 12,7 6,1 336
4
34 153,3 503,2 260,7 13,7 6,1 337
6
35 158,7 494,1 260,9 12,6 6,2 340
5
36 153,8 530,6 272,4 13,2 6,2 351
5

Вариант 2. Рассмотрите показатели, приведенные в табл. 1.


Проанализируйте Объем промышленного производства (Yt),
Инвестиции в основной капитал (X1t), Оборот розничной торговли
(X2t), Внешнеторговый оборот (Х3t), Общая численность
безработных (Х4t) по предложенной выше схеме.

Вариант 3. Рассмотрите показатели, приведенные в табл. 30.


Проанализируйте Оборот розничной торговли (Yt), Объем

35
промышленного производства (X1t), Инвестиции в основной
капитал (X2t), Внешнеторговый оборот (Х3t), Среднемесячная
начисленная заработная плата (Х4t), Общая численность
безработных (Х5t) по предложенной выше схеме.

Вариант 4. Рассмотрите показатели, приведенные в табл. 30.


Проанализируйте Внешнеторговый оборот (Yt), Объем
промышленного производства (X1t), Инвестиции в основной
капитал (X2t), Оборот розничной торговли (Х3t), Среднемесячная
начисленная заработная плата (Х4t) по предложенной выше схеме.

Вариант 5. Рассмотрите показатели, приведенные в табл. 30.


Проанализируйте Среднемесячная начисленная заработная плата
(Yt), Объем промышленного производства (X1t), Инвестиции в
основной капитал (X2t), Общая численность безработных (Х3t),
Оборот розничной торговли (Х4t) по предложенной выше схеме.

Вариант 6. Рассмотрите показатели, приведенные в табл. 31.


Проанализируйте Индекс оборота розничной торговли (Yt), Индекс
потребительских цен (X1t), Индекс реальной среднемесячной
заработной платы (X2t), Индекс стоимости потребительской корзины
(набора из 25 основных продуктов питания) (Х3t) по предложенной
выше схеме.

Таблица 31
*
Перио Yt X1t X2t X3t
д, месяц
1 80,0 108,4 86,0 101,9
2 86,9 104,1 99,1 106,3
3 91,0 102,8 111,7 103,6
4 97,6 103,0 100,0 102,9
5 100,2 102,2 106,0 105,5
6 100,7 101,9 107,7 103,2
7 100,0 102,8 96,9 100,2
8 106,5 101,2 98,1 100,1
9 108,0 101,5 103,1 96,1
10 102,1 101,4 107,0 95,4
11 105,0 109,8 103,0 101,9
12 116,0 103,0 124,4 103,1
13 82,5 102,3 91,0 102,5
14 97,9 101,0 99,4 100,4
15 90,0 114,0 100,5 100,0
16 98,1 118,0 109,8 100,1

36
17 99,4 109,0 109,5 103,1
18 100,9 102,6 106,4 104,4
19 101,4 101,8 98,8 101,8
20 100,2 106,0 98,5 96,1
21 116,0 121,0 114,7 97,0
22 112,0 102,1 117,0 101,0
23 101,2 116,8 116,4 132,0
24 117,2 119,0 118,8 103,5
* Все данные представлены в процентах к предыдущему
периоду.

Вариант 7. Рассмотрите показатели, приведенные в табл. 31.


Проанализируйте Валовой национальный продукт РФ (Yt), Объем
промышленного производства (X1t), Объем продукции сельского
хозяйства (X2t), Объем строительства (Х3t), по предложенной выше
схеме.

Таблица 32
*
Период Yt X1t X2t X3t
месяц
1 236 72.8 4.9 16.5
2 309,8 92,6 10,5 26,7
3 378,9 101,2 52,6 33,1
4 408,1 120,3 21,2 36,5
5 334,0 111,4 9,8 24,1
6 340,6 102,4 11,6 30,0
7 360,6 94,4 52,4 30,6
8 361,6 106,5 19,4 32,4
9 322,9 106,8 7,3 22,5
10 346,4 104,6 9,8 28,3
11 401,5 106,7 54,5 32,1
12 382,5 94,5 17,6 32,2
13 319,5 104,1 7,1 20,7
14 341,1 100,1 9,9 27,5
15 372,6 98,1 49,0 30,1
16 419,8 131,7 13,0 24,6
17 389,1 132,7 11,4 21,8
18 443,7 143,6 18,1 27,3
19 503,7 146,3 80,4 31,8
20 479,0 144,9 24,0 30,5
21 435,2 158,1 14,9 21,7
22 461,1 155,2 18,5 29,4

37
23 532,5 158,3 80,8 37,8
24 476,1 149,5 19,9 37,1
25 437,4 150,4 14,7 24,2
26 481,4 153,8 19,5 31,9
27 576,1 158,7 93,4 42,3
28 505,5 119,9 8,7 66,1
* Все данные приведены в млрд. рублей, в сопоставимых ценах
(с учетом инфляции).

Вариант 8. Рассмотрите показатели, приведенные в табл. 33.


Проанализируйте Доходы бюджета (Yt), Объем промышленного
производства (X1t), Инвестиции в основной капитал (X2t), Общая
численность безработных (Х3t), Экспорт (Х4t) по предложенной
выше схеме.

Таблица 33
П Доходы Инвестиции Объем Экспор Численн
ериод Бюджет в основной промышлен т, ость
, а, млрд. капитал, ного. безработ
месяц руб. млрд. руб. производств млн. $. ных,
а, млрд. млн. чел.
руб.
1 35,0 22,1 129,3 5,911 8,3
2 38,9 23,7 128,5 5,885 8,4
3 46,4 26,1 141,8 6,758 8,5
4 52,6 25,5 132,1 6,236 8,5
5 51,5 26,6 117,7 6,119 8,3
6 50,1 31,8 135,0 6,511 8,1
7 49,9 32,9 115,7 6,305 8,3
8 46,9 35,4 112,8 5,828 8,3
9 47,3 39,3 140,0 5,992 8,6
1 52,7 37,6 158,6 6,083 8,9
0
1 63,6 41,9 169,5 5,965 9,4
1
1 122,2 64,2 204,8 7,291 9,6
2
1 49,0 28,5 187,6 4,602 10,0
3
1 50,3 31,8 197,8 5,029 10,4
4
1 72,6 36,5 238,7 5,929 10,0
5

38
1 92,1 36,9 236,6 6,519 9,6
6
1 85,9 41,4 225,9 5,097 9,1
7
1 98,7 52,8 246,7 5,358 8,8
8
1 102,2 56,2 256,8 6,307 8,7
9
2 107,9 61,8 272,8 6,193 8,7
0
2 100,6 67,6 291,7 6,462 8,8
1
2 108,8 66,5 308,5 6,930 8,9
2
2 138,3 72,0 321,6 7,560 9,1
3
2 191,1 118,4 365,5 9,679 8,9
4
2 102,0 46,1 331,7 6,960 8,7
5
2 115,4 55,8 350,8 8,114 8,6
6
2 149,1 63,9 387,5 9,290 8,2
7
2 168,5 64,5 359,2 8,110 7,8
8
2 182,7 75,8 361,1 8,316 7,4
9
3 170,7 95,7 384,5 8,583 7,3
0

Вариант 9. Рассмотрите показатели, приведенные в табл. 34.


Проанализируйте Рыночную цену акций ОАО «Иркутскэнегро»
(Yt), Курс доллара (X1t), Котировка на покупку (открытие) (X2t),
Котировка на покупку (закрытие) (Х3t), Объем торгов (Х4t) по
предложенной выше схеме.

Таблица 34
* ** * *
Дата Yt X1t X2t X3t X4t*
10.03.00 0,09419 28,53 0,0885 0,0960 254300
11.03.00 0,09588 28,51 0,0950 0,0900 543230
12.03.00 0,09469 28,50 0,0925 0,0960 73125
13.03.00 0,09747 28,43 0,0935 0,0935 124625

39
14.03.00 0,09411 28,39 0,0880 0,0860 128375
15.03.00 0,09382 28,38 0,0885 0,0940 9700
16.03.00 0,09479 28,36 0,0950 0,0990 145325
17.03.00 0,10003 28,34 0,1000 0,1000 579889
18.03.00 0,10815 28,33 0,1025 0,1010 481275
19.03.00 0,10066 28,31 0,0975 0,0975 176450
20.03.00 0,10006 28,29 0,0950 0,0970 25000
21.03.00 0,09656 28,27 0,0975 0,0915 146750
22.03.00 0,09507 28,46 0,0885 0,0950 60450
23.03.00 0,09329 28,60 0,0955 0,0905 87950
24.03.00 0,09345 28,78 0,0895 0,0935 108600
25.03.00 0,09012 28,76 0,0925 0,0850 148250
26.03.00 0,08993 28,72 0,0860 0,0900 22750
27.03.00 0,08772 28,68 0,0910 0,0880 145375
28.03.00 0,09087 28,66 0,0885 0,0925 163550
29.03.00 0,09203 28,63 0,0915 0,0885 329530
30.03.00 0,09193 28,59 0,0900 0,0900 70150
31.03.00 0,09221 28,53 0,0870 0,0900 83825
01.04.00 0,09121 28,60 0,0865 0,0850 42650
02.04.00 0,09095 28,78 0,0875 0,0875 97725
03.04.00 0,09123 28,59 0,0915 0,0930 47250
04.04.00 0,09103 28,55 0,0930 0,0890 22875
05.04.00 0,09101 28,53 0,0900 0,0915 70125
06.04.00 0,09467 28,53 0,0920 0,0940 143750
07.04.00 0,09440 28,46 0,0900 0,0882 94000
08.04.00 0,09531 28,43 0,0905 0,0950 105950
* Данные приведены в $ США.
** Курс доллара США приведен в рублях за 1 доллар.

Вариант 10. Рассмотрите показатели, приведенные в табл. 35.


Проанализируйте Курс доллара США (Yt), Валовой внутренний
продукт (X1t), Общий объем инвестиций (X2t), Валовой
национальный продукт (Х3t), Объем промышленного производства
(Х4t) по предложенной выше схеме. Обратите внимание на
особенности динамики курса доллара.

Таблица 35
* * *
Период, Yt X1t X2t X3t X4t*
* *
квартал рубл.за млрд. млр
1$ рубл. д. рубл. млр млр
д. рубл. д. рубл.
I 4,854 459 57,8 334 111,

40
4
II 5,108 509 75,2 340, 102,
6 4
III 5,396 570 85,2 360, 94,4
6
IV 5,56 611 157, 361, 106,
8 6 5
I 5,726 539 73,2 322, 106,
9 8
II 5,782 594 85,4 346, 104,
4 6
III 5,86 697 108, 401, 106,
9 5 7
IV 5,96 667 141, 382, 94,5
3 5
I 6,106 564 71,9 319, 104,
5 1
II 6,198 632 83,9 341, 100,
1 1
III 16,065 699 107, 372, 98,1
6 6
IV 20,65 846 143, 419, 131,
7 8 7
I 24,18 867 96,8 389, 132,
1 7
II 24,22 1108 131, 443, 143,
1 7 6
III 25,08 1358 185, 503, 146,
9 7 3
IV 27,00 1424 256, 479, 144,
9 0 9
I 28,46 1461 165, 435, 158,
8 2 1
II 28,07 1642 236, 461, 155,
0 1 2
III 28,75 2004 330, 532, 158,
2 5 3
IV 28,16 1956 433, 476, 149,
2 1 5
I 28,74 1886 244, 437, 150,
9 4 4
II 29,07 2116 338, 481, 153,
9 4 8

41
III 29,39 2543 447, 576, 158,
7 1 7
IV 30,14 2496 568, 505, 119,
0 5 9
* Данные приведены в номинальном выражении.
** Данные приведены в сопоставимых ценах.

Вариант 11. Рассмотрите показатели, приведенные в табл. 36.


Проанализируйте Индекс объемов производства в целлюлозно-
бумажной промышленности (Yt), Индекс цен в металлургии (X1t),
Индекс объемов производства в химическом машиностроении
(X2t), Индекс цен на электроэнергию. (Х3t) по предложенной выше
схеме.

Таблица 36. Индексы производства в промышленности.


Металлургия Лесозаго Деревоо Целл Машиностроение
Меся

Черная Алюми - б- .- Метал Химич Авто


ниевая товител рабаты бума лур- ес-кое моби
ц

ь-ная ваю- ж- гическ ль-


щая ная ое ное
1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00
1,00 1,05 1,01 1,04 1,09 1,09 0,93 1,04
0,98 1,01 1,22 1,00 1,05 0,97 0,87 0,96
1,00 1,05 1,95 1,01 1,04 1,02 0,84 0,86
0,99 1,05 1,86 0,95 1,03 0,85 0,84 0,86
0,94 0,95 2,02 0,97 0,97 1,02 0,74 0,94
1,10 1,05 2,23 1,04 1,12 1,01 0,82 1,04
1,03 1,08 1,22 0,97 1,10 1,37 0,85 1,02
1,07 1,10 0,66 0,87 1,07 1,38 0,80 0,89
0,97 1,08 0,88 0,90 1,08 1,36 0,79 0,92
0
1,03 1,11 1,04 0,95 1,12 1,16 0,83 0,94
1
1,00 1,12 1,09 1,00 1,15 1,57 0,91 1,05
2
0,95 1,07 1,00 0,98 1,08 0,99 0,79 1,04
3
1,00 1,10 0,95 1,02 1,14 1,33 0,86 1,16
4
1,04 1,06 1,14 0,96 1,10 0,99 0,90 1,02
5
0,95 1,08 2,13 1,05 1,11 1,06 0,77 1,00
6

42
0,98 1,06 1,91 0,98 1,10 0,80 0,77 0,89
7
1,00 0,98 2,03 1,01 1,05 0,96 0,68 0,97
8

Таблица 37. Индексы цен в промышленности


Месяц Металл Маши Химиче Деревообр Электро
ургия ностроение ская абатываю энергети
щая ка
1 1,00 1,00 1,00 1,00 1,00
2 1,04 1,02 1,02 1,02 1,01
3 1,04 1,03 1,03 1,04 1,05
4 1,02 1,03 1,05 1,05 1,04
5 1,03 1,05 1,11 1,07 1,03
6 1,02 1,08 1,17 1,08 1,08
7 1,02 1,10 1,21 1,10 1,19
8 1,01 1,12 1,22 1,10 1,17
9 1,01 1,14 1,22 1,10 1,20
10 1,03 1,15 1,22 1,10 1,20
11 1,02 1,15 1,23 1,09 1,25
12 0,99 1,16 1,25 1,10 1,29
13 0,99 1,17 1,26 1,11 1,29
14 1,01 1,19 1,28 1,13 1,31
15 1,02 1,20 1,30 1,15 1,33
16 1,01 1,21 1,29 1,16 1,35
17 1,03 1,24 1,30 1,16 1,35
18 1,03 1,25 1,36 1,17 1,41

Вариант 12. Рассмотрите показатели, приведенные в табл. 36-37.


Проанализируйте Индекс объемов производства в Химическом
машиностроении (Yt), Индекс цен в химической промышленности
(X1t), Индекс цен в машиностроении (X2t), Индекс цен на
электроэнергию. (Х3t) по предложенной выше схеме.

Вариант 13. Рассмотрите показатели, приведенные в табл. 36-


37. Проанализируйте Индекс объемов производства в
деревообрабатывающей промышленности (Yt), Индекс цен в
деревообрабатывающей (X1t), Индекс объемов производства в
лесозаготовительной промышленности (X2t), Индекс цен на
электроэнергию. (Х3t) по предложенной выше схеме.

43
Вариант 14. Рассмотрите показатели, приведенные в табл. 36-
37. Проанализируйте Индекс объемов производства в
металлургическом машиностроении (Yt), Индекс цен на
электроэнергию (X1t), Индекс объемов производства в
алюминиевой металлургии (X2t), Индекс цен в металлургии (Х3t),
Индекс объемов производства в черной металлургии (X4t) по
предложенной выше схеме.

Вариант 15. Рассмотрите показатели, приведенные в табл. 36-


37. Проанализируйте Индекс объемов производства в алюминиевой
металлургии (Yt), Индекс цен на электроэнергию (X1t), Индекс
объемов производства в химическом машиностроении (X2t),
Индекс цен в машиностроении (Х3t), Индекс объемов производства
в автомобильном машиностроении (X4t) по предложенной выше
схеме.

Задания для самостоятельной работы.


Упражнения.
1. Параметры 3-х - факторного уравнения регрессии
оценены по 20 наблюдениям. S1 S2 - остаточные дисперсии по 1-й и 2-
й половинам временного ряда. В каком случае гипотезы о
гомоскедастичности следует отвергнуть?
2. Оценивается регрессия по 10 наблюдениям. Известно, что
дисперсия ошибок для первых 5 наблюдений ровно в 2 раза больше,
чем дисперсия ошибок остальных 5 наблюдений. Опишите процедуру
оценивания этой регрессии.
3. Обсудите последствия гетероскедастичности для оценок,
получаемых простым методом наименьших квадратов.
Проиллюстрируйте ответ следующими данными и моделью:
Xt = αZt + et, t = 1, 2,…,6
E(et) = 0
σ2Zt2, t = s
E(etes) =
0, t ≠ s
Таблица 38
t: 1 2 3 4 5 6
Zt 8 6 10 12 4 5
Xt 16 14 18 24 6 10

Используя МНК оцените коэффициент α.

44
4. Пусть х1 = ziα + εi (i = 1, 2), ε1 ~ N(0, σ2), ε2 ~ N(0, 2σ2),
причем ε1 и ε2 статистически независимы. Пусть х1 = +1 и х2 = -1.
найдите взвешенную оценку наименьших квадратов для и ее
дисперсию.
5. Чему равна статистика Дарбина – Уотсона, если
коэффициент корреляции между et и et-1 (t = 1,…,Т) равен минус 1.
6. Статистика Дарбина – Уотсона в регрессии равна 0.5. Что
это означает? Какое преобразование следует применить к этой модели
(запишите формулу)?

Задачи
Задача 2
Имеются следующие данные об урожайности винограда y t за
10 лет:
Таблица 39
t 1 2 3 4 5 6 7 8 9 10
yt 16,3 20,2 17,1 7,7 15,3 16,3 19,9 14,4 18,7 20,7

1. Найти уравнение тренда временного ряда y t , полагая, что


он линейный, и проверить его значимость на уровне 0,05.
2. Провести сглаживание временного ряда y t методом
скользящих средних, используя простую среднюю арифметическую с
интервалом сглаживания: а) m = 3; б) m = 5.

Задача 3
В таблице представлены данные, отражающие динамику роста
доходов на душу населения y t (ден. ед.) за восьмилетний период:
Таблица 40
t 1 2 3 4 5 6 7 8
yt 1133 1222 1354 1389 1342 1377 1491 1684
Полагая, что тренд линейный и условия классической модели
выполнены:
а) найти уравнение тренда и оценить его значимость на уровне
0,05;
б) дать точечный и с надежностью 0,95 интервальный прогнозы
среднего и индивидуального значений доходов на девятый год.

Семинар 3.1.2
Анализ автокорреляционной функции временного ряда. Типы
автокорреляционных зависимостей. Коррелограммы.

45
Пример 4
По данным таблицы для временного ряда Yt найти среднее
значение, среднее квадратическое отклонение, коэффициенты
автокорреляции (для лагов τ=1;2) и частный коэффициент
автокорреляции 1-го порядка.
Таблица 41
Г 1 2 3 4 5 6 7 8
од, t
С 2 1 2 3 3 3 3 3
прос,Y 13 71 91 09 17 62 51 61

Работа в пакете STATISTICA

Задача 4
По данным задачи 1 «Потребление Кока-колы» (семинар 3.1.1):
1. Постройте коррелограммы автокорреляционных
функций;
2. Сделайте выводы о наличии тенденций во временных
рядах;

Выполнение вариантов (1-15) РГЗ №2 п. 2. (формулировка


заданий и данные приведены в семинаре 2.2.2) в программе
STATISTICA.

Семинар 3.1.3

Анализ корреляционных связей временных рядов. Проверка


выполнения предпосылок корреляционного анализа. Устранение
основной тенденции временного ряда с помощью метода
последовательных разностей. Анализ лаговых корреляционных
связей.

Работа в пакете STATISTICA

Задача 5
По данным задачи 1 «Потребление Кока-колы» (семинар 3.1.1):
1. Приведите ряды Qt и Pt к стационарному виду. При
необходимости используйте процедуру «взятие последовательных
разностей».

46
2. Проведите анализ корреляционных связей между Qt и Pt .
3. Проведите анализ лаговых корреляционных связей между
Qt и Pt .

Выполнение вариантов (1-15) РГЗ №2 п. 4. (формулировка


заданий и данные приведены в семинаре 2.2.2) в программе
STATISTICA.

Семинар 3.1.4
Построение факторной динамической модели. Обоснование
включения трендовых, лаговых, авторегрессионных составляющих.
Анализ качества и адекватности факторной динамической модели.
Построение прогнозных значений результирующего показателя.
Построение доверительного интервала для среднего и прогнозного
значений.

Пример 5
Менеджер цветочного магазина не уверен в
правильности выбранной цены на гвоздики, поэтому в
течение 12 недель он варьирует цену и записывает
количество проданных цветов. Полученные данные
приведены в табл.1.1 (t – номер недели, Q t – количество
проданных цветов, P t – цена одной гвоздики (руб.)).
Таблица 42
t Pt Qt t Pt Qt
1 7,65 495 7 7,9 414
2 7,25 615 8 6,45 880
3 7 665 9 7,6 551
4 7,5 592 10 7,75 479
5 8,25 285 11 8 325
6 7,75 344 12 6,75 701

А) оцените параметры модели


lnQ t = β 0 +β 1 *lnP t + ε t , t = 1,…,12
Б) используя полученные оценки коэффициентов,
найдите оптимальную (в смысле максимума выручки от
продаж) цену гвоздики.

Пример 6

47
Так называемая кривая Филипса описывает связь темпа
прироста зарплаты и уровня безработицы. А именно,

Тω t = β 0 + β 1 *1/U t + ε t

где ω t – уровень заработной платы, Тω t = 100(ω t - ω t - 1 ) /


ω t - 1 – темп прироста зарплаты (в процентах) и U t – процент
безработных в год t. Теория предполагает, что β 0 < 0 и β 1 >
0.
Используя данные для некоторой страны из табл.1.2,
ответьте на следующие вопросы:
А) Найдите оценки коэффициентов уравнения и
проверьте наличие значимой связи между Тω t и U t .
Б) Найдите «естественный уровень безработицы», т.е.
такой уровень безработицы, при котором Tω t = 0.
В) Когда изменения в уровне безработицы оказывали
наибольшее (наименьшее) влияние на темп изменения
зарплаты?
Г) Найдите 95%-доверительные интервалы для β 0 и β 1 .
Таблица 43
t Wt Ut t Wt Ut
1 1,932 1,345 10 2,628 2,01
2 1,82 1,63 11 2,916 2,01
3 1,796 1,25 12 2,74 1,725
4 2,052 1,725 13 2,836 1,63
5 2,308 1,25 14 2,684 2,105
6 2,196 1,44 15 3,004 1,345
7 2,124 1,725 16 3,124 1,725
8 2,452 1,345 17 3,244 1,535
9 2,556 1,535 18 3,364 1,63

Пример 7
Предположим, что вы оцениваете линейную функцию
потребления от дохода С t = β 0 + β 1 Y t + ε t среди t=1,2,..n
участников.
1. Как учесть возможный сдвиг этой функции при
переходе от городского к сельскому потребителю, если вы
считаете, что предельная (маргинальная) склонность к
потреблению постоянна, в то время как средняя склонность
к потреблению может меняться?

48
2. Как проверить гипотезу о том, что предельные
(маргинальные) склонности к потреблению участников с
доходом выше и ниже Y* отличаются?

Пример 8 Предположим, что некоторые ежегодные


данные удовлетворяют соотношениям:
Y t = β 0 + β 1 X t + β 2 T + ε t (истинная модель),

причем выполнены все условия классической


регрессии. Однако оценивается «неправильная» модель без
временного тренда:

Yt = β0 + β1Xt + ut .
a) Какие из условий классической регрессии не
выполнены для модели без временного тренда?
b) Будет ли равна нулю сумма остатков для этой
регрессии? Как это связано с ошибочным предположением,
что E(u t ) = 0?

Задача 6
По данным задачи 1 «Потребление Кока-колы» (семинар 3.1.1):
1. Постройте факторное уравнение регрессии для Qt
(потреблениеe кока-колы) в зависимости от цен Pt.
2. Включите в уравнение регрессии лаговую компоненту Pt-τ.
Величину τ обоснуйте результатами корреляционного анализа
(семинар 12).
3. Включите в уравнение регрессии трендовую
составляющую.
4. Выберите уравнение наиболее адекватно описывающее
поведение спроса на кока-колу.
5. Постройте трендовую модель, адекватно описывающую
развитие Pt. Сделайте прогноз цен на 8,9,10,11 периоды
6. Сделайте прогноз объема потребления на 3 последних
(t=8,9,10) периода и на перспективу учитывая расчетные значения цен
(п.5). Сравните с расчетами Qt, сделанными по трендовым моделям.
Какая модель дает прогнозы объема потребления, более близкие к
реальным значениям показателя?
7. В каких границах будут находиться (с доверительной
вероятностью 0,95) среднее и реальное значения показателя Qt в 11-м
периоде?

49
Выполнение вариантов (1-15) РГЗ №2 п. 5. (формулировка
заданий и данные приведены в семинаре 2.2.2) в программе
STATISTICA.

Задания для самостоятельного решения

Упражнения

7. На основе годовых данных 1959-1983 годов были оценены


следующие функции спроса на продовольственные товары.

log Qt = 2.83 – 0.47 log PFt + 0.64 log Yt


(6.69) (-3.94) (24.48)
2
R = 0.987 DW = 0.627
log Qt = 1.87 – 0.36 log PFt + 0.38 logYt + 0.44log Qt-1
(3.24) (-2.79) (3.20) (24.10)
2
R = 0.990 DW = 1.65
где Q – спрос на продукты питания, PF – цены на продукты
питания, Y – доход, в скобках приведены значения t – статистики.
Проверьте каждое уравнение на наличие автокорреляции
ошибок первого порядка и дайте короткий комментарий результатов.
8. Пусть x1,….,xn – независимые случайные величины с
одинаковым средним α и дисперсионной матрицей σ2V, где vij = 1 (i =
1, 2,…,n), vij = ρ, (0<ρ<1; i,j = 1, 2,…,n; i≠j).Найдите обобщенную
оценку наименьших квадратов для α и покажите, что она совпадает с
оценкой наименьших квадратов, полученным обычным образом.
9. Пусть остатки в регрессии Xi = α + βZi + εi равны (1, 2, 0, -1,-
2). Опишите первый шаг метода Кочрена – Оркарта.

Задача 7
В таблице приведены данные по 18 наблюдениям модели
пространственной выборки:
Таблица 44
i x e i x e
2 2
i i i i
1 2 2 1 7 2
1,3 ,3 0 1,5 3,8
2 2 5 1 7 4
2,6 ,6 1 5,7 5,7
3 3 1 1 7 3

50
2,7 2,8 2 6,0 4,7
4 4 1 1 7 5
1,9 0,1 3 8,9 6,9
5 4 1 1 7 5
3,8 4,6 4 9,8 6,8
6 4 1 1 8 4
9,7 3,9 5 0,7 9,8
7 5 2 1 8 5
6,9 4,0 6 0,8 8,9
8 5 2 1 9 8
9,7 1,9 7 6,9 7,8
9 6 1 1 9 8
7,8 9,7 8 7,0 7,5

Предполагая, что ошибки регрессии представляют собой


нормально распределенные случайные величины, проверить гипотезу
о гомоскедастичности, используя тест Голдфелда–Квандта.

Задача 8
При оценивании модели пространственной выборки обычным
методом наименьших квадратов получено уравнение:
y€ = 3 + 0,6 x1 − 1,2 x 2
Уравнение регрессии квадратов остатков на квадраты
регрессоров имеет вид:
2
e€2 = 2 + 0,3x12 + 0,1x 22 ; R =0,2.
Зная, что объем пространственной выборки n=200, проверить
гипотезу Уайта о гомоскедастичности модели.

Задача 9
При оценивании модели пространственной выборки с помощью
обычного метода наименьших квадратов получено уравнение:
y€ = 12 + 3,43 x1 − 0,45 x 2 ; d =1,2.
t = (0,1) (0,4) (0,1)
При осуществлении регрессии квадратов остатков на квадраты
регрессоров получено уравнение вида:
e€2 = 4 + 2 x12 + 0,4 x 22 .
t= (0,7) (0,3)
Объем выборки n =3000. С какими из перечисленных ниже
выводов следует согласиться:
а) полученные значения коэффициентов модели с большой
вероятностью близки к истинным;
б) регрессор X2 может быть незначимым;

51
в) так как значение статистики Дарбина-Уотсона d далеко от
двух, следует устранить автокорреляцию остатков?

Задача 10
При оценивании модели временного ряда получены следующие
результаты.
Уравнение модели имеет вид:
y€ = 2 − 1,2t ; d =1,9.
t= (0,7)
С какими из перечисленных ниже выводов следует согласиться:
а) так как значение статистики Дарбина-Уотсона d близко к
двум, автокорреляция остатков отсутствует;
б) коэффициент модели при t значим;
в) если объем выборки достаточно велик, значение
коэффициента при t в любом случае с большой вероятностью близко к
истинному;
г) применение теста Бреуша-Голдфри может выявить
автокорреляцию остатков между отдаленными наблюдениями?

Задача 11
При оценивании модели временного ряда методом наименьших
квадратов получены следующие результаты:
y€t = 12 − 0,2t ; d =1,8.
t= (0,01)
Известно, что количество наблюдений n =150. С помощью теста
Льюинга-Бокса проверить гипотезу об отсутствии автокорреляции
первого порядка.

Задача 12
Применение теста Льюинга-Бокса дает следующие результаты:
Таблица 45
r(τ) rчаст(τ Qp P(Q>
) Qp)
0,34 0,33 21,45 0,00
0,2 0,11 24,12 0,00
0,01 0,00 24,13 0,00
0,00 0,00 24,13 0,00

Ряд остатков идентифицируется с помощью модели ARMA (p,q).


Какие значения p и q целесообразно выбрать на основе полученных
результатов тестирования?

52
Семинар 3.1.5
Защита расчетно-графического задания №2.

Семинар 3.1.6
Контрольная работа.

Примерный вариант контрольной работы:


Задание 1.
По результатам обследования 25 промышленных предприятий
была получена матрица парных коэффициентов корреляции:
У Х Х
1 2
1 0 0
,58 ,67
0 1 0
1 ,58 ,96
0 0 1
2 ,67 ,96
Какое утверждение верно?
Варианты ответов:
1. между Х1 и Х2 наблюдается мультиколлинеарность;
2. между У и Х1 связь обратная;
3. между У и Х2 связь несущественная;
4. ни одно, среди указанных.

Задание 2.
В чем состоит условие гомоскедастичности остатков в
регрессионной модели? Что гарантирует выполнение этого условия?

Задание 3.
При исследовании зависимости среднего балла успеваемости
студента (У) от объема прочитанной литературы (Х1) и количества
пропущенных занятий (Х2) по данным n=20 наблюдений получено
уравнение регрессии: У = 3 + 0,3Х1 – 1,6Х2. Среднеквадратические
отклонения коэффициентов регрессии Sb1 = 0,2 и Sb2 = 0,8. Начиная с
какого уровня значимости α можно утверждать, что средний балл
успеваемости зависит от объема прочитанной литературы? (t0.2;17 =
1,33; t0.1;17 = 1,74; t0.05;17 = 2,11; t0.01;17 = 2,90; tα;ν)
Варианты ответов:
1. 10%;
2. 20%;

53
3. 5%;
4. ни один среди указанных.

Задание 4.
По данным задания 3 с доверительной вероятностью 99%
приблизительно определите, на какую величину максимально может
измениться средний балл успеваемости студента, при увеличении
объема прочитанной литературы на единицу?
Варианты ответов:
1. 0,3;
2. 0,88;
3. 1,2;
4. ни один среди указанных.

Задание 5.
По результатам исследования 35 наблюдений получены две
эконометрические модели со следующими характеристиками:
модель №1: R2 = 0,76; расчетное значение коэффициента
Дарбина-Уотсона d = 2,01 ;
модель №2: R2 = 0,99; расчетное значение коэффициента
Дарбина-Уотсона d = 0,93.
Какая модель является более адекватной?
Варианты ответов:
1. модель №1;
2. модель №2;
3. обе модели адекватные;
4. ни один среди указанных

Семинар 3.1.7

Разбор решений задач контрольной работы. Доклады студентов


по результатам расчетно-графического задания №2.

Тема 3.2 Системы линейных одновременных уравнений

Семинар 3.2.1
Модель спроса и предложения. Косвенный метод наименьших
квадратов.

Пример 9

54
Для оценки параметров какого из следующих уравнений
системы можно применить косвенный МНК.
Х1=β12Х2 + α11Z1 + α12Z2 + γ1 + ε1
Х2=β21Х1 + γ2 + ε2
Ответ обосновать.

Пример 10
Система уравнений имеет вид:
Х1=а12Х2 + b11Z1
Х2=а21Х1
Какое из уравнений неидентифицировано, почему?

Пример 11
Для оценки параметров какого из следующих уравнений
системы можно применить косвенный МНК?
Х1=β12Х2 + α11Z1 + α12Z2 + с1 + ε1
Х2=β21Х1 + ε2
Ответ обосновать.

Задача 13
Рассматривается простая Кейнсианская модель:
С=α+β*Y+ε
Y=C+I
Где Y - доход, C – потребление, I – инвестиции. Система
уравнений приведенной формы следующая:

α β 1
С= + I+ ε
1− β 1− β 1− β
α 1 1
Y= + I+ ε
1− β 1− β 1− β
Ошибки в приведенной форме для С и Y таковы:
1 1 1
η1 = η2 = ε= ε= ε,
1− β 1 − 0,8 0, 2
т.е. в модели в приведенной форме η1 и η2 распределены
нормально.
В таблице 46 приводятся 20 значений (данные условные) для I и
нормально распределенные ошибки η.Получены данные для C и Y из

55
уравнений приведенной формы, используя значения параметров α = 2
и β = 0,8.
Таблица 46
№ I C Y η1 =
п/п η2
1 2,00 18,19 20,19 0,193
2 2,00 17,50 19,50 -0,504
3 2,20 16,48 18,68 -2,318
4 2,20 19,06 21,26 0,257
5 2,40 21,38 23,78 1,784
6 2,40 21,23 23,63 1,627
7 2,60 21,11 23,71 0,708
8 2,60 22,65 25,25 2,252
9 2,80 20,74 23,54 -0,462
10 2,80 19,85 22,65 -1,348
11 3,00 22,23 25,23 0,234
12 3,00 22,23 25,23 0,226
13 3,20 23,43 26,63 0,629
14 3,20 23,04 26,24 0,244
15 3,40 23,03 26,43 -0,569
16 3,40 24,45 27,85 0,853
17 3,60 26,63 30,23 2,227
18 3,60 24,47 28,07 0,074
19 3,80 24,67 28,47 -0,527
20 3,80 26,00 29,80 0,804
В реальной ситуации существуют только значения I, C, Y.
Значения ошибки в модели и значения α и β неизвестны.
Используя данные таблицы 46, оцените уравнение приведенной
формы для объема потребления и дохода.

Задача 14
Используя данные задачи 13 посчитайте косвенные МНК-
оценки для α и β из:
1. уравнения приведенной формы для объема потребления;
2. уравнения приведенной формы для дохода.
Идентичны ли косвенные МНК-оценки, полученные из обоих
уравнений приведенной формы?

Задача 15
Используя данные задачи 13 определите простые МНК-оценки
для α и β и сравните их с косвенными МНК-оценками из задачи 14.

Задача 16

56
Используя данные задачи 13 для I и используя значения
параметров α = 2 и β = 0,8 составьте 100 выборок для C и Y.

Задача 17
Используя результаты задачи 16:
1. Примените простой МНК к каждому структурному
уравнению системы для 100 выборок.
2. Посчитайте среднее 100 оценок α и β.
3. Проверьте степень эмпирического смещения.

Задача 18
Используя результаты задачи 16:
1. Определите:
А. косвенные МНК-оценки для α и β для 100 выборок;
Б. среднее 100 оценок α и β;
В. степень смещения в маленьких выборках – размером по 20
наблюдений.
2. Сравните смещение косвенных МНК-оценок со смещением
обычных МНК-оценок.

Задача 19
Используя результаты задачи 16, объедините пары выборок так,
чтобы получились 50 выборок по 40 наблюдений.
1. Определите:
А. косвенные МНК-оценки для α и β для этих 50 выборок;
Б. среднее и проверьте смещение оценок.
2. Будут ли эмпирические смещения в этом случае меньше, чем
рассчитанные из 100 выборок по 20 наблюдений?

Семинар 3.2.2
Трехшаговый метод наименьших квадратов.

Пример 12
Почему двухшаговый МНК не применим для оценивания
неидентифицированных уравнений?

Задача 20
Имеются следующие данные:
Таблица 47
N Z1 Z2 Z3 Z4 Z5 X1 X2 X3
1 1 3,06 1,34 8,48 28,00 359,27 102,96 578,49

57
2 1 3,19 1,44 9,16 35,00 415,76 114,38 650,86
3 1 3,30 1,54 9,90 37,00 435,11 118,23 684,87
4 1 3,40 1,71 11,02 36,00 440,17 120,45 680,47
5 1 3,48 1,89 11,64 29,00 410,66 116,25 642,19
6 1 3,60 1,99 12,73 47,00 530,33 140,27 787,41
7 1 3,68 2,22 13,88 50,00 557,15 143,84 818,06
8 1 3,72 2,43 14,50 35,00 472,80 128,20 712,16
9 1 3,92 2,43 15,47 33,00 471,76 126,65 722,23
10 1 4,15 2,31 16,61 40,00 538,30 141,05 811,44
11 1 4,35 2,39 17,40 38,00 547,76 143,71 816,36
12 1 4,37 2,63 18,83 37,00 539,00 142,37 807,78
13 1 4,59 2,69 20,62 56,00 677,60 173,13 983,53
14 1 5,23 3,35 23,76 88,00 943,85 223,21 1292,99
15 1 6,04 5,81 26,52 62,00 893,42 198,64 1179,64
16 1 6,36 6,38 27,45 51,00 871,00 191,89 1134,78
17 1 7,04 6,14 30,28 29,00 793,93 181,27 1053,16
18 1 7,81 6,14 25,40 22,00 850,36 180,56 1085,91
19 1 8,09 6,19 28,84 38,00 967,42 208,24 1246,99
20 1 9,24 6,69 34,36 41,00 1102,61 235,43 1401,94

Таблица 47 содержит векторы наблюдений Z1, Z2 , Z3, Z4, Z5 и


X1, X2, X3 которые представляют выборку, полученную из модели:
Х1 = β12 Х2 + β13 Х3 + α11Z1 + ε1,
Х2 = β12 Х1 + α21Z1 + α22Z2 + α23Z3 + α24Z4 + ε2,
Х3 = β32 Х2 + α31Z1 + α32Z2 + α35Z5 + ε3,
Или в матричной форме:
XB = ZA + ε,
где εi – нормально распределенные векторы.
Гипотетические структурные матрицы коэффициентов В, А и
ковариационная матрица Σ следующие:

⎡60 −40 10 ⎤
⎢ −80 ⎥⎥
⎡ 0 0, 2 0 ⎤ ⎢0 4 ⎡ 227,55 8,91 −56,89 ⎤
⎢ ⎥
В = ⎢ −10 −1 2 ⎥ , А = ⎢ 0 6 0 ⎥ , ∑ = ⎢⎢ 8,91 0, 66 −1,88 ⎥⎥
⎢ ⎥
⎢⎣ 2,5 0 −1⎥⎦ ⎢ 0 −1,5 0 ⎥ ⎢⎣ −56,89 −1,88 15, 76 ⎥⎦
⎢⎣ 0 0 −5 ⎥⎦

Матрица коэффициентов в приведенной форме для


гипотетической модели следующая:

⎡ −142,50 11,50 13, 00 ⎤


⎢ 110, 00 18, 00 116, 00 ⎥
⎢ ⎥
D = AB −1 = ⎢ 15, 00 −3, 00 −6, 00 ⎥
⎢ ⎥
⎢ −3, 75 0, 75 1,50 ⎥
⎢⎣ 6, 25 1, 25 7,50 ⎥⎦

58
В реальной ситуации B, A, Σ, D были бы неизвестны, доступны
были бы только наблюдения в таблице 47 .
Оцените матрицу параметров приведенной формы D = (ZTZ)-
1 T
Z Х.

Задача 21
По данным задачи 20 примените простой МНК к каждому
структурному уравнению системы и оцените матрицы В и А.

Задача 22
По данным задачи 20 используя косвенный МНК, оцените
параметры второго строго идентифицированного уравнения.

Задача 23
По данным задачи 20:
1. Найдите b2 и a2, решая систему:
D2 = D−2b2 + T2A′ a2
2. Сравните с результатом задачи 22.

Задача 24
По данным задачи 20:
1. Найдите минимальный корень λ из уравнения:
W l − λW = 0
2. Используя формулу метода наименьшего дисперсионного
отношения при k = λ, оцените параметры в каждом из трех
структурных уравнений.

Задача 25.
По данным задачи 20, используя формулу двухшагового метода
наименьших квадратов при k = 1, сравните оценки матрицы D,
полученные на основе оценок простым МНК, МНДО и 2МНК, с
исходными гипотетическими матрицами параметров приведенной
формы.

Задача 26.
По данным задачи 20, используя формулу 3МНК, оцените
параметры первого и третьего структурных уравнений совместно.

Задача 27.
Имеем модель Клейна, в которой

59
C = α P + β (W + V ) + χ P−1 + δ + ε1
I = ϕ P + γ P−1 + η K −1 + π + ε 2 , где
W = μ (Y + T − V ) + θ (Y−1 + T−1 − V−1 ) + ψ t + ζ + ε 3

С – функция потребления, I – функция инвестиционного спроса,


W – функция спроса на труд.
Выполняются следующие макроэкономические соотношения:
Y + T = C + I + G, Y = W + V + P, K = K-1 + I
где С – потребительские расходы;
I – инвестиционные расходы;
G – государственные расходы;
P – прибыль;
W – спрос на труд негосударственного сектора;
V – спрос на труд государственного сектора;
K – капитал;
T – налоги;
t – время;
Y – чистый доход от налогов.
Таблица 48
№ t C P W I K-1 V G T
п/п
1 1920 39,8 12,7 28,8 2,7 180,1 2,2 2,4 3,4
2 1921 41,9 12,4 25,5 -0,2 182,8 2,7 3,9 7,7
3 1922 45,0 16,9 29,3 1,9 182,6 2,9 3,2 3,9
4 1923 49,2 18,4 34,1 5,2 184,5 2,9 2,8 4,7
5 1924 50,6 19,4 33,9 3,0 189,7 3,1 3,5 3,8
6 1925 52,6 20,1 35,4 5,1 192,7 3,2 3,3 5,5
7 1926 55,1 19,6 37,4 5,6 197,8 3,3 3,3 7,0
8 1927 56,2 19,8 37,9 4,2 203,4 3,6 4,0 6,7
9 1928 57,3 21,1 39,2 3,0 207,6 3,7 4,2 4,2
10 1929 57,8 21,7 41,3 5,1 210,6 4,0 4,1 4,0
11 1930 55,0 15,6 37,9 1,0 215,7 4,2 5,2 7,7
12 1931 50,9 11,4 34,5 -3,4 216,7 4,8 5,9 7,5
13 1932 45,6 7,0 29,0 -6,2 213,3 5,3 4,9 8,3
14 1933 46,5 11,2 28,5 -5,1 207,1 5,6 3,7 5,4
15 1934 48,7 12,3 30,6 -3,0 202,0 6,0 4,0 6,8
16 1935 51,3 14,0 33,2 -1,3 199,0 6,1 4,4 7,2
17 1936 57,7 17,6 36,8 2,1 197,7 7,4 2,9 8,3
18 1937 58,7 17,3 41,0 2,0 199,8 6,7 4,3 6,7
19 1938 57,5 15,3 38,2 -1,9 201,8 7,7 5,3 7,4
20 1939 61,6 19,0 41,6 1,3 199,9 7,8 6,6 8,9
21 1940 65,0 21,1 45,0 3,3 201,2 8,0 7,4 9,6
22 1941 69,7 23,5 53,3 4,9 204,5 8,5 14 12

60
На основе данных таблицы 48:
1. Оцените параметры модели Клейна простым методом
наименьших квадратов;
2. Оцените параметры модели Клейна двухшаговым методом
наименьших квадратов;
3. Покажите величину смещения оценок.

Задача 28
Экономическая модель описана следующими уравнениями:
Х1 = α10 + α11Z1 + β12 Х2 + ε1,
Х2 = α20 + β21 Х1 + ε2,
где Х1 и Х2 – эндогенные переменные, Z1 – экзогенная
переменная, ε1 и ε2 – случайные ошибки.
Определите направление смещения оценки для β21, если для
оценивания второго уравнения используется метод наименьших
квадратов.

Задача 29
Дана следующая макроэкономическая модель:
Y = C + I + G – макроэкономическое тождество,
C = α10 + β11 Y – функция потребления,
I = α20 + β21 Y - β22 R – функция инвестиций,
(M/P) = β31 Y – β32 R – уравнение денежного рынка,
где эндогенными переменными являются доход Y, потребление
C, инвестиции I и процентная ставка R.
Переменные: государственные расходы G, реальная денежная
масса (M/P)– экзогенные.
Проверьте, является ли данная система идентифицируемой, и
перепишите модель в приведенной форме.

Задача 30
Дана следующая модель краткосрочного равновесия для малой
открытой экономики (модель Манделла – Флеминга):
Y = C + I + nX – макроэкономическое тождество,
C = α11 + β11 Y + ε1– функция потребления,
I = α21 - α21 R + β21 Y + ε2 – функция инвестиций,
nX = α31 – β31 Y - β32 ec + ε3 – функция чистого экспорта,
(M/P) = β41 Y – α41 R + ε4– уравнение денежного рынка,
Где эндогенными переменными являются: доход Y,
потребление C, инвестиции I, чистый экспорт nX и валютный курс ec.
Переменные: процентная ставка R, значение которой формируется на
общем уровне и реальная денежная масса (M/P) – экзогенные; ε1,.,ε4 -
случайные ошибки.
Задания:

61
1. Запишите общие условия для определения структурных
параметров каждого уравнения модели.
2. Какие уравнения модели точно идентифицируемы?
3. Перепишите модель Манделла – Флеминга в приведенной
форме.

Тема 3.3 Основные понятия и модели


дисперсионного анализа

Семинар 3.3.1
Исследование тесноты связи количественных и качественных
переменных. Однофакторный дисперсионный анализ.

Пример 13
Статистическая совокупность разбита по факторному признаку
на 4 группы (А, В, С, Д). Рассчитаны следующие показатели по
результативному признаку:
Таблица 49
Группы Групповые Средние Численность в
средние квадратические группах
отклонения
А 20 10 30
В 25 5 30
С неизвестно 6 25
Д 22 7 15
Общая средняя величина результативного признака в
совокупности равна 22,8 его размерности.
Определите эмпирическое корреляционное отношение.

Задача 31
В результате обследования 20 квартир, получены следующие
(условные) данные:
Таблица 50
№ Тип дома Район города Цена квартары
1 К Ц 65
2 К С 57
3 П С 55
4 П Ц 50
5 П Ц 70
6 Н А 65

62
7 Н А 55
8 К Ц 58
9 П С 50
10 Н А 70
11 Н А 68
12 К Ц 80
13 К Ц 70
14 П А 80
15 П А 58
16 П С 57
17 К Ц 65
18 П С 52
19 П С 45
20 К Ц 62
К – кирпичный дом; П – панельный дом; Н – дом новой
планировки.
А –район Академгородка; Ц – центральный район; С- район
Солнечный.
Задание:
1. Проведите однофакторный дисперсионный анализ между
стоимостью квартиры и типом дома.
2. Наблюдается ли связь между стоимостью квартиры и типом
дома?

Задача 32
По данным задачи 31:
1. Проведите однофакторный дисперсионный анализ между
стоимостью квартиры и районом города, где находится дом.
2. Наблюдается ли связь между стоимостью квартиры и
районом города?

Задача 33
Дополните выборку задачи 7 «Успеваемость» (семинар
2.2.1) данными Х 4 – пол студента (муж/жен)
Проведите однофакторный дисперсионный анализ.
Наблюдается ли связь между полом (муж/жен) студента и
его средним баллом за первый курс?

Задача 34
Дополните выборку задачи 7 «Успеваемость» (семинар
2.2.1) данными Х 5 – тип среднего образовательного
учреждения (школа/гимназия).

63
Проведите однофакторный дисперсионный анализ.
Наблюдается ли связь между типом образовательного
учреждения, которое окончил студент и его средним баллом
за первый курс?

Семинар 3.3.2
Двухфакторный дисперсионный анализ

Задача 35
По данным задач 7 «Успеваемость» (семинар 2.2.1), 33
и34 (семинар 3.3.1) проведите двухфакторный
дисперсионный анализ между Х 3 , Х 4 ,Х 5 .
Можно ли утверждать, что «вчерашние» гимназистки
имеют более ощутимые успехи в СФУ, чем их
однокурсники?

Задача 36
По данным задач 31 и 32 (семинар 3.3.1):
1. Проведите двухфакторный дисперсионный анализ между
стоимостью квартиры, типом дома и районом города, где находится
дом.
2. Действительно ли что, квартиры в кирпичных домах в центре
города более дорогие?

64

Вам также может понравиться