Открыть Электронные книги
Категории
Открыть Аудиокниги
Категории
Открыть Журналы
Категории
Открыть Документы
Категории
Т. В. Крупкина, А. И. Пыжев,
С. В. Бабенышев, Е. С. Кирик
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
В ПРИМЕРАХ И ЗАДАЧАХ
Учебное пособие
СФУ 2007
УДК 000.000
ББК 22.17я73
К 84
Рецензенты
Т. В. Крупкина
К 84 Теория вероятностей и математическая статистика в при-
мерах и задачах. : учебное пособие / Т. В. Крупкина, А. И. Пыжев, С.
В. Бабенышев, Е. С. Кирик. Сибирский федеральный университет.
Красноярск: 2007. 171 с.
ISBN 0-0000-0000-0
ISBN 0-0000-0000-0
Содержание
Принятые обозначения и сокращения 5
4. Схемы испытаний 51
4.1. Схема Бернулли. Полиномиальная схема . . . . . . . . . . . 51
4.2. Асимптотические формулы для схемы Бернулли . . . . . . . 57
3
Содержание
Приложение 162
4
Содержание
5
1. Классическое определение вероятности
Рассмотрим некоторый опыт с конечным числом n взаимоис-
ключающих друг друга исходов, которые равновозможны. Пусть A —
некоторое событие, связанное с этими исходами. Вероятность p (A) можно
определить как долю тех исходов, в результате которых это событие осу-
ществляется:
n (A)
p (A) = , (1)
n
где n — число всех исходов, а n (A) — число исходов благоприятных исхо-
дов, т. е. исходов, в результате которых осуществляется событие A.
Pn = n! (2)
N = n1 · n2 · . . . · nr . (3)
N = nr . (4)
6
Число разбиений на группы. Число способов, которыми можно
разбить n различных элементов на k групп, содержащих соответственно
n1 , n2 , . . . , nk элементов, равно
n!
N= . (7)
n1 ! · n2 ! · . . . · nk !
7
J Числа 100 и 101, очевидно, не кратны 6, а число 102 — кратно. Следова-
тельно, кратны 6 числа 108, 114, . . . , 294, 300.
Итак, последовательность 102, 108, . . . , 294, 300 содержит
300 − 108
+ +1 = 34 элемента. Следовательно, число благоприятных
6
исходов n (A) равно 34.
34
p (A) = .I
201
Пример 4. A = {Число состоит из нечетных цифр}.
n (A) = 1 · 5 · 5 = 25.
25
Следовательно, p (A) = .I
201
В задачах примеров 5—8 испытание состоит в бросании двух играль-
ных костей. Исходом в задаче будет являться пара чисел hc1 , c2 i, выпавших
на костях. Например, пара h1, 6i означает, что выпали кости
, пара
h5, 2i — .
Обращаем внимания читателя на то, что пара hc1 , c2 i является упоря-
доченной, т. е. hc1 , c2 i 6= hc2 , c1 i. Пара h3, 4i означает, что сначала выпала
кость , а затем — .
Требуется найти вероятность события A.
Число всех исходов n равно 62 = 36.
J Перечислим благоприятные исходы: h1, 6i, h6, 1i, h5, 2i, h2, 5i, h4, 3i,
h3, 4i. Как видно, всего их 6.
6 1
p (A) = = .I
36 6
Пример 6. A = {Сумма выпавших очков делится на 3}.
8
J Делятся на три суммы очков 3, 6, 9, 12. Запишем исходы для каждой из
сумм в таблицу:
P
Исходы Количество исходов
3 h1, 2i, h2, 1i 2
6 h2, 4i, h4, 2i, h3, 3i, h5, 1i, h1, 5i 5
9 h6, 3i, h3, 6i, h4, 5i, h5, 4i 4
12 h6, 6i 1
J Благоприятные исходы: h6, 2i, h2, 6i, h5, 1i, h1, 5i. Их четыре.
4 1
p (A) = = .I
36 9
Пример 8. A = {На костях выпадет одно и то же число очков}.
h1, 1i, h2, 2i, h3, 3i, h4, 4i, h5, 5i, h6, 6i.
6 1
p (A) = = .I
36 6
J Всего карт красной масти 18. Из колоды вынимается 5 карт, поэтому чис-
ло благоприятных исходов — это число сочетаний из 18 по 5:
5
n (A) = C18 .
5
C18
p (A) = 5 . I
C36
Пример 10. A = {Среди вынутых пяти карт два туза}.
9
J Всего тузов в колоде 4. Следовательно, остальные 3 карты будут
вынуты из 32.
n (A) = C42 · C32
3
.
C42 · C32
3
p (A) = 5 .I
C36
Пример 11. A = {Среди пяти карт хотя бы одна дама}.
10
Пример 13. На полке трудов лауреатов Нобелевских премий по эко-
номике стоят 4 книги Хикса 1 и 3 книги Фридмана2 . Наугад берутся 2
книги. Найти вероятность того, что среди них хотя бы одна книга
Хикса.
Следовательно,
18 6
p (A) = = .I
21 7
Пример 14. В супермаркете продают 12 сортов масла от разных
производителей. Известно, что четверть сортов не соответству-
ет стандарту. Случайно выбирают 3 сорта масла. Какова вероят-
ность, что ровно два из них соответствуют стандарту?
3
J Число всех исходов равно C12 = 220.
11
J Число билетов, содержащих всевозможные комбинации из двух вопро-
2
сов, равно C40 = 780.
2 0
n (A) = C30 · C10 = 435.
435 29
p (A) = = .I
780 52
Пример 17. Перед тем, как выпустить новый товар на рынок, мно-
гие компании проводят опрос потребителей для выяснения будуще-
го успеха товара. Представитель компании, разрабатывающей но-
вый йогурт с биодобавками, зашел в магазин, где в этот момент
присутствовали 20 покупателей, наугад выбрал троих из них и пред-
ложил им попробовать продукт. Если предположить, что из 20 по-
купателей 5 вообще не употребляют йогурт, 7 не любят биодобав-
ки, а 8 покупателям новый продукт понравился бы, какова вероят-
ность того, что не меньше чем двое из троих опрошенных одобрят
продукт?
3
J Всего исходов C20 = 1140.
Если двое из троих опрошенных одобрят продукт, то благоприятных
1
исходов C82 · C12 = 12 · 28 = 336. Если новый йогурт понравится всем троим,
то благоприятных исходов C83 = 56. Следовательно,
n (A) = 336 + 56 = 392.
392 98
p (A) = = .I
1140 285
Пример 18. В коробке лежат 30 конфет, половина из них — с кофей-
ной начинкой. Наугад берутся 3 конфеты. Найти вероятность то-
го, что среди них не более одной конфеты с кофейной начинкой.
3
J Всего исходов C30 = 4060.
Если конфета с кофейной начинкой одна, то благоприятных исходов
1 2
C15 · C15 = 15 · 105 = 1575. Если среди выбранных нет ни одной конфеты с
0 3
кофейной начинкой, то благоприятных исходов C15 · C15 = 1 · 105 = 455.
Следовательно,
n (A) = 1575 + 455 = 2030.
2030 1
p (A) = = .I
4060 2
В задачах примеров 19—22 испытание состоит в том, что из цифр
1, 2, . . . , 9 выбирают без возвращения и записывают в порядке выбора 4
цифры, образующие четырехзначное число. Найти вероятность события A.
Поскольку испытание состоит в выборе без возвращения и с учетом
порядка, всего исходов A49 = 3024.
12
Пример 19. A = {Записано число 9127}.
n (A) = 1.
1
p (A) = .I
3024
Пример 20. A = {На четырех местах стоят нечетные цифры}.
14
2
J Всего у Семена C20 = 190 вариантов выбора фильмов. Случаев, когда
2
Семен выберет незнакомые фильмы, C14 = 91.
2
C14
p (A) = 2 . I
C20
Пример 27. Карточки, на которых написаны буквы
Т , Е , Л , Е , С , К , О , П ,
раскладывают в ряд. Какова вероятность, что полученное восьми-
буквенное слово является осмысленным?
J Обозначим события:
A0 = {Число правильно вложенных конвертов равно 0},
A1 = {Число правильно вложенных конвертов равно 1},
...
A4 = {Число правильно вложенных конвертов равно 4}.
Всего вариантов вложения писем в конверты 4! = 24. Непосредствен-
ным перебором вариантов устанавливаем, что
i n (Ai ) p (Ai )
3
0 9 8
1
1 8 3
1 I
2 6 4
3 0 0
1
4 1 24
15
J Всего злоумышленник может набрать 108 различных комбинаций, из них
искомый пароль может встретиться ровно один раз. Следовательно,
1
p (A) = .I
108
Пример 30. Какова вероятность угадать 5 выигрышных номеров в
тираже «Спортлото», отмечая на карточке пять чисел от 1 до 36?
5
J Всего наборов по 5 номеров C36 штук. Благоприятный исход один.
1
p (A) = 5 .I
C36
Пример 31. В урне имеется три шара: черный, красный и белый. Из
урны 4 раза извлекали шар, причем после каждого извлечения шар
возвращали обратно. Определить вероятность того, что 4 раза из-
влекали черный шар.
16
Задачи
В задачах 1—3 испытание состоит в случайном выборе одной буквы
из букв слова «ЭКОНОМИКА»; необходимо найти вероятность события
A.
1. A = {Вынута буква «М»}.
2. A = {Вынута согласная буква, но не «М»}.
3. A = {Вынута гласная буква}.
17
причем список выступающих был составлен по алфавиту. Какова ве-
роятность, что 5 первых докладов делали второкурсники?
17. В 25 экзаменационных билетах содержится по два не по-
вторяющихся вопроса. Студент знает ответы только на 40 вопро-
сов. Какова вероятность того, что ему достанется билет, в кото-
ром он оба вопроса знает?
18. В 25 экзаменационных билетах содержится по два не по-
вторяющихся вопроса. Сколько вопросов надо выучить студенту
при подготовке к экзамену, чтобы вероятность того, что ему до-
станется билет, в котором он оба вопроса знает, была бы не меньше
0,9?
19. Из девяти мобильных телефонов три — китайской сборки,
два — венгерской. Какова вероятность, что среди выбранных слу-
чайно четырех телефонов поровну аппаратов китайской и венгер-
ской сборки?
20. Среди двадцати купюр есть две фальшивые. Если взять слу-
чайно две купюры из двадцати, какова вероятность того, что среди
них хотя бы одна фальшивая?
21. Из коробки, в которой лежат 10 испанских апельсинов и 6 —
марокканских, наудачу вынимают 3 фрукта. Найти вероятность
того, что образовалась пара, т. е. вынут один апельсин, выращен-
ный в Испании, и один — из Марокко.
18
специалистов, делится случайным образом на три равные подгруп-
пы. Найти вероятность того, что в каждой части число руководи-
телей и специалистов одинаково.
31. Четыре книги Акунина4 , пять книг Лукьяненко5 и три кни-
ги Роулинг6 случайно раскладывают на 3 бандероли по 4 книги. Како-
ва вероятность, что книги Роулинг окажутся в одной бандероли?
32. Тридцать студентов наудачу расходятся по трем аудито-
риям. Найти вероятность того, что в первой будет 12 человек, а во
второй 5.
33. В автобус зашли 5 человек. Автобус делает 7 остановок.
Найти вероятность того, что все пятеро выйдут на разных оста-
новках.
34. В телефонном номере 6 цифр. Какова вероятность того,
что все цифры различны?
35. В лотерее разыгрывается 1000 билетов. Среди них два вы-
игрыша по 5000 руб., пять выигрышей по 2000 руб., десять выигрышей
по 1000 руб. и 25 по 500 руб. Некто покупает один билет.
а) выигрыша не менее 2000 руб.,
Найти вероятность:
б) какого-либо выигрыша.
36. Семеро сотрудников становятся в очередь для получения
заработной платы. Определить вероятность того, что два опре-
деленных человека стоят рядом.
37. На семинаре «Проблемы невозврата потребительских кре-
дитов» 7 человек, среди которых были два представителя Торгово-
промышленной палаты, случайным образом разместились за круг-
лым столом. Определить вероятность того, что представители
Торгово-промышленной палаты сидят рядом.
38. На полке произвольным образом расставили 6 разных книг
Астафьева7 . Какова вероятность, что две фиксированные книги
окажутся стоящими рядом?
39. На полке стоят 30 книг, среди них шеститомник Каспаро-
8
ва . Какова вероятность, что тома Каспарова расположены в по-
рядке возрастания номеров, но не обязательно рядом?
40. В группе из 15 студентов 7 родились в Красноярске, 4 — в
Томске, 3 — в Новосибирске и 1 — в Норильске. Из группы выбирают 4
студентов. Какова вероятность, что среди них есть уроженцы всех
4
Борис Акунин (псевдоним, настоящее имя — Григорий Чхартишвили; р. 1956) — российский писатель.
5
Сергей Лукьяненко (р. 1968) — российский писатель-фантаст.
6
Джоа́н Ро́улинг (англ. Joanne Rowling ; р. 1965) — английская писательница.
7
Виктор Астафьев (1924—2001) — российский писатель.
8
Каспаров, Г. М. Мои великие предшественники. Новейшая история развития шахматной игры:
В 6 т. / Гарри Каспаров. М.: Рипол классик, 2005.
19
4 городов?
41. Карточки, на которых написаны буквы
А , Ш , Ф , К , Л , Е ,
раскладывают в ряд. Какова вероятность, что получится слово
«ФЛЕШКА»?
42. Карточки, на которых написаны буквы
Г , А , С , Т , Р , О , Н , О , М ,
раскладывают в ряд. Какова вероятность, что они лягут в порядке
«НОРМАГОСТ»?
43. На клавиатуре пишущей машинки 26 букв латинского ал-
фавита. Ребенок 4 раза нажимает клавиши. Какова вероятность,
что он напечатает слово “WORD”?
20
2. Основания теории вероятностей
2.1. Основные понятия
Комбинации событий
21
2.1 Основные понятия
Свойства операций
2. (A + B) + C = A + (B + C) (A · B) · C = A · (B · C) (ассоциативность)
3. A+A=A A·A=A
4. A+∅=A A·∅=∅
5. A+Ω=Ω A·Ω=A
6. A+A=Ω A·A=∅
7. A+B =A·B A·B =A+B (законы двойственности)
(дистрибутивность умножения
8. (A + B) · C = A · C + B · C
относительно сложения)
9. Ω=∅
10. ∅=Ω
22
2.1 Основные понятия
A = {h0, 0, 1i}. I
A = {h0, 0, 1i, h0, 1, 0i, h1, 0, 0i, h0, 1, 1i, h1, 1, 0i, h1, 0, 1i, h1, 1, 1i}. I
J D = A B C + A B C + A B C. I
J D = A B C + A B C + A B C. I
J D = A + B + C = A B C. I
J D = A + B + C = ABC. I
J D = A B C + A B C + A B C + A BC. I
23
2.1 Основные понятия
J D = A B C + A B C + A B C + A BC. I
n
[
J Ai = {Исправен хотя бы один блок}.
i=1
n
\
Ai = {Исправны все блоки}.
i=1
n
[
Ai = {Не исправен хотя бы один блок}.
i=1
n
\
Ai = {Не исправны все блоки}. I
i=1
Пример 44. C = A + A B + A + B.
J C = A + A B + A + B = A + A B + A B = A + A(B + B).
Поскольку B + B = Ω, C = A + A = Ω. I
J C = (A + B)(A + B) + (A + B)(A + B) =
= A A + B A + A B + B B + A A + A B + A B + B B.
Поскольку B B = ∅, A A = ∅,
C = B A + A B + B A + B A = B(A + A) + B(A + A) = B + B = Ω. I
24
2.1 Основные понятия
J Пусть x ∈ A \ (B C) ⇒ x ∈ A(B + C) ⇒ x ∈ A B + A C.
Теперь положим x ∈ (A \ B) + (A \ C) ⇒ x ∈ A B + A C.
Тождество доказано. I
J A и B несовместны, следовательно, A B = ∅.
Рассмотрим пересечение событий A C и B C:
A C B C = A B C = ∅.
Поэтому, A C и B C несовместны. I
A + B + C = AB + AB + BC + BC + C B + C B =
= A B C + A B C + A B C + A B C + A B C + A B C+
+ ABC + ABC + ABC + ABC + ABC + ABC =
= A B C + A B C + A B C + A B C + A B C + A B C + A B C.
25
2.1 Основные понятия
Задачи
В задачах 44—48 описать Ω и подмножество Ω, соответствующее со-
бытию A.
44. Было совершено 3 сделки, A = {2 оказались прибыльными}.
45. Фирма обращается в банки для получения кредита поооче-
редно, то есть дожидается решения, и в случае отказа в кредито-
вании обращается в следующий банк. A = {только 4-й банк примет
положительное решение о кредитовании}.
46. На каждом из двух постов находятся от 1 до 3 охранников.
A = {На втором посту охранников больше, чем на первом}.
47. Четыре человека задумывают по цифре для шифра, A =
{задуманы одинаковые цифры}.
48. Резюме размещают на двух сайтах, A = {хотя бы на одном
сайте есть отклик}.
26
2.1 Основные понятия
27
2.2 Геометрическое определение вероятности
S (Λ)
p (A) = . (10)
S (Ω)
Ω = {hx, yi | 0 6 x 6 2, 0 6 y 6 2} —
S(Λ) = 4 − π.
Тогда,
4−π π
p(A) = = 1 − ≈ 0, 2146. I
4 4
Пример 54. В круг радиуса 1 вписан квадрат. Найти вероятность
того, что точка, поставленная наудачу в круге, окажется вне квад-
рата.
29
2.2 Геометрическое определение вероятности
J Поскольку
Ω = {hx, yi | x2 + y 2 6 1} —
1
круг радиуса 1,
=
r
S (Ω) = π.
Множество Λ составляет множество Ω
за исключением квадрата, вписанного в круг
радиуса 1.
Рис. 2. По теореме Пифагора
√ находим, что сто-
рона квадрата составляет 2. Следовательно,
S (Λ) = π − 2.
π−2 2
p (A) = = 1 − ≈ 0, 3633. I
π π
Пример 55. Два сотрудника должны сдать отчеты с 10 до 13 часов.
Какова вероятность того, что между моментами сдачи отчетов
пройдет меньше часа?
5
Тогда S (Λ) = = p (A). I
9
32
2.2 Геометрическое определение вероятности
Задачи
71. Расчетное время выполнения проекта 92 ± 7 дней. Найти
вероятность того, что проект будет закончен не более, чем за 90
дней.
72. Если среднедушевой доход населения районов Красноярско-
го края представлен с точностью до 100 рублей, то какова вероят-
ность того, что ошибка округления не превышает 30 рублей?
73. Вдоль улицы через каждые 250 метров расположены реклам-
ные щиты. Каждый щит доступен для обозрения с расстояния 5—50
метров. Какова вероятность, что человеку, стоящему на улице, до-
ступен для обозрения щит?
74. В А́банском9 лесхозе 134 тыс. гектаров занято хвойными
породами и 85 тыс. гектаров занято мягколиственными породами.
9
А́бан — поселок городского типа, административный центр Абанского района Красноярского края.
33
2.2 Геометрическое определение вероятности
34
2.2 Геометрическое определение вероятности
|CB|}.
88. На 12-километровом участке водопровода между Академ-
городком и Ветлужанкой10 в двух местах происходит утечка воды.
Найти вероятность того, что расстояние между местами повре-
ждений меньше 3 км.
89. Студент заходит в электронный курс «Теория вероятно-
стей и математическая статистика» для студентов экономиче-
ского факультета в любое время между 19:00 и 19:30 и через 5 минут
отправляет преподавателю вопрос по решению задачи. После этого
студент еще 35 минут присутствует на сайте этого электронно-
го курса. Преподаватель заходит в этот же курс в случайное время
между 19.40 и 20.30, немедленно получает сообщение и отвечает че-
рез 10 минут. Какова вероятность, что студент получит сообщение
до своего выхода с курса?
90. Инвестор встречается с двумя клиентами, которые при-
ходят независимо друг от друга в интервале от 14 до 16 часов. Про-
должительность каждой встречи — 30 минут. Найти вероятность
того, что одному из клиентов придется ждать.
91. В диспетчерскую службу городских электрических сетей за
20 минут поступили 2 заявки на устранение аварии из разных рай-
онов города. Найти вероятность того, что промежуток времени
между заявками меньше 3 минут.
92. Игорь Кузнецов и Олег Сергеев — ведущие специалисты кон-
курирующих авиационных фирм, — собираются посетить Между-
народный аэрокосмический салон в один и тот же день, с 10 до 12
часов дня. Каждый из них проведет не меньше 30 минут на презен-
тации новейшего многоцелевого истребителя. Какова вероятность,
что они там встретятся?
93. Если условия предыдущей задачи распространяются на
троих бывших однокурсников: Кузнецова, Сергеева, а также Илью
Пономарева — сотрудника третьей конкурирующей фирмы, — то
какова вероятность встречи всех троих на презентации?
94. Проект состоит из двух этапов, второй этап можно вы-
полнять только по завершении первого. Расчетное время выполне-
ния первого этапа 180 ± 10 дней, второго этапа 60 ± 5 дней. Найти
вероятность того, что проект будет закончен не более, чем за 235
дней.
10
Академгородок и Ветлужанка — микрорайоны г. Красноярска.
35
3. Теоремы исчисления вероятностей
3.1. Теоремы сложения и умножения
n
! n
[ X X
p Ai = p (Ai ) − p (Ai Aj )+
i=1 i=1 16i<j6n
X
+ p (Ai Aj Ak ) − . . . + (−1)n−1 p (A1 . . . An ).
16i<j<k6n
36
3.1 Теоремы сложения и умножения
J Пусть
A ={Наличие сотового телефона},
B ={Наличие стационарного телефона},
тогда
AB = {наличие сотового и стационарного телефонов}.
По условию,
события A, B, и C независимы и
p (D) = p (A B C) + p (A B C) + p (A B C)−
− p (A B C A B C) − p (A B C A B C) − p (A B C A B C)+
+ p (A B C A B C A B C).
37
3.1 Теоремы сложения и умножения
Поскольку A A = ∅, B B = ∅, C C = ∅, то
p (A B C A B C) = p (A B C A B C) = p (A B C A B C) =
= p (A B C A B C A B C) = p (∅) = 0,
а, следовательно,
p (D) = p (A B C) + p (A B C) + p (A B C).
Так как события A, B и C независимы,
p (D) = p (A B C) + p (A B C) + p (A B C) = 0, 468. I
p (D) = p(A B C) = 1 − p (A B C) =
= 1 − [1 − p (A)][1 − p (B)][1 − p (C)] = 0, 856. I
38
3.1 Теоремы сложения и умножения
p (D) = p (A B C) + p (A B C) + p (A B C).
J Проинтерпретируем задачу.
Пусть A ={Первое изделие стандартно};
B ={Второе изделие стандартно};
p (A) = 0, 8; p (B) = 0, 8.
Способ 2. D = A B + A B + A B.
p (D) = p (A B) + p (A B) + p (A B) = 0, 16 + 0, 16 + 0, 64 = 0, 96.
Способ 3. D = A B.
39
3.1 Теоремы сложения и умножения
и сравнить их.
Введем события Ai = {i-й член жюри принимает правильное
решение}, i = 1, 2, 3. Тогда
A = A1 A2 A3 + A1 A2 A3 + A1 A2 A3 + A1 A2 A3 .
J Пусть
40
3.1 Теоремы сложения и умножения
A1 + A2 + . . . + An = A1 A2 . . . An .
n
1
p (A) = 1 − .
2
Число банков определится из неравенства
n
1
1− > 0, 99.
2
Решим это неравенство.
n
1
− > −0, 01;
2
n
1
6 0, 01;
2
2n > 100;
n > log2 100 ≈ 6, 64386;
Таким образом, нужно обратиться по меньшей мере в 7 банков, чтобы
вероятность получить хотя бы одно положительное решение о кредитовании
была не меньше 0,99. I
Задачи
95. Из 180 студентов 30 не сдали экзамен, 20 не сдали курсовую
работу, 15 не сдали и то и другое. Пусть событие A = {студент
сдал экзамен}, B = {студент сдал курсовую работу}. Являются ли
эти события независимыми?
96. В условиях предыдущей задачи найти вероятность того,
что студент не сдал экзамен, если известно, что он не сдал курсо-
вую работу.
97. Человек имеет текущий счет с вероятностью 0,56, депо-
зитный счет с вероятностью 0,42, и тот и другой с вероятностью
0,30. Являются ли события, состоящие в наличии счетов, независи-
мыми? Какова вероятность, что имеется хотя бы один счёт?
98. В условиях предыдущей задачи найти вероятность того,
что человек имеет текущий счет при наличии депозитного счета.
99. Два аудитора проверили 10 одних и тех же фирм. Первый
аудитор обнаружил нарушения у 6 фирм, второй у 7 фирм, при этом
41
3.1 Теоремы сложения и умножения
42
3.1 Теоремы сложения и умножения
43
3.2 Формула полной вероятности. Формула Байеса
n
X
p (A) = p ( Hi ) p (A/Hi ). (17)
i=1
44
3.2 Формула полной вероятности. Формула Байеса
J Пусть
A ={Заключение сделки},
H1 ={Денежный перевод в ближайшие три дня},
H2 ={Денежный перевод позднее, но не позже, чем через неделю}.
p (H1 ) = 0, 3; p (H2 ) = 0, 8 − 0, 3 = 0, 5;
p (A/H1 ) = 0, 8; p (A/H2 ) = 0, 5.
По формуле полной вероятности
J Положим
A ={Купленный батон оказался непропеченным},
H1 ={Батон испекли в первой хлебопекарне},
H2 ={Батон испекли во второй хлебопекарне},
H3 ={Батон испекли в третьей хлебопекарне}.
11
То́мас Ба́йес (Бейес, англ. Reverend Thomas Bayes; 1702—1761) — английский математик и священник.
45
3.2 Формула полной вероятности. Формула Байеса
p (H1 ) p (A/H1 )
p (H1 /A) = .
p (H1 ) p (A/H1 ) + p (H2 ) p (A/H2 ) p (H3 ) p (A/H3 )
0, 1 · 0, 01
p (H1 /A) = ≈ 0, 013. I
0, 1 · 0, 01 + 0, 6 · 0, 1 + 0, 3 · 0, 05
46
3.2 Формула полной вероятности. Формула Байеса
= 0, 7 · 0, 1 + 0, 2 · 0, 3 + 0, 1 · 0, 4 = 0, 17. I
p (H1 ) = 0, 6 · 0, 6 · 0, 3 = 0, 108;
p (H2 ) = 0, 4 · 0, 4 · 0, 3 = 0, 048;
p (H3 ) = 0, 4 · 0, 6 · 0, 7 = 0, 168.
47
3.2 Формула полной вероятности. Формула Байеса
p (H1 ) p (A/H1 )
p (H1 /A) = .
p (H1 ) p (A/H1 ) + p (H2 ) p (A/H2 ) p (H3 ) p (A/H3 )
0, 108 · 1
p (H1 /A) = =
0, 108 · 1 + 0, 048 · 1 + 0, 168 · 1
0, 108 1
= = ≈ 0, 3333. I
0, 108 + 0, 048 + 0, 168 3
Пример 73. С вероятностью 0,6 договор находится в одной из трех
папок. После просмотра двух папок договор не обнаружен. Какова
вероятность того, что договор в третьей папке?
По условию задачи
p (H3 ) p (A/H3 ) 0, 2 · 1
p (H3 /A) = = =
4
P 0, 2 · 0 + 0, 2 · 0 + 0, 2 · 1 + 0, 4 · 1
p (Hi ) p (A/Hi )
i=1
0, 2 1
= = ≈ 0, 3333. I
0, 6 3
Задачи
136. Если размер детали отклоняется от установленного раз-
мера не более чем на 1 %, она признается стандартной. Если откло-
нение составляет не более 3 %, то вероятность того, что деталь
будет признана стандартной, уменьшается до 0,5. А если отклоне-
ние составляет от 3 % до 5 %, вероятность равна 0,25. Если размер
детали отклоняется от установленного размера более чем на 5 %,
деталь считается нестандартной. Рассчитать вероятность того,
48
3.2 Формула полной вероятности. Формула Байеса
49
3.2 Формула полной вероятности. Формула Байеса
Артем.
147. Пусть B1 , B2 , B3 — несовместные события, составляющие
полную группу: p (B1 ) = 0, 2; p (B2 ) = 0, 15; p (B3 ) = 0, 65. Рассмотрим
событие A : p (A) = 0, 4. Если A не зависит от B1 , B2 , B3 , используя
формулу Байеса, определить, верно ли равенство p (B1 /A) = p (B1 ) =
0, 2?
148. С вероятностью 0,8 преподаватель находится в данный
момент в университете. Эта вероятность распределена следующим
образом: с вероятностью 0,6 преподаватель на кафедре, а с вероят-
ностью 0,2 в деканате. Студент, ищущий преподавателя, обнару-
жил, что на кафедре его нет. Как изменится с учетом этой инфор-
мации вероятность того, что преподаватель в деканате?
149. Два независимых эксперта оценивают эффективность
операции. Оценка эффективности является качественной и прини-
мает 3 значения: «низкая», «средняя», «высокая». В среднем 30 %
операций имеют «низкую» эффективность, 50 % — «среднюю»,
20 % — «высокую». Первый эксперт ошибается в трех случаях из де-
сяти, а второй — в одном случае из пяти. Первый оценил эффектив-
ность конкретной операции как «низкую», а второй, как «среднюю».
Какова вероятность того, что оба они не правы?
150. В ящике лежало 10 шаров, которые могли быть черны-
ми или белыми. Все гипотезы о числе белых шаров равновероятны. В
ящик добавили 1 белый шар. Какова вероятность после этого вынуть
белый шар?
151. В условиях предыдущей задачи вынутый шар оказался бе-
лым. Какова вероятность того, что все шары в ящике белые?
152. На конвейер поступают однотипные детали, изготовля-
емые двумя рабочими. При этом первый поставляет 60 %, второй —
40 % общего числа изделий. Вероятность того, что изделие, изго-
товленное первым рабочим, окажется нестандартным, равна 0,002;
для второго рабочего эта вероятность равна 0,05. Взятое наудачу
с конвейера изделие оказалось нестандартным. Определить вероят-
ность того, что оно изготовлено вторым рабочим.
50
4. Схемы испытаний
4.1. Схема Бернулли. Полиномиальная схема
p (Ai ) = p, p (Ai ) = 1 − p = q, i = 1, . . . , n.
Полиномиальная формула.
n!
pn (m1 , . . . , mk ) = pm m2 mk
1 · p2 · . . . · pk .
1
(21)
m1 ! · m2 ! · . . . · mk !
pn (m1 , . . . , mk ) = p {A1 произошло m1 раз, . . . , Ak произошло mk раз}.
k
X
mi = n.
i=1
51
4.1 Схема Бернулли. Полиномиальная схема
p24 (2) + p24 (3) + . . . + p24 (24) = 1 − [p24 (0) + p24 (1)].
52
4.1 Схема Бернулли. Полиномиальная схема
53
4.1 Схема Бернулли. Полиномиальная схема
4
4! 1 4·3 4
p (1, 2, 1) = = 4 = .
1! · 2! · 1! 3 3 27
4
4! 1 2·3 2
p (2, 2, 0) = = 4 = .
2! · 2! · 0! 3 3 27
Тогда искомая вероятность равна
4 4 4 2 14
+ + + = ≈ 0, 518. I
27 27 27 27 27
Пример 78. Менеджер по кадрам подбирает кандидатуры сотруд-
ников, которые могут общаться с иностранными клиентами фир-
мы и будут направлены на работу в центральный офис компании.
Критерием отбора является знание сотрудником английского язы-
ка. Всего в фирме работает 150 человек, причем вероятность встре-
тить среди ее сотрудников тех, кто знает английский язык, со-
ставляет 0,6. Каково наивероятнейшее число работников фирмы,
которым следует ждать повышения?
np + p = 90, 6 ∈
/ Z.
Задачи
153. Студент выполняет тест из 5 вопросов, требующих от-
ветов «да» или «нет». Предположим, студент еще не изучал данную
тему, и отвечает на вопросы случайным образом (вероятность пра-
вильного ответа на каждый вопрос равна 0,5). Найти вероятность
того, что студент правильно ответит на:
а) все вопросы;
б) не меньше 4 вопросов;
в) меньше 4 вопросов;
г) не более 2;
д) не менее 2 и не более 4.
54
4.1 Схема Бернулли. Полиномиальная схема
55
4.1 Схема Бернулли. Полиномиальная схема
56
4.2 Асимптотические формулы для схемы Бернулли
57
4.2 Асимптотические формулы для схемы Бернулли
Zx Zx
1 2
− t2
где Φ(x) = √ e dt = ϕ(t) dt.
2π
−∞ −∞
r r
m n n
p α1 6 6 α2 ≈ Φ (α2 − p) − Φ (α1 − p) . (26)
n pq pq
r r
m n n
p β1 6 − p 6 β2 ≈ Φ β2 − Φ β1 . (27)
n pq pq
11 e−1 1
p100 (1) ≈ = .
1! e
Итак, вероятность того, что в выборке окажется меньше двух брако-
ванных изделий, составляет 2/e. I
Пример 81. Замерщик пластиковых окон за год обслуживает 1 000
заказов. Вероятность того, что он ошибся в замерах одного окна
составляет 0,01. Какова вероятность того, что по замерам это-
го работника будет за год изготовлено не меньше 3 бракованных
окон?
J Как и раньше, воспользуемся приближением Пуассона.
Чтобы решить эту задачу, нужно найти сумму
p1000 (3) + p1000 (4) + . . . + p1000 (1000), (28)
однако, очевидно, что это очень трудоемкая процедура. Если же предста-
вить (28) в виде
1 − [p1000 (0) + p1000 (1) + p1000 (2)],
вычисления не составят большого труда.
100 e−10 1
p1000 (0) ≈ = 10 .
0! e
1 −10
10 e 10
p1000 (1) ≈ = 10 .
1! e
2 −10
10 e 50
p1000 (2) ≈ = 10 .
2! e .
Таким образом, искомая вероятность равна 1 − 61 e10 ≈ 0, 997. I
Пример 82. Диспетчеру таксопарка за каждые 5 минут поступают
в среднем 6 заказов. Найти вероятность того, что за три минуты
не поступит ни одного заказа.
J Здесь λ — среднее число событий, появляющихся в единицу вре-
мени. За 6 минут диспетчер принимает в среднем 5 заказов, следовательно,
λ = 6/5.
Будем пользоваться приближенной формулой Пуассона:
(λt)m e−λt
pt (m) ≈ .
m!
Требуется найти вероятность того, что за три минуты не поступит ни
одного заказа:
(3 · 6/5)0 e−3·6/5 1
p3 (0) ≈ = e−36/5 = 36/5 . I
0! e
59
4.2 Асимптотические формулы для схемы Бернулли
20 − 15 −15
p (m 6 20) = p (0 6 m 6 20) ≈ Φ √ −Φ √ =
10, 5 10, 5
= Φ (1, 54303) − Φ (−4, 6291) ≈ 0, 9382. I
Пример 85. Сделки на электронной бирже осуществляются не ча-
ще, чем раз в секунду. Каждую секунду в течение часа главный ком-
пьютер фиксирует одно из двух состояний: «проходит сделка» или
«компьютер свободен». Вероятность зафиксировать сделку в любой
момент времени равна 0,8. Найти вероятность того, что относи-
тельная частота регистрации сделки, вычисленнная за час, откло-
нится от ее вероятности не более, чем на 0,01.
J Поскольку сделки на бирже осуществляются не чаще, чем раз в секунду
в течение часа, всего испытаний 60 · 60 = 3 600. Следовательно,
n = 3 600;p = 0, 8; q = 0, 2; np = 2 880; npq = 576.
m
Для подсчета p n − p 6 0, 01 = p −0, 01 6 m
n − p 6 0, 01 вос-
пользуемся формулой (27).
60
4.2 Асимптотические формулы для схемы Бернулли
r r
m 3 600 3 600
p −0, 01 6 − p 6 0, 01 = Φ 0, 01 − Φ −0, 01 =
n 0, 16 0, 16
r
3 600
= 2Φ 0, 01 − 1 = 2Φ (1, 5) − 1 ≈ 0, 9332. I
0, 16
Задачи
177. Вероятность нарушения герметичности упаковки при пе-
ревозке равна 0,001. Найти вероятность того, что среди 1 000 пере-
везенных упаковок 3 окажутся негерметичными.
178. Если в фирме по организации праздников заказывают в
среднем два конных свадебных экипажа в день, то какова вероят-
ность, что за день поступит больше двух заказов?
179. На факультете 750 студентов. Найти вероятность того,
что у 2 студентов день рождения придется на 1 января, cчитая, что
вероятность рождения в фиксированный день равна 1/365.
180. В партии из 40 000 купюр 8 фальшивых. Из партии берут
1 000 купюр. Какова вероятность, что среди них хотя бы одна фаль-
шивая?
181. На конвейер поступают однотипные детали, производи-
мые автоматом. Вероятность того, что деталь, изготовленная ав-
томатом, окажется нестандартной, равна 0,002. Какова вероят-
ность, что из тысячи деталей более двух нестандартны?
182. В течение минуты оператору поступает в среднем 60 вы-
зовов. Найти вероятность того, что за 2 секунды не поступит ни
одного вызова.
183. Корректура в 400 страниц содержит 1 200 опечаток. Най-
ти вероятность того, что число опечаток на странице отклонит-
ся от 3 не более чем на 1.
184. В среднем бракованные изделия составляют 0,5 %. Найти
вероятность того, что из 100 изделий не будет ни одного бракован-
ного.
185. Компания разрабатывает новую диетическую еду и про-
водит в сетевом магазине опрос 100 произвольно выбранных потре-
бителей, в котором выявляются 2 наиболее ходовых товара. Обо-
значим x количество тех человек из 100, которые выбрали другой
товар, кроме двух наиболее ходовых. Пусть при одном из опросов
x = 40. Какова вероятность, что при таком же опросе, проводимом
61
4.2 Асимптотические формулы для схемы Бернулли
62
5. Одномерные дискретные случайные величины
Определение случайной величины и функции распределения
3) 0 6 F (x) 6 1.
4) p ( x 6 ξ < y) = Fξ (y) − Fξ (x).
63
Дискретные случайные величины часто задаются рядом распределе-
ния
ξ x1 x2 . . . xn
p p1 p 2 . . . pn
64
J В этой задаче мы будем иметь дело с дискретным распределени-
ем Бернулли B (1; 0, 4), ряд распределения ξ которого выглядит следующим
образом:
ξ 0 1
p 0, 6 0, 4
0 при x 6 0;
Очевидно, что Fξ (x) = 0, 6 при 0 < x 6 1; I
1 при x > 1.
Пример 88. Один раз бросают две игральные кости. Случайная вели-
чина ξ — сумма выпавших очков. Построить ряд распределения слу-
чайной величины ξ.
J Сумма очков, выпадающих при броске двух игральных костей при-
надлежит множеству {2, 3, . . . , 12}, следовательно, ξ принимает значения
из этого множества. Запишем ряд распределения случайной величины ξ,
расчитывая pi при помощи классического определения вероятности:
ξ 2 3 4 5 6 7 8 9 10 11 12
I
p 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Пример 89. Из урны, содержащей три белых и два черных шара, три
раза вынимают (с возвращением) шар. Случайная величина ξ — чис-
ло вынутых черных шаров. Построить ряд распределения ξ, найти
Fξ (x).
J В данном случае случайная величина соответствует числу успехов в
трех испытаниях, проводимых по схеме Бернулли, поэтому ξ имеет биноми-
альное распределение B (3; 0, 4).
Построим ряд распределения ξ, расчитывая pi при помощи формулы
Бернулли.
ξ 0 1 2 3
p 0, 216 0, 432 0, 288 0, 064
Тогда функция
распределения ξ запишется следующим образом.
0 при x 6 0;
0, 216 при 0 < x 6 1;
Fξ (x) = 0, 648 при 1 < x 6 2; I
0, 936 при 2 < x 6 3;
1 при x > 3.
65
J Здесь ξ вновь имеет биномиальное распределение B (3, p), поэтому
задача решается аналогично предыдущей.
ξ 0 1 2 3
I
p (1 − p) 3p (1 − p) 3p (1 − p) p3
3 2 2
N = 15; M = 11; n = 5; ξ = 0, 1, . . . , 5.
По формуле
m
C11 · C45−m
p (m) = p11, 15 (m, 5) = 5
C15
расчитаем pi и запишем ряд распределения ξ:
ξ 0 1 2 3 4 5
.I
p 0 1/273 20/273 90/273 120/273 42/273
Задачи
192. Найдите функцию распределения величины ξ ≡ c (вырож-
денное распределение).
193. Найдите функцию распределения индикатора события A,
вероятность которого равна 0,3.
194. Найдите функцию распределения индикатора события A,
состоящего в том, что точка, поставленная наудачу в круге ради-
уса 1, окажется вне квадрата, вписанного в круг.
195. Испытание состоит в бросании двух костей. Запишите
ряд распределения индикатора события A ={Произведение выпавших
12
Здесь «хакер» — компьютерный злоумышленник, хотя этот термин имеет и более широкое толкование:
специалист, обладающий доскональными сведениями в каких-либо вопросах.
66
очков делится на 3}, и найдите его функцию распределения.
196. Пусть случайная величина ξ обозначает число прочитан-
ных книг за последний месяц, и её функция распределения имеет вид:
0 при x 6 0,
1/9 при 0 < x 6 1,
1/3 при 1 < x 6 2,
Fξ (x) = 2/3 при 2 < x 6 3,
7/9 при 3 < x 6 5,
8/9 при 5 < x 6 9,
1 при x > 9.
67
а) ξ = ω 2 ;
б) ξ = ω −1 ;
2ω ;
в) ξ =
0 при ω = −3,
г) ξ = 1 при ω = 1,
0 при ω = 3;
2
ω при ω = ±3,
д) ξ =
ω при ω = 1.
202. Найдите функцию распределения случайной величины
ξ (ω) = 2 ω, определенной на дискретном вероятностном простран-
стве (Ω, F, P) с Ω = {1, 2, 3}, если
p (1) = 0, 2; p (2) = 0, 3; p (3) = 0, 5.
68
нуты, имеет пуассоновское распределение с параметром λ = 3. Най-
дите p (ξ > 2).
211. Если при наборе существует вероятность p = 0, 00001 то-
го, что любая буква будет набрана неправильно, и случайная величи-
на ξ равна числу опечаток в книге, имеющей 100 000 печатных зна-
ков, то каково точное и приближённое распределение ξ?
212. Вероятность нарушения герметичности упаковки при пе-
ревозке равна 0,01; случайная величина ξ равна числу негерметич-
ных упаковок среди 200 перевезённых. Как приближённо распределе-
на случайная величина ξ?
213. Если при перевозке случится авария, вероятность наруше-
ния герметичности упаковки равна 0,2. Случайная величина ξ равна
числу негерметичных упаковок среди 10 перевезённых. Как распреде-
лена случайная величина ξ?
214. В условиях предыдущей задачи большое количество упако-
вок проверяют по очереди. Случайная величина ξ равна числу прове-
ренных упаковок до первой встретившейся негерметичной. Каково
распределение ξ?
215. Если в предыдущих условиях случайная величина ξ равна
числу проверенных упаковок до третьей встретившейся негерме-
тичной, как распределена случайная величина ξ?
216. В компьютерной игре для прохождения на следующий уро-
вень необходимо сбить n мишеней. Вероятность попадания в цель
при одном выстреле равна p. Случайная величина ξ — число произ-
веденных выстрелов. Найдите закон распределения ξ.
217. В урне находится 5 белых и 10 красных шаров. Двое пооче-
редно вынимают (с возвращением) шары до появления белого шара.
Случайная величина ξ — число вынутых шаров. Найдите закон рас-
пределения ξ.
218. Из четырех ключей только один подходит к замку. Слу-
чайная величина ξ — число попыток при открывании замка. Найди-
те закон распределения ξ.
69
6. Непрерывные случайные величины
6.1. Одномерные непрерывные случайные величины
Согласно свойству 4)
70
6.1 Одномерные непрерывные случайные величины
Найти: а) постоянную C;
б) Fξ (x);
в) p (1, 2 6 ξ < 1, 6).
J По свойству 3) плотности распределения случайной величины
Z+∞
fξ (x) dx = 1.
−∞
Rx
0 dt при x 6 0;
−∞
Z x
R0 Rx π
Fξ (x) = fξ (t) dt = 0 dt + sin t dt при 0 < x 6 ;
−∞ −∞ 0 2
π/2
R0 R Rx π
0 dt при x > .
0 dt + sin t dt +
−∞ 0 π/2 2
71
6.1 Одномерные непрерывные случайные величины
По свойствам интеграла
Z+∞ Z0 Z+∞
c c c
dx = dx + dx.
ex + e−x ex + e−x ex + e−x
−∞ −∞ 0
72
6.1 Одномерные непрерывные случайные величины
Z+∞
c ζ
x
ζ
x
dx = lim c arctg e = lim c arctg e =
ex + e−x ζ→+∞ 0 ζ→+∞ 0
0
= c lim arctg eζ − arctg 1 =
ζ→+∞
hπ πi π
= c lim − =c .
ζ→−∞ 2 4 4
Тогда
Z+∞
c π
dx = c .
ex + e−x 2
−∞
73
6.1 Одномерные непрерывные случайные величины
Тогда
15
20 − 11
20 4
p (ξ 6 16 ξ > 12) = = .
1 − 11
20
9
Задачи
219. Автобусы приходят на остановку каждые 30 минут. Они
могут опаздывать, но никогда не приходят раньше. Время задерж-
ки автобуса распределено равномерно и не превышает 20 минут.
Найти вероятность того, что последний за день автобус опоздает
более, чем на 19 минут.
220. Случайная величина ξ задана функцией распределения
0, x 6 0,
Fξ (x) = x3 , 0 < x 6 1,
1, 1 < x.
Найти: а) постоянную C;
б) Fξ (x);
в) p (−0, 5C 6 ξ < −0, 5C).
222. Случайная величина ξ имеет плотность распределения
fξ (x) = A x exp ( −h2 x2 ), x > 0 (закон Рэлея14 ).
Найти: а) постоянную A,
б) Fξ (x),
в) p (0 6 ξ < 1).
223. Случайная величина ξ задана плотностью распределения
fξ (x) = A exp(−x/x0 ), x > 0, x0 — параметр.
74
6.1 Одномерные непрерывные случайные величины
Найти: а) постоянную A,
б) Fξ (x).
224. Случайная величина ξ имеет плотность распределения
c
fξ (x) = , x ∈ R.
1 + x2
Найти: а) постоянную c,
б) Fξ (x),
в) p (0 6 ξ < 1).
225. Случайная величина ξ задана плотностью распределения
0, при x 6 −1,
c (x + 1) при −1 < x 6 0,
fξ (x) =
c при 0 < x 6 1,
0 при 1 < x.
Найти: a) постоянную c,
б) Fξ (x),
в) p (−0, 2 6 ξ 6 0, 2).
226. Определить, могут ли следующие функции быть функци-
ями распределения каких-либо случайных величин:
0 при x 6 0,
а) Fξ (x) = x при 0 < x 6 1,
0 при x > 1;
0 при x 6 −1,
−cx при −1 6 x 6 0,
б) Fξ (x) =
cx при 0 6 x < 1,
1 при x > 1;
Fξ (x) = c + b · arctg x, x ∈ R.
75
6.1 Одномерные непрерывные случайные величины
76
6.2 Многомерные случайные величины
77
6.2 Многомерные случайные величины
78
6.2 Многомерные случайные величины
Z+∞
fη (y) = fξ, η (x, y) dx. (36)
−∞
79
6.2 Многомерные случайные величины
ξ x1 x2 . . . xn
m
P m
P m
P
p pi1 pi2 . . . pin
i=1 i=1 i=1
η y1 y2 . . . ym
n n n
P P P I
p p1i p2i . . . pmi
i=1 i=1 i=1
v2
При помощи подстановки t = − вычислим неопределенный инте-
2
грал, соответствующий внутреннему:
2
t = − v2 ,
Z Z Z
−v 2 2t 1 1
e dv = = − e dt = − e2t d(2t) = − e2t .
dt = −v dv 2 2
Тогда
Zy y 2
1 −2 v2 1 h −y2 1 e−y
i
−v 2
0
ve dv = e 2 = − e −e = − .
2
0 2 2 2
0
80
6.2 Многомерные случайные величины
81
6.2 Многомерные случайные величины
Zx
def
Fξ (x) = fξ (t) dt.
−∞
Найдём fξ (x).
Z1
1 1
fξ (x) = dy = , 0 6 x 6 3.
3 3
0
Тогда
Z0 Zx
(35) 1 x
Fξ (x) = 0 dt + dt = .
3 3
−∞ 0
82
6.2 Многомерные случайные величины
Zy Z0 Zy
def (36)
Fη (y) = fη (t) dt = 0 dt + 1 dt = y.
−∞ −∞ 0
5) В данном случае
Zx Zy
1 xy
F5 (x, y) = du dv = . . . = .
3 3
0 0
Таким образом,
0 при x 6 0 или y 6 0;
(xy)/3
при 0 < x 6 3 и 0 < y 6 1;
Fξ, η (x, y) = x/3 при 0 < x 6 3 и y > 1;
y при x > 3 и 0 < y 6 1;
при x > 3 и y > 1.
1
Z1
1 1
fξ (x) = dy = .
3 3
0
Z3
1
fη (y) = dx = 1. I
3
0
Задачи
243. Дискретная двумерная случайная величина (ξ, η) задана
таблицей распределения
η\ξ −1 0 1
0 0, 1 x 0
1 0 3x 0
2 0 0, 1 0, 4
83
6.2 Многомерные случайные величины
η\ξ 0 1 2
−1 0, 3 0 0
0 0 0, 3 0
1 0 0 0, 4
η\ξ 3 4
1 1/6 1/3
2 1/6 1/3
84
6.2 Многомерные случайные величины
местной плотности:
Cxy 2 при 0 < y < 1, 0 < x < 1;
fξ, η (x, y) =
0 — иначе.
Найти постоянную C и одномерную плотность fξ (x).
253. В условиях предыдущей задачи найдите p (ξ + η > 1) и
p (1/2 < ξ < 3/4).
254. Определить плотность вероятности двумерной случай-
ной величины (ξ, η) по заданной функции распределения:
(1 − e−2x )(1 − e−3y ) при x > 0, y > 0;
Fξ, η (x, y) =
0 — иначе.
86
7. Числовые характеристики
одномерной случайной величины
7.1. Математическое ожидание
ξ 0 1 2 3
P 0, 2 0, 3 0, 4 0, 1
J Воспользовавшись формулой (38), легко получим
M ξ = 0 · 0, 2 + 1 · 0, 3 + 2 · 0, 4 + 3 · 0, 1 = 1, 4. I
87
7.1 Математическое ожидание
ξ 0 1 2 ... k ...
2 k ,
p p p(1 − p) p(1 − p) . . . p(1 − p) . . .
88
7.1 Математическое ожидание
Z+∞ Z+∞
Mξ = xfξ (x) dx = xfξ (x) dx =
−∞ 0
Z+∞ +∞
αβ α β Z
= xe−αx xβ−1 dx = e−αx xβ dx.
Γ(β) Γ(β)
0 0
89
7.1 Математическое ожидание
Задачи
В задачах 265—272 требуется найти математические ожидания ука-
занных случайных величин.
265. Вероятность попадания при одном выстреле равна 0,7.
Случайная величина ξ равна числу попаданий в цель при двух выстре-
лах.
266. Проводят один опыт, в результате которого событие мо-
жет произойти с вероятностью 0,4. Случайная величина ξ принима-
ет значение 1, если событие произошло и 0, если оно не произошло.
267. Игра состоит в набрасывании колец на колышек. Игрок по-
лучает 3 кольца и бросает их до первого попадания. Вероятность
попадания при одном броске 0,5. Случайная величина равна числу из-
расходованных колец.
268. В лотерее имеется ni выигрышей стоимостью mi , где i =
1, . . . , k. Всего билетов N . Случайная величина ξ — стоимость выиг-
рыша на один билет.
269. Из четырех ключей только один подходит к замку. Слу-
чайная величина ξ — число попыток при открывании замка.
270. Партия из 8 деталей содержит 2 нестандартные. Науда-
чу отобраны 3 детали. Случайная величина ξ — число стандартных
90
7.1 Математическое ожидание
91
7.2 Другие числовые характеристики случайной величины
Dξ = M (ξ − M ξ)2 . (40)
92
7.2 Другие числовые характеристики случайной величины
то есть F (xq ) = q.
Квантилью порядка q (0 < q < 1) дискретной случайной величи-
ны ξ называется значение xq , при котором
ξ 0 1 2 3
p 0, 2 0, 3 0, 4 0, 1
J Легко найти M ξ = 1, 4.
По формуле (40)
Dξ = M ξ 2 − (M ξ)2 =
= 02 · 0, 2 + 12 · 0, 3 + 22 · 0, 4 + 32 · 0, 1 − 1, 42 = 0, 84. I
93
7.2 Другие числовые характеристики случайной величины
Z+∞ Z2 5 2
3 · 25
2 2 3 4 3 x 12
Mξ = x fξ (x) dx = x dx = · = = .
8 8 5 0 8·5 5
−∞ 0
Z+∞ Z0 ZC Z+∞ ZC
fξ (t) dt = 0 dt + sin t dt + 0 dt = sin t dt =
−∞ −∞ 0 C 0
= − cos t|C0 = − cos C + cos 0 = 1 − cos C.
π
1 − cos C = 1 ⇔ cos C = 0 ⇔ C = + πk, k ∈ Z.
2
Поскольку функция fξ (t) > 0 почти всюду, то C = π/2.
По определению мода — это число m0 такое, что
94
7.2 Другие числовые характеристики случайной величины
−∞ 0
me = π/3. I
95
7.2 Другие числовые характеристики случайной величины
Квантиль Значение
x0,1 0, 1
x0,2 0, 2
x0,3 0, 3
x0,4 0, 4
x0,5 0, 5
x0,6 0, 6
x0,7 0, 7
x0,8 0, 8
x0,9 0, 9
Задачи
288. Докажите, что
k
X
k
µk = M (ξ − M ξ) = (−1)k−i · Cki αi α1k−i .
i=0
96
7.2 Другие числовые характеристики случайной величины
97
7.3 Математические ожидания и дисперсии
некоторых важных распределений
раметром a.
309. Найдите отношение квантилей порядков 0,8 и 0,2 случай-
ной величины, имеющей равномерное распределение R[a; b].
310. Случайная величина ξ распределена нормально с M ξ = 100.
Известно, что x0,05 = 90. Найти σ.
Задачи
311. Производят 5 выстрелов по мишени. Вероятность попа-
дания при одном выстреле p = 0, 4. Найти математическое ожида-
ние и дисперсию числа промахов.
312. Число вызовов ξ, поступающих оператору в течение ми-
нуты, имеет пуассоновское распределение с параметром λ = 3. Най-
дите M ξ, Dξ.
313. Если при наборе существует вероятность p = 0, 00001 то-
го, что любая буква будет набрана неправильно, и случайная вели-
чина ξ равна числу опечаток в книге, имеющей 400000 печатных зна-
ков, то каково M ξ?
314. Вероятность нарушения герметичности упаковки при пе-
ревозке равна 0,001, и случайная величина ξ равна числу негерметич-
ных упаковок среди 1000 перевезенных. Найдите M ξ, Dξ.
315. В условиях предыдущей задачи упаковки проверяют по
очереди. Случайная величина ξ равна числу проверенных упаковок до
98
7.3 Математические ожидания и дисперсии
некоторых важных распределений
99
8. Линейная зависимость между случайными величи-
нами
8.1. Линейная зависимость двух величин
100
8.1 Линейная зависимость двух величин
ξ 0 2 4 η 1 3 5
p 0, 5 0, 4 0, 1 p 0, 1 0, 5 0, 4
Вычислим числовые характеристики.
M ξ = 1, 2; M η = 3, 6;
Dξ = 3, 2 − 1, 2 = 0, 61; Dη = 14, 6 − 3, 62 = 1, 64;
2
√ √
σξ = 1, 76 ≈ 1, 33; ση = 1, 64 ≈ 1, 28.
Ряд распределения ξ · η выглядит следующим образом:
ξ·η 0 2 6 12
p 0, 5 0, 1 0, 3 0, 1
M (ξ · η) = 2 · 0, 1 + 6 · 0, 3 + 12 · 0, 1 = 3, 2.
По формуле (53) вычисления коэффициента корреляции имеем
3, 2 − 1, 2 · 3, 6
ρξ,η = ≈ −0, 659.
1, 33 · 1, 28
Используя формулу (54), получим уравнение линейной регрессии
1, 28
η̂ − 3, 6 = −0, 659 · (ξ − 1, 2);
1, 33
η̂ = −0, 634 · ξ + 4, 361.
Наконец вычислим остаточную дисперсию
2
Sост = 1, 64(1 − 0, 6592 ) ≈ 0, 928. I
M (ξ · ξ 4 ) − M (ξ) · M (ξ 4 ) M (ξ 5 ) − M (ξ) · M (ξ 4 )
ρξ, ξ 4 = = .
σξ σξ 4 σξ σξ 4
Найдем закон распределения ξ 5 :
ξ 5 −1 0 1
p 0, 2 0, 6 0, 2
101
8.1 Линейная зависимость двух величин
Задачи
В задачах 322—324 заданы совместные законы распределения дву-
мерных случайных величин (ξ, η).
Требуется найти:
а) коэффициент корреляции ρξ, η ;
б) уравнение линейной регрессии η на ξ и остаточную дисперсию;
в) уравнение линейной регрессии ξ на η и остаточную дисперсию.
322.
ξη 1 2 3
−2 0 0, 2 0
0 0, 1 0, 2 0, 1
2 0 0, 1 0, 1
4 0 0, 1 0, 1
323.
ξη 0 1 2
−1 0, 2 0, 1 0
0 0 0, 1 0, 1
2 0 0, 3 0, 2
324.
ξη 0 1 2
−1 0, 3 0 0
0 0 0, 3 0
1 0 0, 4 0
102
8.2 Числовые характеристики многомерной случайной величины
σ12
cov (ξ1 , ξ2 ) . . . cov (ξ1 , ξn )
cov (ξ2 , ξ1 ) σ22 . . . cov (ξ2 , ξn )
K= . (55)
... ... ... ...
cov (ξn , ξ1 ) cov (ξn , ξ2 ) . . . σn2
103
8.2 Числовые характеристики многомерной случайной величины
M ξ0 = a0 , M ξi = ai , ai < ∞, i = 0, 1, . . . , n,
дисперсиями
и корреляционной матрицей R.
Уравнением линейной регрессии ξ0 на ξ1 , . . . , ξn называется урав-
нение
ξb0 = b0 + b1 ξ1 + · · · + bn ξn ,
где bo , b1 , . . . , bn — параметры, минимизирующие остаточную диспер-
сию
M (ξ0 − ξb0 )2 .
где
R0i σ0 |R0i | σ0
bi = − · = (−1)i+1 · . (58)
R00 σi |R00 | σi
Здесь и далее через Rij обозначено алгебраическое дополнение эле-
мента aij матрицы R, |Rij | — определитель Rij .
2
Остаточная дисперсия Sост = M (ξ0 − ξb0 )2 равна
2 |R|
Sост = σ02 · . (59)
R00
Виды коэффициентов корреляции.
Частный коэффициент корреляции используется как мера
линейной зависимости между двумя какими-либо случайными величинами
из ξ1 , . . . , ξn после вычитания эффекта, обусловленного взаимодействием
этих двух величин с некоторым непустым подмножеством из оставшихся
n − 2 случайных величин.
Пусть l и h — две какие-либо величины из набора ξ1 , . . . , ξn и c —
некоторое непустое подмножество из оставшихся n − 2 величин. Опреде-
лим величины τ1 = l − µl.c и τ2 = h − µh.c . Здесь µl.c = l(c) , µh.c = h(c) —
104
8.2 Числовые характеристики многомерной случайной величины
105
8.2 Числовые характеристики многомерной случайной величины
|R0i | σ0
где bi = (−1)i+1 · .
|R00 | σi
Вычислим параметры b1 , b2 .
0, 3 0, 9
√ √
|R01 | σ 0
0, 2 1 5 0, 12 5
b1 = (−1)1+1 · = ·√ = · √ ≈ 0, 161.
|R00 | σ1 1 0, 2
3 0, 96 3
0, 2 1
0, 3 0, 9
√ √
2+1 |R 02 | σ 0
1 0, 2 5 −0, 84 5
b2 = (−1) · = − ·√ =− · √ ≈ 0, 7395.
|R00 | σ2
1 0, 2 7 0, 96 7
0, 2 1
2 |R| 0, 168
Sост = σ02 · =5· ≈ 0, 875. I
|R00 | 0, 96
106
8.2 Числовые характеристики многомерной случайной величины
Задачи
334. Может ли матрица K быть ковариационной матрицей?
10 11
K= .
11 12
107
8.2 Числовые характеристики многомерной случайной величины
338.
1 −0, 1 0, 5
R = −0, 1 1 0, 7 ,
0, 5 0, 7 1
M ξi = 0, Dξi = 1, i = 0, 1, 2.
340.
1 0, 5 0, 8
R = 0, 5 1 0, 7 ,
0, 8 0, 7 1
M ξ0 = 0, M ξ1 = 1, M ξ2 = 3, Dξ0 = 1, Dξ1 = 4, Dξ2 = 9.
108
8.2 Числовые характеристики многомерной случайной величины
M ξ0 = 1, M ξ1 = 2, M ξ2 = 2.
344.
1 −0, 1 0, 5
R = −0, 1 1 0, 7 .
0, 5 0, 7 1
346.
1 0, 5 0, 8
R = 0, 5 1 0, 7 .
0, 8 0, 7 1
109
9. Условные распределения
9.1. Условные законы распределения
ξη −1 0 1
0 0, 1 0, 1 0
1 0 0, 3 0
2 0 0, 1 0, 4
110
9.1 Условные законы распределения
η /ξ = 0 −1 0
p 0, 5 0, 5
ξ /η = 0 0 1 2
I
p 0, 2 0, 6 0, 2
Z1−y
fη (y) = dx = 1 − y − (−1 + y) = 2 − 2y.
−1+y
fξ, η (x, y) 1
fη/ξ=x (y) = = , (x, y) ∈ T ;
fξ (x) 1 − |x|
fξ, η (x, y) 1
fξ/η=y (x) = = , (x, y) ∈ T. I
fη (y) 2(1 − y)
111
9.1 Условные законы распределения
Задачи
В задачах 347—350 дана совместная плотность распределения
fξ, η (x, y) двумерной случайной величины (ξ, η). Найти обе условные плот-
ности fη/ξ=x (y) и fξ/η=y (x).
1 1
347. fξ, η (x, y) = · .
π 2 1 + x2 + y 2 + x2 y 2
−(x2 +y 2 )
348. fξ, η (x, y) = 4xye
, x > 0, y > 0.
1/3 при 0 6 x 6 3, 0 6 y 6 1;
349. fξ, η (x, y) =
0 — иначе.
cos x · cos y при 0 6 x 6 π/2, 0 6 y 6 π/2;
350. fξ, η (x, y) =
0 — иначе.
112
9.2 Регрессия
9.2. Регрессия
2
Корреляционным отношением θη, ξ называется выражение
2 M (r (ξ) − M η)2
θη, ξ = . (70)
ση2
ξη −1 0 1
0 0 0, 1 0
1 0, 3 0 0
2 0, 2 0 0, 4
Найти регрессию r(ξ).
M (η/ξ = 0) = 0.
113
9.2 Регрессия
η /ξ = 1 −1 0 1
p 1 0 0
M (η/ξ = 1) = −1.
η /ξ = 2 −1 0 1
p 1/3 0 2/3
M (η/ξ = 2) = 1/3.
0 при ξ = −1,
r (ξ) = −1 при ξ = 0,
1/3 при ξ = 1.
ηξ 10 20 30
1 0, 2 0, 3 0
2 0 0, 2 0, 1
3 0, 1 0 0, 1
J Найдем условные законы распределения η/ξ.
η/ξ = 10 1 2 3
p 2/3 0 1/3
2 1 5
M (η/ξ = 10) = 1 · +3· = .
3 3 3
η/ξ = 20 1 2 3
p 3/5 2/5 0
3 4 4
M (η/ξ = 20) = 1 · +2· = .
5 5 5
114
9.2 Регрессия
η/ξ = 30 1 2 3
p 0 1/2 1/2
1 1 5
M (η/ξ = 30) = 2 ·
+3· = .
2 2 2
Теперь вычислим регрессию η на ξ.
5/3 при ξ = 10,
r (ξ) = 7/5 при ξ = 20,
5/2 при ξ = 30.
Так как r (ξ) принимает значение 5/3 ровно тогда, когда ξ = 10,
p (r (ξ) = 5/3) = p (ξ = 10). Аналогичное утверждение справедливо для
r (ξ) = 7/5 и r (ξ) = 5/2, следовательно, ряд распределения r (ξ) запишется
следующим образом.
r (ξ) 5/3 7/5 5/2
p 0, 3 0, 5 0, 2
Из формулы (70) следует, что для нахождения корреляционного отно-
шения необходимо вычислить M η и ση2 .
Запишем ряд распределения случайной величины η.
η 1 2 3
p 0, 5 0, 3 0, 2
M η = 1, 7; M η 2 = 3, 5; ση2 = Dη = 0, 61.
M (r (ξ) − M η)2 =
= 0, 3 · (5, 3 − 1, 7)2 + 0, 5 · (7/5 − 1, 7)2 + 0, 2 · (5/2 − 1, 7)2 = 0, 173(3).
Итак,
2 0, 173(3)
θη, ξ = ≈ 0, 284. I
0, 61
Задачи
В задачах 359—361 заданы совместные законы распределения дву-
мерных случайных величин (ξ, η).
Требуется найти: а) регрессии η на ξ и ξ на η;
б) корреляционные отношения η на ξ и ξ на η.
115
9.2 Регрессия
359.
ξ\η 1 2 3
−2 0 0, 2 0
0 0, 1 0, 2 0, 1
2 0 0, 1 0, 1
4 0 0, 1 0, 1
360.
ξ\η 0 1 2
−1 0, 2 0, 1 0
0 0 0, 1 0, 1
2 0 0, 3 0, 2
361.
ξ\η 0 1 2
−1 0, 3 0 0
0 0 0, 3 0
1 0 0, 4 0
116
10. Закон больших чисел, центральная предельная
теорема
10.1. Неравенства и закон больших чисел
Тогда
n
P n
P
ξk M ξk
k=1 p k=1
→ .
n n
118
10.2 Центральная предельная теорема
Задачи
363. Пусть ξ такова, что p(0 < ξ < 1) = 1. Доказать, что
Dξ < M ξ.
369.
ξn 0 1
1
p nα 1 − n1α
370. √ √
ξn − n 0 n
1 2 1
p n 1− n n
371.
ξn −nα 0 nα
1
p 2n2 1 − n12 2n1 2
119
10.2 Центральная предельная теорема
372. √ √
ξn − ln n ln n
1 1
p 2 2
373.
ξn en 0
1 1
p n 1− n
p p
374. Пусть ξn −→ a, ηn −→ b. Доказать, что
p
ξn + ηn −→ a + b.
376.
ξn 0 1
1 .
p n3 1 − n13
377. √ √
ξn − n 0 n
1 2 1 .
p n 1− n n
378.
ξn −3n 0 2n
.
p 2n1 2 1 − n12 2n1 2
379. √ √
ξn − ln n ln n
1 1 .
p 2 2
380.
ξn 0 2n
1 1 .
p 1− n n
381.
ξn 0 2n
.
p n1 1 − n1
120
10.2 Центральная предельная теорема
382.
ξn 100 1000
.
p 1/2 1/2
121
10.2 Центральная предельная теорема
122
11. Случайная выборка
11.1. Основные понятия
123
11.1 Основные понятия
X ∗ = (−1, 1, 1, 1, 2, 2, 2, 2, 4).
0 при x 6 −1,
1/9 при −1 < x 6 1,
F9 (x) = 4/9 при 1 < x 6 2,
8/9 при 2 < x 6 4,
1 при
x > 4.
I Задачи
392. Какая статистическая модель применима для выборки, по-
лученной следующим образом: 10 раз измерялось число попаданий в
цель при трех независимых выстрелах, произведенных одним и тем
же стрелком?
393. Какая статистическая модель применима для выборки, по-
лученной следующим образом: 8 раз измерялось число черных шаров,
вынутых за три вынимания с возвращением из урны, которая содер-
жит два белых и два черных шара?
394. Какая статистическая модель применима для выборки, по-
лученной следующим образом: у 100 студенток первого курса изме-
рен рост?
395. Какая статистическая модель применима для выборки, по-
лученной измерением на 10 опытных делянках урожайности культу-
ры, если известно, что урожайность культуры составляет 35 цент-
неров с гектара?
396. Какая статистическая модель применима для выборки, по-
лученной измерением 100 раз времени ожидания автобуса?
124
11.2 Группировка выборки. Графические характеристики
X 0 2 4 6
.
ni 3 8 10 2
-
1 2 3 4 5 6 x
Рис. 12. Эмпирическая функция распределения
125
11.2 Группировка выборки. Графические характеристики
126
11.2 Группировка выборки. Графические характеристики
52, 7 66, 5 68, 1 69, 1 70, 4 70, 7 71, 7 74, 3 74, 5 75, 0
75, 0 76, 0 77, 5 77, 7 78, 0 79, 3 79, 8 79, 9 80, 3 80, 4
80, 5 80, 7 80, 8 81, 1 81, 3 81, 4 81, 6 82, 2 82, 2 82, 2
82, 6 82, 6 82, 8 83, 7 84, 2 84, 2 84, 5 84, 6 84, 6 84, 7
84, 8 85, 0 85, 0 86, 1 86, 3 86, 3 86, 6 86, 8 86, 8 86, 9
87, 5 87, 6 87, 6 87, 8 87, 9 88, 0 88, 1 88, 1 88, 6 88, 9
89, 1 89, 2 89, 4 89, 4 89, 6 89, 8 90, 0 90, 2 90, 6 90, 6
90, 7 90, 9 90, 9 91, 5 91, 6 91, 8 91, 9 92, 0 92, 4 92, 7
92, 8 93, 2 93, 4 93, 5 94, 1 94, 3 95, 5 95, 8 96, 1 96, 2
96, 6 96, 7 96, 8 97, 9 98, 3 99, 3 100, 1 100, 3 100, 4 100, 4
100, 9 101, 1 101, 3 101, 4 101, 8 102, 3 103, 3 103, 4 103, 8 103, 8
104, 2 104, 2 104, 5 105, 0 105, 7 106, 8 107, 7 108, 6 109, 0 109, 7
110, 9 111, 5 111, 7 112, 4 112, 7 113, 5 113, 7 115, 7 118, 7 120, 4
127
11.2 Группировка выборки. Графические характеристики
Задачи
405. Произвести группировку выборки:
20, 2; 19, 2; 16, 9; 19, 3; 17, 1; 17, 8; 16, 6; 16, 3; 15, 2; 18, 0; 16, 8; 20, 0; 17, 7; 16, 6;
19, 0; 17, 5; 17, 8; 20, 6; 17, 2; 18, 0; 17, 1; 18, 4; 17, 4; 15, 8; 19, 4; 17, 8; 19, 8; 19, 6;
16, 3; 20, 0; 17, 4; 19, 3; 19, 3; 16, 5; 18, 8; 17, 2; 18, 7; 18, 6; 19, 2; 16, 2; 18, 2; 17, 4.
X 0 − 6 6 − 12 12 − 18 18 − 24
.
ni 1 8 10 6
128
11.2 Группировка выборки. Графические характеристики
408.
ni ni P ni
№ ni n nh n
1 0, 00 − 0, 09 80 0, 080 0, 007 0, 080
2 0, 09 − 0, 18 81 0, 081 0, 007 0, 161
3 0, 18 − 0, 27 93 0, 093 0, 008 0, 254
4 0, 27 − 0, 36 85 0, 085 0, 008 0, 339
5 0, 36 − 0, 45 87 0, 087 0, 008 0, 426
.
6 0, 45 − 0, 54 87 0, 087 0, 008 0, 513
7 0, 54 − 0, 63 87 0, 087 0, 008 0, 600
8 0, 63 − 0, 72 106 0, 106 0, 010 0, 706
9 0, 72 − 0, 81 99 0, 099 0, 009 0, 805
10 0, 81 − 0, 90 89 0, 089 0, 008 0, 894
11 0, 90 − 0, 99 106 0, 106 0, 010 1, 000
XY [−0.9; 0) [0; 0.9) [0.9; 1.8) [1.8; 2.7) [2.7; 3.6) [3.6; 4.5) [4.5; 5.4]
[−1.53; −0.75) 0 0 4 0 0 0 0
[−0.75; 0.03) 0 5 1 3 3 2 0
[0.03; 0.81) 0 2 6 7 6 0 1
[0.81; 1.59) 2 3 9 10 6 1 1
[1.59; 2.37) 0 0 4 5 4 4 1
[2.37; 3.15) 1 0 5 1 0 1 0
[3.15; 3.93) 0 0 0 0 1 1 0
129
11.2 Группировка выборки. Графические характеристики
6 6
8/75
0.1
- -
0 1 2 3 4 5 6 7 8 9 10 x 0 1 2 3 4 5 6 7 8 9 10 x
130
12. Числовые характеристики выборки
12.1. Выборочные характеристики
M X = M ξ = α1 ;
1 µ2 σ2
DX = Dξ = = ;
n n n
2 (n − 1)µ2 (n − 1)σ 2
MS = == ;
n n
131
12.1 Выборочные характеристики
(n − 1)2
2 (n − 3) 2
DS = µ4 − µ .
n3 n−1 2
Выборочной модой называется значение mo , чаще всего наблюдающееся:
ni (m0 ) = max ni .
i
nq − (n1 + · · · + n(q)−1
x∗q = x(q) + h · ,
n(q)
где x(q) — левая граница квантильного интервала, n(q) — численность кван-
тильного интервала, n1 , · · · , n(q)−1 — численности интервалов, предшеству-
ющих квантильному.
132
12.1 Выборочные характеристики
130/2 − (1 + 3 + 11 + 31)
m∗e = 86, 5 + · 8, 4567 ≈ 90, 517.
40
133
12.2 Статистики
I Задачи
412. Выборочная дисперсия, рассчитанная по выборке объема
25, равна 9. Найдите исправленную выборочную дисперсию.
413. По выборке {1, 1, 2, 1, 2, 4} найти выборочную дисперсию.
414. По выборке {−1, 1, 2, 1, 2, 3, 4, 1} найти моду, выборочное
среднеквадратичное отклонение.
415. По выборке {1, 0, 0, 2, 2, 1} найти выборочные центральные
моменты 2-го и 3-го порядков.
416. Дан статистический ряд величины X:
X 0 2 4 6
.
ni 3 8 10 2
Найти выборочное среднее и выборочную дисперсию.
417. Дан статистический ряд величины X:
X −1 0 1 2
.
ni 5 7 4 1
найти выборочные начальные моменты 2-го и 3-го порядков.
418. Дан группированный статистический ряд величины Х:
X 0 − 6 6 − 12 12 − 18 18 − 24
.
ni 2 7 5 6
Найти приближенно моду, медиану, выборочную дисперсию.
419. Найти a3 по выборке (5, 6, 1, 4, 5, 7, 3, 5, 5, 6).
420. По эмпирической функции распределения найдите выбо-
рочное среднее.
0 при x 6 1,
1/3 при 1 < x 6 2,
Fn (x) =
1/2 при 2 < x 6 3,
1 при x > 3.
12.2. Статистики
134
12.2 Статистики
135
12.2 Статистики
Задачи
421. Нарисовать на одном чертеже графики плотности рас-
пределения N (0, 1) и плотности распределения Стьюдента.
422. Нарисовать на одном чертеже графики плотности рас-
пределений Стьюдента Tn1 , Tn2 при n1 < n2 .
423. Доказать, что t2n = f1,n ; χ21 = u2 , где u ∈ N (0, 1).
424. Найти распределение статистик: Z1 = X1 , Z2 = X1∗ , X ∈
N (a, σ).
425. Найти распределение статистики Z = Xi −X, X ∈ N (a, σ).
426. Найти распределение статистики Z:
X1 + X 2
Z= , X ∈ N (a, σ).
2
136
12.2 Статистики
√
ством Z = n X−a S̄
. Докажите, что величина Z имеет распределение
Tn−1 .
433. hF i — непрерывная модель. Найти распределение стати-
стики n
X
G=− ln F (xi ).
i=1
n
1 n−1 2
434. Доказать, что если s2 = (Xi − X̄)2 , то M s2 =
P
n n σ .
i=1
435. Найдите плотность распределения Стьюдента.
436. Найдите плотность распределения Фишера.
437. Найдите k-й начальный момент распределения Фишера.
137
13. Статистические оценки
13.1. Критерии качества оценок
138
13.1 Критерии качества оценок
По неравенству Чебышева
Dâ1
p (|â1 − a| > ε) 6 , (71)
ε2
но как мы знаем,
1 µ2 σ2
DX̄ = Dξ = = .
n n n
Таким образом, правая часть (71) стремится к нулю, и оценка â1 состоя-
тельна.
Оценка â2 , полученная вторым стажером, не зависит от n и поэтому
p (|â2 − a| > ε) тоже не зависит от n, соответственно, не может стремиться
к нулю при стремлении n к бесконечности. Оценка â2 не является состоя-
тельной. I
DX λ
Dλ̂ = DX̄ = = .
n n
Для нахождения информационного количества Фишера I используем фор-
мулу: 2
∂ ln p (ξ = x)
I = −nM .
∂λ2
λx e−λ
Поскольку p (ξ = x) = pλ (x) = , то ln p (ξ = x) = x ln λ − λ − ln x! и
x!
∂ 2 ln p (ξ = x) x
2
= − 2.
∂λ λ
Тогда
x n
I = −nM − 2 = .
λ λ
Получили, что Dλ̂ = I1 , то есть оценка X̄ является эффективной.I
Задачи
438. Исследовать на несмещенность оценки параметров a, σ
нормального распределения N (a, σ) : â = X̄, σb2 = s2 .
439. Исследовать на несмещенность оценку параметра λ рас-
пределения Пуассона Pλ : λ̂ = X.
440. Исследовать на несмещенность оценку параметра p бино-
миального распределения с параметрами N, p :
Pn
Xi X
p̂ = i=1 = .
nN N
140
13.1 Критерии качества оценок
141
13.2 Методы нахождения оценок
ной.
L(x1 , . . . , xn , θ) = p (ξ = x1 ) · . . . · (ξ = xn ).
142
13.2 Методы нахождения оценок
J
n P
Y e−λn λ xi
L= Pλ (xi ) = Q .
i=1
(x i !)
X Y
ln L(X, λ) = −λn + xi lnλ − ln (xi !).
Найдем max ln L(X, λ).
P
∂ ln L(X, λ) xi
= −n + = 0.
∂λ λ
P
xi
Получаем λ̂ = n = x̄. Очевидно, это точка максимума, так как
∂ 2 ln L
<0 =⇒ x̄ — о.м.п. λ. I
∂λ2
Пример 131. Найдем в условиях предыдущего примера оценку макси-
мального правдоподобия функции параметра λ2 .
J По свойству инвариантности
b 2 = (x̄)2 . I
λb2 = (λ)
143
13.2 Методы нахождения оценок
J
β β
Mξ = , Dξ =
.
α α2
Mξ
β = αM ξ =⇒ Dξ =
α
Тогда
Mξ (M ξ)2
α= ,β= .
Dξ Dξ
Мы получили оценки
X x̄2
α̂ = 2 , β̂ = 2 . I
S S
Пример 134. Найти методом моментов оценки параметров распре-
деления R[a, b].
J
a+b (b − a)2
Mξ = , Dξ =
2 12
(b − M ξ)2
a = 2M ξ − b =⇒ Dξ = .
3
√ √
Отсюда b = M ξ + σ 3, a = M ξ − σ 3. Окончательно:
√ √
â = X − s 3, b̂ = X + s 3. I
Задачи
470. Найти оценки максимального правдоподобия параметров
a, σ в N (a, σ).
471. Найти оценку максимального правдоподобия функции a2 +
a в N (a, σ).
472. Найти оценку максимального правдоподобия параметра p
в B(N, p).
P3 473. Найти оценку максимального правдоподобия функции
i
i=0 p в B(N, p).
474. Найти оценку максимального правдоподобия параметра λ
в Pλ .
475. Найти оценки максимального правдоподобия параметров
a, b в R[a, b].
476. Найти оценку максимального правдоподобия параметра
α, если f (x) = eα−x , x > α.
477. Найти оценку максимального правдоподобия параметра
144
13.2 Методы нахождения оценок
−|x|
e
α, если f (x) = 2(1−e −α ) , |x| 6 α.
145
14. Доверительные интервалы.
Две статистики I1 (X), I2 (X) (I1 (X) < I2 (X)) называют довери-
тельным интервалом значимости α для параметра θ (0 < α < 1), если
выполняется условие
θ̂ − θ d
p → u ∈ N (0, 1).
Dθ̂
!
θ̂ − θ
1 − α = p u α2 < p < u1− α2 .
Dθ̂
Разрешая относительно θ, получим доверительный интервал значимости α.
146
Пример 135. Федеральные Центры оздоровительного питания изу-
чают потребление населением биологически активных добавок
(БАД). Было опрошено 4 группы по 100 покупателей каждая. В сред-
нем из ста опрошенных встречалось 60 человек употребляющих БАД,
причем σ = 10. Каков доверительный интервал значимости α = 0, 05
для числа людей, употребляющих БАД на сто опрошенных?
J Требуется найти доверительный интервал значимости α = 0, 05 для па-
раметра a нормального распределения N (a, σ) при известном σ = 10; вос-
пользуемся вышеприведенной формулой:
σ σ
Ia = X − √ · u1− α2 ; X + √ · u1− α2 =
n n
10 10
= 60 − √ · u0,975 ; 60 − √ · u0,975 =
4 4
10 10
= 60 − · 1, 96; 60 − · 1, 96 =
2 2
= (60 − 9, 8; 60 + 9, 8) = (50, 2; 69, 8). I
147
№ Значения № Значения № Значения № Значения
1 48,9231 26 49,5273 51 49,7769 76 50,1459
2 49,0009 27 49,5319 52 49,8113 77 50,1484
3 49,0009 28 49,5642 53 49,8743 78 50,1792
4 49,0009 29 49,5757 54 49,8743 79 50,1969
5 49,0676 30 49,5757 55 49,8743 80 50,2041
6 49,1057 31 49,5757 56 49,8806 81 50,2253
7 49,1104 32 49,5908 57 49,8913 82 50,2253
8 49,1591 33 49,6426 58 49,9032 83 50,2253
9 49,1915 34 49,6436 59 49,908 84 50,2366
10 49,1957 35 49,6949 60 49,9485 85 50,2681
11 49,1957 36 49,7218 61 49,9562 86 50,2743
12 49,1957 37 49,7218 62 49,961 87 50,3392
13 49,2786 38 49,7218 63 49,9704 88 50,4789
14 49,2786 39 49,7218 64 49,9861 89 50,5537
15 49,2892 40 49,7218 65 49,9921 90 50,5914
16 49,2892 41 49,7218 66 50,029 91 50,5914
17 49,2892 42 49,7218 67 50,0655 92 50,5914
18 49,3908 43 49,7218 68 50,0655 93 50,6346
19 49,3933 44 49,7218 69 50,0655 94 50,6346
20 49,4365 45 49,7218 70 50,0779 95 50,6346
21 49,449 46 49,7218 71 50,0779 96 50,6985
22 49,5006 47 49,7297 72 50,0779 97 50,7337
23 49,5191 48 49,7297 73 50,1117 98 50,7971
24 49,5273 49 49,7297 74 50,1117 99 50,816
25 49,5273 50 49,7301 75 50,1117 100 50,9521
J Для нахождения доверительного интервала необходимо сначала рассчи-
тать выборочные характеристики X и S: X = 49, 8388 и S = 0, 4703. Ис-
пользуем формулу:
S S
Ia = X − √ · tn−1, 1− α2 , X + √ · tn−1, 1− α2 ;
n n
найдем по таблице квантилей распределения Стьюдента tn−1, 1− α2 =
t99, 0,995 = 2, 58. Тогда
0, 4703 0, 4703
Ia = 49, 8388 − √ · 2, 58; 49, 8388 + √ · 2, 58 = (49, 717; 49, 960) . I
100 100
Задачи
486. Найти доверительный интервал для a в N (a, σ) при извест-
148
ном σ.
487. Найти доверительный интервал для a в N (a, σ) при неиз-
вестном σ.
488. Пусть по 16 измерениям величины ξ, имеющей нормальное
распределение, найдено среднее значение X = 4, 1. Оценить неиз-
вестное математическое ожидание случайной величины ξ по выбо-
рочной средней при помощи доверительного интервала с довери-
тельной вероятностью 0,95, если среднее квадратическое отклоне-
ние величины ξ известно и равно единице.
489. В условиях предыдущей задачи найти доверительный ин-
тервал для неизвестного математического ожидания случайной ве-
личины ξ с доверительной вероятностью 0,95, если среднее квадра-
тическое отклонение неизвестно, а выборочное среднее квадрати-
ческое отклонение величины S = −1.
490. Найти в нормальной модели доверительные интервалы для
a и σ по данным: x̄ = 103, S 2 = 16, n = 26, α = 0, 1.
491. Найти доверительный интервал для σ в модели N (2, σ) по
выборке: 2, 3, 3, 1, 1, 2, 4, 2, 1, 3 при α = 0, 1.
492. При проведении рекламной акции за первые четыре дня
распространители раздали соответственно 2470, 2490, 2580 и 2520
рекламных проспектов. Считая применимой нормальную модель,
найти доверительные интервалы для дисперсии и для среднего квад-
ратического отклонения числа раздаваемых в день рекламных про-
спектов.
493. Найти 95%-ый доверительный интервал для числа пасса-
жиров пригородного поезда, если среднее число пассажиров, рассчи-
танное за 25 рабочих дней, равно 500, а σ = 20.
494. По результатам 25 наблюдений цены товара в различных
магазинах был определен доверительный интервал для математи-
ческого ожидания цены при α = 0, 3 : Ia = [23, 84; 24, 37] (σ не извест-
но). Найдите доверительный интервал при доверительной вероят-
ности 0,95.
495. Средняя длительность оборота (в днях) оборотных
средств, рассчитанная по 36 торговым фирмам, составляет 47 дней,
причем σ = 2, 1. Найти 95%-ый и 99%-ый доверительные интервалы
для средней длительности оборота.
496. Найти доверительный интервал для p в B(N, P ) при из-
вестном N .
497. Найти доверительный интервал для λ в Pλ .
∗
498. Показать, что интервал (Xn∗ , nX√nα ) является доверитель-
149
ным интервалом для b значимости α в модели R[0, b].
499. В равномерном распределении R[a, 0] найти доверитель-
ный интервал для a.
500. Найти доверительный интервал для θ в N (θ, θ).
150
15. Статистические гипотезы.
Статистической гипотезой (или просто гипотезой) называется
любое утверждение о виде или свойствах распределения наблюдаемых в
эксперименте случайных величин.
Статистическая гипотеза называется простой, если однозначно фик-
сирует распределение наблюдений. Иначе это сложная гипотеза. Прове-
ряемая гипотеза называется нулевой (H0 ). Любая гипотеза о распределе-
нии наблюдаемой случайной величины, которая может оказаться истинной,
но отличается от основной гипотезы, называется альтернативной гипо-
тезой. Правило, согласно которому проверяют гипотезу H0 (принимают или
отвергают), называется статистическим критерием проверки гипотезы
H0 .
Статистическая гипотеза называется параметрической, если она
представляет из себя предположение о том, что неизвестный параметр рас-
пределения (дисперсия, математическое ожидание и т.п.) имеет наперед за-
данное значение или множество значений.
В процессе проверки H0 можно принять правильное решение или со-
вершить ошибку.
Вероятностью ошибки первого рода называется вероятность откло-
нить H0 , когда H0 верна.
Эта вероятность совпадает с уровнем значимости критерия α. Оче-
видно,
α = p (Hd = H1 /H0 ) = p (T (x) ∈ V /H0 ),
(α равняется вероятности того, что значение статистики T принадле-
жит критической области V при условии, что верна H0 ).
Вероятностью ошибки второго рода называется вероятность при-
нять H0 , когда H0 не верна.
Вероятность ошибки второго рода обозначается β. Очевидно,
151
странства, удовлетворяющих неравенству
L(x, θ1 )
> cα ,
L(x, θ0 )
где cα – константа, зависящая от α, L – функция правдоподобия.
Теорема Неймана–Пирсона применима и к простым гипотезам о виде
распределения.
Пример 138. Найти наилучшую критическую область для проверки
гипотезы H0 : R[−a, a] против гипотезы H1 : N (0, σ) по одному на-
блюдению (n = 1) при уровне значимости α = 0, 1.
J 2
x
√1 e− 2σ2 : 1
x ∈ [−a, a],
L(x, H1 ) 2a ,
= σ 2π (73)
x2
L(x, H0 ) √1 e − 2σ
: 0 = ∞, x ∈
2
/ [−a, a].
σ 2π
НКО V заданного уровня значимости α состоит из точек выборочного про-
странства, удовлетворяющих неравенству (??):
L(x, θ1 )
> cα ,
L(x, θ0 )
следовательно, надо разрешить (73) относительно x. Разрешая, получаем:
152
Пример 139. В условиях предыдущего примера найти мощность по-
лученного критерия.
J Мощность критерия численно равна площади над критической об-
ластью, рассчитанной на основе распределения Z при альтернативной ги-
потезе H1 . Решение принимается по одному наблюдению, то есть распреде-
ление Z совпадает с распределением X. Таким образом, M (K) равна пло-
щади криволинейной трапеции с основанием V , ограниченной сверху гра-
фиком плотности N (0, σ). Основание трапеции состоит из трех несвязан-
ных интервалов: (−∞; −a) ∪ [−aα; aα] ∪ (a; ∞). Площадь под графиком
плотности выражается через функцию распределения, и
M (K) = Φ0,σ (−a) + (Φ0,σ (aα) − Φ0,σ (−aα)) + (1 − Φ0,σ (a).
Замечание. Последнее выражение легко упрощается. M (K) можно
(и нужно) выразить через функцию Φ(x). При решении задач с числовыми
данными подставляются табличные значения функции Φ(x). I
Задачи
В задачах 501–503 даны оценки за контрольную работу первой и вто-
рой групп X = (x1 , . . . , xn ), Y = (y1 , . . . , ym ), которые можно рассматривать
как выборки из генеральных совокупностей оценок. Сформулировать нуле-
вую и альтернативную гипотезы для получения ответа на вопрос:
501. «Учится ли первая группа по этому предмету лучше вто-
рой?»
502. «Одинаково ли успешно учатся по этому предмету первая
и вторая группа?»
503. «Можно ли считать, что первая и вторая группа учатся
по этому предмету одинаково ровно?»
В задачах 504–506 даны числа ежедневных покупок, совершенных в
магазине в течение одного месяца до раздачи рекламных листовок и в тече-
ние месяца после раздачи рекламных листовок. Сформулировать нулевую и
альтернативную гипотезы для получения ответа на вопрос:
504. «Изменяет ли раздача листовок число покупок?»
505. «Увеличивает ли раздача листовок число покупок?»
506. «Уменьшился ли разброс числа покупок?»
В задачах 507–509 даны результаты измерений артериального давле-
ния у одних и тех же людей до и после приема лекарства. Сформулировать
нулевую и альтернативную гипотезы для получения ответа на вопрос:
507. «Повышает ли это лекарство давление?»
508. «Понижает ли это лекарство давление?»
509. «Это лекарство увеличивает разброс давления у пациен-
153
тов?»
510. Имеются данные о солнечной активности и о заболевае-
мости дифтеритом за ряд лет. Сформулировать нулевую и альтер-
нативную гипотезы для проверки содержательной гипотезы: «Уве-
личение солнечной активности понижает заболеваемость дифте-
ритом18 ».
511. Для каждой из двух книг имеются данные о частотах, с
которыми встречаются в тексте различные служебные слова и зна-
ки препинания. Сформулировать нулевую и альтернативную гипо-
тезы для проверки содержательной гипотезы: «Эти две книги на-
писаны одним автором».
512. Найти наилучшую критическую область в модели N (a, σ)
для проверки гипотезы H0 : a = a0 против гипотезы H1 : a = a1 по
выборке объема n = 25, если σ = 5, a0 = 1, a1 = 3, уровень значимости
α = 0, 05. Найти мощность критерия.
513. В статистической модели f (x) = λe−λx , x > 0 найти наи-
лучшую критическую область для проверки гипотезы H0 : λ = 1
против гипотезы H1 : λ = 4 по выборке объема n = 1 при уровне
значимости α = 0, 1. Найти мощность критерия.
514. В статистической модели N (a, σ) найти наилучшую кри-
тическую область для проверки гипотезы H0 : σ 2 = 4 против гипо-
тезы H1 : σ 2 = 9, если объем выборки n = 25, а уровень значимости
α = 0, 05.
515. Найти наилучшую критическую область для проверки ги-
потезы H0 : f (x) = 12 при |x| 6 1 против гипотезы H1 : ξ ∈ N (0, 1) по
одному наблюдению (n = 1), α = 0, 05. Найти мощность критерия.
516. Найти наилучшую критическую область для проверки ги-
потезы H0 : ξ ∈ N (0, 1) против гипотезы H1 : f (x) = 21 при |x| 6 1 по
одному наблюдению (n = 1), если α = 0, 05. Найти мощность крите-
рия.
517. Найти наилучшую критическую область для проверки ги-
потезы H0 : R[− 21 , 12 ] против гипотезы H1 : N (0, 0, 16) по одному на-
блюдению n = 1 при уровне значимости α = 0, 1. Найти мощность
критерия.
518. В статистической модели B(N, p) найти наилучшую кри-
тическую область для проверки гипотезы H0 : p = 14 против гипоте-
зы H1 : p = 12 , N = 10, если объем выборки n = 25, уровень значимости
α = 0, 1.
519. В статистической модели Γ(α, 1) найти наилучшую кри-
18
Гипотеза Чижевского.
154
тическую область для проверки гипотезы H0 : α = 1 против гипо-
тезы H1 : α = 3 при n = 16, α = 0, 05.
520. Найти наилучшую критическую область для проверки ги-
потезы H0 : λ = 1 против гипотезы H1 : λ = 2 в статистической
модели Pλ , n = 9, α = 0, 05.
521. Сколько наблюдений необходимо, чтобы мощность крите-
рия для проверки гипотезы H0 : a = 0 против гипотезы H1 : a = 2
в статистической модели была не меньше 0, 9, если уровень значимо-
сти α = 0, 05?
155
16. Проверка статистических гипотез
16.1. Параметрические гипотезы
Гипотеза о среднем. H0 : a = a0
156
16.2 Гипотеза о виде распределения.
H0 : σ1 = σ2 не
отвергается)
hN (a, σ)i(σ1 , σ2 неиз- r x̄−ȳ Tν, где ν ≈
s̄2
1 s̄2
2
2
n1 + n2 s̄2 s̄2
вестны, и гипотеза H0 : 1
n1 + n2
2
σ1 = σ2 отвергается) s̄2
!2
s̄2
!2 −2
1 2
n1 n2
n1 +1 + n2 +1
ных выборок.
H0 : F (x) = F0 (x).
Критерии, проверяющие гипотезу о виде распределения, называются
критериями согласия.
Критерий согласия Колмогорова.
Пусть x = (x1 , . . . , xn ) – выборка из генеральной совокупности с
неизвестной функцией распределения F (x). Выдвинута простая гипотеза
H0 : F (x) = F0 (x), где F0 (x) задана. Критерий согласия Колмогорова при-
меняют для непрерывных функций распределения F (x).
В качестве статистики критерия выбирают величину
157
16.2 Гипотеза о виде распределения.
158
16.2 Гипотеза о виде распределения.
2. Воспользуемся статистикой
nS 2
Z= 2 ,
σ0
при условии H0 статистика Z имеет распределение χ2n−1 .
3. Найдем критическую область V . Так как σ1 < σ0 , то при верной
2
гипотезе H1 статистика Z = nS 2
σ0
принимает меньшие значения, чем при
верной гипотезе H0 , следовательно, критическая область левосторонняя:
V = {x : Z(x) 6 χ2α }. Из таблиц находим граничное значение Zкрит. =
χ2100;0,05 = 77, 929. Таким образом, критическая область V = [0, 77, 929].
4. Рассчитаем по выборке значение статистики Zв :
159
16.2 Гипотеза о виде распределения.
J
H0 : Fη (y) = FR[0,1] (y).
В качестве статистики критерия возьмем величину
√
Dn = n · max Fn∗ (y) − FR[0,1] (y)
y
Задачи
Замечание. Если в условиях не указан уровень значимости α, следует
задать его самим.
522. Средние по отрасли издержки на производство единицы
некоторого товара составляют a0 = 13, а по 26 предприятиям кор-
порации выборочное среднее издержек равно x̄ = 11, S = 2. Можно ли
считать, что издержки в данной корпорации ниже, или отклонение
следует считать случайным? (α = 0, 05).
523. В условиях примера 137 проверить гипотезу о том, что
математическое ожидание курса английского фунта стерлингов за
160
16.2 Гипотеза о виде распределения.
161
Приложение.
1 x2
Таблица 3. Значения функции ϕ (x) = √ e− 2
2π
x Сотые доли x
0 1 2 34 5 6 7 8 9
0, 0 39894 39892 39886 39876
39862 39844 39822 39797 39767 39733
0, 1 39695 39654 39608 39559
39505 39448 39387 39322 39253 39181
0, 2 39104 39024 38940 38853
38762 38667 38568 38466 38361 38251
0, 3 38139 38023 37903 37780
37654 37524 37391 37255 37115 36973
0, 4 36827 36678 36526 36371
36213 36053 35889 35723 35553 35381
0, 5 35207 35029 34849 34667
34482 34294 34105 33912 33718 33521
0, 6 33322 33121 32918 32713
32506 32297 32086 31874 31659 31443
0, 7 31225 31006 30785 30563
30339 30114 29887 29659 29431 29200
0, 8 28969 28737 28504 28269
28034 27798 27562 27324 27086 26848
0, 9 26609 26369 26129 25888
25647 25406 25164 24923 24681 24439
1, 0 24197 23955 23713 23471
23230 22988 22747 22506 22265 22025
1, 1 21785 21546 21307 21069
20831 20594 20357 20121 19886 19652
1, 2 19419 19186 18954 18724
18494 18265 18037 17810 17585 17360
1, 3 17137 16915 16694 16474
16256 16038 15822 15608 15395 15183
1, 4 14973 14764 14556 14350
14146 13943 13742 13542 13344 13147
1, 5 12952 12758 12566 12376
12188 12001 11816 11632 11450 11270
1, 6 11092 10915 10741 10567
10396 10226 10059 09893 09728 09566
1, 7 09405 09246 09089 08933
08780 08628 08478 08330 08183 08038
1, 8 07895 07754 07614 07477
07341 07207 07074 06943 06814 06687
1, 9 06562 06438 06316 06195
06077 05960 05844 05730 05618 05508
2, 0 05399 05292 05186 05082
04980 04879 04780 04682 04586 04492
2, 1 04398 04307 04217 04128
04041 03955 03871 03788 03706 03626
2, 2 03548 03470 03394 03319
03246 03174 03103 03034 02966 02899
2, 3 02833 02768 02705 02643
02582 02522 02463 02406 02349 02294
2, 4 02240 02186 02134 02083
02033 01984 01936 01889 01842 01797
2, 5 01753 01710 01667 01625
01585 01545 01506 01468 01431 01394
2, 6 01358 01323 01289 01256
01223 01191 01160 01130 01100 01071
2, 7 01042 01014 00987 00961
00935 00910 00885 00861 00837 00814
2, 8 00792 00770 00748 00727
00707 00687 00668 00649 00631 00613
2, 9 00595 00578 00562 00545
00530 00514 00499 00485 00471 00457
3, 0 00443 00430 00417 00405
00393 00381 00370 00358 00348 00337
x Десятые доли x
0 1 2 3 4 5 6 7 8 9
3 00443 00327 00238 00172 00123 00084 00061 00043 00029 00020
162
Zx
1 t2
Таблица 4. Значения функции Φ0 (x) = √ e− 2 dt
2π
0
x Сотые доли x
0 1 2 3 4 5 6 7 8 9
0, 0 0, 0000 00399 00798 01197 01595 01994 02392 02790 03188 03586
0, 1 03983 04380 04776 05117 05567 05962 06356 06749 07142 07535
0, 2 07920 08317 08700 09095 09483 09871 10257 10642 11026 11409
0, 3 11791 12172 12552 12930 13307 13683 14058 14431 14803 15173
0, 4 15542 15910 16276 16640 17003 17365 17724 18082 18439 18793
0, 5 19146 19497 19847 20194 20540 20884 21226 21566 21904 22241
0, 6 22575 22907 23237 23565 23891 24215 24537 24857 25175 25490
0, 7 25804 26115 26424 26731 27035 27337 27637 27935 28230 28524
0, 8 28814 29103 29389 29673 29955 30234 30511 30785 31057 31328
0, 9 31594 31859 32121 32381 32639 32894 33147 33398 33646 33891
1, 0 34134 34375 34614 34850 35083 35314 35543 35769 35993 36214
1, 1 36433 36650 36864 37076 37286 37493 37698 37900 38100 38298
1, 2 38493 38686 38877 39065 39251 39435 39617 39796 39973 40148
1, 3 40320 40490 40658 40824 40988 41149 41309 41466 41621 41774
1, 4 41924 42073 42220 42634 42507 42647 42786 42922 43056 43189
1, 5 43319 43447 43574 43699 43822 43943 44062 44179 44295 44408
1, 6 44520 44630 44738 44845 44950 45053 45154 45254 45352 45449
1, 7 45543 45637 45728 45819 45907 45994 46080 46164 46246 46327
1, 8 46407 46485 46562 46638 46712 46784 46856 46926 46995 47062
1, 9 47128 47193 47257 47320 47381 47441 47500 47558 47615 47671
2, 0 47725 47778 47831 47882 47932 47982 48030 48077 48124 48169
2, 1 48214 48257 48300 48341 48382 48422 48461 48499 48537 48574
2, 2 48610 48645 48679 48713 48745 48778 48809 48839 48870 48899
2, 3 48928 48956 48983 49010 49036 49061 49086 49111 49134 49158
2, 4 49180 49202 49224 49245 49266 49286 49305 49324 49343 49361
2, 5 49379 49396 49413 49430 49446 49461 49477 49491 49506 49520
2, 6 49535 49547 49560 49573 49586 49598 49609 49621 49632 49643
2, 7 49653 49664 49674 49683 49693 49702 49711 49720 49728 49737
2, 8 49744 49752 49760 49767 49774 49781 49788 49795 49801 49807
2, 9 49813 49819 49825 49830 49836 49841 49846 49851 49856 49861
3, 0 49865 49869 49874 49878 49882 49886 49889 49893 49897 49899
x Десятые доли x
0 1 2 3 4 5 6 7 8 9
3 49865 49903 49931 49952 49966 49977 49984 49989 49993 49995
163
Таблица 5. Некоторые важные дискретные распределения
Обозначение Значения Закон распределения Интерпретация
Вырожденное ξ≡c p (ξ = c) = 1 Случайная величина — постоянная c
ξ = xi ; 1
Дискретное равномерное p (ξ = xi ) = Величина с равновероятными значениями
i = 1, 2, . . . , n n
B (1, p) — Бернулли ξ = 0, 1 p (ξ = 0) = 1 − p, p (ξ = 1) = p Число успехов в одном испытании
p (ξ = m) = CNm pm (1 − p)N −m .
Число успехов в N испытаниях, проводи-
B (N, p) — Биномиальное ξ = 0, 1, . . . , N
m = 0, 1, . . . , N ; N ∈ N; мых по схеме Бернулли
0<p<1
164
m!
λ>0 успехов)
B (r, p) — Отрицательное m
ξ = 0, 1, . . . p (ξ = m) = Cr+m−1 pr (1 − p)m , Если r ∈ Z, то m — число неудач до r-го
биномиальное (Паскаля) успеха
m = 0, 1, . . . ; r > 0; 0 < p < 1
Таблица 6. Некоторые важные непрерывные распределения
165
Γ−1 (β)αβ xβ−1 e−αx при x > 0
2
g 0 (x) n o
Кэптейна a, σ>0 √ exp − (g (x)−a) 2σ 2
σ 2π
1 n o
Логарифмически нормальное x−a)2
a, σ>0 √ exp − (ln 2σ 2 , x>0
[частный случай распределения Кэптейна при g (x) = ln x] σ 2πx
λ
Лапласа λ>0 exp {−λ|x − α|}
2
0 при x < 1,
Парето p>0 −(p+1)
px при x > 1.
n o
x−α
1 exp − β
Логистическое β>0 · n o2
β
1 + exp − x−αβ
Таблица 7. Матем. ожидания и дисперсии некоторых важных распределений
Распределение Mξ Dξ
Бернулли B (1, p) p q
Биномиальное B (N, p) Np N pq
Пуассона Pλ λ λ
M nM (N − M )(N − n)
Гипергеометрическое Gm, n (M, N ) n
N N 2 (N − 1)
q q
Геометрическое Gp
p p2
rq rq
Паскаля19 B (r, p)
p p2
Равномерное R[a, b]
a+b (b − a)2
2 12
Нормальное N (a, σ) a σ2
1 1
Показательное Eλ
λ λ2
Коши Ca, λ не ∃ не ∃
β β
Γ (Гамма) Γα, β
α α2
2
Лапласа α
λ2
166
Таблица 8. Греческий алфавит
Буква Название
A α альфа
B β бета
Γ γ гамма
∆ δ дельта
E ε эпсилон
Z ζ дзета
H η эта
Θ ϑ тета
I ι йота
K κ каппа
Λ λ лямбда
M µ мю
N ν ню
Ξ ξ кси
O o омикрон
Π π пи
P ρ ро
Σ σ сигма
T τ тау
Υ υ ипсилон
Φ ϕ фи
X χ хи
Ψ ψ пси
Ω ω омега
167
Таблица 9. Таблица случайных чисел
5686 4215 5470 4452 4841 0477 9567 7496 1297 3594 1020 3531 4296
3106 9375 4545 0447 0754 6377 1127 7126 1021 4070 4488 2365 9633
9359 1271 7562 0122 8112 4863 1022 0731 8446 2302 8433 3299 5987
2057 0762 1429 8535 9029 9745 3458 5023 3502 2436 6435 2646 0295
6177 2755 3080 3275 0521 6623 1133 3278 0500 7573 7426 3188 0187
7707 3047 4901 3519 7888 6411 1631 6981 1972 4269 0022 3860 1580
6751 4022 6540 7804 5528 4690 3586 9839 6641 0404 0735 0888 3504
2651 9051 5764 7155 6489 2660 3341 8784 0605 4640 8692 7712 9832
6607 0480 2557 3461 9755 4398 8857 0221 3844 1823 4407 5914 7545
2362 2428 7899 2623 9965 7366 0486 8185 5896 3985 3105 7210 5375
2213 8481 0919 2350 7310 7106 0046 1683 6269 1120 5436 8921 6457
8361 9849 9902 4244 2377 9213 4625 5978 5266 7521 8488 6854 9203
2598 2673 2399 5112 4318 5003 3532 6430 5679 5041 2108 1813 4235
3915 9380 3918 5957 3603 6553 6247 8907 5282 1106 9223 5629 6982
4138 2901 7592 1650 2580 5676 6470 0122 0820 2140 5291 8499 3653
168
1727 0453 3032 2902 4114 2462 2820 0414 7197 3854 2940 3500 8685
6131 0774 7788 5011 4971 0848 0748 7103 3262 5182 1185 1493 3425
0114 4662 0802 1125 8745 5513 9750 0695 5727 7577 8631 0759 5430
9953 1426 0405 2109 2304 5329 2475 8555 8172 1376 3459 6778 6917
0159 9635 7058 4886 2373 5937 9383 5763 8004 8602 2457 9134 0099
2200 2369 8140 4865 4874 4867 5206 0434 3845 0659 0499 3671 2771
2104 9275 2118 8024 1033 0528 3665 9721 6339 3377 3780 0366 4746
Список литературы
[1] Булдык, Г. М. Теория вероятностей и математическая статистика: Учебное посо-
бие. — /Г. М. Булдык. — Минск: Вышейш. шк., 1989.
[2] Вентцель, Е. С. Теория вероятностей: Учебное пособие. — Изд. 6-е, перераб. и доп.
/ Е. С. Вентцель, Л. А. Овчаров. — М.: Наука. Гл. ред. физ.-мат. лит., 1969.
[5] Гнеденко, Б. В. Курс теории вероятностей: Учебник. — Изд. 6-е, перераб. и доп. /
Б. В. Гнеденко. — М.: Наука. Гл. ред. физ.-мат. лит., 1988.
169
Учебное издание
Учебное пособие
Редактор — А. А. Назимова
Корректор — Т. Е. Бастрыгина
Лицензия ЛР № 020372 от 29.01.1997
м2, Х1 Х2 Х3 Y
1 30 17,8 6,7 65
2 32,3 12,3 9 57
3 32 17 7 55
4 29 13 7 50
5 38 20 9 70
6 39 19 6 65
7 29 15 6 55
8 32 18,8 6 58
9 33 15,5 6 50
10 31,6 18,7 5,8 70
11 34 18 6 68
12 35,4 17,5 9,2 80
13 30 18 7 70
14 21,1 16,9 5,5 80
15 29 16 6 58
16 29 16 6 57
17 30 18 6 65
18 33 19 8 52
19 32 21 6 45
20 29 18 6 62
Задания:
1. Подумайте, какой из представленных показателей наиболее
существенно влияет на цену? Какие, важные по Вашему мнению,
факторы остались без внимания исследователя?
2. Рассчитайте основные описательные статистики для первых
десяти наблюдений Y: среднюю, дисперсию, среднеквадратическое
1
отклонение, коэффициент вариации, коэффициент ассиметрии,
коэффициент эксцесса.
3. Сделайте выводы об однородности выборки и о близости ее к
нормальному закону распределения.
Семинар 2.1.2
Работа в пакете STATISTICA. Визуализация данных.
Определение степени однородности выборки. Проверка данных
на близость к нормальному закону распределения. Построение
корреляционной матрицы
Задача 2
По данным задачи 1 «Стоимость жилья».(семинар 2.1.1):
Задания для работы в пакете STATISTICA:
1. создайте новый файл;
2. введите данные;
3. рассчитайте основные описательные статистики,
4. использование графического редактора для построения
гистограмм и функций распределения данных.
5. Визуализация данных. Определение степени
однородности выборки. Проверка данных на близость к нормальному
закону распределения.
6. Построение поля корреляции.
7. Построение корреляционной матрицы.
Задача 3.
По приведенным ниже данным вычислите оценку парного
линейного коэффициента корреляции между переменными X и Y.
2
10 10 10 10 10
∑ xi = 9; ∑ xi2 = 908;
i =1 i =1
∑ yi = 68,
i =1
∑x y
i =1
i i = 664. ∑ y i2 = 496.
i =1
Задача 4.
По результатам обследования n = 8 промышленных
предприятий получена следующая информация ( X 1 — себестоимость
продукции, X 2 — объем выработки, X 3 — фондоотдача.):
Таблица 2
X1 30 20 40 35 45 25 50 30
X2 20 30 50 70 80 20 90 25
X3 20 25 20 15 10 30 10 20
Определите:
1. значения средних квадратических отклонений ( S х ), где j= 1, j
2, 3;
2. значения парных коэффициентов корреляции r12 , r13 и r23 .
Генеральная совокупность, предполагается нормально
распределенной.
Задача 5.
По данным n=10 машиностроительных предприятий, методами
корреляционного анализа исследуется взаимосвязь между
следующими показателями:
Х1 — рентабельность (%);
Х2 — премии и вознаграждения на одного работника;
Х3 — фондоотдача.
Таблица 3
№ п/п Х1 Х2 Х3
1 13,26 1,23 1,45
2 10,16 1,04 1,30
3 13,72 1,80 1,37
4 12,82 0,43 1,65
5 10,63 0,88 1,91
6 9,12 0,57 1,68
7 25,83 1,72 1,94
8 23,39 1,70 1,89
9 14,68 0,84 1,94
10 10,05 0,60 2,06
Постройте матрицу выборочных парных линейных
коэффициентов корреляции.
3
Задача 6
Ниже приведены данные о количестве потребляемого пива(Q) и
ценах на этот продукт(P).
Таблица 4
год 1 2 3 4 5 6 7 8 9 10
Q 34.4 35.8 36.7 38.3 39.1 40.1 40.7 40.3 41.4 41.7
P 90.6 85.3 81.8 78.9 73.9 74.3 71.5 68.4 66.4 65.9
Задания:
1. Вычислите среднюю, дисперсию для каждого ряда,
ковариацию и коэффициент корреляции между ними.
2. Сделайте выводы о характере и тесноте связи.
Семинар 2.2.1.
Работа в пакете STATISTICA.
Анализ адекватности корреляционных связей.
Формирование более однородной выборки.
Оценка адекватности результатов по скорректированной
выборке. Формирование отчета в программе Excel
Задача 7 «Успеваемость»
Провести анализ корреляционных связей между успеваемостью
студента в средней школе и его успеваемостью в высшей школе.
В группе проводится сбор информации по каждому студенту:
Х1 — средний балл успеваемости по школьному аттестату;
Х2 — сумма набранных баллов при поступлении в университет;
Х3 — средний балл успеваемости за первый курс;
Х4 – пол студента (мужской – 0, женский – 1)
Х5 – тип среднеобразовательного учебного заведения, которое
окончил студент ( школа – 0, гимназия – 1)
4
Задания для самостоятельной работы.
Задача 8.
Исследуйте взаимосвязи между средним душевым доходом,
индексом человеческого развития и индексом человеческой бедности.
Имеются следующие данные:
Таблица 5
Страна Душевой Индекс Индекс
доход*, человеческого человеческой
долл., развития (ИЧР), бедности (ИЧБ),
у х1 х2
ОАЭ 1600 0,866 14,9
Таиланд 7100 0,833 11,7
Уругвай 6750 0,883 11,7
Ливия 6130 0,801 18,8
Колумбия 6110 0,848 10,7
Иордания 4190 0,730 10,9
Египет 3850 0,514 34,8
Марокко 3680 0,566 41,7
Перу 3650 0,717 22,8
Шри-Ланка 3280 0,711 20,7
Филиппины 2680 0,672 17,7
Боливия 2600 0,589 22,5
Китай 2600 0,626 17,5
Зимбабве 2200 0,513 17,3
Пакистан 2150 0,445 46,8
Уганда 1370 0,328 41,3
Нигерия 1350 0,393 41,6
Индия 1350 0,446 36,7
* По паритету покупательной способности валют
5
Задания:
1. Проведите визуализацию данных. Сделайте заключение об
однородности и близости выборки к нормальному распределению.
2. Постройте поля корреляций Y, X1 и Y, X2.
Сформулируйте гипотезу о форме связи.
3. Постройте корреляционную матрицу, дайте анализ связям.
Семинар 2.2.2.
Проверка статистической значимости парного коэффициента
корреляции. Построение корреляционной матрицы с расчетными
уровнями значимости. Выполнение расчетно-графического задания
(РГЗ) №1: п. I.,п. II.
Задача 9
По данным n=10 машиностроительных предприятий, методами
корреляционного анализа исследуется взаимосвязь между
следующими показателями:
Х1 — рентабельность (%);
Х2 — премии и вознаграждения на одного работника;
Х3 — фондоотдача.
Таблица 6
№ п/п Х1 Х2 Х3
1 13,26 1,23 1,45
2 10,16 1,04 1,30
3 13,72 1,80 1,37
4 12,82 0,43 1,65
5 10,63 0,88 1,91
6 9,12 0,57 1,68
7 25,83 1,72 1,94
8 23,39 1,70 1,89
9 14,68 0,84 1,94
10 10,05 0,60 2,06
Задания:
1. Проверьте при α=0,05 значимость парного коэффициента
корреляции ρ12 ;
2. найдите его интервальную оценку с доверительной
вероятностью γ=0,95.
Задача 10.
6
Ниже приведены данные об объемах продаж Кока-колы (Q) и
ценах на этот продукт (P).
Таблица 7
год 1 2 3 4 5 6 7 8 9 10
Q 34.4 35.8 36.7 38.3 39.1 40.1 40.7 40.3 41.4 41.7
P 90.6 85.3 81.8 78.9 73.9 74.3 71.5 68.4 66.4 65.9
Определите, начиная с какого уровня значимости можно
утверждать, что связь между ценой и количеством потребляемой
Кока-колы существует?
Задача 11
По данным задачи 1 «Стоимость жилья» (семинар 2.1.1):
1. Подумайте, какой из представленных показателей
наиболее существенно влияет на цену?
2. Какие, важные по Вашему мнению, факторы остались без
внимания исследователя?
3. Постройте корреляционную матрицу.
4. Проанализируйте корреляционные связи. Оправдались ли
Ваши ожидания (п.1)?
Задача 12
По данным задачи 7 «Успеваемость» (семинар 2.2.1).
1. Проверьте значимость коэффициентов корреляции на
уровнях: 1% ,5% ,10%.
2. Постройте корреляционную матрицу с расчетными
уровнями значимости, используя пакет STATISTICA.
3. Отчета сформируйте в программе Excel.
Содержание работы:
I. Визуализация данных.
1.1. Постройте диаграмму рассеивания для исследуемого
показателя (Y).
1.2. Проверьте исходные данные на близость к нормальному
закону распределения. Постройте гистограмму (Y) и график (Y) на
нормальной вероятностной бумаге.
7
2.1. Постройте поля корреляций показателя (Y) с каждым из
факторов Хj . Сделайте предположение о характере связи между
показателями.
2.2. Постройте корреляционную матрицу, определите уровни
значимости коэффициентов корреляции.
2.3. Выделите факторы, оказывающие значимое (на уровне
≤0,05) влияние на результирующий показатель (Y).
2.4. Проанализируйте наличие мультиколлинеарности между
объясняющими переменными.
2.5. Дайте экономическую интерпретацию корреляционным
связям.
Таблица 8
№
пп У1 У2 У3 Х4 Х5 Х6 Х7 Х8 Х9
1 9,26 204,2 13,26 0,23 0,78 0,4 1,37 1,23 0,23
2 9,38 209,6 10,16 0,34 0,75 0,26 1,49 1,04 0,39
8
12,1
3 1 222,6 13,72 0,19 0,68 0,4 1,44 1,8 0,43
10,8
4 1 236,7 12,85 0,17 0,7 0,5 1,42 0,43 0,18
5 9,35 62 10,63 0,23 0,62 0,4 1,35 0,88 0,15
6 9,87 53,1 9,12 0,43 0,76 0,19 1,39 0,57 0,34
7 8,17 172,1 25,83 0,31 0,73 0,25 1,16 1,72 0,38
8 9,12 56,5 23,39 0,26 0,71 0,44 1,27 1,7 0,09
9 5,88 52,6 14,68 0,49 0,69 0,17 1,16 0,84 0,14
10 6,3 46,6 10,05 0,36 0,73 0,39 1,25 0,6 0,21
11 6,22 53,2 13,99 0,37 0,68 0,33 1,13 0,82 0,42
12 5,49 30,1 9,68 0,43 0,74 0,25 1,1 0,84 0,05
13 6,5 146,4 10,03 0,35 0,66 0,32 1,15 0,67 0,29
14 6,61 18,1 9,13 0,38 0,72 0,02 1,23 1,04 0,48
15 4,32 13,6 5,37 0,42 0,68 0,06 1,39 0,66 0,41
16 7,37 89,8 9,86 0,3 0,77 0,15 1,38 0,86 0,62
17 7,02 62,5 12,62 0,32 0,78 0,08 1,35 0,79 0,56
18 8,25 46,3 5,02 0,25 0,78 0,2 1,42 0,34 1,76
19 8,15 103,5 21,18 0,31 0,81 0,2 1,37 1,6 1,31
20 8,72 73,3 25,17 0,26 0,79 0,3 1,41 1,46 0,45
№
п/п Х10 Х11 Х12 Х13 Х14 Х15 Х16 Х17
2600 167,6
1 1,45 6 9 47750 6,4 166,32 10,08 17,72
2393
2 1,3 5 186,1 50391 7,8 92,88 14,76 18,39
2258 220,4
3 1,37 9 5 43149 9,76 158,04 6,48 26,46
2122
4 1,65 0 169,3 41089 7,9 93,96 21,96 22,37
5 1,91 7394 39,53 14257 5,35 173,88 11,88 28,13
1158
6 1,68 6 40,41 22661 9,9 162,3 12,6 17,55
2660 102,9
7 1,94 9 6 52509 4,5 88,56 11,52 21,92
8 1,89 7801 37,02 14903 4,88 101,16 8,28 19,52
1158
9 1,94 7 45,74 25587 3,46 166,32 11,52 23,99
10 2,06 9475 40,07 16821 3,6 140,76 32,4 21,76
1081
11 1,96 1 45,44 19459 3,56 128,52 11,52 25,68
12 1,02 6371 41,08 12973 5,65 177,84 17,28 18,13
13 1,85 2676 136,1 50907 4,28 114,48 16,2 25,74
9
1 4
14 0,88 4210 42,39 6920 8,85 93,24 13,32 21,21
15 0,62 3557 37,39 5736 8,52 126,72 17,28 22,97
1414 101,7
16 1,09 8 8 26705 7,19 91,8 9,72 16,38
17 1,6 9872 47,55 20068 4,82 69,12 16,2 13,21
18 1,53 5975 32,61 11487 5,46 66,24 24,84 14,48
1666 103,2
19 1,4 2 5 32029 6,2 67,68 14,76 13,38
20 2,22 9166 38,95 18946 4,25 50,4 7,56 13,69
У1 — производительность труда
У2 — индекс снижения себестоимости продукции
У3— рентабельность
Х4 — трудоемкость единицы продукции
Х5 — удельный вес рабочих в составе промышленно-
производственного персонала
Х6 — удельный вес покупных изделий
Х7 — коэффициент сменности оборудования
Х8 — премии и вознаграждения на одного работника
Х9 — удельный вес потерь от брака
Х10 — фондоотдача
Х11 — среднгодовая численность промышленно-
производственного персонала
Х12 — среднегодовая стоимость основных производственных
фондов
Х13 — среднегодовой фонд заработной платы промышленно-
производственного персонала
Х14 — фондовооруженность труда
Х15 — оборачиваемость нормируемых оборотных средств
Х16 — оборачиваемость ненормируемых оборотных средств
Х17 — непроизводственные расходы
10
1 31 82 25 26 53 30 29
2 21 55 8 27 32 42 26
1. Вычислить коэффициент ранговой корреляции Спирмена
между результатами тестирования по двум тестам.
2. На уровне α=0,05 оценить его значимость.
Задача 14.
По данным n=15 предприятий, каждое из которых
характеризуется по трем показателям: х1 – объем сменной выработки,
х2 – себестоимость продукции и х3 – фондоотдача; получена матрица
парных коэффициентов корреляции:
⎡ 1 −0, 6 0,8 ⎤
R = ⎢ −0, 6 1 −0, 6 ⎥⎥
⎢
⎢⎣ 0,8 −0, 6 1 ⎥⎦
1. Определите оценку частного коэффициента корреляции
r23.1.
2. Проверьте при α=0,05 значимость частного
коэффициента корреляции r23.1.
3. Найдите точечную оценку множественного
коэффициента корреляции, характеризующего тесноту связи между
себестоимостью и остальными переменными.
4. При α=0,05 проверить значимость множественного
коэффициента корреляции r2.13.
5. Определите, какая доля дисперсии х2 объясняется
влиянием показателей х1 и х3.
Пример 1
Покажите, что b 1 = r X Y *S Y /S X , где r X Y — выборочный
коэффициент корреляции между X и Y, а S Y , S X —
стандартные отклонения Y и X соответственно.
Пример 2
Для наблюдений:
Таблица 10
11
Y X
2 1
5 3
3 2
4 3
6 4
Вычислите следующие величины:
1. коэффициент детерминации R 2 в регрессии Y t на X t
при наличии свободного члена;
2. коэффициент детерминации R 2 в регрессии Y t на X t
при отсутствии свободного члена;
3. коэффициент детерминации R 2 в регрессии y t на x t
при наличии свободного члена, где y t и x t — отклонения
переменных Y t и X t от их средних значений;
4. коэффициент детерминации R 2 в регрессии y t на x t
при отсутствии свободного члена.
Пример 3.
Рассмотрим модель регрессии на константу
Y t = β 0 + ε t . t = 1,…,n.
1. Найдите оценки метода наименьших квадратов для β 0
2
и σ (дисперсии ошибок).
2. Чему равен коэффициент детерминации R 2 ?
Пример 4.
Рассмотрим модель регрессии без константы
Y t = β 1 *Y t + ε t . , t = 1,…,n.
Формула для МНК-оценки в регрессии без константы:
∑ X tYt
b1 =
∑ X t2
Приведите примеры данных, для которых:
1. значение коэффициента R 2 , рассчитанное по формуле
R 2 = RSS/TSS, отличается от значения R 2 , рассчитанного по
формуле R 2 = 1 — ESS/TSS;
2. значение коэффициента R 2 , рассчитанное по формуле
R 2 = RSS/TSS, больше 1;
3. значение R 2 , рассчитанное по формуле R 2 = 1 —
ESS/TSS, меньше 0.
Пример 5.
12
Исследуйте зависимость между производительностью труда
одного занятого Y и фондом оплаты труда X по n = 10 косметическим
салонам.
Таблица 11
№ 1 2 3 4 5 6 7 8 9 10
п/п
X 8 11 12 9 8 8 9 9 8 12
Y 5 10 10 7 5 6 6 5 6 8
Пример 6.
По данным примера 5 оцените производительность труда
одного занятого для салонов с фондом оплаты труда 8 (у.е);
Пример 7
Наблюдения 5 пар (X,Y) дали следующие результаты:
Оцените регрессию Y t = β 0 + β 1 *X t + ε t .
Пример 8.
По приведенным ниже данным:
n = 12 Χ = 200
∑X = 2400 Υ = 173,92
∑Y = 2087 ∑Y 2 = 364741
∑X 2 = 483236 ∑XY = 419782
Вычислите парную регрессию Y на Х
Пример 9.
По данным годовых отчетов, десяти (n=10)
машиностроительных предприятий, оцените линейную
регрессионную модель зависимости производительности труда Y
(млн. руб. на чел.), от объёма производства X (млрд. руб.): Y = β0 +
β1X + ε.
Таблица 12
Nп/п (i) Y X
1 2,1 3
2 2,8 4
3 3,2 5
4 4,5 5
5 4,8 5
6 4,9 5
13
7 5,5 6
8 6,5 7
9 12,1 15
10 15,1 20
Задача 15 «Производительность».
Имеются следующие данные:
Таблица 13
№ п/п Фонд оплаты труда (Х) Производительность труда (Y)
1 1 1,6
2 3 2,4
3 6 2,8
4 8 3,2
Задания:
1. Найдите точечную оценку условного
математического ожидания производительности труда при
фонде оплаты труда равном 10, если генеральное уравнение
регрессии — линейное.
2. Проверьте значимость генерального коэффициента
корреляции ρХУ на уровнях 1%, 5%, 10%.
3. Проверьте качество уравнения регрессии с
помощью:
• Средней ошибки аппроксимации;
• Стандартной ошибки регрессии;
• Коэффициента детерминации.
4. Сформулировать задачу, обратную данной ( Х —
результирующий показатель, У — объясняющая переменная).
5. Выполнить п. 2-3 для обратной задачи. Какие
статистики в прямой и обратной задачах совпадают, а какие
разные?
Задача 16
По данным задачи 15 «Производительность» выполните:
1. Ввод данных;
2. Расчеты в модуле Multiple Regression.
3. Анализ таблиц: Regression Summary, ANOVA.
4. Анализ таблиц: Regression Summary, ANOVA в
задачи, обратной к задаче «Производительность».
5. Отчет в программе Excel.
14
Задача 17
По данным задачи 7 «Успеваемость» (семинаре 2.2.1):
1. Постройте регрессионную модель зависимости
среднего балла успеваемости студента за первый курс (Х3) от
среднего балла по аттестату (Х1).
2. Проведите анализ качества уравнения.
Задача 18
По данным задачи 1 «Стоимость жилья» (семинар 2.1.1).
1. Постройте регрессионную модель зависимости
стоимости квартиры (У) от размера жилой площади (Х2).
2. Проведите анализ качества уравнения.
Упражнения.
15
6. Дисперсии временных рядов индекса денежной
массы и сводного индекса цен равны 150 и 200, их ковариация
равна 100. Чему равен параметр влияния денежной массы на
цены по модели прямой регрессии и доля объясненной дисперсии
в дисперсии индекса цен?
7. По заданной матрице ковариации двух переменных
⎡14 / 3 5 / 3⎤
⎢ 5 / 3 2 / 3⎥ найти остаточную дисперсию уравнения регрессии
⎣ ⎦
первой переменной по второй.
8. В регрессионной модели Y = b0 + b1X + e, где Y = (5,
3, 7, 1) получены оценки b1 = 2, b0 = 1, а коэффициент
детерминации оказался равным 100%. Найдите X.
9. В регрессии Y = b0 + b1X + e, где Y = (5, 3, 7, 1)
коэффициент детерминации оказался равным 50%. Найдите
сумму квадратов остатков Σ еi² .
10. Две регрессии построены на одних и тех же данных:
Y = aX + b, X = cY + d. Т — коэффициент детерминации в
первой регрессии, S — во второй. Напишите соотношение между
Т и S.
11. Возможна ли ситуация, когда угловые
коэффициенты в уравнениях прямой и обратной регрессии
соответственно равны 0,5 и 3,0. Почему?
12. Докажите, что линия ортогональной регрессии
находится между линиями прямой и обратной регрессии.
13. Какая из двух оценок коэффициента зависимости
выпуска продукции от количества занятых в производстве
больше другой: по прямой или ортогональной регрессии. Ответ
обосновать.
14. Какая из двух оценок коэффициента зависимости
спроса от цены больше другой: по прямой или ортогональной
регрессии. Ответ обосновать.
15. Оценка парной регрессии ведется в
стандартизированной шкале. Как связан коэффициент
детерминации и коэффициент регрессии (угловой)?
16. Какой вид будет иметь оценка уравнения регрессии
Y = β0 + β1 * Х + ε, если фактическое значение коэффициента
детерминации равно нулю, среднее значение у и х,
соответственно равны 1 и 3?
17. В модели Y = b0 + b1 * Х + e фактор Х равен (1, 3, 7,
1). Могут ли остатки быть равными (1, -2, 2, -1). Обосновать.
18. В модели Y = b0 + b1 * Х + e фактор Х равен (1, 3, 7,
2). Могут ли остатки быть равными (1, -2, 1, -1). Обосновать.
19. Оцените модель Y = b0 + b1 * Х + e используя
следующие данные:
16
Таблица 14
Y 3 1 8 3 5
X 3 1 5 2 4
Вычислите остатки (еt) и покажите, что:
а) Σ et = 0 б) Σ Хtet = 0
20. Что геометрически означает R2 = 0 и R2 = 1?
21. Докажите, что коэффициент детерминации не
зависит от выбора масштаба измерения переменных.
Задача 21.
На основании данных о темпе прироста (%) внутреннего
национального продукта (У) и промышленного производства (Х),
десяти развитых стран мира за 1992 г., приведенных в таблице и
предположения, что генеральное регрессии имеет вид:
Yˆ = β 0 + β 1 х.
Таблица 16
страны У Х
Япония 3,5 4,3
США 3,1 4,6
Германия 2,2 2,0
17
Франция 2,7 3,1
Италия 2,7 3,0
Великобритания 1,6 1,4
Канада 3,1 3,4
Австралия 1,8 2,6
Бельгия 2,3 2,6
Нидерланды 2,3 2,4
Требуется определить оценки вектора b и остаточной
дисперсии S ост 2 .
Задача 22.
1. В регрессии Χ = αΖ + β + ε матрица вторых начальных
моментов регрессоров равна
9
2
2
1
Найти матрицу вторых центральных моментов.
Семинар 2.3.2.
Проверка значимости уравнения регрессии. Проверка
значимости коэффициентов регрессии. Проверка выполнения
условий Гаусса — Маркова (предпосылок регрессионного
анализа).
Пример 10.
Наблюдения 5 пар (X,Y) дали следующие результаты:
Пример 11.
18
По приведенным ниже данным и результатам примера 8
(семинар 5):
n = 12 Χ = 200
∑X = 2400 Υ = 173,92
∑Y = 2087 ∑Y 2 = 364741
∑X 2 = 483236 ∑XY = 419782
Вычислите S ост , S b , S b
2 2
0
2
1
Пример 12.
По условию и результатам примера 2 (семинар 6):
1. Проверьте на 5%-уровне значимость
коэффициентов β 0 и β 1 .
2. Вычислите коэффициент детерминации,
используя равенство
R = RSS/TSS и R 2 = 1 – ESS/TSS.
2
Пример 13.
По условию и результатам примера 9 (семинар 5) проведите
статистический анализ полученного уравнения регрессии:
1. Определите абсолютные и относительные ошибки
аппроксимации.
2. Проверьте значимость уравнения регрессии на 5%
уровне.
3. Проверьте значимость коэффициентов регрессии на
1%, 5%, 10% уровнях значимости.
Пример 14.
По следующим данным о производительности труда одного
занятого Y и фонде оплаты труда X по n = 10 косметическим салонам.
Таблица 17
№ п/п 1 2 3 4 5 6 7 8 9 10
X 8 11 12 9 8 8 9 9 8 12
Y 5 10 10 7 5 6 6 5 6 8
построено уравнение регрессии Y по X: yˆ = 2,75 + 1,016 x .
(Результаты примера 5, семинар 5)
1. Оцените на уровне α = 0,05 значимость
уравнения регрессии Y по X.
2. Найдите коэффициент детерминации и
поясните его смысл.
19
Задача 23
По результатам задачи 16 «Производительность» (семинар
2.3.1):
1. Проверить качество уравнения регрессии с
помощью:
• средней ошибки аппроксимации;
• коэффициента детерминации;
• стандартной ошибки регрессии.
2. Проверить значимость коэффициента
корреляции на 5% уровне.
3. Проверить значимость уравнения регрессии на
5% уровне.
4. Проверить значимость параметров уравнения
регрессии на 5% уровне.
5. Проверить выполнение условий Гаусса-
Маркова (в программе STATISTICA).
6. Постройте задачу, обратную данной.
7. Выполните пункты 1-5 для обратной задачи.
Задача 24
На основании данных о темпе прироста (%) внутреннего
национального продукта (У) и промышленного производства (Х),
десяти развитых стран мира за 1992 г., приведенных в таблице и
предположения, что генеральное регрессии имеет вид:
Y€ = β 0 + β1 х.
Таблица 18
страны У Х
Япония 3,5 4,3
США 3,1 4,6
Германия 2,2 2,0
Франция 2,7 3,1
Италия 2,7 3,0
Великобритания 1,6 1,4
Канада 3,1 3,4
Австралия 1,8 2,6
Бельгия 2,3 2,6
20
Нидерланды 2,3 2,4
Требуется:
а) определить оценки вектора b и остаточной дисперсии
S ост ;
2
21
детерминации равен 0.5. Чему равна F-статистика Фишера для
уравнения регрессии?
Семинар 2.3.3
Построение нелинейного регрессионного уравнения.
Проверка качества и адекватности нелинейного уравнения
регрессии. Проверка выполнения условий Гаусса — Маркова для
нелинейной регрессионной модели. Множественная
регрессионная модель.
Пример 15.
Могут ли следующие уравнения быть преобразованы в
уравнения, линейные по параметрам?
а) Y i = α * exp(βX i )*ε i ,
б) Y i = α * exp(-βX i ) + ε i ,
в) Y i = exp(α + βX i + ε i ),
г) Y i = α / (β - X i ) + ε i .
Обозначения α и β введены вместо традиционных β 0 и
β 1 соответственно.
22
Пример 17. По данным примера 2 оценить сменную добычу
угля на одного рабочего для шахт с мощностью пласта 8 м и уровнем
механизации работ 6%.
Пример 18.
По данным примера 2 определить множественный коэффициент
детерминации и проверить значимость полученного уравнения
регрессии Y по X 1 и X 2 на уровне
α =0,05.
Пример 19.
Регрессия зависимой переменной Y на три независимые
переменные на основе n = 30 наблюдений дала следующие
результаты:
Таблица 20
Ŷ= 25,1 + 1,2Х 1 + 1,0Х 2 - 0,50Х 3
Стандартные ошибки (2,1) (1,5) (1,3) (0,060)
Sbj
t-значения (11,9) ( ) ( ) ( )
95%-доверительные (±4,3) ( ) ( ) ( )
границы
A. Заполните пропуски.
B. Истинный или ложны следующие утверждения (
если ложны, исправьте их):
1. Оценка коэффициента при Х1 есть 1,2. Другие исследователи
могут собрать другие данные и построить другие оценки этого
коэффициента.
2. Распределение этих оценок сосредоточенно вокруг
истинного значения 1,2. Поэтому оценка называется несмещенной.
3. Если есть априорная уверенность в том, что Х1 не влияет на
Y, то представляется разумным отвергнуть нулевую гипотезу H0: β1 =
0 на 5%-уровне значимости.
4. Если есть априорная уверенность в том, что Х2 влияет на Y,
то представляется более разумным использовать оценку 1,0, чем
принимать нулевую гипотезу H0: β2 = 0.
Пример 20.
23
Бюджетное обследование 5 случайно выбранных семей
дало следующие результаты (в тыс.руб.):
Таблица 21
Семья Накоплен Доход, Имущест
ия, S Y во, W
1 3,0 40 60
2 6,0 55 36
3 5,0 45 36
4 3,5 30 15
5 1,5 30 90
1. Оцените регрессию S на Y и W.
2. Спрогнозируйте накопления семьи, имеющей
доход 40тыс.руб. и имущество стоимостью 25тыс.руб.
3. Предположим, что доход семьи возрос на
10тыс.руб., в то время как стоимость имущества не
изменилась. Оцените, как возрастут её накопления.
4. Оцените, как возрастут накопления семьи,
если её доход вырос на 5тыс. руб., а стоимость
имущества увеличилась на 15тыс.руб.
5. Найдите сумму квадратов остатков и
постройте оценку дисперсии регрессии.
Пример 21.
Рассмотрим регрессию S t = β 1 + β 2 y t + β 3 ω t + ε t из
предыдущего примера
А) Постройте 95%-доверительный интервал для
1. β2;
2. β3;
Б) Проверьте с 5%-уровнем значимости следующие
гипотезы:
1. β 3 = 0 (стоимость имущества несущественна);
2. β 2 = 0 (величина дохода несущественна);
3. β 2 = 1 (таким мог быть ответ вашего коллеги
на вопрос о зависимости накопления от дохода).
4. β 2 = 1.57 (такое значение коэффициента β 2
могло быть с высокой степенью надежности
установлено для другой стороны, и вас интересует
вопрос, верно ли это для вашей страны).
В) Пусть некоторая семья имеет доход Y = 30тыс.руб. и
имущество стоимостью V = 52,5тыс.руб.
1. Чему равна прогнозная величина её
накопления?
24
2. В каком смысле эта семья может
рассматриваться как средняя между семьями 4 и 5
(задача 3.5)? Почему прогнозная величина её
накоплений не есть среднее между 3,5 и 1,5тыс.руб.?
3. Постройте 95 %-доверительный интервал для
прогнозной величины накопления этой семьи.
Задача 32
По данным задачи 1 «Стоимость жилья». (семинар 2.1.1):
1. Подберите нелинейное уравнение
регрессии, описывающие связь Y и Х 2 .
2. Проанализируйте качество
нелинейного уравнения и сравните с
качеством линейной модели.
3. Проверьте значимость параметров
уравнения регрессии и значимость
уравнения в целом на уровне 5%.
Задача 33
По данным задачи 7 «Успеваемость». (семинар 2.2.1):
1. Подберите нелинейное уравнение
регрессии, описывающие связь Х 1 и Х 3 .
2. Проанализируйте качество
нелинейного уравнения и сравните с
качеством линейной модели.
3. Проверьте значимость параметров
уравнения регрессии и значимость
уравнения в целом на уровне 5%.
Упражнения
22. Оценить линейную регрессию Х = Z1α1 + Z2α2 + β + ε по
МНК для каждой из следующих групп данных (ниже расположенные
величины показывают, что данные находятся в отклонениях от
среднего значения)
25
а) Х: 3 2 8 3 5 Z1: 3 1 5 2 4 Z2: 5 4 6 4 6
2 2
б) Σ Z1 = 10; Σ Z2 = 5; Σ Z1Z2 = 5; Σ Z1X = 8; Σ Z2X = 6;
2
ΣX = 10; N = 23
в) Σ Z12 = 20; Σ Z22 = 10; Σ Z1Z2 = 15; Σ Z1X = -10; Σ Z2X =
15; Σ X2 = 102,5; N= 33
26
а) ∑ z12 = 10 ; ∑ z 22 = 5 ; ∑ z1 z 2 = 5 ; ∑ z1 x = 5 ; ∑ z 2 x = 6
б) ∑ z12 = 20 ; ∑ z 22 = 10 ; ∑ z1 z 2 = 10 ; ∑ z1 x = 15 ; ∑ z 2 x = −10
Задача 34.
Анализ годовых данных (21 наблюдений) о спросе на некоторый
товар привёл к результатам, указанным в следующей таблице:
Таблица 22
Средние Стандартное Коэффициент
отклонение корреляции
x = 51.843 S X = 9.205 R XY = −0.9158
y = 8.313 S Y = 1.780 RYT = −0.8696
T = 0.000 S T = 6.057 R XT = 0.9304
где x — потребление на душу населения,
y — цена с учётом дефлятора,
T — время (годы).
а) Найдите коэффициент при времени в оценённой регрессии y
по x и T.
б) Проверьте, будет ли этот коэффициент значимо отличен от
нуля.
в) Кратко объясните экономический смысл включения в
регрессию времени в качестве объясняющей переменной.
Задача 35
Имеются следующие данные о выработке литья на одного
работающего х1(т), браки литья х2(т) и себестоимости х1т литья у
(руб.) по 25 литейным цехам заводов:
Таблица 23
I X1i X2i Yi i X1i X2i Yi i X1i X2i Yi
1 14.6 4.2 239 10 25.3 0.9 198 19 17.0 9.3 282
2 13.5 6.7 254 11 56.0 1.3 170 20 33.1 3.3 196
3 21.5 5.5 262 12 40.2 1.8 173 21 30.1 3.5 186
4 17.4 7.7 251 13 40.6 3.3 197 22 65.2 1.0 176
5 44.8 1.1 158 14 75.8 3.4 172 23 22.6 5.2 238
6 111.9 2.2 101 15 27.6 1.1 201 24 33.4 2.3 204
7 20.1 8.4 259 16 88.4 0.1 130 25 19.7 2.7 205
8 28.1 1.4 186 17 16.6 4.1 251
9 22.3 4.2 204 18 33.4 2.3 195
27
Необходимо:
а). найти множественный коэффициент детерминации и
пояснить его смысл;
б). найти уравнение множественной регрессии y по x1 и x2?
Оценить значимость этого уравнения и его коэффициентов на уровне
а =0,05;
в) сравнить раздельное влияние на зависимую переменную
каждой из объясняющих переменных, используя стандартизованные
коэффициенты регрессии и коэффициенты эластичности;
г) найти 95%-ные доверительные интервалы для коэффициентов
регрессии, а так же для среднего и индивидуальных значений
себестоимости 1т литья в цехах, в которых выработка литья на одного
работающего составляет 40 т, а брак литья — 40%
Задача 36
Имеются следующие данные о годовых ставках месячных
доходов по трем акциям за шестимесячный период:
Таблица 24
Акция Доходы по месяцам, %
А 5.4 5.3 4.9 4.9 8.4 6.0
B 6.3 6.2 6.1 5.8 5.7 5.7
C 9.2 9.2 9.1 9.0 8.7 8.7
Есть основания предполагать, что доходы y по акции с зависят
от доходов х1 и х2 по акциям А и В. Необходимо:
а) составить уравнение регрессии у по х1 и х2;
б) найти множественный коэффициент детерминации R2 и
пояснить его смысл;
в) проверить значимость полученного уравнения регрессии на
уровне а=00,5;
г) оценить средний доход по акции С если доходы по акциям A
и B составили соответственно 5,5 и 6,0%
Семинар 2.3.4.
Экономический смысл линейных коэффициентов регрессии.
Коэффициент эластичности. Доверительный интервал для линии
регрессии. Доверительный интервал для прогнозного значения.
Пример 22.
Таблица 25
№ п/п 1 2 3 4 5 6 7 8 9 10
X 8 11 12 9 8 8 9 9 8 12
Y 5 10 10 7 5 6 6 5 6 8
По данным таблицы 25:
28
А также используя результаты примера 5 из семинара 5:
1) оцените производительность труда одного занятого
для салонов с фондом оплаты труда 8 (у.е);
2) найдите 95% -ные доверительные интервалы для
индивидуального и среднего значений производительности
труда для таких же салонов;
3) найдите с надежностью 0,95 интервальные оценки
коэффициента регрессии β 1 и дисперсии σ².
Пример 23.
По результатам примера 9 (семинар 5) и примера 4 (семинар 6)
определите интервальные оценки коэффициентов регрессии с
доверительной вероятностью γ=0,95.
Задача 37
По результатам задач 16 и 23 «Производительность»
(семинары 2.3.1 и 2.3.2):
1. Дайте экономическую интерпретацию
коэффициентам регрессии.
2. Определите коэффициент средней
эластичности производительности труда от
изменения фонда оплаты труда.
3. Постройте доверительный интервал
среднего значения производительности труда , если
ФОТ составит 10 ед.
4. Постройте доверительный интервал
индивидуального значения производительности
труда , если ФОТ составит 10 ед.
Задача 38
По данным 30 нефтяных компаний получено следующее
уравнение регрессии между оценкой Y (ден. ед.) и фактической
стоимостью X (ден. ед.) этих компаний: ух = 0,8750* + 295. Найти:
95%-ные доверительные интервалы для среднего и индивидуального
значений оценки предприятий, фактическая стоимость которых
составила 1300 ден. ед., если коэффициент корреляции между
переменными равен 0,76, а среднее квадратическое отклонение S x =
29
270 ден. ед.
Задача 39
На основании данных о темпе прироста (%) внутреннего
национального продукта (У) и промышленного производства (Х),
десяти развитых стран мира за 1992 г., приведенных в таблице и
предположения, что генеральное регрессии имеет вид:
Y€ = β 0 + β1 х.
Таблица 26
страны У Х
Япония 3,5 4,3
США 3,1 4,6
Германия 2,2 2,0
Франция 2,7 3,1
Италия 2,7 3,0
Великобритания 1,6 1,4
Канада 3,1 3,4
Австралия 1,8 2,6
Бельгия 2,3 2,6
Нидерланды 2,3 2,4
Требуется:
1. с доверительной вероятностью γ =0,9 построить интервальные
оценки β 0 и β1 ;
2. с доверительной вероятностью γ =0,9 построить
интервальные оценки уравнения регрессии в точках,
⎛1 ⎞ ⎛1 ⎞
определяемых вектором начальных условий x 0 = ⎜⎜ ⎟⎟ ; x 0 = ⎜⎜ ⎟⎟ .
⎝ 3⎠ ⎝5⎠
Задача 40
По 10 наблюдениям дана оценка 4 одному из коэффициентов
двухфакторной регрессии. Дисперсия ошибки этого коэффициента
рана 4. Построить 99% доверительный интервал для этого
коэффициента.
Задача 41
МНК-оценка параметра регрессии, полученная по 16
наблюдениям, равна 4, оценка его стандартной ошибки – 1. Можно ли
утверждать с вероятностью ошибки не более 5%, что истинное
значение параметра равно 5.93? Ответ обосновать.
30
Семинар 2.3.5
Защита расчетно-графического задания №1.
Семинар 10.
Построение трендовых моделей. Построение линейного
тренда. Построение нелинейного тренда. Анализ качества и
адекватности трендовых моделей.
Пример 1.
Провести сглаживание временного ряда Y по данным :
Таблица 27
Год, t 1 2 3 4 5 6 7 8
Спрос, 213 171 291 309 317 362 351 361
Y
методом скользящих средних, используя простую
среднюю арифметическую с интервалом сглаживания m = 3
года.
Пример 2.
Таблица 28
Год, t 1 2 3 4 5 6 7 8
Спрос,Y 213 171 291 309 317 362 351 361
Пример 3.
По данным и результатам предыдущего примера, полагая, что
тренд линейный, а возмущения удовлетворяют требованиям
классической модели:
1. Дайте точечную оценку прогноза среднего значения
спроса на момент t=9 (девятый год).
2. Дайте интервальную (с надежностью 0,95) оценку
прогноза среднего значения спроса на некоторый товар на
момент t=9 (девятый год).
3. Постройте доверительный интервал (с надежностью
0,95) для индивидуального значения Yt=9.
31
Имеются ежегодные данные о ценах и объемах потребления
кока-колы.
Таблица 29
T 1 2 3 4 5 6 7 8 9 10
Q 34,4 35,8 36,7 38,3 39,1 40,1 40,7 40,3 41,4 41,7
P 90,6 85,3 81,8 78,9 73,9 74,3 71,5 68,4 66,4 65,9
1. Проведите визуализацию данных;
2. Постройте трендовые модели разных видов;
3. Проведите анализ качества и адекватности
моделей.
Содержание работы:
1. Визуализация данных.
1.1. Постройте диаграмму рассеивания для исследуемого
показателя (Yt).
1.2. Проверьте исходные данные на близость к
нормальному закону распределения. Постройте гистограммы и
графики на нормальной вероятностной бумаге.
32
3.2. Приведите в отчете все три модели. Выберите из них
наиболее адекватную. Обоснуйте свой выбор, используя
критерии Фишера и Стьюдента. Приведите графики квадратов
остатков в зависимости от объясняющей переменной, а также
графики остатков на нормальной вероятностной бумаге.
Проверьте выполнение условий Гаусса-Маркова.
3.3. Рассчитайте средние уровни Yt на 3 последних
периода и сравните с реальными данными. Сделайте точечный
и интервальный прогноз среднего уровня показателя Yt на
перспективный период, а также постройте доверительный
интервал для прогнозного значения. Интерпретируйте
результаты.
Варианты работ:
33
Вариант 1. Рассмотрите показатели, приведенные в табл. 1.
Проанализируйте Инвестиции в основной капитал (Yt), Объем
промышленного производства (X1t), Оборот розничной торговли
(X2t), Внешнеторговый оборот (Х3t), Среднемесячная начисленная
заработная плата (Х4t) по предложенной выше схеме.
Таблица 30
Период, Инвестици Объем Оборот Внешнетор Общая Среднемеся
месяц ив промышле розничной го-вый численност чная
основной нн. торговли, оборот, ь начисленна
капитал, производст млрд. руб. млрд. $ безработны я
млрд. руб. ва, млрд. х, млн. чел. заработная
руб. плата, руб
на 1
занятого
1 41,9 169,5 110,0 8,9 9,3 116
4
2 64,2 204,8 136,5 10,8 9,6 148
2
3 28,5 187,6 119,7 7,3 10,0 116
7
4 31,8 197,8 120,9 7,9 10,4 119
9
5 36,5 238,7 132,0 9,3 10,0 138
5
6 36,9 236,6 133,1 9,8 9,6 142
3
7 41,4 225,9 136,5 8,0 9,1 147
2
8 52,8 246,7 139,8 9,3 8,8 162
6
9 56,2 256,8 143,3 9,5 8,7 161
8
10 61,8 272,8 154,9 9,3 8,7 160
8
11 67,6 291,7 158,5 9,7 8,8 168
4
12 66,5 308,5 164,4 10,3 8,9 171
6
13 72,0 321,6 167,4 11,1 9,1 178
9
14 118,4 365,5 196,7 13,7 8,9 228
3
15 46,1 331,7 167,0 9,9 8,7 183
0
16 55,8 350,8 164,9 11,5 8,6 183
9
17 63,9 387,5 176,6 13,0 8,2 201
8
18 64,5 359,2 174,8 11,5 7,8 203
34
9
19 75,8 361,1 176,6 11,8 7,4 210
1
20 95,7 384,5 181,6 12,2 7,3 229
4
21 99,0 391,6 186,5 12,2 7,2 230
2
22 112,9 407,7 198,9 12,9 7,1 228
9
23 118,3 417,6 201,6 12,6 7,1 236
7
24 114,6 442,7 209,8 13,2 7,0 242
5
25 123,1 451,9 215,5 14,5 7,0 250
8
26 195,5 476,2 252,9 15,1 7,0 302
5
27 70,9 436,4 209,4 11,6 7,1 273
3
28 82,3 430,2 211,0 11,8 7,1 265
5
29 91,7 482,0 229,3 13,2 6,8 296
4
30 93,4 467,2 232,6 13,1 6,4 292
3
31 112,8 468,1 239,1 13,3 6,1 305
4
32 132,7 477,5 242,7 14,0 6,1 328
4
33 135,7 491,8 245,2 12,7 6,1 336
4
34 153,3 503,2 260,7 13,7 6,1 337
6
35 158,7 494,1 260,9 12,6 6,2 340
5
36 153,8 530,6 272,4 13,2 6,2 351
5
35
промышленного производства (X1t), Инвестиции в основной
капитал (X2t), Внешнеторговый оборот (Х3t), Среднемесячная
начисленная заработная плата (Х4t), Общая численность
безработных (Х5t) по предложенной выше схеме.
Таблица 31
*
Перио Yt X1t X2t X3t
д, месяц
1 80,0 108,4 86,0 101,9
2 86,9 104,1 99,1 106,3
3 91,0 102,8 111,7 103,6
4 97,6 103,0 100,0 102,9
5 100,2 102,2 106,0 105,5
6 100,7 101,9 107,7 103,2
7 100,0 102,8 96,9 100,2
8 106,5 101,2 98,1 100,1
9 108,0 101,5 103,1 96,1
10 102,1 101,4 107,0 95,4
11 105,0 109,8 103,0 101,9
12 116,0 103,0 124,4 103,1
13 82,5 102,3 91,0 102,5
14 97,9 101,0 99,4 100,4
15 90,0 114,0 100,5 100,0
16 98,1 118,0 109,8 100,1
36
17 99,4 109,0 109,5 103,1
18 100,9 102,6 106,4 104,4
19 101,4 101,8 98,8 101,8
20 100,2 106,0 98,5 96,1
21 116,0 121,0 114,7 97,0
22 112,0 102,1 117,0 101,0
23 101,2 116,8 116,4 132,0
24 117,2 119,0 118,8 103,5
* Все данные представлены в процентах к предыдущему
периоду.
Таблица 32
*
Период Yt X1t X2t X3t
месяц
1 236 72.8 4.9 16.5
2 309,8 92,6 10,5 26,7
3 378,9 101,2 52,6 33,1
4 408,1 120,3 21,2 36,5
5 334,0 111,4 9,8 24,1
6 340,6 102,4 11,6 30,0
7 360,6 94,4 52,4 30,6
8 361,6 106,5 19,4 32,4
9 322,9 106,8 7,3 22,5
10 346,4 104,6 9,8 28,3
11 401,5 106,7 54,5 32,1
12 382,5 94,5 17,6 32,2
13 319,5 104,1 7,1 20,7
14 341,1 100,1 9,9 27,5
15 372,6 98,1 49,0 30,1
16 419,8 131,7 13,0 24,6
17 389,1 132,7 11,4 21,8
18 443,7 143,6 18,1 27,3
19 503,7 146,3 80,4 31,8
20 479,0 144,9 24,0 30,5
21 435,2 158,1 14,9 21,7
22 461,1 155,2 18,5 29,4
37
23 532,5 158,3 80,8 37,8
24 476,1 149,5 19,9 37,1
25 437,4 150,4 14,7 24,2
26 481,4 153,8 19,5 31,9
27 576,1 158,7 93,4 42,3
28 505,5 119,9 8,7 66,1
* Все данные приведены в млрд. рублей, в сопоставимых ценах
(с учетом инфляции).
Таблица 33
П Доходы Инвестиции Объем Экспор Численн
ериод Бюджет в основной промышлен т, ость
, а, млрд. капитал, ного. безработ
месяц руб. млрд. руб. производств млн. $. ных,
а, млрд. млн. чел.
руб.
1 35,0 22,1 129,3 5,911 8,3
2 38,9 23,7 128,5 5,885 8,4
3 46,4 26,1 141,8 6,758 8,5
4 52,6 25,5 132,1 6,236 8,5
5 51,5 26,6 117,7 6,119 8,3
6 50,1 31,8 135,0 6,511 8,1
7 49,9 32,9 115,7 6,305 8,3
8 46,9 35,4 112,8 5,828 8,3
9 47,3 39,3 140,0 5,992 8,6
1 52,7 37,6 158,6 6,083 8,9
0
1 63,6 41,9 169,5 5,965 9,4
1
1 122,2 64,2 204,8 7,291 9,6
2
1 49,0 28,5 187,6 4,602 10,0
3
1 50,3 31,8 197,8 5,029 10,4
4
1 72,6 36,5 238,7 5,929 10,0
5
38
1 92,1 36,9 236,6 6,519 9,6
6
1 85,9 41,4 225,9 5,097 9,1
7
1 98,7 52,8 246,7 5,358 8,8
8
1 102,2 56,2 256,8 6,307 8,7
9
2 107,9 61,8 272,8 6,193 8,7
0
2 100,6 67,6 291,7 6,462 8,8
1
2 108,8 66,5 308,5 6,930 8,9
2
2 138,3 72,0 321,6 7,560 9,1
3
2 191,1 118,4 365,5 9,679 8,9
4
2 102,0 46,1 331,7 6,960 8,7
5
2 115,4 55,8 350,8 8,114 8,6
6
2 149,1 63,9 387,5 9,290 8,2
7
2 168,5 64,5 359,2 8,110 7,8
8
2 182,7 75,8 361,1 8,316 7,4
9
3 170,7 95,7 384,5 8,583 7,3
0
Таблица 34
* ** * *
Дата Yt X1t X2t X3t X4t*
10.03.00 0,09419 28,53 0,0885 0,0960 254300
11.03.00 0,09588 28,51 0,0950 0,0900 543230
12.03.00 0,09469 28,50 0,0925 0,0960 73125
13.03.00 0,09747 28,43 0,0935 0,0935 124625
39
14.03.00 0,09411 28,39 0,0880 0,0860 128375
15.03.00 0,09382 28,38 0,0885 0,0940 9700
16.03.00 0,09479 28,36 0,0950 0,0990 145325
17.03.00 0,10003 28,34 0,1000 0,1000 579889
18.03.00 0,10815 28,33 0,1025 0,1010 481275
19.03.00 0,10066 28,31 0,0975 0,0975 176450
20.03.00 0,10006 28,29 0,0950 0,0970 25000
21.03.00 0,09656 28,27 0,0975 0,0915 146750
22.03.00 0,09507 28,46 0,0885 0,0950 60450
23.03.00 0,09329 28,60 0,0955 0,0905 87950
24.03.00 0,09345 28,78 0,0895 0,0935 108600
25.03.00 0,09012 28,76 0,0925 0,0850 148250
26.03.00 0,08993 28,72 0,0860 0,0900 22750
27.03.00 0,08772 28,68 0,0910 0,0880 145375
28.03.00 0,09087 28,66 0,0885 0,0925 163550
29.03.00 0,09203 28,63 0,0915 0,0885 329530
30.03.00 0,09193 28,59 0,0900 0,0900 70150
31.03.00 0,09221 28,53 0,0870 0,0900 83825
01.04.00 0,09121 28,60 0,0865 0,0850 42650
02.04.00 0,09095 28,78 0,0875 0,0875 97725
03.04.00 0,09123 28,59 0,0915 0,0930 47250
04.04.00 0,09103 28,55 0,0930 0,0890 22875
05.04.00 0,09101 28,53 0,0900 0,0915 70125
06.04.00 0,09467 28,53 0,0920 0,0940 143750
07.04.00 0,09440 28,46 0,0900 0,0882 94000
08.04.00 0,09531 28,43 0,0905 0,0950 105950
* Данные приведены в $ США.
** Курс доллара США приведен в рублях за 1 доллар.
Таблица 35
* * *
Период, Yt X1t X2t X3t X4t*
* *
квартал рубл.за млрд. млр
1$ рубл. д. рубл. млр млр
д. рубл. д. рубл.
I 4,854 459 57,8 334 111,
40
4
II 5,108 509 75,2 340, 102,
6 4
III 5,396 570 85,2 360, 94,4
6
IV 5,56 611 157, 361, 106,
8 6 5
I 5,726 539 73,2 322, 106,
9 8
II 5,782 594 85,4 346, 104,
4 6
III 5,86 697 108, 401, 106,
9 5 7
IV 5,96 667 141, 382, 94,5
3 5
I 6,106 564 71,9 319, 104,
5 1
II 6,198 632 83,9 341, 100,
1 1
III 16,065 699 107, 372, 98,1
6 6
IV 20,65 846 143, 419, 131,
7 8 7
I 24,18 867 96,8 389, 132,
1 7
II 24,22 1108 131, 443, 143,
1 7 6
III 25,08 1358 185, 503, 146,
9 7 3
IV 27,00 1424 256, 479, 144,
9 0 9
I 28,46 1461 165, 435, 158,
8 2 1
II 28,07 1642 236, 461, 155,
0 1 2
III 28,75 2004 330, 532, 158,
2 5 3
IV 28,16 1956 433, 476, 149,
2 1 5
I 28,74 1886 244, 437, 150,
9 4 4
II 29,07 2116 338, 481, 153,
9 4 8
41
III 29,39 2543 447, 576, 158,
7 1 7
IV 30,14 2496 568, 505, 119,
0 5 9
* Данные приведены в номинальном выражении.
** Данные приведены в сопоставимых ценах.
42
0,98 1,06 1,91 0,98 1,10 0,80 0,77 0,89
7
1,00 0,98 2,03 1,01 1,05 0,96 0,68 0,97
8
43
Вариант 14. Рассмотрите показатели, приведенные в табл. 36-
37. Проанализируйте Индекс объемов производства в
металлургическом машиностроении (Yt), Индекс цен на
электроэнергию (X1t), Индекс объемов производства в
алюминиевой металлургии (X2t), Индекс цен в металлургии (Х3t),
Индекс объемов производства в черной металлургии (X4t) по
предложенной выше схеме.
44
4. Пусть х1 = ziα + εi (i = 1, 2), ε1 ~ N(0, σ2), ε2 ~ N(0, 2σ2),
причем ε1 и ε2 статистически независимы. Пусть х1 = +1 и х2 = -1.
найдите взвешенную оценку наименьших квадратов для и ее
дисперсию.
5. Чему равна статистика Дарбина – Уотсона, если
коэффициент корреляции между et и et-1 (t = 1,…,Т) равен минус 1.
6. Статистика Дарбина – Уотсона в регрессии равна 0.5. Что
это означает? Какое преобразование следует применить к этой модели
(запишите формулу)?
Задачи
Задача 2
Имеются следующие данные об урожайности винограда y t за
10 лет:
Таблица 39
t 1 2 3 4 5 6 7 8 9 10
yt 16,3 20,2 17,1 7,7 15,3 16,3 19,9 14,4 18,7 20,7
Задача 3
В таблице представлены данные, отражающие динамику роста
доходов на душу населения y t (ден. ед.) за восьмилетний период:
Таблица 40
t 1 2 3 4 5 6 7 8
yt 1133 1222 1354 1389 1342 1377 1491 1684
Полагая, что тренд линейный и условия классической модели
выполнены:
а) найти уравнение тренда и оценить его значимость на уровне
0,05;
б) дать точечный и с надежностью 0,95 интервальный прогнозы
среднего и индивидуального значений доходов на девятый год.
Семинар 3.1.2
Анализ автокорреляционной функции временного ряда. Типы
автокорреляционных зависимостей. Коррелограммы.
45
Пример 4
По данным таблицы для временного ряда Yt найти среднее
значение, среднее квадратическое отклонение, коэффициенты
автокорреляции (для лагов τ=1;2) и частный коэффициент
автокорреляции 1-го порядка.
Таблица 41
Г 1 2 3 4 5 6 7 8
од, t
С 2 1 2 3 3 3 3 3
прос,Y 13 71 91 09 17 62 51 61
Задача 4
По данным задачи 1 «Потребление Кока-колы» (семинар 3.1.1):
1. Постройте коррелограммы автокорреляционных
функций;
2. Сделайте выводы о наличии тенденций во временных
рядах;
Семинар 3.1.3
Задача 5
По данным задачи 1 «Потребление Кока-колы» (семинар 3.1.1):
1. Приведите ряды Qt и Pt к стационарному виду. При
необходимости используйте процедуру «взятие последовательных
разностей».
46
2. Проведите анализ корреляционных связей между Qt и Pt .
3. Проведите анализ лаговых корреляционных связей между
Qt и Pt .
Семинар 3.1.4
Построение факторной динамической модели. Обоснование
включения трендовых, лаговых, авторегрессионных составляющих.
Анализ качества и адекватности факторной динамической модели.
Построение прогнозных значений результирующего показателя.
Построение доверительного интервала для среднего и прогнозного
значений.
Пример 5
Менеджер цветочного магазина не уверен в
правильности выбранной цены на гвоздики, поэтому в
течение 12 недель он варьирует цену и записывает
количество проданных цветов. Полученные данные
приведены в табл.1.1 (t – номер недели, Q t – количество
проданных цветов, P t – цена одной гвоздики (руб.)).
Таблица 42
t Pt Qt t Pt Qt
1 7,65 495 7 7,9 414
2 7,25 615 8 6,45 880
3 7 665 9 7,6 551
4 7,5 592 10 7,75 479
5 8,25 285 11 8 325
6 7,75 344 12 6,75 701
Пример 6
47
Так называемая кривая Филипса описывает связь темпа
прироста зарплаты и уровня безработицы. А именно,
Тω t = β 0 + β 1 *1/U t + ε t
Пример 7
Предположим, что вы оцениваете линейную функцию
потребления от дохода С t = β 0 + β 1 Y t + ε t среди t=1,2,..n
участников.
1. Как учесть возможный сдвиг этой функции при
переходе от городского к сельскому потребителю, если вы
считаете, что предельная (маргинальная) склонность к
потреблению постоянна, в то время как средняя склонность
к потреблению может меняться?
48
2. Как проверить гипотезу о том, что предельные
(маргинальные) склонности к потреблению участников с
доходом выше и ниже Y* отличаются?
Yt = β0 + β1Xt + ut .
a) Какие из условий классической регрессии не
выполнены для модели без временного тренда?
b) Будет ли равна нулю сумма остатков для этой
регрессии? Как это связано с ошибочным предположением,
что E(u t ) = 0?
Задача 6
По данным задачи 1 «Потребление Кока-колы» (семинар 3.1.1):
1. Постройте факторное уравнение регрессии для Qt
(потреблениеe кока-колы) в зависимости от цен Pt.
2. Включите в уравнение регрессии лаговую компоненту Pt-τ.
Величину τ обоснуйте результатами корреляционного анализа
(семинар 12).
3. Включите в уравнение регрессии трендовую
составляющую.
4. Выберите уравнение наиболее адекватно описывающее
поведение спроса на кока-колу.
5. Постройте трендовую модель, адекватно описывающую
развитие Pt. Сделайте прогноз цен на 8,9,10,11 периоды
6. Сделайте прогноз объема потребления на 3 последних
(t=8,9,10) периода и на перспективу учитывая расчетные значения цен
(п.5). Сравните с расчетами Qt, сделанными по трендовым моделям.
Какая модель дает прогнозы объема потребления, более близкие к
реальным значениям показателя?
7. В каких границах будут находиться (с доверительной
вероятностью 0,95) среднее и реальное значения показателя Qt в 11-м
периоде?
49
Выполнение вариантов (1-15) РГЗ №2 п. 5. (формулировка
заданий и данные приведены в семинаре 2.2.2) в программе
STATISTICA.
Упражнения
Задача 7
В таблице приведены данные по 18 наблюдениям модели
пространственной выборки:
Таблица 44
i x e i x e
2 2
i i i i
1 2 2 1 7 2
1,3 ,3 0 1,5 3,8
2 2 5 1 7 4
2,6 ,6 1 5,7 5,7
3 3 1 1 7 3
50
2,7 2,8 2 6,0 4,7
4 4 1 1 7 5
1,9 0,1 3 8,9 6,9
5 4 1 1 7 5
3,8 4,6 4 9,8 6,8
6 4 1 1 8 4
9,7 3,9 5 0,7 9,8
7 5 2 1 8 5
6,9 4,0 6 0,8 8,9
8 5 2 1 9 8
9,7 1,9 7 6,9 7,8
9 6 1 1 9 8
7,8 9,7 8 7,0 7,5
Задача 8
При оценивании модели пространственной выборки обычным
методом наименьших квадратов получено уравнение:
y€ = 3 + 0,6 x1 − 1,2 x 2
Уравнение регрессии квадратов остатков на квадраты
регрессоров имеет вид:
2
e€2 = 2 + 0,3x12 + 0,1x 22 ; R =0,2.
Зная, что объем пространственной выборки n=200, проверить
гипотезу Уайта о гомоскедастичности модели.
Задача 9
При оценивании модели пространственной выборки с помощью
обычного метода наименьших квадратов получено уравнение:
y€ = 12 + 3,43 x1 − 0,45 x 2 ; d =1,2.
t = (0,1) (0,4) (0,1)
При осуществлении регрессии квадратов остатков на квадраты
регрессоров получено уравнение вида:
e€2 = 4 + 2 x12 + 0,4 x 22 .
t= (0,7) (0,3)
Объем выборки n =3000. С какими из перечисленных ниже
выводов следует согласиться:
а) полученные значения коэффициентов модели с большой
вероятностью близки к истинным;
б) регрессор X2 может быть незначимым;
51
в) так как значение статистики Дарбина-Уотсона d далеко от
двух, следует устранить автокорреляцию остатков?
Задача 10
При оценивании модели временного ряда получены следующие
результаты.
Уравнение модели имеет вид:
y€ = 2 − 1,2t ; d =1,9.
t= (0,7)
С какими из перечисленных ниже выводов следует согласиться:
а) так как значение статистики Дарбина-Уотсона d близко к
двум, автокорреляция остатков отсутствует;
б) коэффициент модели при t значим;
в) если объем выборки достаточно велик, значение
коэффициента при t в любом случае с большой вероятностью близко к
истинному;
г) применение теста Бреуша-Голдфри может выявить
автокорреляцию остатков между отдаленными наблюдениями?
Задача 11
При оценивании модели временного ряда методом наименьших
квадратов получены следующие результаты:
y€t = 12 − 0,2t ; d =1,8.
t= (0,01)
Известно, что количество наблюдений n =150. С помощью теста
Льюинга-Бокса проверить гипотезу об отсутствии автокорреляции
первого порядка.
Задача 12
Применение теста Льюинга-Бокса дает следующие результаты:
Таблица 45
r(τ) rчаст(τ Qp P(Q>
) Qp)
0,34 0,33 21,45 0,00
0,2 0,11 24,12 0,00
0,01 0,00 24,13 0,00
0,00 0,00 24,13 0,00
52
Семинар 3.1.5
Защита расчетно-графического задания №2.
Семинар 3.1.6
Контрольная работа.
Задание 2.
В чем состоит условие гомоскедастичности остатков в
регрессионной модели? Что гарантирует выполнение этого условия?
Задание 3.
При исследовании зависимости среднего балла успеваемости
студента (У) от объема прочитанной литературы (Х1) и количества
пропущенных занятий (Х2) по данным n=20 наблюдений получено
уравнение регрессии: У = 3 + 0,3Х1 – 1,6Х2. Среднеквадратические
отклонения коэффициентов регрессии Sb1 = 0,2 и Sb2 = 0,8. Начиная с
какого уровня значимости α можно утверждать, что средний балл
успеваемости зависит от объема прочитанной литературы? (t0.2;17 =
1,33; t0.1;17 = 1,74; t0.05;17 = 2,11; t0.01;17 = 2,90; tα;ν)
Варианты ответов:
1. 10%;
2. 20%;
53
3. 5%;
4. ни один среди указанных.
Задание 4.
По данным задания 3 с доверительной вероятностью 99%
приблизительно определите, на какую величину максимально может
измениться средний балл успеваемости студента, при увеличении
объема прочитанной литературы на единицу?
Варианты ответов:
1. 0,3;
2. 0,88;
3. 1,2;
4. ни один среди указанных.
Задание 5.
По результатам исследования 35 наблюдений получены две
эконометрические модели со следующими характеристиками:
модель №1: R2 = 0,76; расчетное значение коэффициента
Дарбина-Уотсона d = 2,01 ;
модель №2: R2 = 0,99; расчетное значение коэффициента
Дарбина-Уотсона d = 0,93.
Какая модель является более адекватной?
Варианты ответов:
1. модель №1;
2. модель №2;
3. обе модели адекватные;
4. ни один среди указанных
Семинар 3.1.7
Семинар 3.2.1
Модель спроса и предложения. Косвенный метод наименьших
квадратов.
Пример 9
54
Для оценки параметров какого из следующих уравнений
системы можно применить косвенный МНК.
Х1=β12Х2 + α11Z1 + α12Z2 + γ1 + ε1
Х2=β21Х1 + γ2 + ε2
Ответ обосновать.
Пример 10
Система уравнений имеет вид:
Х1=а12Х2 + b11Z1
Х2=а21Х1
Какое из уравнений неидентифицировано, почему?
Пример 11
Для оценки параметров какого из следующих уравнений
системы можно применить косвенный МНК?
Х1=β12Х2 + α11Z1 + α12Z2 + с1 + ε1
Х2=β21Х1 + ε2
Ответ обосновать.
Задача 13
Рассматривается простая Кейнсианская модель:
С=α+β*Y+ε
Y=C+I
Где Y - доход, C – потребление, I – инвестиции. Система
уравнений приведенной формы следующая:
α β 1
С= + I+ ε
1− β 1− β 1− β
α 1 1
Y= + I+ ε
1− β 1− β 1− β
Ошибки в приведенной форме для С и Y таковы:
1 1 1
η1 = η2 = ε= ε= ε,
1− β 1 − 0,8 0, 2
т.е. в модели в приведенной форме η1 и η2 распределены
нормально.
В таблице 46 приводятся 20 значений (данные условные) для I и
нормально распределенные ошибки η.Получены данные для C и Y из
55
уравнений приведенной формы, используя значения параметров α = 2
и β = 0,8.
Таблица 46
№ I C Y η1 =
п/п η2
1 2,00 18,19 20,19 0,193
2 2,00 17,50 19,50 -0,504
3 2,20 16,48 18,68 -2,318
4 2,20 19,06 21,26 0,257
5 2,40 21,38 23,78 1,784
6 2,40 21,23 23,63 1,627
7 2,60 21,11 23,71 0,708
8 2,60 22,65 25,25 2,252
9 2,80 20,74 23,54 -0,462
10 2,80 19,85 22,65 -1,348
11 3,00 22,23 25,23 0,234
12 3,00 22,23 25,23 0,226
13 3,20 23,43 26,63 0,629
14 3,20 23,04 26,24 0,244
15 3,40 23,03 26,43 -0,569
16 3,40 24,45 27,85 0,853
17 3,60 26,63 30,23 2,227
18 3,60 24,47 28,07 0,074
19 3,80 24,67 28,47 -0,527
20 3,80 26,00 29,80 0,804
В реальной ситуации существуют только значения I, C, Y.
Значения ошибки в модели и значения α и β неизвестны.
Используя данные таблицы 46, оцените уравнение приведенной
формы для объема потребления и дохода.
Задача 14
Используя данные задачи 13 посчитайте косвенные МНК-
оценки для α и β из:
1. уравнения приведенной формы для объема потребления;
2. уравнения приведенной формы для дохода.
Идентичны ли косвенные МНК-оценки, полученные из обоих
уравнений приведенной формы?
Задача 15
Используя данные задачи 13 определите простые МНК-оценки
для α и β и сравните их с косвенными МНК-оценками из задачи 14.
Задача 16
56
Используя данные задачи 13 для I и используя значения
параметров α = 2 и β = 0,8 составьте 100 выборок для C и Y.
Задача 17
Используя результаты задачи 16:
1. Примените простой МНК к каждому структурному
уравнению системы для 100 выборок.
2. Посчитайте среднее 100 оценок α и β.
3. Проверьте степень эмпирического смещения.
Задача 18
Используя результаты задачи 16:
1. Определите:
А. косвенные МНК-оценки для α и β для 100 выборок;
Б. среднее 100 оценок α и β;
В. степень смещения в маленьких выборках – размером по 20
наблюдений.
2. Сравните смещение косвенных МНК-оценок со смещением
обычных МНК-оценок.
Задача 19
Используя результаты задачи 16, объедините пары выборок так,
чтобы получились 50 выборок по 40 наблюдений.
1. Определите:
А. косвенные МНК-оценки для α и β для этих 50 выборок;
Б. среднее и проверьте смещение оценок.
2. Будут ли эмпирические смещения в этом случае меньше, чем
рассчитанные из 100 выборок по 20 наблюдений?
Семинар 3.2.2
Трехшаговый метод наименьших квадратов.
Пример 12
Почему двухшаговый МНК не применим для оценивания
неидентифицированных уравнений?
Задача 20
Имеются следующие данные:
Таблица 47
N Z1 Z2 Z3 Z4 Z5 X1 X2 X3
1 1 3,06 1,34 8,48 28,00 359,27 102,96 578,49
57
2 1 3,19 1,44 9,16 35,00 415,76 114,38 650,86
3 1 3,30 1,54 9,90 37,00 435,11 118,23 684,87
4 1 3,40 1,71 11,02 36,00 440,17 120,45 680,47
5 1 3,48 1,89 11,64 29,00 410,66 116,25 642,19
6 1 3,60 1,99 12,73 47,00 530,33 140,27 787,41
7 1 3,68 2,22 13,88 50,00 557,15 143,84 818,06
8 1 3,72 2,43 14,50 35,00 472,80 128,20 712,16
9 1 3,92 2,43 15,47 33,00 471,76 126,65 722,23
10 1 4,15 2,31 16,61 40,00 538,30 141,05 811,44
11 1 4,35 2,39 17,40 38,00 547,76 143,71 816,36
12 1 4,37 2,63 18,83 37,00 539,00 142,37 807,78
13 1 4,59 2,69 20,62 56,00 677,60 173,13 983,53
14 1 5,23 3,35 23,76 88,00 943,85 223,21 1292,99
15 1 6,04 5,81 26,52 62,00 893,42 198,64 1179,64
16 1 6,36 6,38 27,45 51,00 871,00 191,89 1134,78
17 1 7,04 6,14 30,28 29,00 793,93 181,27 1053,16
18 1 7,81 6,14 25,40 22,00 850,36 180,56 1085,91
19 1 8,09 6,19 28,84 38,00 967,42 208,24 1246,99
20 1 9,24 6,69 34,36 41,00 1102,61 235,43 1401,94
⎡60 −40 10 ⎤
⎢ −80 ⎥⎥
⎡ 0 0, 2 0 ⎤ ⎢0 4 ⎡ 227,55 8,91 −56,89 ⎤
⎢ ⎥
В = ⎢ −10 −1 2 ⎥ , А = ⎢ 0 6 0 ⎥ , ∑ = ⎢⎢ 8,91 0, 66 −1,88 ⎥⎥
⎢ ⎥
⎢⎣ 2,5 0 −1⎥⎦ ⎢ 0 −1,5 0 ⎥ ⎢⎣ −56,89 −1,88 15, 76 ⎥⎦
⎢⎣ 0 0 −5 ⎥⎦
58
В реальной ситуации B, A, Σ, D были бы неизвестны, доступны
были бы только наблюдения в таблице 47 .
Оцените матрицу параметров приведенной формы D = (ZTZ)-
1 T
Z Х.
Задача 21
По данным задачи 20 примените простой МНК к каждому
структурному уравнению системы и оцените матрицы В и А.
Задача 22
По данным задачи 20 используя косвенный МНК, оцените
параметры второго строго идентифицированного уравнения.
Задача 23
По данным задачи 20:
1. Найдите b2 и a2, решая систему:
D2 = D−2b2 + T2A′ a2
2. Сравните с результатом задачи 22.
Задача 24
По данным задачи 20:
1. Найдите минимальный корень λ из уравнения:
W l − λW = 0
2. Используя формулу метода наименьшего дисперсионного
отношения при k = λ, оцените параметры в каждом из трех
структурных уравнений.
Задача 25.
По данным задачи 20, используя формулу двухшагового метода
наименьших квадратов при k = 1, сравните оценки матрицы D,
полученные на основе оценок простым МНК, МНДО и 2МНК, с
исходными гипотетическими матрицами параметров приведенной
формы.
Задача 26.
По данным задачи 20, используя формулу 3МНК, оцените
параметры первого и третьего структурных уравнений совместно.
Задача 27.
Имеем модель Клейна, в которой
59
C = α P + β (W + V ) + χ P−1 + δ + ε1
I = ϕ P + γ P−1 + η K −1 + π + ε 2 , где
W = μ (Y + T − V ) + θ (Y−1 + T−1 − V−1 ) + ψ t + ζ + ε 3
60
На основе данных таблицы 48:
1. Оцените параметры модели Клейна простым методом
наименьших квадратов;
2. Оцените параметры модели Клейна двухшаговым методом
наименьших квадратов;
3. Покажите величину смещения оценок.
Задача 28
Экономическая модель описана следующими уравнениями:
Х1 = α10 + α11Z1 + β12 Х2 + ε1,
Х2 = α20 + β21 Х1 + ε2,
где Х1 и Х2 – эндогенные переменные, Z1 – экзогенная
переменная, ε1 и ε2 – случайные ошибки.
Определите направление смещения оценки для β21, если для
оценивания второго уравнения используется метод наименьших
квадратов.
Задача 29
Дана следующая макроэкономическая модель:
Y = C + I + G – макроэкономическое тождество,
C = α10 + β11 Y – функция потребления,
I = α20 + β21 Y - β22 R – функция инвестиций,
(M/P) = β31 Y – β32 R – уравнение денежного рынка,
где эндогенными переменными являются доход Y, потребление
C, инвестиции I и процентная ставка R.
Переменные: государственные расходы G, реальная денежная
масса (M/P)– экзогенные.
Проверьте, является ли данная система идентифицируемой, и
перепишите модель в приведенной форме.
Задача 30
Дана следующая модель краткосрочного равновесия для малой
открытой экономики (модель Манделла – Флеминга):
Y = C + I + nX – макроэкономическое тождество,
C = α11 + β11 Y + ε1– функция потребления,
I = α21 - α21 R + β21 Y + ε2 – функция инвестиций,
nX = α31 – β31 Y - β32 ec + ε3 – функция чистого экспорта,
(M/P) = β41 Y – α41 R + ε4– уравнение денежного рынка,
Где эндогенными переменными являются: доход Y,
потребление C, инвестиции I, чистый экспорт nX и валютный курс ec.
Переменные: процентная ставка R, значение которой формируется на
общем уровне и реальная денежная масса (M/P) – экзогенные; ε1,.,ε4 -
случайные ошибки.
Задания:
61
1. Запишите общие условия для определения структурных
параметров каждого уравнения модели.
2. Какие уравнения модели точно идентифицируемы?
3. Перепишите модель Манделла – Флеминга в приведенной
форме.
Семинар 3.3.1
Исследование тесноты связи количественных и качественных
переменных. Однофакторный дисперсионный анализ.
Пример 13
Статистическая совокупность разбита по факторному признаку
на 4 группы (А, В, С, Д). Рассчитаны следующие показатели по
результативному признаку:
Таблица 49
Группы Групповые Средние Численность в
средние квадратические группах
отклонения
А 20 10 30
В 25 5 30
С неизвестно 6 25
Д 22 7 15
Общая средняя величина результативного признака в
совокупности равна 22,8 его размерности.
Определите эмпирическое корреляционное отношение.
Задача 31
В результате обследования 20 квартир, получены следующие
(условные) данные:
Таблица 50
№ Тип дома Район города Цена квартары
1 К Ц 65
2 К С 57
3 П С 55
4 П Ц 50
5 П Ц 70
6 Н А 65
62
7 Н А 55
8 К Ц 58
9 П С 50
10 Н А 70
11 Н А 68
12 К Ц 80
13 К Ц 70
14 П А 80
15 П А 58
16 П С 57
17 К Ц 65
18 П С 52
19 П С 45
20 К Ц 62
К – кирпичный дом; П – панельный дом; Н – дом новой
планировки.
А –район Академгородка; Ц – центральный район; С- район
Солнечный.
Задание:
1. Проведите однофакторный дисперсионный анализ между
стоимостью квартиры и типом дома.
2. Наблюдается ли связь между стоимостью квартиры и типом
дома?
Задача 32
По данным задачи 31:
1. Проведите однофакторный дисперсионный анализ между
стоимостью квартиры и районом города, где находится дом.
2. Наблюдается ли связь между стоимостью квартиры и
районом города?
Задача 33
Дополните выборку задачи 7 «Успеваемость» (семинар
2.2.1) данными Х 4 – пол студента (муж/жен)
Проведите однофакторный дисперсионный анализ.
Наблюдается ли связь между полом (муж/жен) студента и
его средним баллом за первый курс?
Задача 34
Дополните выборку задачи 7 «Успеваемость» (семинар
2.2.1) данными Х 5 – тип среднего образовательного
учреждения (школа/гимназия).
63
Проведите однофакторный дисперсионный анализ.
Наблюдается ли связь между типом образовательного
учреждения, которое окончил студент и его средним баллом
за первый курс?
Семинар 3.3.2
Двухфакторный дисперсионный анализ
Задача 35
По данным задач 7 «Успеваемость» (семинар 2.2.1), 33
и34 (семинар 3.3.1) проведите двухфакторный
дисперсионный анализ между Х 3 , Х 4 ,Х 5 .
Можно ли утверждать, что «вчерашние» гимназистки
имеют более ощутимые успехи в СФУ, чем их
однокурсники?
Задача 36
По данным задач 31 и 32 (семинар 3.3.1):
1. Проведите двухфакторный дисперсионный анализ между
стоимостью квартиры, типом дома и районом города, где находится
дом.
2. Действительно ли что, квартиры в кирпичных домах в центре
города более дорогие?
64