Вы находитесь на странице: 1из 16

0

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ


ОДЕССКИЙ НАЦИОНАЛЬНЫЙ МОРСКОЙ УНИВЕРСИТЕТ
Кафедра: «Управление логистическими системами и проектами»

РАСЧЕТНО-ГРАФИЧЕСКОЕ ЗАДАНИЕ
ПО ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ
СТАТИСТИКЕ

Выполнила: ст. 2 курса,


4 группы
Грановская Настя
Проверил:
Поддубная Н. Н.

2020 г
0

Содержание

1. Титульный лист
2. Оценка нормальности распределения
3. Сравнение двух экспериментальных распределений
4. Вывод
1

Согласно исходным данным необходимо решить две задачи (1 и 2.1


или 2.2 или 2.3).

Вариант задачи 1 - 12

1. В ОНМУ в двух группах состоялось тестирование по


Логистике, которое оценивалось по шкале с максимальной оценкой 60
баллов. Необходимо проанализировать результаты тестирования,
построить вариационный ряд, гистограмму. Выдвинуть гипотезу о виде
закона распределения. Подобрать параметры закона распределения
(равные их оценкам на основе опытных данных). С помощью критерия
согласия проверить, согласуется ли гипотеза с опытными данными.
Уровень значимости взять, равным 0,05.

Исходные данные:

Баллы ФИО Баллы ФИО Баллы ФИО Баллы ФИО

Бондаренко
52 Анастасия Головченко
42 Максим Новицкий
50 Денис Хрисова
24 Юлия

Курбатова
46 Анастасия Варягина
36 Анна Стоянова
52 Евгения Мурадян
24 Максим

Бреславец
42 Анастасия Гайдаенко
60 Злата Нижинская
52 Даша. Никита
52 Лукинов

Любименко Антоненко Виктория Суворов Дмитрий


Фомичев
26 Георгий 44 Екатерина 40 64

Андреева
56 Неля Медведев
52 Семён Садиков
46 Даниил Бошкова
34 Елена

Потёмкина Елизавета Мамросенко Дарина Терещенко Анастасия Милюкова


54 42 40 Татьяна
36

Тимошенко
58 Илья Явдощина
36 Валерия Цимбалюк
40 Александр Корчевская
42 Елизавета

Мелентьева Валерия Якимова Д. А. Крижановская Молчанюк


42 54 40 Виктория 42

Кравченко Кирилл Ермашова Мария Матяш Бандилей Виктория


38 46 Константин
56 32

Пархидько
38 Владимир Макарова
38 Мария Мельник
46 Артем Шевкис
52 Марта

Гулеватый
52 Андрей Алексаньян
42 Таисия Новикова
60 Яна Олейник
46 Анжелика

Шалашный Андрей Усенко Бондаренко Елена Рогозянская А.И.


56 Александра
50 44 24

Бакалюк
60 Михайло Косарев
46 Павел Барсегян
34 Ева Балан
24Вика
2

Проничев
52 Сергій Хачикян
42 Руслагн Лысюк
52 Игорь Радецкий
60 Богдан

Боднар
44 Виктория Галкина
56 Дарья Загородня
56 А. Шмелёва
58 Анастасия

Ковальчук
52 Владислава Погасий
32 Дарья Музыка
58 Ирина Кукса
58Игорь

Кобзаренко Елена Зброжек Софія Сирота Сирота Наталия


60 58 Александр
26 46

Георгий
42 Проценко Хаджи
42 Ярослава Литвак
46 Анна Мосиенко
38 Валерия

Котова Алли-Иппа Владимир Склярова Анастасия Чубчик Андрей


Анастасия
50 64 40 50

Михайличенко
40 Максим Гнидой
28 Роман Дудник
34 Виктория Белякова
40 Настя

Решение.

Условно разделим две группы на группу синих и группу желтых.

Для того, чтобы начать анализ генеральной совокупности нам нужно


совместить все оценки и провести ранжировку ряда, т.к. в Ворде это делать
неудобно, можно использовать Эксель. У нас попались оценки выше 60, но
т.к. по условию сказано, что оценивается работы по шкале 60 баллов, можно
сделать вывод, что 60 максимальный бал, тогда мы отсеиваем
«дополнительные баллы» и заменяем оценки на 60.

Ранжированный ряд:

Р
анжиро
ванный
ряд
2 4 4 5
4 0 6 2
2 4 4 5
4 0 6 4
2 4 4 5
4 0 6 4
2 4 4 5
4 0 6 6
2 4 4 5
6 0 6 6
2 4 4 5
6 0 6 6
2 4 4 5
8 2 6 6
3

3 4 5 5
2 2 0 6
3 4 5 5
2 2 0 8
3 4 5 5
4 2 0 8
3 4 5 5
4 2 0 8
3 4 5 5
4 2 2 8
3 4 5 5
6 2 2 8
3 4 5 6
6 2 2 0
3 4 5 6
6 2 2 0
3 4 5 6
8 2 2 0
3 4 5 6
8 4 2 0
3 4 5 6
8 4 2 0
3 4 5 6
8 4 2 0
4 4 5 6
0 6 2 0
Далее для дальнейшего анализа необходимо ряд разбить на интервалы.

Число интервалов определим, используя формулу Стерджиса:


m = +1 3,322logn ; m=1+3,322 log80
=1+3,322*1,90309=7,32206498
n = 80, потому что всего 80 оценок.
(x max −xmin ) (60−24 )
Рассчитаем величину интервала:k = = =4,91665=5.
m 7,32206 498

Разбиваем генеральную совокупность на 8 интервалов с шагом k = 5

Строим интервалы и записываем частоту и частости вариант, попавших


в интервалы.

диапаз ч ч

он астота ас-ти
инте
x x w
рвала ni
i i+5 i = ni/n
2 2 0
1 7
4 9 ,0875
4

2 3 0
2 2
9 4 ,025
3 3 1 0
3
4 9 0 ,125
3 4 1 0
4
9 4 7 ,2125
4 4 1 0
5
4 9 1 ,1375
4 5 1 0
6
9 4 4 ,175
5 5 1 0
7
4 9 2 ,15
5 6 0
8 7
9 4 ,0875
8
Сумма 1
0
Строим диаграмму вариационного ряда.

Диограмма распределения частот


18

16

14

12

10

0
24-29 29-34 34-39 39-44 44-49 49-54 54-59 59-64

На основании диаграммы, выдвигаем гипотезу о виде закона


распределения, подбираем параметры закона распределения и проверяем их
на нормальность.

Н0 – нулевая гипотеза о виде закона распределения.

N (a, s2) – нормальность распределения с параметрами,


5

а – среднее ряда, s2 – среднеквадратичное отклонение.

Составляем расчетную таблицу для нахождения точечных оценок


параметра распределения. Необходимо перейти к простому вариационному
ряду.

В таблице приведенные значения означают:

6 столбец: выборочная средняя;


7 столбец: интервальные средние сумма по столбцу определяет среднее
вариационного ряда;
8 столбец: расчет интервальной дисперсии (по строкам) и сумма
-дисперсия вариационного ряда.
Таким образом, предполагаем, что исследуемая величина имеет
нормальный закон распределения с параметрами a = 45,750 и S = 9,85

S 2= 96,938 . С помощью критерия согласия Пирсона проверим,


согласуется ли гипотеза с опытными данными на уровне значимости α = 0,05.

9-10 столбцы: расчет аргумента интегральной функции Лапласа;


11-12 столбцы: значение функции Лапласа по таблицам;
Для нахождения значений воспользуемся таблицей интегральной
функции Лапласа. 13 столбец: расчет вероятности попадания случайной
величины в соответствующий интервал. Сумма по столбцу должна быть
близка к 1.
14 столбец: расчет составляющей nPi формулы критерия χ2. Где
n=80 - количество оценок, а Pi -интервальная вероятность.

15-16 столбцы: использовать в случае необходимости объединения


интервалов (случай, когда интервал содержит частоты меньше 5). В данном
случае объединению подлежат строки 7 и 8;

17 столбец: интервальный расчет χ2, сумма по столбцу определяет


χ2теорет (наблюдаемый).
6

Формулы:

Число степеней свободы:


v =(k –1)∙(с –1), где k-число строк, c-число столбцов:
v =(8-1)*(2-1) = 7
По таблице критических значений χкр при уровне значимости α = 0,05 и числе
степеней свободы v = 7, найдем χкр = 14,067.
Сравним числа χкр = 14,067 ˂ χтеор = 14,886 , χкр ˂ χтеор
Ответ : нулевая гипотеза о нормальном распределении генеральной
совокупности отвергается.
7

Номер диапазон частота час-ти Средн


S2=(x*- (xi- (xi+7- (ni-
интер- а=Х*wi Ф(хі) Ф(хі+1) Рі nPi
wi = a)2*wi a)/s a)/s nPi)2/nPi
вала xi xi+7 ni Х*
ni/n
1 2 3 4 5 6 7 8 9 10 11 12 13 14 17
1 24 29 7 0,0875 26,5 2,319 32,424 -2,208 -1,701 -0,4861 -0,4554 0,0307 2,456 8,41
2 29 34 2 0,025 31,5 0,788 5,077 -1,701 -1,193 -0,4554 -0,383 0,0724 5,792 2,48
3 34 39 10 0,125 36,5 4,563 10,695 -1,193 -0,685 -0,383 -0,2517 0,1313 10,504 0,02
4 39 44 17 0,2125 41,5 8,819 3,838 -0,685 -0,178 -0,2517 -0,0675 0,1842 14,736 0,35
5 44 49 11 0,1375 46,5 6,394 0,077 -0,178 0,330 -0,0675 0,1293 0,1968 15,744 1,43
6 49 54 14 0,175 51,5 9,013 5,786 0,330 0,838 0,1293 0,2967 0,1674 13,392 0,03
7 54 59 12 0,15 56,5 8,475 17,334 0,838 1,345 0,2967 0,4099 0,1132 9,056 0,96
8 59 64 7 0,0875 61,5 5,381 21,705 1,345 1,853 0,4099 0,4678 0,0579 4,632 1,21
СУММА 80,000 1,000   45,750 96,938         0,954 76,312 14,886
Все данные занесены в таблицу.

а=45,750

S 2= 96,938

S = 9,85
8

Диаграмма распределения частот


18 18
17

16 16
15.74

14.74
14
14 14
13.39

12
12 12
11

1010.5
10 10

9.06

8 8
7 7

6 6
5.79

4.63
4 4

2.46 2
2 2

0 0
24-29 29-34 34-39 39-44 44-49 49-54 54-59 59-64
9

2. Сравнение двух экспериментальных распределений

Задача 2
По моему варианту, условие для моей задачи в пункте 2.3
2.3 Используя критерий «хи-квадрат» при уровне значимости α = 0,05,
проверить, существует ли зависимость между двумя независимыми
экспериментальными выборками. Для анализа используется
генеральная совокупность, анализируемая в задаче 1. В качестве
независимых выборок выделить из генеральной совокупности:
группу девочек из 1 группы (голубой фон) и группу мальчиков со 2
группы (желтый фон). Используя средние характеристики
определить какая из групп, лучше усвоила теорию.
Исходные данные из 1 задачи :

Баллы ФИО Баллы ФИО Баллы ФИО Баллы ФИО

Бондаренко
52 Анастасия Головченко
42 Максим Новицкий
50 Денис Хрисова
24 Юлия

Курбатова
46 Анастасия Варягина
36 Анна Стоянова
52 Евгения Мурадян
24 Максим

Бреславец
42 Анастасия Гайдаенко
60 Злата Нижинская
52 Даша. Никита
52 Лукинов

Любименко Антоненко Виктория Суворов Дмитрий


Фомичев
26 Георгий 44 Екатерина 40 64

Андреева
56 Неля Медведев
52 Семён Садиков
46 Даниил Бошкова
34 Елена

Потёмкина Елизавета Мамросенко Дарина Терещенко Анастасия Милюкова


54 42 40 Татьяна
36

Тимошенко
58 Илья Явдощина
36 Валерия Цимбалюк
40 Александр Корчевская
42 Елизавета

Мелентьева Валерия Якимова Д. А. Крижановская Молчанюк


42 54 40 Виктория 42

Кравченко Кирилл Ермашова Мария Матяш Бандилей Виктория


38 46 Константин
56 32

Пархидько
38 Владимир Макарова
38 Мария Мельник
46 Артем Шевкис
52 Марта

Гулеватый
52 Андрей Алексаньян
42 Таисия Новикова
60 Яна Олейник
46 Анжелика

Шалашный Андрей Усенко Бондаренко Елена Рогозянская А.И.


56 Александра
50 44 24

Бакалюк
60 Михайло Косарев
46 Павел Барсегян
34 Ева Балан
24Вика

Проничев
52 Сергій Хачикян
42 Руслагн Лысюк
52 Игорь Радецкий
60 Богдан

Боднар
44 Виктория Галкина
56 Дарья Загородня
56 А. Шмелёва
58 Анастасия

Ковальчук
52 Владислава Погасий
32 Дарья Музыка
58 Ирина Кукса
58Игорь

Кобзаренко Елена Зброжек Софія Сирота Сирота Наталия


60 58 Александр
26 46

Георгий
42 Проценко Хаджи
42 Ярослава Литвак
46 Анна Мосиенко
38 Валерия

Котова
50 Алли-Иппа
64 Владимир Склярова
40 Анастасия Чубчик
50 Андрей
10

Анастасия

Михайличенко
40 Максим Гнидой
28 Роман Дудник
34 Виктория Белякова
40 Настя

Решение.

Для начала, нам нужно выделить отдельно девочек из 1 группы и


мальчиков из 2 группы.

Ниже я уже запишу их оценки и проранжирую отдельно каждую группу.

У нас получилось 23 девочки и 15 мальчиков.

Девочки Мальчики
32 24
36 26
36 40
38 42
42 46
42 46
42 50
42 50
42 52
44 52
44 56
46 56
46 58
50 60
50 60
52  
54  
54  
56  
56  
58  
60  
60  

Потом разбиваем оценки на интервалы при помощи формулы Стерджесса


аналогично задачи 1.
m = 1 + 3,322lgn = 1 + 3,322*lg 38 =6,24804
n = 38 – и мальчиков, и девочек
Определяем величину интервала:
(x max −xmin ) (60−24)
k= = =5,76181
m 6,24804
11

В итоге, все числа по результатам тестирования представим в виде таблицы с


учетом ранжирования оценок каждой группы в отдельности. Результаты
оценивались по 60-бальной шкале.
Принимаем m = 6 , k = 6.

Оценки Сумма
Группа
24-30 30-36 36-42 42-48 48-54 54-60
Группа 0 1 3 9 3 7 23
Девочек
Группа 2 0 1 3 4 5 15
Мальчиков
Сумма 2 1 4 12 7 12 38

Суммы – кол-во оценок по группам


M = 23, N = 15
Всего 38
Проверка значимости статистической гипотезы при помощи критерия
значимости может быть разбита на следующие этапы:
1)сформулировать проверяемую (Н0) и альтернативную (H1) гипотезы;
2)назначить уровень значимости ;
3)выбрать статистический критерий;
4)определить теоретическое (χТ) и выборочное (χВ) значения критерия;
5)определить критическую область χk;
6)принять статистическое решение: если χвχk , то гипотезу H0 принять, т.
е. считать, что гипотеза H0 не противоречит результатам наблюдений; Если
χвχk, то отклонить гипотезу H0 как не согласующуюся с результатами
наблюдений.
Формулировка гипотез:
Н0: Существенной разницы в уровне знаний студентов в двух группах не
существует.
Н1: Существенная разница в уровне знаний в группах существует.
Я могу сказать, что в группе девочек успеваемость лучше чем у мальчиков,
но это только на первый взгляд, тогда точные утверждения касательно
сравнения успеваемости Девочек и Мальчиков следует делать только на
основе статистической обработки экспериментальных данных. Формула:
12

где fэ – эмпирическая частота;


fm – теоретическая частота;
k – количество разрядов признака.
Расчетная формула критерия хи-квадрат для сравнения двух эмпирических
распределений в зависимости от вида представленных данных может иметь
следующий вид:
2
2 1 (M ∗xi −N∗y i )
χ эмп = ∗∑
M∗N x i+ y i

где M и N – соответственно число элементов в первой и второй выборке. В


нашем случае, эти числа совпадают.
Подставляя в формулу данные получаем:
χ2эмп =
1 ( 0∗23−15∗2 )2 ( 1∗23−0∗15 )2 ( 3∗23−1∗15 )2 ( 9∗23−3∗15 )2 ( 3∗23−4∗15 )2 ( 7∗23−5∗
23∗15
∗ ( 2
+
1
+
4
+
12
+
7
+
12
13,10987
Число степеней свободы в данном случае равно:
V= (k –1)∙(с –1), где k-число строк, c-число столбцов
V= (2–1)∙(6 –1) =5
По таблице находим:

χ 2кр = 11,07 для р≤ 0,05


{
15,086 для р ≤ 0,01

Построим ось значимости для того чтобы посмотреть в какую зону попадет
наше χ2эмп.
13

Сейчас следует принять статистическое решение.

Если χвχk, то отклонить гипотезу H0 как не согласующуюся с результатами


наблюдений.. Наша χв не входит в χk , а значит нам следует отклонить
нулевую гипотезу, это логично, ведь у девочек оценок больше, потому что их
больше и сравнивать неравные количества человек нелогично, критерий «хи-
квадрат» дал возможность получит точный ответ.
Для сравнения уровня знаний рассчитаем среднее значение ряда, медиану и
моду.
Формула среднего вариационного ряда:

Где xі -варианты дискретного ряда или середина интервалов интервального


ряда;
m–число неповторяющихся вариантов или число интервалов;
n – сумма частот.
Для Девочек: x́=¿47,043478
Для Мальчиков: x́=¿47,866667
Таким образом, значения среднего вариационных рядов незначительно
отличаются и можно сделать вывод о том, что уровень знания в мальчиков
выше (незначительно) .
Мода Девочек - 42
14

Мода Мальчиков - 46
Мода – это вариант, которому соответствует наибольшая частота. В нашем
случае мода показывает, что оценки «42» ставились наибольшее количество
раз в группе девочек и оценки «46» - мальчиков.
Медиана Девочек - 46
Медиана Мальчиков - 50
Медиана в нашем случае — это значение вероятности того, что студент с
равной вероятностью может получить оценку меньше и больше медианы. То
есть, чем больше медиана, тем лучше.
Вывод.
Таким образом, рассчитав среднее вариационных рядов, моду и медиану для
мальчиков и девочек, можно сделать вывод, что успеваемость среди
мальчиков по итоговым работам по Логистике выше, чем успеваемость
девочек. Так как сравнивалось неравное количество мальчиков и девочек, это
не может эти результаты нельзя вносить в статистику, их мы расчитывали
только для общего сведения. Если бы и девочек, и мальчиков было поровну,
тогда уже это можно было бы записать в статистику успеваемости среди
студентов двух групп. Наибольшее количество низких оценок от 24-30 в
группе мальчиков ( 2 оценки низкого уровня). Наибольшее количество
оценок высокого уровня от 54-60 в группе девочек ( 7 оценок), опять же, это
из-за того, что девочек больше чем мальчиков.
Все расчеты по таблицам в Эксель и продублированы в Ворд.