Вы находитесь на странице: 1из 42

Министерство науки и высшего образования Российской Федерации

Федеральное государственное бюджетное образовательное учреждение


высшего образования «Московский авиационный институт (национальный
исследовательский университет)»
Институт №6 «Аэрокосмический»
Кафедра 610 «Управление эксплуатацией ракетно-космических систем»

Отчет по лабораторным работам (Вариант 10)


по дисциплине «Моделирование систем и процессов»

Выполнил:

Студент группы М6О-314С-19 Иванов Е. Г.


(подпись)

Принял:

Старший преподаватель Гусев Е. В.


(подпись)

Дата защиты: Оценка:

Москва 2021
Содержание
Лабораторная работа №1.......................................................................................3
Лабораторная работа №2.....................................................................................14
Лабораторная работа №3.....................................................................................21
Лабораторная работа №4.....................................................................................30
Лабораторная работа №5.....................................................................................41

2
Лабораторная работа №1
«Дисперсионный анализ»

Цель работы:
1) изучение метода дисперсионного анализа с целью установления
влияния факторов (входных величин) на отклик системы;
2) исследование вопросов применимости метода дисперсионного
анализа для решения конкретных статистических задач.
Постановка задачи:
во многих областях практической деятельности встречаются процессы,
состояния которых зависят от входных переменных (факторов), не имеющих
количественного описания. Для изучения влияния факторов на выходную
функцию (отклик), их общего оценивания, ранжирования и выделения среди
них существенных используется подход, получивший название
дисперсионный анализ. Идея подхода заключается в изучении влияния
факторов по величинам дисперсии выходной величины (отклика).
Дисперсионный анализ состоит в выделении и оценке отдельных
факторов, вызывающих изменчивость значений функций отклика. С этой
целью производится разложение дисперсии наблюденных значений отклика
на составляющие, порождаемые независимыми факторами.
Рассмотрим постановку задачи дисперсионного анализа в общем виде.
Выходная переменная Y может зависеть (по физическим причинам) от n
независимых факторов (x1, x2…xn), притом факторы не всегда имеют
количественное описание. Каждый фактор может варьироваться на m уровнях.
Каждая строка с индексом j содержит m наблюдений выходной переменной Y.

3
Требуется определить, в какой мере существенно на фоне случайных

погрешностей, влияние того или иного фактора xi (i=1,n) на отклик Y,


провести сравнение с другими факторами и выделить наиболее существенные
из них.
Допущения, на которых базируется дисперсионный анализ:
наблюдения переменной Y - есть нормально распределенные случайные
величины с математическим ожиданием M[Y]=my. Дисперсия единичного
2
σ
наблюдения ε обусловлена случайными ошибками ε, постоянна во всех

опытах и на всех уровнях факторов xi (i=1,n) .


Идея дисперсионного анализа:
чтобы иметь возможность оценивать влияние каждого фактора на
переменную Y и сравнивать влияние различных факторов следует установить
некоторый количественный показатель этого влияния. Рассмотрим идею
дисперсионного анализа на примере изучения влияния одного фактора X на m
уровнях, получим значения отклика y1, y2…yn, рассеяние которых можно
m
1
S 20 ( y )= ∑
m−1 j=1
( y j− y )2
характеризовать выборочной дисперсией, , где
m
1
y= ∑ y j 2 2
m j=1 . Число степеней свободы S 0 ( y) есть ν =m-1. Если отличие S 0 ( y) от
0

2
σ ε незначимо, то разброс наблюдений, который она характеризует, связан

только со случайными причинами и влияние фактора X несущественно. Если


2 2
же отличие S 0 ( y) σ
от ε значительно, то повышенный разброс наблюдений
вызывается не только случайными причинами, но и влиянием фактора X,
которое следует признать существенным.
Так как в последнем случае складывается влияние по крайней мере
двух факторов:
2
σ
1) случайных причин с дисперсией ε ;

4
2
2) фактора X с дисперсией σ x , что приводит к общему рассеянию
2 2
наблюдений, то их общая дисперсия является суммой σ x + σ ε , а ее оценка:
S 20 ( y )≈σ 2x +σ 2ε .

Откуда дисперсия фактора X определяется выражением:


σ 2x≈S 20 ( y )−σ 2ε .
2
В общем случае дисперсия ошибок σ ε неизвестна, поэтому схема
дисперсионного анализа должна быть такой, чтобы позволяла определить ее
наряду с оценкой дисперсии фактора X. С этой целью планируется проведение
серии параллельных опытов на каждом из всех возможных сочетаний уровней
факторов. Таким образом, основная идея дисперсионного анализа заключается
в разложении оценки общего рассеяния на составляющие, зависящие от:
1) случайных причин;
2) от каждого из рассматриваемых факторов.
Алгоритм решения задачи:
рассмотрим процедуру однофакторного дисперсионного анализа. Пусть
фактор X варьируется на n уровнях.
Не нарушая общности выводов, рассмотрим случай равночисленных
серий наблюдений на всех уровнях  i=1,n , т.е pi=p.
Рассеяние между столбцами обусловлено ошибкой воспроизводимости,
а рассеяние между строчками – действием изучаемого фактора X. Вычислим
среднее арифметическое y i серий из p наблюдений для каждого i-го уровня
фактора с помощью соотношения вида:
p
1
y i= ∑ y ij (1)
p j=1 .
Общее среднее арифметическое y всех n×p наблюдений по всем
уравнениям вычисляется следующим образом:
n n p
1
y= ∑ y= 1 ∑∑ y
n i=1 i np i=1 j=1 ij . (2)
Рассеяние отдельных наблюдений относительно общего среднего
обусловлено действием как случайных причин, так и влиянием фактора X.
2
Действие фактора случайности проявляется в рассеянии (с дисперсией σ ε )
наблюдений серий параллельных исследований на каждом уровне xi вокруг
5
среднего арифметического y i своей серии. Влияние же фактора X (с
2
дисперсией σ x ) вызывает повышенное рассеяние средних арифметических y i
относительно общего среднего y . Каждое из этих трех рассеяний можно
охарактеризовать соответствующей суммой квадратов отклонений. В
соответствии с основной идеей дисперсионного анализа разложим общую
сумму квадратов отклонений yij от общего среднего y на две составляющие,
одна из которых характеризует влияние фактора случайности, а другая –
фактора изменчивости:
n p n p p
S 0 =∑ ∑ ( y ij− y ) =∑ ∑ ( y ij − y i ) +n ∑ ( y j − y )2=S ε + S x
2 2
(3)
i=1 j=1 i=1 j =1 j=1 .
Оценки дисперсий:
предположим, что влияние фактора Х на отклик отсутствует, т.е.

гипотеза Н0 об однородности y i , i=1,n верна. Тогда все n серий параллельных


наблюдений можно рассматривать как случайные выборки одной и той же
генеральной совокупности и, следовательно:
1) Несмещенная общая оценка дисперсии воспроизводимости по всем
n×p наблюдениям определяется выражением:
n p
1 S0
S 20 = ∑ ∑
np−1 i=1 j=1
( y ij − y )2=
np−1
≈σ 2ε (4)
,

с числом степеней свободы ν ε =np−1 ;


2) выборочная дисперсия рассеивания «внутри серий» или остаточная

оценка дисперсии воспроизводимости σ 2ε , находится как среднее из

выборочных дисперсии по каждой серии в отдельности:


n p
1 1 Sε
S 2ε =
n i=1
∑ ∑
p−1 j=1
( y ij− y i )2 =
n( p−1 )
≈σ 2ε (5)
,

с числом степеней свободы ν ε =n( p−1) ;


3) выборочная дисперсия средних по сериям служит несмещенной
σ 2ε
оценкой дисперсии p с которой нормально распределены независимые друг
от друга средние i-ых серий:

6
1
n
Sx σ 2x
2
S ( y i )= ∑ ( y − y ) = p (n−1 )≈ p
n−1 i=1 i
2
(6)
,

с числом степеней свободы ν x=n−1 . Отсюда нетрудно получить


третью оценку воспроизводимости, выборочную дисперсию рассеивания
«между сериями»:
Sx
S 2x ( y i )== ≈σ 2ε (7)
n−1 .

с числом степеней свободы ν x=n−1 . Подсчет чисел степеней свободы

проверяется с помощью соотношения ν 0 =ν ε +ν x .


Из сказанного очевидно, что при отсутствии влияния фактора Х оценки
2 2 2
S 0 , Sε , S x однородны, так как являются оценками одной и той же генеральной

дисперсии.
Предположим теперь, что влияние фактора Х на отклик существенно,

т.е. гипотеза Н0 об однородности y i , i=1,n неверна. Тогда n серий наблюдений


можно рассматривать как случайные выборки независимых нормально
распределенных случайных величин с одной и той же дисперсией
2
воспроизводимости σ ε и различными генеральными средними m1, m2…mn и,
следовательно:
2
S
1) выборочная дисперсия 0 характеризует влияние как фактора
2 2 2
случайности ε, так и фактора Х, т.е. S 0 ≈σ ε +σ x ;

2) так как сумма S ε не изменяется при замене yij на yij-mi, то выборочная


2
S
дисперсия ε также не изменяется и по-прежнему является несмещенной
2 2 2
оценкой для генеральной дисперсии воспроизводимости σ ε , т.е.  S ε ≈σ ε ;

3) поскольку сумма S x учитывает не только случайные, но и

систематические расхождения между средними серий и увеличивается за счет

7
2
влияния фактора Х, дисперсия S x при этом также увеличивается и перестает
2
σε
2 2 2
служить оценкой только p , откуда следует, что  S x≈σ ε + pσ x .
Из сделанного второго предположения очевидно, что при влиянии
2 2 2
фактора Х оценки S 0 , Sε , S x неоднородны. Следовательно, сопоставляя эти
выборочные дисперсии, можно принять решение о справедливости первого
или второго предположения относительно существенности влияния фактора Х
2
(с дисперсией σ x ) на отклик.
Оценка влияния фактора:
для того, чтобы влияние фактора Х было признано существенным
2
S x2
( σ x >0), необходимо и достаточно, чтобы оценка дисперсии значимо
2
отличалось от S ε . Проверку исходной гипотезы Н0 об однородности этих
выборочных дисперсии можно осуществить с помощью критерия Фишера:
2
Sx
FH= (8)
. S 2ε
При использовании критерия Фишера применяется следующее правило

принятие решения: если F H >Fq ( ν x ,ν ε ) , то влияние фактора Х признается

существенным, и, наоборот, если F H <Fq ( ν x ,ν ε ) , то влияние фактора Х


признается несущественным.

8
Таблица 9 на 10 из чего следует, что критерий Фишера берётся
равным 2,06:

9
Код:

Выведенная случайная матрица:

Средние значения по сериям:

10
Общее среднее значение:

Среднее квадратичное отклонение:

Общая дисперсия (S0) и общая оценка дисперсии


воспроизводимости (S02):

Таблица для нахождения влияния фактора случайности:

11
Влияние фактора случайности (Se) и выборочная дисперсия
внутри серий (Se2):

Таблица для нахождения влияния фактора изменчивости:

Влияние фактора изменчивости (Sx) и выборочная дисперсия


между сериями (Sx2):

Расчётный критерий Фишера и зависимость процесса от фактора


(логический вид):

Вывод: в ходе исследований был проведен лабораторный анализ,


который в свою очередь показал, что расчетный критерий Фишера выше
12
табличных значений, тем самым, влияния фактора X на результаты
эксперимента не имеет существенного основания.

13
Лабораторная работа №2
«Системы массового обслуживания»

Цель работы:
изучение системы массового обслуживания (СМО) с отказами и
исследование вопросов оптимального построения подобных систем.
Постановка задачи:
пусть в n-канальной равнодоступной СМО действуют два потока: ·
входной поток заявок; · поток освобождений каналов.
Пусть оба потока являются простейшими с интенсивностью
соответственно λ и μ.
СМО с отказами характерна тем, что если заявка застает свободным
хотя бы один канал, то она принимается к обслуживанию и обслуживается до
конца любым из свободных каналов. Если же заявка застает все n каналов
занятыми, то она получает отказ и покидает систему необслуженной.
СМО с отказами описывается следующим множеством состояний: 𝐴0 –
все n каналов свободны, в системе нет заявок; 𝐴1 – занят один канал,
обслуживается 1 заявка; 𝐴 – занято 𝑘 < каналов, обслуживается k заявок; 𝐴𝑛 –
заняты все n каналов, обслуживается n заявок.
Размеченный граф состояний для СМО с отказами может быть
представлен в следующем виде:

Рассмотрим стационарное состояние системы. Поскольку все потоки,


действующие в системе, являются простейшими, в процессе протекает
марковский процесс. В этом случае для вывода уравнений системы можно
воспользоваться следующим мнемоническим правилом: алгебраическая сумма
слагаемых, каждое из которых представляет собой произведение вероятности
𝑃 нахождения системы в каком-либо определенном k состоянии на
14
интенсивность потока, переводящего систему в другое состояние, равна нулю.
Число слагаемых равно сумме стрелок, входящих и выходящих из состояния
𝐴, причем для входящих стрелок соответствующее слагаемое берется со
знаком плюс, а для выходящих – со знаком минус.
Система алгебраических уравнений, описывающая стационарный
режим работы СМО и составленная по графу возможных состояний в
соответствии с мнемоническим правилом, имеет следующий вид:

К данной системе добавляется очевидное нормировочное условие для


вероятностей нахождения СМО в определенных состояниях:

Подставив (5) в (4), получим основные расчетные формулы для


вероятностей нахождения системы в определенном k-ом состоянии (формулы
Эрланга):

15
Формулы Эрланга (6) дают предельный закон распределения
вероятностей числа занятых каналов в зависимости от параметров входного
потока заявок и потока обслуживания.
Поведение СМО с отказами в стационарном режиме описывается
следующими основными характеристиками: Вероятность отказа заявке в
обслуживании:

16
Код:

17
График, построенный на базе заданных данных на базе MATLAB:

Расчеты

Изменение вероятности отказа при числе линий (n1) равным четырем,


интенсивности обслуживания (m1) равной 21 и цена этого улучшения (S1):

μ 19 20 21
Pотказа 0.0131 0.0111 0.0096
18
Вероятность отказа (Poтказа) при числе линий (n1) равным пяти и цена
этого улучшения (S1):

Вывод: в данной Лабораторной работе были проведены исследования,


требуемые улучшения для достижения нужной вероятности отказа и их цена.
Также был определён наиболее выгодный путь улучшения, которым является
увеличение количества линий до пяти, стоимость которого является 550 у.е.,
что по расчетам наиболее выгодная цена для достижения вероятности отказа
менее 0,01.

19
Лабораторная работа №3
«Система массового обслуживания с ожиданием»
Цели работы:
1) изучение системы массового обслуживания (СМО) с ожиданиями;
2) исследование вопросов оптимального построения подобных систем.
Содержание работы:
 изучить основные характеристики СМО с отказами;
 ответить на вопросы теста;
 с использованием ЭВМ решить конкретные задачи;
 получить результаты и составить отчет по работе.
Описание СМО с ожиданием:
рассмотрим следующую СМО с простейшими потоками заявок λ и
обслуживания μ: поступившая заявка может обслуживаться любым свободным
каналом; если все п каналов заняты, поступившая заявка становится в очередь
и ждет своего обслуживания. Будем считать, что число мест в очереди
неограниченно, причем заявка, вставшая в очередь раньше, и будет
обслуживаться раньше.
Подобные системы называют СМО с ожиданием. В этих системах
общее число заявок, находящихся в системе, складывается из обслуживаемых
заявок и заявок, находящихся в очереди. Поэтому СМО с ожиданием можно
характеризовать следующим бесконечным множеством состояний:
А0 – все n каналов свободны, в системе нет заявок и нет очереди;

Аk – занято k <n каналов, обслуживается k заявок, очереди нет;

Аn – заняты все n каналов, обслуживается n заявок, очереди нет.

Аn+1 – заняты все n каналов, обслуживается n заявок, одна заявка


находится в очереди.

Аn+r – заняты все n каналов, обслуживается n заявок, в очереди


находится r заявок.
20
Размеченный граф возможных состояний СМО с ожиданием имеет
следующий вид:

Стационарное состояние системы описывается бесконечной системой


алгебраических уравнений относительно вероятностей Рk и Pn+r. Эта система
формируется по графу состояний в соответствии с мнемоническим правилом,
описанным в лабораторной работе № 2. Система имеет следующий вид:
−λP0 +μP 1=0
−( λ +kμ )P k +( k +1) μPk +1 +λPk −1 =0 , 1<k <n (1)
−( λ +nμ )Pn+r +nμPn+r+1 + λPn+r−1 =0 ,

∑ Pk =1
при нормировочном условии  k=0 .
Первые n уравнений системы (1) совпадают с n уравнениями для СМО с
отказами и поэтому имеют решение в виде формул Эрланга:

()
k k
1 λ α
Pk = P0 = P0 , 0<k<n α= λ (2)
k! μ k! ,  μ .
Последние уравнения системы (1), начиная с п+1, одинаковы по
структуре. С помощью вспомогательных переменных:
z r =λPn+r−1−μ nP n+r , (3)
эти уравнения можно записать в виде:

z s −z s+1=0 , (4)
откуда имеем
z r+1=z r =…=z 0 . (5)
Учитывая соотношения (3) и (5), получим следующую рекуррентную
формулу:
λ
Pn+r = P (6)
μn n+r−1 .
Применяя (6) r раз последовательно, получим
21
λr λn+r α n+r
Pn+r = P n= P 0 = P0 (7)
μr nr μn+r nr n! n !nn+r .

Вероятность P0 можно найти из нормировочного условия, в которые


подставим формулы (2) при 0≤k≤n и (7) при r≥0:

[ ( ) ( ) ∑( ) ] .
n ∞ n
1 λ k 1 λ n ∞
λ r
∑ Pk +∑ Pn+r=P0 ∑ k ! μ + n ! μ nμ
(8)
k =0 r=1 k=0 r=1

λ α
ρ= =
Обозначим nμ n . Пусть ρ≤1, тогда сумма бесконечно убывающей

ρ
∑ ρr= 1− ρ
геометрической прогрессии со знаменателем ρ равна r=1 . Соотношение
(8) примет вид:

[ ]
n n

() ()

1 λ k 1 λ n ρ
∑ Pk +∑ Pn+r =P0 ∑ k ! μ + n ! μ ⋅1−ρ
k=0 r=1 k=0 ,
откуда

1
P0 = n
∑ k1! ( μλ ) + n1! ( μλ ) ⋅1−ρ
k n
ρ (9)
k=0 .
С использованием соотношения (9) нетрудно подсчитать основные
характеристики СМО с ожиданием.

Характеристики СМО с ожиданием в установившемся режиме


Поведение СМО с ожиданием в стационарном режиме описывается
следующими основными характеристиками:

Вероятность того, что все каналы свободны:

1
P0 = n k n
∑ αk ! + αn !⋅1−ρ
ρ (10)
k=0 .
Вероятность того, что все каналы заняты:

22
n
α
Pn = P (11)
n! 0 .

Вероятность того, что все n каналов заняты и r заявок находится в


очереди:
n+r
α
Pn+r = r P0 (12)
n! n .
Среднее число заявок в очереди:

ρ
mr =∑ rP n+r = Pn (13)
r=1 (1−ρ )2 .

Среднее время ожидания заявок в очереди:

mr
t ож= (14)
λ .

Среднее число каналов, свободных от обслуживания:


n−1 n−1
αk
N c =∑ ( n−k ) P = ∑ ( n−k ) P k (15)
k =0 k ! 0 k =0 .
Среднее число каналов, занятых обслуживанием:

N з=n−N c . (16)
Коэффициент простоя каналов:

Nc
K п= (17)
n .

Коэффициент загрузки каналов:


K з= (18)
n .

Описание реальной СМО с ожиданием и постановказадачи исследования


В качестве реальной СМО рассмотрим следующую задачу. Порт имеет n
причалов для разгрузки судов. Если все причалы заняты, то прибывшие суда
ожидают своей очереди на разгрузку. В среднем за сутки на разгрузку

23
поступает λ судов, а среднее время разгрузки одного судна составляет ν
1
μ=
рабочих дней, т.е. интенсивность разгрузки ν судов в сутки.

Простой каждого судна перед разгрузкой обходится государству в Qож


ед. стоимости в сутки, простой одного причала - в Qп.к. ед. стоимости в сутки, а
стоимость суточной эксплуатации причала - в Qк ед. стоимости.
Эффективность функционирования порта можно оценить величиной
суммарных потерь, связанных с простоем судов и причалов, а также с
эксплуатацией причалов. Эти потери находятся по следующей формуле:
C п= λt ож Q ож +N c Qп .к. +N з Qк . (19)
Необходимо сделать оценку экономической целесообразности
увеличения числа причалов в соответствии с критерием суммарных потерь, т.
е. экспериментально подобрать такое значение n, при котором величина Сп
была бы минимальной.
Для решения задачи с помощью данной обучающей системы необходимо:

а) при заданных значениях n, λ и μ будут найдены величины Po, Pn, Mr,


Tож, Nc и Nз с помощью соотношений (10), (11), (13) - (16).
б) на основе этих данных, представленных в таблице в окне «Результаты
вычислений», найти величину суммарных потерь Сп по формуле (19);
в) увеличить число причалов на 1 при постоянных λ и μ и повторить
пп. а) и б);
г) повторять пп. а) - г) до тех пор, пока число причалов не будет
равным 15;
д) сделать выводы из полученных результатов и построенного
графика Сп=f(n).

24
Код:

25
График, построенный на базе заданных данных на базе MATLAB:

26
Расчеты MATLAB выведенные в таблицу:

n P0 Pn Mr t Nc Nz C1
0.025 3.235 1.1805e+0
4 0.1171 2.5909 0.4711 0.7647
6 3 4
0.028 3.591 1.1186e+0
5 0.0841 1.8608 0.3383 1.4090
5 0 4
0.032 3.670 1.0084e+0
6 0.0514 1.1384 0.2070 2.3294
3 6 4
0.035 3.568 8.9831e+0
7 0.0262 0.5803 0.1055 3.4319
6 1 3
0.037 3.425 8.2624e+0
8 0.0112 0.2484 0.0452 4.5747
7 3 3
0.038 3.323 7.9648e+0
9 0.0041 0.917 0.0167 5.6670
7 0 3
1 0.039 3.269 7.9454e+0
0.0014 0.0300 0.0055 6.7303
0 1 7 3
1 0.039 4.0008e- 3.247 8.0626e+0
0.0089 0.0016 7.7529
1 3 04 1 3
1 0.039 1.0799e- 4.3451e- 3.238 8.2349e+0
0.0024 8.7611
2 3 04 04 9 3
1 0.039 2.6883e- 1.0817e- 3.236 8.4266e+0
5.9493e-04 9.7637
3 3 05 04 3 3
1 0.039 6.2130e- 2.4999e- 10.764 3.235 8.6243e+0
1.3750e-04
4 3 06 05 4 6 3
1 0.039 1.3401e- 5.3921e- 11.764 3.235 8.8237e+0
2.9656e-05
5 3 06 06 6 4 3
Наиболее выгодная цена суточного обслуживания порта равна С1 = 1.0084e+04

27
Вывод: в ходе лабораторной работы мы изучили теорию и выполнили
расчеты, просчитали траты (потери) на обслуживание порта, при этом был
определён наиболее выгодный способ обслуживания, представляющим собой
увеличение числа причалов до 12, стоимость которого
равняется 1.0084e+04 y.e.

28
Лабораторная работа №4
«Проверка статистических гипотез»
Цель работы:
уяснение сути методов проверки статистических гипотез,
используемых в теории надёжности изделий и систем ракетно-космической
техники. Закрепление навыков студентов в проверке некоторых часто
используемых статистических гипотез.

Статистическая проверка гипотез при оценке резко выделяющихся


членов выборки
На практике часто необходимо проверить следует ли отбросить
подозрительный член выборки, который, например, может появиться
вследствие описки или других причин.
Покажем методику проверки одним из наиболее простых методов с
помощью так называемого r-критерия:
1. Выдвигается гипотеза H 0 : x n принадлежит данной выборке, а его
отличие от остальных членов выборки – случайно.
2. Назначается уровень значимости α.
3. Вычисляются следующие статистические характеристики:
m x − x1 mx − x n
r min = , r max = ,
Dx
√ ( n −1 )
n
Dx
√ ( n −1 )
n
где mx – оценка математического ожидания; D x – оценка
среднего квадратичного отклонения; n – количество
экспериментальных данных.
4. Критическое значение r α , min (r α , max) выбирают по таблице для
заданного уровня значимости и числа степеней свободы ν=n −2:

29
5. Если окажется, что |r α , min( r α ,max )|≥ r α , то гипотеза отвергается и
следует отбросить данное экспериментальное значение выборки.

Проверка о законе распределения по методу Н.В. Смирнова


На практике часто необходимо оценить, соответствует ли наблюдаемая
выборка какому-либо закону распределения.
При выборке по методу Н.В. Смирнова в качестве меры согласования
теоретического и статистического законов распределения используются
функция разности статистической и теоретической функции распределения.
Проверка гипотезы осуществляется следующим образом.
1. По внешнему виду (на графике) функции распределения
выдвигается нулевая гипотеза, что распределение подчиняется закону F ( x).
2. Назначается уровень значимости α.
3. Вычисляется наблюдаемое значение критической статистики
показателя согласованности по формуле

[ ]
n 2
1 2∙ i− 1
u= +∑ F x ( xi ) − ,
12 ∙ n i=1 2∙ n

30
где n – количество экспериментальных точек; F x ( xi ) – теоретическое
значение исследуемой функции распределения при параметрах распределения
(mx и D x), найденных из эксперимента; i – порядковый номер наблюдения в
упорядоченной по возрастанию выборке.
Если проверяется нормальный закон распределения, то вместо
функции F x ( xi ) берётся табличное значение нормированной нормальной
функции распределения, то есть:

F x ( xi ) =Φ
( Dx )
x i − mx
.

Из таблицы для уровня значимости α находят критерий uα :


α 0,5 0,1 0,05 0,02 0,01
uα 0,118 0,347 0,461 0,62 0,744

4. Проверяется условие u<u α. Если оно выполняется, то нулевая


гипотеза принимается. Этот метод применяется, если выборка представлена
отдельными экспериментальными точками.

Проверка гипотез о законе распределения по методу К. Пирсона


В этом методе мерой расхождения теоретического и статистического
законов распределения служит сумма квадратов разностей между частотой и
вероятностью попадания случайной величины в интервале, на которые
разбиваются множество возможных значений этой величины.
Проверка гипотезы применительно к нормальному закону
распределения осуществляется следующим образом:
1. Выдвигается гипотеза H 0, что статистический закон подчиняется
нормальному закону распределения.
2. Выбирается уровень значимости α.
3. Наблюдаемые значения случайной величины разбиваются на l
интервалов и вычисляют показатель согласованности по следующей формуле:

31
l
n ( ℎ j − p j )2
u=∑ ,
j =1 pj

где ℎ j – частота; p j – вероятность попадания случайной величины в j-й


интервал, или по следующей формуле:
l
m2j
u=∑ −n,
j =1 n pj

где m j – число наблюдений, попавших в j-й интервал.


Вероятность Pj попадания случайной величины X, следующей
гипотетическому закону распределения, в j-й разряд (интервал) вычисляется
следующим образом:
P j=P ( x j < X < x j +1 )=F x ( x j+1 ) − F x ( x j ) ,

где F x – теоретический закон распределения с параметрами ( mx и D x),


полученными из эксперимента.
Для нормального закона распределения формулу можно записать так:

P j=Φ ( x j +1 − mx
Dx
−Φ ) (
x j − mx
Dx
. )
4. Критическая граница uα для нормального закона распределения
ищется по таблице χ 2 (распределение Пирсона) с (l −3) степенями свободы.
То есть, для нормального закона распределения uα = χ 2.
5. Проверяется условие u<u α. Если оно выполняется, то расхождение
между экспериментальными данными и гипотезой полагают несущественным.
В противном случае гипотеза H 0 отвергается.

32
Проверка гипотезы о равенстве двух дисперсий из нормально
распределённых генеральных совокупностей
Прежде, чем сравнивать между собой две выборки, необходимо
убедиться, что дисперсии этих двух выборок равны между собой в
статистическом смысле. Такая проверка делается с помощью критерия
Фишера.
1. Выдвигается гипотеза H 0: D2x1=D 2x 2.
2. Выбирается уровень значимости α.
3. Критической статистикой служит следующая функция:
D2x 1 2 2
F= 2
, если Dx 1 > D x 2
D x2

2
Dx 2 2 2
F= 2
, если D x 1 < D x 2
D x1

4. Критическое значение статистики F α соответствует распределению


Фишера с ν1 =n1 − 1 и ν 2=n2 − 1 степенями свободы.
5. Рассчитанное значение t сравнивается с критическим t α . При |t |≥t α , ν
гипотеза H 0 отвергается, при |t |<t α ,ν гипотеза H 0 принимается. В последнем
случае говорят, что среднее значение выборок значимо не отличается в
статическом смысле.
6. Если объём независимых выборок одинаково, то есть
n1 =n2=n , то формула упрощается:

m x1 −m x2
t= √n .
√ D x 1+ D x 2
2 2

Проверка гипотезы о значении двух средних из нормально


распределённых генеральных совокупностей
Здесь рассматривается случай независимых выборок. На практике
часто возникает необходимость сравнить, например, свойства материалов из
двух партий. Пусть получены статистические характеристики mx 1 , mx2 , и
D x1 , D x 1, где цифры 1, 2 относятся к номерам партий. Проверка гипотезы о
2 2

равенстве двух средних производится следующим образом:


33
1. Выдвигается гипотеза H 0: mx 1=mx2 .
2. Выбирается уровень значимости α.
3. Критической статистикой служит следующая функция
выборочных данных:

t=
m x1 −m x2
√ n1 n2
,

√ ( n −1 ) ∙ D 2x 1+ ( n− 1 ) ∙ D2x2 n1 +n 2
n1 + n2 − 2

где n1 и n2 соответственно количество экспериментальных точек в


первой и второй партиях.
4. Критическое значение статистики t α ищется по таблице Стьюдента
с ν=n1 +n2 −2, степенями свободы для уровня значимости α.
5. Рассчитанное значение t сравнивается с критическим t α . При |t |≥t α , ν
гипотеза H 0 отвергается, при |t |<t α ,ν гипотеза H 0 принимается. В последнем
случае говорят, что среднее значение выборок значимо не отличается в
статическом смысле.
Если объём независимых выборок одинаково, то есть n1 =n2=n , то
формула упрощается:
m x1 −m x2
t= √n .
√D 2
x1
2
+Dx 2

34
По варианту даны следующий вариационный ряд:
N: 92, 98, 104, 120, 110, 88, 81, 102, 112, 95.
Гипотезы:
1. о резко выделяющихся членах выборки.
2. о законе распределения по м. Смирнова.

35
Код:

36
Расчеты производимые в MATLAB, а также информация, выведенная в
табличные значения:

Задание 1:

m D rmin rmax
100.2000 11.8397 0.7301 0.4630

Исходя из рассчетов можно сделать следующие выводы:

1) rmin < rа (0.7301 < 2,146) —гипотезу Н0 верна.


2) rmax < ra (0.4630 < 2,146) —гипотеза Н1 верна.

Задание 2:

37
Значения критической границы по методу Смирнова:

ans
u
logical
12.5360 0

U = 12.5360> Ua=0.347, то нулевая гипотеза не принимается — данный ряд


противоречит закону распределения по Н. В. Смирнову.

38
Вывод: в данной лабораторной работе были проверены гипотезы:
1) о резко выделяющихся членах выборки;
2) о законе распределения по м. Смирнова.
Также были рассчитаны и сравнены с табличными значениями критические
значения статистик, в результате чего был сделан вывод, что гипотеза о
законе распределения по м. Смирнова в частном случае неверна.

39
Лабораторная работа №5
«Дисперсионный анализ в EXCEL»

Цель работы:
изучение метода дисперсионного анализа с целью установления
влияния факторов (входных величин) на отклик системы и исследование
вопросов применимости метода дисперсионного анализа для решения
конкретных статистических задач, при помощи программы EXCEL с пакетом
«анализ данных».
Исходные данные:
0,7794 3,6119 4,9549 5,2122 0,8164 0,4558 2,9355 0,7918 1,0139
3,4129 1,5778 3,2301 0,5066 5,2158 1,4395 2,0263 5,6523 3,8947
2,8163 3,9245 5,9768 2,3987 3,4782 0,7399 5,4003 5,7368 4,3903
0,0714 4,1353 0,4691 1,5592 3,2992 1,1034 2,2155 3,4513 3,8865
2,0227 4,4889 2,6561 4,8004 0,8697 1,4397 0,6672 0,3587 2,7055
0,9731 2,7032 0,6399 2,5885 5,1182 2,5036 4,6815 1,4087 3,2821
4,7657 0,5029 5,7714 5,4639 3,7323 0,2979 2,3384 2,119 1,7779
1,8673 1,3739 0,0278 1,0911 2,1057 5,4163 1,4501 4,9272 4,4682
3,1712 5,48 4,6495 1,5828 3,0795 5,6687 2,4235 0,0924 1,1337
0,9939 0,9143 4,9038 0,8732 2,4108 2,9452 0,5787 0,2581 4,1207

Анализ данных, произведенный в программе EXCEL:

40
Расчеты производимые в MATLAB, а также информация,
выведенная в табличные значения:

Наименование Se Se2
Внутри серий 7.2203e+08 8.9140e+06
-//- Sx Sx2
Между сериями 1.1930e+09 1.4913e+08
-//- F
Критерий Фишера 0.5341e+05

Проверка с помощью программы EXCEL прошла успешно,


выявленных ошибок не выявлено.

41
Вывод: проверили расчеты MATLAB при помощи пакета
«Анализ данных» в программе EXСEL, чтобы сравнить данные на
подлинность результата.

42

Вам также может понравиться