3

Министерство образования и науки Российской Федерации
ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
Кафедра Технологии Машиностроения
ОТЧЕТ
к лабораторной работе по дисциплине
Математическая статистика и прогнозирование
ОЦЕНКИ
наименование темы
Выполнил студент группы ИСМбо-11-1 Власов Д.И.

шифр группы подпись Фамилия И.О.
Проверил доцент Казимиров Д.Ю.

должность подпись Фамилия И.О.
Иркутск 2023 г.
1
Оглавление
1. Сравнение оценок..........................................................................................2
Определения......................................................................................................2
1.1. Постановка конкретной задачи..............................................................2
1.2. Теоретическое сравнение оценок...........................................................3
1.3. Статистическое сравнение оценок.........................................................4
2. Выполнение задания......................................................................................6
2.1. Оценивание по выборкам объема n = 20...............................................6
2.2. Оценивание по выборкам объема n = 40.............................................10
2.3. Оценивание по выборкам объема n = 95.............................................14
2.4. Сравнение трех оценок по стандартному отклонению......................20
2
1. Сравнение оценок
Определения
Пусть x1, ..., xn — выборка , т.е. n независимых испытаний случайной
величины X , имеющeй функцию распределения F(x / a), зависящую от
параметра a, значение которого неизвестно. Требуется оценить значение
параметра a.
Оценкой â = (x1, ..., xn) называется функция наблюдений, используемая
для приближенного определения неизвестного параметра. Значение â оценки
является случайной величиной, поскольку (x1, ..., xn) — случайная величина
(многомерная).
Свойства оценок
1. Оценка â= (x1, ..., xn) называется состоятельной, если при n  
â  a по вероятности при любом значении a.
2. Оценка â = (x1, ..., xn) называется несмещенной, если при любом a Mâ
= M(x1, ..., xn) = a.
Состоятельность - обязательное свойство используемых оценок. Свойство
несмещенности является желательным; многие применяемые оценки
свойством несмещенности не обладают.
3. Оценка * называется оптимальной, если для неё средний квадрат
ошибки
M(â- a)2= M[*(x1, ..., xn) - a]2= min M[(x1, ..., xn) - a]2
минимален среди всех оценок {}; здесь критерием качества оценки принят
квадарт ошибки (â - a)2. В более общей ситуации, если критерием качества
служит некоторая величина L(â, a), называемая функцией потерь (или
функцией штрафа), то оптимальная оценка та, для которой минимальна
величина ML(â, a); последняя есть функциея неизвестного a и называется
функцией условного риска. Ясно, что оптимальной оценки может не
существовать (так как характеристикой является функция, а не число).
1.1. Постановка конкретной задачи.

Пример. Пусть на заводе имеется большая партия из N (тысячи)
транзисторов, используемых для сборки некоторого прибора. Выходные
параметры прибора (например, надежность, уровень шума, вероятность
выхода из режима и т.д.) зависят от обратных токов транзисторов; обратный
ток у разных экземпляров различен, и потому можно считать его случайной
величиной, причем, как известно технологам, распределённой равномерно в
диапазоне от 0 до Imax, где Imax —порог отбраковки, установленный на заводе
- изготовителе транзисторов. Следовательно, выходные параметры прибора
определяются величиной Imax. Предположим, что по каким-либо причинам
значение Imax производителю приборов неизвестно. Ясно, что в этом случае
из партии нужно случайным выбором извлечь n (сравнительно немного:
десятки) транзисторов, измерить их ток, и по измерениям оценить Imax
(неизвестный параметр а). Таким образом, возникает
3
Статистическая задача: по наблюдениям x1, ..., xn над случайной
величиной , распределённой равномерно на отрезке [0, a], оценить
неизвестный параметр a.
Сравним три способа оценивания (три оценки):
оценку, полученную методом моментов,
n
2
n
∑ xi
â1 = i=1 , (1)
оценку, полученную методом максимального правдоподобия (после
исправления смещённости),
n+1
â2 = n max xi (2)
и оценку, полученную методом порядковых статистик,
â3 = 2 x 0.5 = x(k) + x(k+1),
^
(3)
x ( k ) + x (k +1)
где x^ 0.5 = 2 — выборочная квантиль порядка 0.5, т.е.
выборочная медиана; x(k) — член вариационного ряда с номером k; здесь
полагаем n = 2k. Точность этих оценок можно сравнить теоретически и
экспериментально (статистически).
Замечание. Точность, однако, не является единственным критерием
качества оценок. Весьма важно, например, свойство устойчивости оценки к
изменению закона распределения или к засорению; в этом смысле, как
оказывается, â3 — наиболее хороша, а â2 — наименее; действительно, пусть,
например, в нашу выборку случайно попало наблюдение, резко
превосходящее все остальные (в случае с партией триодов, попался триод, не
прошедший отбраковку); значение оценки â2 резко изменится, значение â3
почти не изменится.
1.2. Теоретическое сравнение оценок

Все три оценки несмещённые, что можно проверить методами теории
вероятностей. Определим дисперсии оценок :
n 2
2 a
∑ xi
Dâ1 = D( n i=1 ) = 3n ,
n¿
n+1¿ ¿ a
2
Dâ2 = D( ¿ max x ) =i
n(n+2) ,
2
a
Dâ3 = D(x(k) + x(k+1))  n ,
4
откуда ясно, что â2 — наиболее точная оценка, а â3 — наименее.
Поясним приведенные формулы для дисперсий .
Первая :
n 2
4 4 4 na a
2
2∑
Dx i 2
nDxi 2
Dâ1 = n i=1 = n = n ⋅12 = 3⋅n .
Вторая. Определим функцию распределения статистики max xi :
{( )
n
z
n
,zÎ [ 0,a ] ¿ ¿¿¿
∏ P {xi <z } a
F(z)  P{ max xi < z} = P{x1 < z, ..., xn < z} = i=1 = ;
плотность распределения
()
n−1
n z
p(z) = F(z) = a a , z[0, a].
Далее
a
()
n−1
n+1 n z
n+1
n
∫z a a dz
Mâ 2 = M( n max xi ) = 0 = a,
2 a
( ) ()
n−1
( )
n+1 2 n 2
n+1
n
∫ z na az
2
dz
n n+2
a
Mâ22 = M 0 = ,
2
a
Dâ2 = Mâ22 — (Mâ2)2= n(n+2)
Третья. Используем теорему Крамера, согласно которой выборочная p -
1 p (1− p)
n f 2( x p )
квантиль имеет дисперсию, равную приближенно , где xp —
истинная p-квантиль, f(x) - плотность распределения наблюдений выборки. В
нашем случае (при n = 2k) статистика
0.5 (x(k) +x (k+1) )  m
является выборочной медианой (p = 0.5) , f(x0.5) = 1/a , â3 = 2m, и потому
1 1
1 2⋅2
4 2
a
n 12
Dâ3=Dm =
(a) = n .
1.3. Статистическое сравнение оценок

Далеко не всегда удается аналитически вычислить дисперсию оценки. Как
экспериментально определить, какой из оценок пользоваться? По одной
5
выборке нельзя судить о разбросе значений оценки, поскольку значение
всего одно; необходимо иметь несколько выборок, например, k = 20, (или
хотя бы 5  10), оценить разброс значений для каждой оценки и предпочесть
ту оценку (тот способ оценивания), для которой разброс меньше. Если же
выборка всего одна, то следует (если n достаточно велико) разбить её
случайным образом на несколько выборок, и по ним сравнивать качество
оценок.
Сформируем k =20 выборок из распределения R[0, a=10] объема n для
различных n=10, 40, 160 и определим разброс оценок. Характеристиками
разброса значений а1,...,аk оценки â будем считать размах
w = max ai - min ai
и среднеквадратичное отклонение (СКО)
√
k k
1 1
∑
k −1 i=1
(ai −ā )2 ā= ∑ i
k i=1 .
Sa= ,
В качестве примера в табл.1 и на рис.1 приведены результаты сравнения

трех оценок.
Таблица 1. Разброс значений оценок.
â1 â2 â3
amin 7.98 9.21 6.04
n = 10 amax 13.80 10.98 15.69
w 5.82 1.77 9.65
Sa 1.51 0.53 2.35
amin 8.59 9.77 7.02
n = 40 amax 11.35 10.24 12.89
w 2.76 0.47 5.86
Sa 0.84 0.14 1.56
amin 9.12 9.85 8.67
n = 160 amax 11.26 10.06 12.24
w 2.14 0.21 3.57
Sa 0.50 0.05 0.94
Сравнение значений размахов w и СКО Sа для 3 оценок показывает, что

оценка â2(х1, ... , хn) наиболее точна, а оценка â3(х1, ... , хn) - наименее.
Приведенные результаты экспериментального сравнения 3 способов
обработки наблюдений показывают следующее.
1. Значения оценок концентрируются в окрестности оцениваемого
параметра (проявление свойства несмещенности оценок).
2. С ростом числа наблюдений точность (величина разброса) оценок
улучшается (проявление свойства состоятельности).
3. Различные оценки различаются по величине средней ошибки, откуда
ясно, что различные способы обработки наблюдений нужно сравнивать по
6
величине среднего значения некоторого критерия качества, например,
среднего значения квадрата ошибки.
2. Выполнение задания.
2.1. Оценивание по выборкам объема n = 10
Таблица первых 8 выборок
Создание суммы, максимума и медианы.
Транспонированная
7
Результаты оценок.
Стандартные отклонения, минимум и максимум.
Сравнение размахов.
N=20 а1 а2 а3
Min 9,228932 8,378187 7,08271
Max 13,54171 10,99448 14,93569
w 4,31278 2,6163 7,85298
8
Сравнение оценок â2 и â3 графически:
Вывод: При проведение сравнения размахов выборки при n=10 и

стандартного отклонения дают понять, что оценка а2 более точна, чем а1 и
а3. По графику оценок а2 и а3, наблюдается точность оценки а2.
9
Таблица первых 8 выборок.
Создание суммы, максимума и медианы.
10
Результаты оценок
Стандартное отклонение, минимум и максимум
Сравнение размахов
N=40 а1
Min 22,61217
Max 56,9222
w 34,31
11

12
Таблица первых 8 выборок
Создание суммы, максимума и медианы
13
Результаты оценок
Стандартное отклонение, минимум и максимум
Сравнение размахов
N=95 а1 а2
Min 45,41834 51,76738
Max 136,3924 104,4922
w 90,974 52,7248
14

15
2.4. Сравнение трех оценок по стандартному отклонению
Вывод: По данным графика видно, что во всех трех случаях при n=10, n=40,
n=160 самой низкой оценкой является а2. Из этого следует что оценка а2
более точнее, чем оценки а2 и а3 в данных трех выборках.
16

3

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

3

Загружено:

Авторское право:

Доступные форматы

Министерство образования и науки Российской Федерации

ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

Кафедра Технологии Машиностроения

Выполнил студент группы ИСМбо-11-1 Власов Д.И.

Проверил доцент Казимиров Д.Ю.

1.1. Постановка конкретной задачи.

1.2. Теоретическое сравнение оценок

Вторая. Определим функцию распределения статистики max xi :

1.3. Статистическое сравнение оценок

В качестве примера в табл.1 и на рис.1 приведены результаты сравнения

Сравнение значений размахов w и СКО Sа для 3 оценок показывает, что

Таблица первых 8 выборок

Создание суммы, максимума и медианы.

Стандартные отклонения, минимум и максимум.

Min 9,228932 8,378187 7,08271

Max 13,54171 10,99448 14,93569

w 4,31278 2,6163 7,85298

Вывод: При проведение сравнения размахов выборки при n=10 и

Создание суммы, максимума и медианы.

Стандартное отклонение, минимум и максимум

Вывод: При проведение сравнения размахов выборки при n=40 и

Таблица первых 8 выборок

Создание суммы, максимума и медианы

Стандартное отклонение, минимум и максимум

Вывод: При проведение сравнения размахов выборки при n=160 и

Вам также может понравиться