Вы находитесь на странице: 1из 16

Министерство образования и науки Российской Федерации

ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

Кафедра Технологии Машиностроения

ОТЧЕТ
к лабораторной работе по дисциплине
Математическая статистика и прогнозирование
ОЦЕНКИ
наименование темы

Выполнил студент группы ИСМбо-11-1 Власов Д.И.


шифр группы подпись Фамилия И.О.

Проверил доцент Казимиров Д.Ю.


должность подпись Фамилия И.О.

Иркутск 2023 г.

1
Оглавление
1. Сравнение оценок..........................................................................................2
Определения......................................................................................................2
1.1. Постановка конкретной задачи..............................................................2
1.2. Теоретическое сравнение оценок...........................................................3
1.3. Статистическое сравнение оценок.........................................................4
2. Выполнение задания......................................................................................6
2.1. Оценивание по выборкам объема n = 20...............................................6
2.2. Оценивание по выборкам объема n = 40.............................................10
2.3. Оценивание по выборкам объема n = 95.............................................14
2.4. Сравнение трех оценок по стандартному отклонению......................20

2
1. Сравнение оценок
Определения
Пусть x1, ..., xn — выборка , т.е. n независимых испытаний случайной
величины X , имеющeй функцию распределения F(x / a), зависящую от
параметра a, значение которого неизвестно. Требуется оценить значение
параметра a.
Оценкой â = (x1, ..., xn) называется функция наблюдений, используемая
для приближенного определения неизвестного параметра. Значение â оценки
является случайной величиной, поскольку (x1, ..., xn) — случайная величина
(многомерная).
Свойства оценок
1. Оценка â= (x1, ..., xn) называется состоятельной, если при n  
â  a по вероятности при любом значении a.
2. Оценка â = (x1, ..., xn) называется несмещенной, если при любом a Mâ
= M(x1, ..., xn) = a.
Состоятельность - обязательное свойство используемых оценок. Свойство
несмещенности является желательным; многие применяемые оценки
свойством несмещенности не обладают.
3. Оценка * называется оптимальной, если для неё средний квадрат
ошибки
M(â- a)2= M[*(x1, ..., xn) - a]2= min M[(x1, ..., xn) - a]2
минимален среди всех оценок {}; здесь критерием качества оценки принят
квадарт ошибки (â - a)2. В более общей ситуации, если критерием качества
служит некоторая величина L(â, a), называемая функцией потерь (или
функцией штрафа), то оптимальная оценка та, для которой минимальна
величина ML(â, a); последняя есть функциея неизвестного a и называется
функцией условного риска. Ясно, что оптимальной оценки может не
существовать (так как характеристикой является функция, а не число).

1.1. Постановка конкретной задачи.


Пример. Пусть на заводе имеется большая партия из N (тысячи)
транзисторов, используемых для сборки некоторого прибора. Выходные
параметры прибора (например, надежность, уровень шума, вероятность
выхода из режима и т.д.) зависят от обратных токов транзисторов; обратный
ток у разных экземпляров различен, и потому можно считать его случайной
величиной, причем, как известно технологам, распределённой равномерно в
диапазоне от 0 до Imax, где Imax —порог отбраковки, установленный на заводе
- изготовителе транзисторов. Следовательно, выходные параметры прибора
определяются величиной Imax. Предположим, что по каким-либо причинам
значение Imax производителю приборов неизвестно. Ясно, что в этом случае
из партии нужно случайным выбором извлечь n (сравнительно немного:
десятки) транзисторов, измерить их ток, и по измерениям оценить Imax
(неизвестный параметр а). Таким образом, возникает

3
Статистическая задача: по наблюдениям x1, ..., xn над случайной
величиной , распределённой равномерно на отрезке [0, a], оценить
неизвестный параметр a.
Сравним три способа оценивания (три оценки):
оценку, полученную методом моментов,
n
2
n
∑ xi
â1 = i=1 , (1)
оценку, полученную методом максимального правдоподобия (после
исправления смещённости),
n+1
â2 = n max xi (2)
и оценку, полученную методом порядковых статистик,
â3 = 2 x 0.5 = x(k) + x(k+1),
^
(3)
x ( k ) + x (k +1)
где x^ 0.5 = 2 — выборочная квантиль порядка 0.5, т.е.
выборочная медиана; x(k) — член вариационного ряда с номером k; здесь
полагаем n = 2k. Точность этих оценок можно сравнить теоретически и
экспериментально (статистически).
Замечание. Точность, однако, не является единственным критерием
качества оценок. Весьма важно, например, свойство устойчивости оценки к
изменению закона распределения или к засорению; в этом смысле, как
оказывается, â3 — наиболее хороша, а â2 — наименее; действительно, пусть,
например, в нашу выборку случайно попало наблюдение, резко
превосходящее все остальные (в случае с партией триодов, попался триод, не
прошедший отбраковку); значение оценки â2 резко изменится, значение â3
почти не изменится.

1.2. Теоретическое сравнение оценок


Все три оценки несмещённые, что можно проверить методами теории
вероятностей. Определим дисперсии оценок :
n 2
2 a
∑ xi
Dâ1 = D( n i=1 ) = 3n ,

n¿
n+1¿ ¿ a
2

Dâ2 = D( ¿ max x ) =i
n(n+2) ,
2
a
Dâ3 = D(x(k) + x(k+1))  n ,

4
откуда ясно, что â2 — наиболее точная оценка, а â3 — наименее.
Поясним приведенные формулы для дисперсий .
Первая :
n 2
4 4 4 na a
2
2∑
Dx i 2
nDxi 2
Dâ1 = n i=1 = n = n ⋅12 = 3⋅n .

Вторая. Определим функцию распределения статистики max xi :

{( )
n
z
n
,zÎ [ 0,a ] ¿ ¿¿¿
∏ P {xi <z } a
F(z)  P{ max xi < z} = P{x1 < z, ..., xn < z} = i=1 = ;
плотность распределения

()
n−1
n z
p(z) = F(z) = a a , z[0, a].
Далее
a

()
n−1
n+1 n z
n+1
n
∫z a a dz
Mâ 2 = M( n max xi ) = 0 = a,

2 a

( ) ()
n−1

( )
n+1 2 n 2
n+1
n
∫ z na az
2
dz
n n+2
a
Mâ22 = M 0 = ,
2
a
Dâ2 = Mâ22 — (Mâ2)2= n(n+2)
Третья. Используем теорему Крамера, согласно которой выборочная p -
1 p (1− p)
n f 2( x p )
квантиль имеет дисперсию, равную приближенно , где xp —
истинная p-квантиль, f(x) - плотность распределения наблюдений выборки. В
нашем случае (при n = 2k) статистика
0.5 (x(k) +x (k+1) )  m
является выборочной медианой (p = 0.5) , f(x0.5) = 1/a , â3 = 2m, и потому
1 1
1 2⋅2
4 2
a
n 12
Dâ3=Dm =
(a) = n .

1.3. Статистическое сравнение оценок


Далеко не всегда удается аналитически вычислить дисперсию оценки. Как
экспериментально определить, какой из оценок пользоваться? По одной

5
выборке нельзя судить о разбросе значений оценки, поскольку значение
всего одно; необходимо иметь несколько выборок, например, k = 20, (или
хотя бы 5  10), оценить разброс значений для каждой оценки и предпочесть
ту оценку (тот способ оценивания), для которой разброс меньше. Если же
выборка всего одна, то следует (если n достаточно велико) разбить её
случайным образом на несколько выборок, и по ним сравнивать качество
оценок.
Сформируем k =20 выборок из распределения R[0, a=10] объема n для
различных n=10, 40, 160 и определим разброс оценок. Характеристиками
разброса значений а1,...,аk оценки â будем считать размах
w = max ai - min ai
и среднеквадратичное отклонение (СКО)


k k
1 1

k −1 i=1
(ai −ā )2 ā= ∑ ˆ i
k i=1 .
Sa= ,

В качестве примера в табл.1 и на рис.1 приведены результаты сравнения


трех оценок.
Таблица 1. Разброс значений оценок.
â1 â2 â3
amin 7.98 9.21 6.04
n = 10 amax 13.80 10.98 15.69
w 5.82 1.77 9.65
Sa 1.51 0.53 2.35
amin 8.59 9.77 7.02
n = 40 amax 11.35 10.24 12.89
w 2.76 0.47 5.86
Sa 0.84 0.14 1.56
amin 9.12 9.85 8.67
n = 160 amax 11.26 10.06 12.24
w 2.14 0.21 3.57
Sa 0.50 0.05 0.94

Сравнение значений размахов w и СКО Sа для 3 оценок показывает, что


оценка â2(х1, ... , хn) наиболее точна, а оценка â3(х1, ... , хn) - наименее.
Приведенные результаты экспериментального сравнения 3 способов
обработки наблюдений показывают следующее.
1. Значения оценок концентрируются в окрестности оцениваемого
параметра (проявление свойства несмещенности оценок).
2. С ростом числа наблюдений точность (величина разброса) оценок
улучшается (проявление свойства состоятельности).
3. Различные оценки различаются по величине средней ошибки, откуда
ясно, что различные способы обработки наблюдений нужно сравнивать по

6
величине среднего значения некоторого критерия качества, например,
среднего значения квадрата ошибки.

2. Выполнение задания.
2.1. Оценивание по выборкам объема n = 10

Таблица первых 8 выборок

Создание суммы, максимума и медианы.

Транспонированная

7
Результаты оценок.

Стандартные отклонения, минимум и максимум.

Сравнение размахов.

N=20 а1 а2 а3

Min 9,228932 8,378187 7,08271

Max 13,54171 10,99448 14,93569

w 4,31278 2,6163 7,85298

8
Сравнение оценок â2 и â3 графически:

Вывод: При проведение сравнения размахов выборки при n=10 и


стандартного отклонения дают понять, что оценка а2 более точна, чем а1 и
а3. По графику оценок а2 и а3, наблюдается точность оценки а2.

9
2.2. Оценивание по выборкам объема n = 40
Таблица первых 8 выборок.

Создание суммы, максимума и медианы.

Транспонированная

10
Результаты оценок

Стандартное отклонение, минимум и максимум

Сравнение размахов
N=40 а1
Min 22,61217

Max 56,9222

w 34,31

11
Сравнение оценок â2 и â3 графически:

Вывод: При проведение сравнения размахов выборки при n=40 и


стандартного отклонения дают понять, что оценка а2 более точна, чем а1 и
а3. По графику оценок а2 и а3, наблюдается точность оценки а2.

12
2.3. Оценивание по выборкам объема n = 95

Таблица первых 8 выборок

Создание суммы, максимума и медианы

Транспонированная

13
Результаты оценок

Стандартное отклонение, минимум и максимум

Сравнение размахов
N=95 а1 а2
Min 45,41834 51,76738
Max 136,3924 104,4922
w 90,974 52,7248

14
Сравнение оценок â2 и â3 графически:

Вывод: При проведение сравнения размахов выборки при n=160 и


стандартного отклонения дают понять, что оценка а2 более точна, чем а1 и
а3. По графику оценок а2 и а3, наблюдается точность оценки а2.

15
2.4. Сравнение трех оценок по стандартному отклонению

Вывод: По данным графика видно, что во всех трех случаях при n=10, n=40,
n=160 самой низкой оценкой является а2. Из этого следует что оценка а2
более точнее, чем оценки а2 и а3 в данных трех выборках.

16

Вам также может понравиться