Вы находитесь на странице: 1из 16

Министерство образования и науки Российской Федерации

ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

Кафедра Технологии Машиностроения

ОТЧЕТ
к лабораторной работе по дисциплине
Математическая статистика и прогнозирование
ОЦЕНКИ
наименование темы

Выполнил студент группы ИСМбо-11-1 Власов Д.И.


шифр группы подпись Фамилия И.О.

Проверил доцент Казимиров Д.Ю.


должность подпись Фамилия И.О.

Иркутск 2023 г.

1
Оглавление
1. Сравнение оценок..........................................................................................2
Определения......................................................................................................2
1.1. Постановка конкретной задачи..............................................................2
1.2. Теоретическое сравнение оценок...........................................................3
1.3. Статистическое сравнение оценок.........................................................4
2. Выполнение задания......................................................................................6
2.1. Оценивание по выборкам объема n = 20...............................................6
2.2. Оценивание по выборкам объема n = 40.............................................10
2.3. Оценивание по выборкам объема n = 95.............................................14
2.4. Сравнение трех оценок по стандартному отклонению......................20

2
1. Сравнение оценок
Определения
Пусть x1, ..., xn — выборка , т.е. n независимых испытаний случайной
величины X , имеющeй функцию распределения F(x / a), зависящую от
параметра a, значение которого неизвестно. Требуется оценить значение
параметра a.
Оценкой â = (x1, ..., xn) называется функция наблюдений, используемая
для приближенного определения неизвестного параметра. Значение â оценки
является случайной величиной, поскольку (x1, ..., xn) — случайная величина
(многомерная).
Свойства оценок
1. Оценка â= (x1, ..., xn) называется состоятельной, если при n  
â  a по вероятности при любом значении a.
2. Оценка â = (x1, ..., xn) называется несмещенной, если при любом a Mâ
= M(x1, ..., xn) = a.
Состоятельность - обязательное свойство используемых оценок. Свойство
несмещенности является желательным; многие применяемые оценки
свойством несмещенности не обладают.
3. Оценка * называется оптимальной, если для неё средний квадрат
ошибки
M(â- a)2= M[*(x1, ..., xn) - a]2= min M[(x1, ..., xn) - a]2
минимален среди всех оценок {}; здесь критерием качества оценки принят
квадарт ошибки (â - a)2. В более общей ситуации, если критерием качества
служит некоторая величина L(â, a), называемая функцией потерь (или
функцией штрафа), то оптимальная оценка та, для которой минимальна
величина ML(â, a); последняя есть функциея неизвестного a и называется
функцией условного риска. Ясно, что оптимальной оценки может не
существовать (так как характеристикой является функция, а не число).

1.1. Постановка конкретной задачи.


Пример. Пусть на заводе имеется большая партия из N (тысячи)
транзисторов, используемых для сборки некоторого прибора. Выходные
параметры прибора (например, надежность, уровень шума, вероятность
выхода из режима и т.д.) зависят от обратных токов транзисторов; обратный
ток у разных экземпляров различен, и потому можно считать его случайной
величиной, причем, как известно технологам, распределённой равномерно в
диапазоне от 0 до Imax, где Imax —порог отбраковки, установленный на заводе
- изготовителе транзисторов. Следовательно, выходные параметры прибора
определяются величиной Imax. Предположим, что по каким-либо причинам
значение Imax производителю приборов неизвестно. Ясно, что в этом случае
из партии нужно случайным выбором извлечь n (сравнительно немного:
десятки) транзисторов, измерить их ток, и по измерениям оценить Imax
(неизвестный параметр а). Таким образом, возникает

3
Статистическая задача: по наблюдениям x1, ..., xn над случайной
величиной , распределённой равномерно на отрезке [0, a], оценить
неизвестный параметр a.
Сравним три способа оценивания (три оценки):
оценку, полученную методом моментов,
n
2
n
∑ xi
â1 = i=1 , (1)
оценку, полученную методом максимального правдоподобия (после
исправления смещённости),
n+1
â2 = n max xi (2)
и оценку, полученную методом порядковых статистик,
â3 = 2 x 0.5 = x(k) + x(k+1),
^
(3)
x ( k ) + x (k +1)
где x^ 0.5 = 2 — выборочная квантиль порядка 0.5, т.е.
выборочная медиана; x(k) — член вариационного ряда с номером k; здесь
полагаем n = 2k. Точность этих оценок можно сравнить теоретически и
экспериментально (статистически).
Замечание. Точность, однако, не является единственным критерием
качества оценок. Весьма важно, например, свойство устойчивости оценки к
изменению закона распределения или к засорению; в этом смысле, как
оказывается, â3 — наиболее хороша, а â2 — наименее; действительно, пусть,
например, в нашу выборку случайно попало наблюдение, резко
превосходящее все остальные (в случае с партией триодов, попался триод, не
прошедший отбраковку); значение оценки â2 резко изменится, значение â3
почти не изменится.

1.2. Теоретическое сравнение оценок


Все три оценки несмещённые, что можно проверить методами теории
вероятностей. Определим дисперсии оценок :
n 2
2 a
∑ xi
Dâ1 = D( n i=1 ) = 3n ,

n¿
n+1¿ ¿ 2
a
Dâ2 = D( ¿ max x ) =i
n(n+2) ,
2
a
Dâ3 = D(x(k) + x(k+1))  n ,

4
откуда ясно, что â2 — наиболее точная оценка, а â3 — наименее.
Поясним приведенные формулы для дисперсий .
Первая :
n 2
4 4 4 na a
2
2∑
Dx i 2
nDxi 2
Dâ1 = n i=1 = n = n ⋅12 = 3⋅n .

Вторая. Определим функцию распределения статистики max xi :

{( )
n
z
n
,zÎ [ 0 ,a] ¿ ¿¿¿
∏ P {xi <z} a
F(z)  P{ max xi < z} = P{x1 < z, ..., xn < z} = i=1 = ;
плотность распределения

()
n−1
n z
p(z) = F(z) = a a , z[0, a].
Далее
a

()
n−1
n+1 n z
n+1
n
∫z a a dz
Mâ 2 = M( n max xi ) = 0 = a,

2 a

( ) ()
n−1

( )
2
n+1
n
∫ z na az
2
dz n+1 n 2
n n+2
a
Mâ22 = M 0 = ,
2
a
Dâ2 = Mâ22 — (Mâ2)2= n(n+2)
Третья. Используем теорему Крамера, согласно которой выборочная p -
1 p (1− p)
n f 2( x p )
квантиль имеет дисперсию, равную приближенно , где xp —
истинная p-квантиль, f(x) - плотность распределения наблюдений выборки. В
нашем случае (при n = 2k) статистика
0.5 (x(k) +x (k+1) )  m
является выборочной медианой (p = 0.5) , f(x0.5) = 1/a , â3 = 2m, и потому
1 1
1 ⋅
2 2
4 a2
n 1 2
Dâ3=Dm =
(a) = n .

1.3. Статистическое сравнение оценок


Далеко не всегда удается аналитически вычислить дисперсию оценки. Как
экспериментально определить, какой из оценок пользоваться? По одной

5
выборке нельзя судить о разбросе значений оценки, поскольку значение
всего одно; необходимо иметь несколько выборок, например, k = 20, (или
хотя бы 5  10), оценить разброс значений для каждой оценки и предпочесть
ту оценку (тот способ оценивания), для которой разброс меньше. Если же
выборка всего одна, то следует (если n достаточно велико) разбить её
случайным образом на несколько выборок, и по ним сравнивать качество
оценок.
Сформируем k =20 выборок из распределения R[0, a=10] объема n для
различных n=10, 40, 160 и определим разброс оценок. Характеристиками
разброса значений а1,...,аk оценки â будем считать размах
w = max ai - min ai
и среднеквадратичное отклонение (СКО)


k k
1 1

k −1 i=1
(ai −ā )2 ā= ∑ ˆ i
k i =1 .
Sa= ,

В качестве примера в табл.1 и на рис.1 приведены результаты сравнения


трех оценок.
Таблица 1. Разброс значений оценок.
â1 â2 â3
amin 7.98 9.21 6.04
n = 10 amax 13.80 10.98 15.69
w 5.82 1.77 9.65
Sa 1.51 0.53 2.35
amin 8.59 9.77 7.02
n = 40 amax 11.35 10.24 12.89
w 2.76 0.47 5.86
Sa 0.84 0.14 1.56
amin 9.12 9.85 8.67
n = 160 amax 11.26 10.06 12.24
w 2.14 0.21 3.57
Sa 0.50 0.05 0.94

Сравнение значений размахов w и СКО Sа для 3 оценок показывает, что


оценка â2(х1, ... , хn) наиболее точна, а оценка â3(х1, ... , хn) - наименее.
Приведенные результаты экспериментального сравнения 3 способов
обработки наблюдений показывают следующее.
1. Значения оценок концентрируются в окрестности оцениваемого
параметра (проявление свойства несмещенности оценок).
2. С ростом числа наблюдений точность (величина разброса) оценок
улучшается (проявление свойства состоятельности).
3. Различные оценки различаются по величине средней ошибки, откуда
ясно, что различные способы обработки наблюдений нужно сравнивать по

6
величине среднего значения некоторого критерия качества, например,
среднего значения квадрата ошибки.

2. Выполнение задания.
2.1. Оценивание по выборкам объема n = 10

Таблица первых 11 выборок

Создание суммы, максимума и медианы.

Транспонированная

7
Результаты оценок.

Стандартные отклонения, минимум и максимум.

Сравнение размахов.

N=10 а1 а2 а3

Min 6,709378 8,001182 5,884521

Max 12,99278 10,99113 13,72784

w 6,2834 2,98995

8
Сравнение оценок â2 и â3 графически:

Вывод: Сравнение размахов выборки при n=10 и стандартного отклонения


показывают, что оценка а2 более точна, чем оценка а1 и а3. Из графика
оценок а2 и а3, так же наблюдается точность оценки а2.

9
2.2. Оценивание по выборкам объема n = 40
Таблица первых 11 выборок.

Создание суммы, максимума и медианы.

Транспонированная

10
Результаты оценок

Стандартное отклонение, минимум и максимум

Сравнение размахов
N=40 а1
Min 8,397547

Max 11,4613

w 3,06376

11
Сравнение оценок â2 и â3 графически:

Вывод: Сравнение размахов выборки при n=40 и стандартного отклонения


показывают, что оценка а2, точнее, чем а1 и а3. Из графика оценок а2 и а3,
так же видно выше упомянутое.

12
2.3. Оценивание по выборкам объема n = 160

Таблица первых 11 выборок

Создание суммы, максимума и медианы

Транспонированная

13
Результаты оценок

Стандартное отклонение, минимум и максимум

Сравнение размахов

N=160 а1 а2
9,333502 10,84982
Min
10,66371 10,9943
Max

w 1,33021 0,14448

14
Сравнение оценок â2 и â3 графически:

Вывод: Сравнение размахов выборки при n=160 и стандартного отклонения


показывают, что оценка а2, точнее, чем а1 и а3. Из графика оценок а2 и а3,
так же наблюдается точность оценки а2.

15
2.4. Сравнение трех оценок по стандартному отклонению

Вывод: из графика видно, что во всех трех случаях при n=10, n=40, n=160
самой низкой оценкой является а2. От суда следует что оценка а2 более
точнее, чем оценки а2 и а3 в данных трех выборках. С ростом числа
наблюдений точность (величина разброса) оценок улучшается (проявление
свойства состоятельности). Imax=10,99.

16

Вам также может понравиться