Академический Документы
Профессиональный Документы
Культура Документы
интервал со случайными границами a ; a , который с
* *
заданной вероятностью γ накрывает неизвестное истинное зна-
чение параметра a . При этом должно выполняться равенство:
P a* a a* .
Интервал a a a называют доверительным
* *
1
I. Вычисление точечных оценок
1. Среднее арифметическое
Среднее арифметическое значение является статистиче-
ской оценкой математического ожидания µ.
Для несгруппированной выборки объёма n:
x1 , x2 , , xn среднее арифметическое равно
1 n
x xi
n i 1
В MS Excel для вычисления выборочного среднего несгруппиро-
ванной выборки используется функция (категория Статисти-
ческие): СРЗНАЧ(число1;число2; …), где: число1; число2; …
─ от 1 до 30 аргументов, для которых вычисляется среднее.
2
Пример 2. Найти выборочное среднее для выборки,
представленной статистическим рядом:
xi -2 -1 0 1 2 3 4 5 6 7
mi 1 2 3 4 4 5 5 6 7 5
Последовательность выполнения
1. Ввести значения вариант xi в ячейки С2:С11, а значения
соответствующих частот mi в ячейки D2:D11.
2. В ячейку C12 ввести формулу
=СУММПРОИЗВ(С2:С11;D2:D11)/СУММ(D2:D11).
Функция СУММ() находится в категории Математиче-
ские. В ячейке С12 появится результат: 3,571429.
3
Для интервального статистического ряда сначала определяют
1
номер медианы как полусумму частот iMe mi . Затем от-
2 i
считывают накопленные частоты и находят первый интервал
xk 1 , xk , для которого накопленные частоты mkнак. не меньше
номера медианы i Me . Медиана определяется с помощью интер-
поляционной формулы:
1
mi mkнак1.
Me xk 1 xk xk 1
2 i
mk
В MS Excel для вычисления медианы дискретного ряда при-
меняется функция (категория Статистические):
МЕДИАНА(число1;число2; …),
Пример 3.
4
Пример 4.
Найти медиану для интервального статистического ряда, ко-
торый показывает распределение предприятий региона по чис-
ленности работников.
№ интервала Число работников Число предприятий
1 1─10 23
2 11─30 52
3 31─60 60
4 61─100 34
5 101─150 27
6 151─250 11
7 251─500 8
Последовательность выполнения
1. Ввести данные в диапазоне А1:D9.
2. В ячейку D10 ввести формулу =СУММ(D3:D9)/2.
3. В ячейку E3 ввести формулу =D3, а в ячейку E4 ─ фор-
мулу =E3+D4.
4. Протянуть ячейку Е4 маркером заполнения до Е9. Меди-
анным интервалом является интервал № 3.
5. В ячейку D11 ввести формулу =B5+(C5-B5)*(D10-E4)/D5.
Появится результат ─ значение медианы: 46,25.
5
3 Выборочная и исправленная выборочная дисперсии
Оценками характеристик рассеивания являются выбо-
рочная дисперсия и выборочное среднеквадратическое от-
клонение.
Для несгруппированной выборки:
Выборочная дисперсия определяется по формуле:
Dв
1 n
n i 1
1 n
xi x xi2 x ,
2
n i 1
2
s2
1 n
n 1 i1
2
xi x
1 n 2
n 1 i1
xi
n 2
n 1
x .
6
Среднеквадратическое (стандартное) отклонение вычисляет-
ся по формулам:
в Dв , s s 2 .
В MS Excel среднеквадратическое отклонение вычисляется с
помощью функций СТАНДОТКЛОНП ( в ) и СТАНДОТ-
КЛОН (отвечает значению s).
Пример 5.
Для условий примеров 1 и 2 вычислить дисперсии.
4 Асимметрия и эксцесс
В качестве оценки отклонения экспериментального рас-
пределения от нормального используются выборочные коэф-
фициенты асимметрии и эксцесса, которые вычисляются по
формулам:
выборочный коэффициент асимметрии
3
n
n x x
As i
n 1n 2 i 1 s
выборочный коэффициент эксцесса
nn 1 3n 1
4
n
xi x
2
n 1n 2n 3
Ex
s n 2n 3
i 1
Для симметричных распределений коэффициент асим-
метрии равен нулю. Знак асимметрии показывает скос распре-
деления относительно среднего: «+» указывает на то, что справа
от среднего сосредоточено больше элементов выборки, чем сле-
ва от среднего значения. «-» указывает на отклонение распреде-
ления в сторону отрицательных значений.
В MS Excel для вычисления асимметрии предназначена функ-
ция СКОС(Массив), где Массив ─ диапазон ячеек с выбороч-
ными данными, для которых вычисляется асимметрия.
Эксцесс характеризует относительную остроконечность или
сглаженность распределения по сравнению с нормальным. По-
7
ложительный эксцесс обозначает относительно остроконечное
распределение. Отрицательный эксцесс обозначает относитель-
но сглаженное распределение. Для нормального распределения
эксцесс равен нулю.
В MS Excel эксцесс вычисляет функция ЭКСЦЕСС(Массив),
где Массив ─ диапазон ячеек, содержащий ряд.
Функции СКОС и ЭКСЦЕСС применимы ТОЛЬКО
к несгруппированной выборке.
8
В MS Excel для вычисления величины z предназначена
n
функция (категория Статистические):
ДОВЕРИТ(Альфа;Станд_откл;Размер),
Пример 7 .
По выборке объёма n=50 найдено значение выборочного
среднего x =3,5. Стандартное отклонение равно =2,5. Постро-
ить доверительный интервал для генерального среднего с уров-
нем надёжности 95%.
Последовательность выполнения
1. Вычислить уровень значимости:
1 1 0,95 0,05 5% .
2. Ввести в ячейку А1 формулу =ДОВЕРИТ(0,05;2,5;50). В
А1 появится результат: 0,693.
3. Вычислить границы доверительного интервала:
9
2) Интервальной оценкой математического ожидания μ
нормального распределения при неизвестной дисперсии 2
называется интервал:
x ; x , t
s
,
n
удовлетворяющий равенству: P x x ,
где γ ─ заданная доверительная вероятность, μ ─ истинное ма-
тематическое ожидание, x ─ точечная оценка математического
ожидания, s 2 ─ исправленная выборочная дисперсия; n ─ объём
t
10
2. Вычислить границы доверительного интервала:
s 2 ,5
t 2 ,093 1,17 ;
n 20
x 3,5 1,17 2 ,33 ;
x 3,5 1,17 4 ,67 .
Доверительный интервал для генерального среднего имеет
вид:
2,33 4,67 .
нове соотношения
n 1s 2 n 1s 2 ,
P 2
2
2
12
где: γ ─ заданная доверительная вероятность, s 2 ─ исправлен-
ная выборочная дисперсия; n ─ объём выборки; 2 и 1 опре-
2 2
деляются из условий
1 1
P 2 12
2
, P 2
2 2
2
Для вычисления 1 и 2 используется функция
2 2
11
1 1 0,95 1 1 0,95
0,975 , 0,025 ,
2 2 2 2
k 25 1 24 .
2. Ввести в ячейки А1 и А2 соответственно формулы
=ХИ2ОБР(0,975;24), = ХИ2ОБР(0,025;24).
В ячейках появятся результаты: 12,40 и 39,36,
Т.е. 1 12 ,40 и 2 39 ,36 .
2 2
12
‒ Исправленное среднее квадратическое отклонение
1 n
S
n 1 i 1xi x 2
‒ исправленную выборочную дисперсию
1 n
S2
n 1 i 1xi x 2
‒ Эксцесс
nn 1 xi x 3n 1
4 2
n
k
n 1n 2n 3 i 1 n 2n 3
‒ Асимметрию
3
xi x
n
n
As
n 1n 2 i 1
‒ размах выборки
R xmax xmin
‒ минимальное значение выборки
‒ максимальное значение выборки
‒ сумму всех значений выборки
‒ объём выборки
‒ наибольшее значение признака, имеющее разность с по-
рядком единиц
‒ наименьшее значение признака, имеющее разность с по-
рядком единиц
‒ уровень надёжности (предельную ошибку выборки)
Уровень надёжности. Флажок устанавливается в том случай,
когда необходимо вычислить доверительный интервал для ма-
тематического ожидания, соответствующий заданной довери-
тельной вероятности (указывается в поле справа в процентах). В
таблице результатов появится число, равное половине длины
доверительного интервала.
x t x
13
К-наименьший и К-наибольший. Если флажки установлены,
то появляются элементы упорядоченной выборки, расположен-
ные на K-ом месте от её начала и от конца.
14
S S
x t x t ,
n n
где: число t определяется с помощью распределения Стъюдента
с k = n 1 степенями свободы; доверительная вероят-
ность(уровень надёжности).
Для вычисления значения t используем функцию
СТЪЮДРАСПОБР(вероятность; Степени_свободы).
Рассчитаем вероятность уровень значимости α = 1 . Для
надёжности 95% α = 1 0,95 = 0,05. Вызовем функцию с аргу-
ментами:
=СТЪЮДРАСПОБР(0,05; 29). Получим результат: 2,045.
Найдём границы доверительного интервала:
S 0,61
t 2,045 0,23
n 30
(Такое же значение получается в инструменте «Описательная
статистика» при вычислении параметра Уровень надёжности).
S S
x t 3,17 0,23 2,94 ; x t 3,17 0,23 3,40
n n
Таким образом, доверительный интервал имеет вид:
2,94 3,40 .
15