Вы находитесь на странице: 1из 6

Описательная статистика. Распределения случайных величин.

Теоретические распределения случайных величин и их свойства: биномиальное распределение, распреде-


ление Пуассона, нормальное распределение.
Центральная предельная теорема. Закон больших чисел. Определение достаточного объема выборки.

Случайной величиной называют переменную величину, которая в одних и тех же


условиях принимает различные числовые значения, зависящие от случая. Случайная ве-
личина называется дискретной, если она может принимать только целые значения. Слу-
чайная величина, принимающая все значения из некоторого промежутка, называется не-
прерывной случайной величиной. Счетные признаки, варьирующие дискретно, отно-
сятся к дискретным случайным величинам, а мерные признаки, варьирующие непре-
рывно, – к непрерывным случайным величинам.
Значения случайных величин невозможно предугадать даже при полностью из-
вестных условиях эксперимента, в котором они измеряются. Можно лишь указать ве-
роятности того, что случайная величина принимает то или иное значение или попадает
в то или иное множество. Но, зная распределения вероятностей этих случайных величин,
можно сделать выводы о событиях, в которых участвуют случайные величины.
Законом распределения случайной дискретной величины (X) называется вся-
кое соотношение, устанавливающее связь между возможными значениями случайной ве-
личины (x1, x2,… xn) и соответствующими им вероятностями (р1, р2,… рn). Простейшей
формой задания этого закона является таблица:

Таблица 4 – таблица распределения случайной величины

X x1 x2 x3 … xn
Р(X) p1 p2 p3 … pn

Такая таблица называется таблицей распределения (вероятностей) случайной ве-


личины X. При этом события (x1, x2,… xn) образуют полную группу, что означает:
𝒏

∑ 𝒑𝒊 = 𝟏
𝒊=𝟏

Про случайную величину X в таком случае говорят, что она подчинена данному
закону распределения.
Пример 1. Из ящика, в котором находятся незабудки с синими и голубыми лепест-
ками, наугад достают по 1 растению. Найти закон распределения случайной величины
Х – числа появлений цветков с синими лепестками за одно испытание.
2
В данном опыте возможно 2 равновозможных исхода за одно испытание: (Г, С)
цветок с синими лепестками может появиться (x1) или не появиться (x2). Следовательно,
случайная величина Х может принимать только 2 значения: x1 = 1; x2 = 0. Вероятности:
Р(X=0) = ½ = 0,5; Р(X=1) = ½ = 0,5; р1 = 0,5; р2 = 0,5. Закон распределения:
X x1 x2
Р(X) 0,5 0,5

Пример 2. Из ящика, в котором находятся незабудки с синими и голубыми лепест-


ками, наугад достают по 2 растения. Найти закон распределения случайной величины Х
– числа появлений цветков с синими лепестками за одно испытание.
В данном опыте может осуществиться 4 равновозможных исхода за одно испыта-
ние: (СС, СГ, ГС, ГГ), цветок с синими лепестками может появиться 1 раз (x1), появиться
2 раза (x2) или не появиться совсем (x3). Следовательно, случайная величина Х может
принимать 3 значения: x1 = 1; x2 = 2; x3 = 0. Вероятности: Р(X=1) = ¼ = 0,25; Р(X=2) =
2/4 = ½ = 0,5; Р(X=0) = ¼ = 0,25; р1 = 0,25; р2 = 0,5; р3 = 0,25. Закон распределения:
X x1 x2 x3
Р(X) 0,25 0,5 0,25

Пример 3. Из ящика, в котором находятся незабудки с синими и голубыми лепест-


ками, наугад достают по 3 растения. Найти закон распределения случайной величины Х
– числа появлений цветков с синими лепестками за одно испытание.
В данном опыте может осуществиться 8 равновозможных исхода за одно испыта-
ние: (ССС, ССГ, СГГ, СГС, ГСС, ГСГ, ГГС, ГГГ) цветок с синими лепестками может
появиться 1 раз (x1), появиться 2 раза (x2), появиться 3 раза (x3) или не появиться вообще
(x4). Следовательно, случайная величина может принимать 4 значения: x1 = 1; x2 = 2; x3
= 3; x4 = 0. Вероятности: Р(X=0) = 1/8 = 0,125; Р(X=1) = 3/8 = 0,375; Р(X=2) = 3/8 = 0,375;
Р(X=3) = 1/8 = 0,125; р1 = 0,125; р2 = 0,375; р3 = 0,375; р4 = 0,125. Закон распределения:
X x1 x2 x3 x4
Р(X) 0,125 0,375 0,375 0,125

Большинство применяемых на практике распределений являются дискретными


или непрерывными. К дискретным относятся распределение Бернулли, биноминальное
и пуассоновское распределения.
Распределение Бернулли используется для того, чтобы определить вероятность
успешного исхода при одном испытании. Биноминальное распределение используется
для определения вероятности появления определенного числа успешных исходов при n
независимых испытаниях. Распределение Пуассона описывает число событий, происхо-
дящих в одинаковых промежутках времени или на одинаковых площадях, при условии,
3
что события происходят независимо друг от друга. Биноминальное распределение и рас-
пределение Пуассона для случайной величины Х можно рассчитать по таблицам.
К непрерывным распределениям относят нормальное, а также, связанные с нор-
мальным распределения: Стьюдента, 2 – квадрат и F – распределение Фишера.

Биномиальное распределение
Пусть производится n последовательных независимых одинаковых испытаний, в
каждом из которых может наступить или не наступить событие А. Вероятность наступ-
ления события А в каждом испытании – р, а события Ā – q = 1 – р.
Обозначим Рn(m) = р (событие А наступило m раз в n испытаниях). Тогда

𝐏𝐧 (𝐦) = 𝐂𝐧𝐦 𝐩𝐦 𝐪𝐧−𝐦

где 𝐂𝐧𝐦 – число сочетаний из m элементов по n, или биномиальный коэффициент.

𝒏!
𝐂𝐧𝐦 =
𝒎! (𝒏 − 𝒎)!

Это и есть биномиальный закон распределения вероятностей.


Пример 4. Из ящика, в котором находятся незабудки (100) с синими (50) и голу-
быми (50) лепестками, наугад достают по 1 растению (р = q = 0,5). Какова вероятность,
что в 10 испытаниях 5 раз произойдет событие А – появится цветок с синими лепест-
ками?

5
10! 10 ∙ 9 ∙ 8 ∙ 7 ∙ 6 ∙ 5 ∙ 4 ∙ 3 ∙ 2 10 ∙ 9 ∙ 8 ∙ 7 ∙ 6 3 ∙ 2 ∙ 7 ∙ 6
𝐶10 = = = = = 252
5! (10 − 5)! 5∙4∙3∙2∙5∙4∙3∙2 5∙4∙3∙2 1

pmqn-m = 0,55∙0,55 = 0,00098; 𝐏𝐧 (𝐦) = 252 ∙ 0,000978 = 0,246

Распределение Пуассона
Если случайная величина X распределена по закону Пуассона, тогда вероятность
того, что при n независимых испытаниях она примет определенное значение m, выража-
ется формулой
𝒂𝐦
𝐏𝐧 (𝐦) = ∙ 𝐞−𝐚 , (𝐦 = 𝟎, 𝟏, 𝟐 … 𝐧), где a = np,
𝐦!

где а - некоторая положительная величина, называемая параметром закона Пуассона.


Пример 5. Вероятность появления в популяции незабудок с синими и голубыми
лепестками цветка с сиреневыми лепестками составляет р = 0,004. Найти вероятность
того, что среди 1000 наугад взятых растений окажется 5 цветков с сиреневыми лепест-
ками.

n = 1000, p = 0,004; а = 0,004∙1000 = 4.


4
45 1024
Р1000(5) = ∙ 𝑒 −4 = ∙ 0,018 = 0,156;
5! 120

Нормальное распределение
В любом более или менее симметричном вариационном ряду заметна одна харак-
терная особенность – накапливание вариант в центральных классах и постепенное убы-
вание их численности по мере удаления от центра ряда. Таким образом, прослеживается
широко распространенная в природе закономерность: в статической совокупности боль-
шинство вариант оказывается среднего или близкого к нему размера, чем дальше они
отстоят от среднего значения, тем реже встречаются в данной совокупности. Такая зако-
номерность описывается законом нормального распределения.
Вероятность Р(xi) любого значения xi непрерывно распределяющейся случайной
величины Х находится в интервале от х до x + dx и определяется функцией Гаусса-
Лапласа (нормальное распределение):
1 x  2
1  ( i )
P( xi )  e 2 
dx
  2
где dx – малая величина, определяющая ширину интервала,  - стандартное отклонение,
характеризующее степень рассеяния значений xi случайной величины Х вокруг генераль-
ной средней .
Графически эта функция выражается в виде кривой вероятности называемой нор-
мальной кривой. Положение кривой полностью определяется двумя параметрами гене-
ральной средней величиной  и стандартным отклонением . В зависимости от величины
 форма нормальной кривой может быть пологой (при относительно большой величине
) или крутой (при небольшой величине ). Но во всех случаях нормальная кривая
строго симметрична относительно центра распределения и сохраняет правильную коло-
колообразную форму. Если  приравнять к 1, то нормальная кривая будет иметь посто-
янную (стандартизированную) форму (ymax = 0,3989) (рис. 7).
Для нормального распределения характерно совпадение по абсолютной величине
средней арифметической, медианы и моды. Равенство между этими показателями ука-
зывает на нормальность данного распределения. Для кривой нормального распределения
характерно, что на равные интервалы, измеряемые стандартным отклонением () от
центра распределения, приходится равное число вариант. Вероятность отклонения лю-
бой варианты в ту или другую сторону от средней  на , 2 и 3 следующая:
-  < | xi - x | < +  P = 0,6827;
- 2 < | xi - x | < + 2 P = 0,9545;
5
- 3 < | xi - x | < + 3 P = 0,9973;
Следовательно, с вероятностью Р = 0,6827 можно утверждать, что наугад отобран-
ная из нормально распределяющейся совокупности варианта не отклонится от средней 
больше чем на ± . Вероятность случайного отклонения от средней  не более чем на
±3 равна P=0,9973, это означает, что 99,7% от всех вариант нормально распределяю-
щейся совокупности находится в пределах 3. Этот важный вывод известен в биомет-
рии как правило плюс—минус трех сигм (рис. 7).

Рис. 7. График нормального распределения

Закон больших чисел и центральная предельная теорема


Практика изучения случайных явлений показывает, что хотя результаты отдель-
ных наблюдений, проведенных в одинаковых условиях, могут сильно отличаться, сред-
ние результаты для достаточно большого числа наблюдений устойчивы и слабо зави-
сят от результатов отдельных наблюдений. Теоретическим обоснованием этого свойства
случайных явлений является закон больших чисел, который утверждает, что при опре-
деленных, достаточно общих условиях, с увеличением числа случайных величин (объ-
ема выборки) их выборочное среднее арифметическое стремится к генеральной средней
величине и перестает быть случайным.
Центральная предельная теорема утверждает, что всегда, когда случайная ве-
личина образуется в результате сложения большого числа независимых случайных ве-
личин с конечными дисперсиями, закон распределения этой случайной величины оказы-
вается практически нормальным законом. Главная особенность, выделяющая нормаль-
ный закон среди других законов, состоит в том, что он является предельным законом, к
которому приближаются другие законы распределения при весьма часто встречающихся
типичных условиях.

Определение необходимого объема выборки


6
Необходимый объем выборки, отвечающий точности, с какой намечено получить
средний результат, рассчитывается по формуле:

𝑡 2 (𝑡 ∙ 𝑆𝑥̅ )
𝑛 = ( ) , где 𝐾 =
𝐾 𝑆𝑥

где t – коэффициент Стьюдента для заданного уровня значимости.

Пример. Для выборки (табл. 3): известно выборочное среднее равно x = 6, Sx =


1,22, S x = 0,4; t = 2,31;  =6 ± 2,31∙0,4= 6±0,9. Показатель точности средней величины

невысок: Cs = (0,4/6)∙100 = 6,6. Какое число испытаний необходимо провести, чтобы


ошибка средней величины уменьшилась вдвое?
t S x = 2,31∙0,4 = 0,9; Sx = 1,22; n = 9; Так как необходимо уменьшить ошибку вдвое,

запишем: t S x = 2,31∙0,2 = 0,46; К = 0,46/1,22 = 0,38; n = (2,31/0,38)2 = 37.

 Рекомендуемая литература по теме:

1. Лакин Г.Ф. Биометрия. М., Высшая школа, 1990. с. 66 – 87; с. 89 – 92.


2. Рокицкий П.Ф. Биологическая статистика., Минск, «Вышэйш.школа», 1973. с. 82- 88;
с. 53 – 76.
3. Гусак А.А. Теория вероятностей. Справочное пособие к решению задач, 1999. с. 83 –
92, 173 – 200, 207 – 223.

 Вопросы для самопроверки

1. Какая случайная величина называется дискретной, а какая - непрерывной?


2. Что называется законом распределения случайной величины?
3. Перечислите основные свойства теоретических распределений случайных величин.
4. Назовите основные свойства нормального распределения.
5. Что такое закон трех сигм?
6. Нарисуйте график нормального распределения.
7. Сформулируйте Центральную предельную теорему.
8. Сформулируйте Закон больших чисел.
9. Как определить достаточный объем выборки?