Вы находитесь на странице: 1из 25

Основы Теории Вероятностей II

Евгений Седашов, PhD


esedashov@hse.ru

8/10/2020
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Покер I

• На прошлом занятии мы разобрали основы


аксиоматической теории вероятностей.

• Мы увидим, как аксиоматическая теория вероятностей


может применяться для непосредственного рассчёта
вероятностей.

• Предположим, что вы хотите узнать вероятность


комбинации “сет” (три карты одного достоинства) в
5-карточном покере.

8/10/2020 2 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Покер II

• Во-первых, определим множество элементарных


исходов: в данном случае это последовательности из 5
карт, выбранных из 52-х карточной колоды (порядок
карт учитывается).

• По сути, вероятность сета – это сумма вероятностей


элементарных исходов, соответствующих данной
комбинации.

• Вероятность конкретного элементарного исхода:


1
52∗51∗50∗49∗48
(почему?)

8/10/2020 3 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Покер III

• Теперь нужно посчитать количество элементарных


исходов, соответствующих сету.

• Во-первых, существует тринадцать различных


вариантов сетов (от 2-2-2 до А-А-А).

• При этом в рамках каждого сета существует


(4 ∗ 3 ∗ 2) = 24 различных варианта
последовательностей карт.

8/10/2020 4 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Покер IV

5!
• Наконец, существует 3!2! = 10 способов выбрать
положение сета в последовательности из 5 карт.

• У нас также есть две карты, не участвующие в


комбинации; существует 48 способов выбрать
четвёртую карту (необходимо исключить комбинацию
каре) и 44 способа выбрать пятую карту (убираем
фулл-хаус): 48 ∗ 44 = 2112

• Перемножаем всё вместе: 2112∗10∗24∗13


52∗51∗50∗49∗48
= 0.021

8/10/2020 5 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Покер V

• Вероятность каре? (0.00024)

• Вероятность стрита? (0.003925)

• Вероятность двух пар? (0.047539)

8/10/2020 6 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Пример из Политологии

• Предположим, что в политической системе есть пять


партий.

• Какова вероятность, что choice set избирателя


включает конкретные две партии?

• Общее количество choice set – 25 , включаю нулевой


choice set.

• Количество choice set, включающих конкретные две


партии – 23 = 8.

• Искомая вероятность составляет 23 1


25
= 4

8/10/2020 7 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Понятие Случайной Величины

• До сих пор нашим ключевым интересом была работа с


множеством элементарных исходов и событиями,
которые можно составлять на основе этого множества.

• Часто нас интересует не само множество


элементарных исходов, а некоторая функция,
определённая на этом множестве.

• Случайная величина – это функция X : Ω → R, т.е.


функция, ставящая в соответствие каждому
элементарному исходу ω действительное число.

8/10/2020 8 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Примеры Случайных Величин

• Вернёмся к нашему рабочему примеру подброса


обычной монеты три раза.

• Мы можем определить случайную величину X , равную


1, если выпадает 2 орла или больше, и нулю в
противном случае.

• Мы также можем определить случайную величину X ,


фиксирующую количество выпавших орлов (пример
Биномиальной случайной величины).

8/10/2020 9 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Распределение Случайной Величины I

• Аналогично вероятностям различных событий мы


можем задавать вероятности для случайных величин.

• Вернёмся к биномиальной случайной величине X и


нашему рабочему примеру.

• Во-первых, мы можем чётко определить множество


значений X : 0, 1, 2, 3 в соответствии с количеством
выпавших орлов.

• Вероятность, что X будет равна 0, соответствует


вероятности выпадения трёх решек, т.е. ( 21 )3 .

8/10/2020 10 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Распределение Случайной Величины II

• Вероятность, что X будет равна 1: 3 ∗ ( 12 )3 .

• Вероятность, что X будет равна 2: 3 ∗ ( 21 )3 .

• Вероятность, что X будет равна 3: ( 21 )3 .

• Сумма всех вероятностей будет 1.

• Вероятность случайной величины определяется через


вероятность события, соответствующего конкретному
значению случайной величины.

8/10/2020 11 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Функция Распределения

• Функцией распределения случайной величины X


называется функция FX (x), такая, что

FX (x) = PX [X ≤ x] = P[ω : X (ω) ≤ x]

lim FX (x) = 0
x→−∞

lim FX (x) = 1
x→∞

• Функция распределения задаёт правило, по которому


рассчитываются вероятности для конкретной
случайной величины.

• Функцию распределения легко рассчитать для нашего


рабочего примера.
8/10/2020 12 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Дискретные и Непрерывные Случайные Величины

• Если функция распределения X непрерывна, то и сама


случайная величина называется непрерывной.

• Если случайная величина принимает счётное


количество значений, то она называется дискретной;
функция распределения такой случайной величины
выглядит как лестница.

8/10/2020 13 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Независимые Случайные Величины

• Две дискретных случайных величины X и Y


называются независимыми, если PXY [X = X , Y =
y ] = P[ω : X (ω) = x ∩ Y (ω) = y ] = P[ω : X (ω) =
x]P[ω : Y (ω) = y ] = PX [X = x]PY [Y = y ].

• Две непрерывных случайных величины называются


независимыми, если fXY (x, y ) = fX (x)fY (y ).

8/10/2020 14 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Математическое Ожидание I
• Ключевой мерой центральной тенденции для
случайных величин является математическое
ожидание, обозначаемое как E[X ].

• Математическое ожидание для дискретных случайных


величин определяется как
X
E[X ] = xPX [X = x]
x

• Математическое ожидание для непрерывных


случайных величин определяется как
Z ∞
E[X ] = xf (x)dx
−∞

где f (x) – функция плотности вероятности.


8/10/2020 15 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Математическое Ожидание II

• Математическое ожидание является ключевым


понятием для социальных наук, т.к. нас, как правило,
интересуют именно усреднённые характеристики.

• Например, нас может интересовать средний возраст


людей, голосующих на выборах.

• Или нас может интересовать средний уровень ВВП


для демократических государств в прошлом году.

• Сравнение средних значений – это первый шаг любого


количественного анализа.

8/10/2020 16 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Дисперсия I

• Дисперсия является мерой “разброса” случайной


величины вокруг среднего значения и обозначается
как V[X ].

• По сути, дисперсия показывает, насколько хорошо мы


можем предсказать некоторое вероятностное явление,
опираясь на среднее значение.

• Низкая дисперсия означает, что явление хорошо


описывается средним значением.

8/10/2020 17 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Дисперсия II

• Для дискретных случайных величин дисперсия


рассчитывается как
X
V[X ] = [x − E[X ]]2 P[X = x]
x

• Для непрерывных случайных величин дисперсия


рассчитывается как
Z ∞
V[X ] = (x − E[X ])2 f (x)dx
−∞

8/10/2020 18 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Ковариация I

• Часто на практике возникает вопрос: насколько


хорошо изменения в случайной величине X могут
объяснить изменения в случайной величине Y ?

• Например, нас может интересовать вопрос: насколько


хорошо изменения в политическом режиме
государства предсказывают изменения в уровне ВВП
на душу населения?

• Нас также может интересовать вопрос: как количество


природных ресурсов влияет на тип политического
режима?

8/10/2020 19 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Ковариация II

• Ковариация обозначается C[X , Y ] и равна

C[X , Y ] = E[(X − E[X ])(Y − E[Y ])]

• Для дискретных случайных величин мы можем


преобразовать это выражение:
XX
C[X , Y ] = (x−E[X ])(y −E[Y ])PX ,Y [X = x, Y = y ] =
x y
XX
(x − E[X ])(y − E[Y ])P[ω : X (ω) = x ∩ Y (ω) = y ]
x y

8/10/2020 20 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Свойства Математического Ожидания

• Если X (ω) = c для всех ω ∈ Ω, то E[X ] = c


(математическое ожидание константы равно ей
самой).
• E[cX ] = cE[X ] (константы могут выноситься за знак
матожидания).
• E[ ni=1 Xn ] = ni=1 E[Xn ] (линейность матожидания);
P P
если Xn неотрицательные случайные величины
(Xn (ω) ≥ 0 ∀n ∀ω), то n может быть равно ∞; в
противном случае свойство может не соблюдаться для
n = ∞.
• Для независимых случайных величин
E[XY ] = E[X ]E[Y ].

8/10/2020 21 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Понятие Статистической Оценки I

• До сих пор мы говорили о случайных величинах и


связанных понятиях, как если бы нам была известна
функция распределения случайной величины.
• В реальности мы, как правило, не знаем точный закон
распределения.
• Например, для того, чтобы точно узнать закон
распределения случайной величины, соответствующей
возрасту голосующих на выборах, нам нужно было бы
провести полную перепись всех избирателей –
очевидно неосуществимый проект.
• В подобных ситуациях нам на помощь приходят
статистические оценки.

8/10/2020 22 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Понятие Статистической Оценки II

• Выборка (sample) S – подмножество генеральной


совокупности (population), отобранное в соответствии
с определёнными процедурами.

• Статистической оценкой T (S) называется оценка


определённого параметра генеральной совокупности,
рассчитываемая на основе конкретного сэмпла.

• Например, средний возраст голосующих на выборах


можно оценить на основе опроса, где в рамках
выборки у респондентов спрашивают их возраст и
также задают вопрос о явке на выборах.

8/10/2020 23 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Несмещённые Статистические Оценки

• Статистическая оценка T (S) называется


несмещённой, если E[T (S)] = θ, где θ – оцениваемый
параметр генеральной совокупности.

• Например, среднее арифметическое в выборке,


обозначаемое X̄ , является несмещённой оценкой
математического ожидания E[X ].

1
PN
• Дисперсия в выборке N−1 2
i=1 (Xi − X̄ ) является
несмещённой оценкой дисперсии V[X ] в генеральной
совокупности.

8/10/2020 24 / 25
Вероятность Событий Случайные Величины Математическое Ожидание Статистические Оценки

Состоятельные Оценки

• Хорошая статистическая оценка должна приближаться


к оцениваемому параметру с ростом числа
наблюдений.

• Иными словами, вероятность, что оцениваемый


параметр и его оценка будут различаться, должна
снижаться с ростом размера выборки.

• Оценки, для которых соблюдается данное свойство,


называются состоятельными.

8/10/2020 25 / 25