Академический Документы
Профессиональный Документы
Культура Документы
org/specializations/machine-learning-data-analysis 1 из 13
Статистики
Статистики
X n = X1 , . . . , X n ,
Рис. 1.
Рис. 2.
Рис. 3. Рис. 4.
Рис. 5.
Рис. 6.
1
b−a
a b
Рис. 7.
мода
медиана
матожидание
Рис. 8.
X ∼ Pois(λ) ⇒ DX = λ, EX = λ.
X ∼ N (µ, σ 2 ) ⇒ DX = σ 2 .
https://www.coursera.org/specializations/machine-learning-data-analysis 6 из 13
Статистики
68%
µ − 2σ µ µ + 2σ
µ − 3σ µ − σ µ + σ µ + 3σ
Рис. 9.
50%
µ − 2σ µ µ + 2σ
µ − 3σ µ − σ µ + σ µ + 3σ
Рис. 10.
3. Важные статистики
Оценка матожидания случайной величины — это выборочное среднее:
n
1X
X̄ = Xi .
n i=1
https://www.coursera.org/specializations/machine-learning-data-analysis 7 из 13
Статистики
95%
µ − 2σ µ µ + 2σ
µ − 3σ µ − σ µ + σ µ + 3σ
Рис. 11.
99.7%
µ − 2σ µ µ + 2σ
µ − 3σ µ − σ µ + σ µ + 3σ
Рис. 12.
X n = X1 , X2 , . . . , Xn
⇒ X(1) 6 X(2) 6 . . . 6 X(n) .
Рис. 13.
Рис. 14.
Рис. 15.
Какое распределение имеет выборочное среднее, и как оно связано с исходным рас-
пределением?
Можно провести эксперимент. Берется случайная величина с распределением,
показанным на рис. 16.
Из данной случайной величины можно взять выборку объема n и посчитать по
ней выборочное среднее. Данное действие необходимо повторить в рамках экспери-
мента достаточно много раз, чтобы затем построить гистограмму полученных вы-
борочных средних. На рис. 17 приведена гистограмма, построенные по выборкам
объема n = 2. По сравнению с исходной плотностью случайной величины, данная
гистограмма выглядит более гладкой. С увеличением объёма выборки процесс сгла-
живания продолжается (см. рис. 18 для n = 3).
При объеме выборки n = 5 гистограмма становится унимодальной (см. рис. 19).
Дальнейшее увеличение выборки не влияет на форму гистограммы, она лишь ста-
новится более узкой (см. рис. 20 для n = 30).
https://www.coursera.org/specializations/machine-learning-data-analysis 10 из 13
Статистики
Рис. 16.
5. Доверительные интервалы
Имеется некий продукт, для которого известна его целевая аудитория. Необхо-
димо узнать, насколько хорошо целевая аудитория знакома с данным продуктом.
Введём следующую случайную величину:
(
1, член ЦА знает продукт,
X=
0, не знает.
тогда: !
p(1 − p)
p̄n ≈∼ N p, .
n
В правую часть данного выражения можно подставить p̄n вместо p:
!
p̄n (1 − p̄n )
p̄n ≈∼ N p̄n , .
n