Академический Документы
Профессиональный Документы
Культура Документы
3. Статистические
эксперименты и проверка
гипотез
Доверительные интервалы
Пусть набор данных x1 , … , xn — реализация выборки X1 , … , Xn , где Xi ∼
F . Пусть θ — интересующий нас параметр распределения F , а α ∈ (0, 1).
Если для любого возможного значения θ верно
то интервал
σ σ
(xn − zα/2 ⋅ , xn + zα/2 ⋅ ).
n n
Распределение Стьюдента
Распределение Стьюдента t(m) — распределение колоколообразной формы,
симметричное относительно нуля. Его плотность имеет более толстые и длинные
хвосты, чем у нормального распределения: f(x) стремится к нулю при x,
стремящемся к +∞ и −∞, но медленнее, чем в стандартном нормальном
распределении.
Параметр m называют количеством степеней свободы.
Критическое значение (или (1 − α)-квантиль) tm, α — это такое число, что
P (T > tm, α ) = α, где T ∼ t(m).
Эквивалентно, FT (tm, α ) = P (T ⩽ tm, α ) = 1 − α.
Вычисление критических значений Стьюдента в Python. Пример:
Если
1) Xi ∼ N(μ, σ 2 ) и σ неизвестна или
2) n > 100 и σ неизвестна,
тогда случайная величина
ˉn − μ
X
T =
Sn / n
(x ).
sn sn
ˉn − t(n−1), α/2 ⋅ ,x
ˉn + t(n−1), α/2 ⋅
n n
А также
sn
(xn − t(n−1), α/2 ⋅ , + ∞)
n
нулевая обозначается H0 ,
T = t ∈ K ⟺ (p-значение для t) ⩽ α.
A/B тестирование
Z -тест для разницы средних из распределений с известными дисперсиями
H0 : μx = μy ,
H1 : μx =
μy .
H0 : μx = μy ,
H1 : μx =
μy .
ˉ ˉ
H0 : μx = μy ,
H1 : μx =
μy .
2
zα + zβ
n⩾( ) ⋅ (s2x + s2y )
MDE
Для двустороннего —
zα/2 + zβ 2
n⩾( ) ⋅ (s2x + s2y )
MDE