Академический Документы
Профессиональный Документы
Культура Документы
Georgina Flesia
FaMAF
18 de mayo, 2015
Test de Kolmogorov-Smirnov
Yjd = i si Yi ∈ [yj−1 , yj ).
#{i | Yi ≤ x}
Fe (x) = .
n
I Fe (x): proporción de valores observados menores o iguales a x.
I Hipótesis nula: Fe (x) es “cercana” a F (x).
I Estadístico de Kolmogorov-Smirnov
0 x < y(1)
1
y(1) ≤ x < y(2)
n
...
Distribución empírica ⇒ Fe (x) = j
n y(j) ≤ x < y(j+1)
..
.
1 y(n) ≤ x
Gráficamente
F (x)
D = max{D + , D − }
El estadístico D
1
F (y(4) )
D−
Fe (y(3) )
Fe (y(2) )
D+
F (y(2) )
Notemos que:
I D + se alcanza en el límite inferior de algún intervalo, ya que
F (x) es creciente y Fe (x) es constante en [y(j−1) , y(j) ):
j
D + = max Fe y(j) − F y(j) = max
− F y(j)
1≤j≤n 1≤j≤n n
j j −1
D = max − F (y(j) ), F (y(j) ) − ← Estadístico de K-S
1≤j≤n n n
PF (D ≥ d) no depende de la distribución F .
F (Y ) ∼ U(0, 1).
#{i | F (Yi ) ≤ F (x)}
D = sup
− F (x)
x n
Equivalentemente, se puede reemplazar
I F (Yi ) por Ui , v.a. uniformemente distribuida en (0, 1), y
I F (x) por y ∈ [0, 1].
#{i | Ui ≤ y }
D = sup − y
0≤y ≤1 n
Estimación del valor p
#{i | Ui ≤ y }
D = sup − y
0≤y ≤1 n
#{i | Ui ≤ y }
sup − y ≥ d
0≤y ≤1 n
y = F (y )
2/3
1/3
F (x) = 1 − e−x/100 .
66, 72, 81, 94, 112, 116, 124, 140, 145, 155,
e−λ λj
P(Y = j) = ⇒ ¿λ desconocido?
j!
I En este caso, se estiman el o los parámetros desconocidos a
partir de la muestra.
El caso discreto
(2.9)j
p̂j+1 = P(Y = j) = e−2.9 , j = 0, 1, 2, . . .
j!
Ejemplo
- El modelo
I H0 ) Los datos de la muestra Y1 , Y2 , . . . , Yn provienen de una
distribución determinada, salvo por un conjunto de parámetros
desconocidos θ1 , . . . , θm .
Primer paso
I θ̂j : estimación de θj a partir de la muestra, j = 1, 2, . . . , m.
I p̂j : si la distribución tiene parámetros θ̂1 , . . . , θ̂m .
I Estadístico T :
k
X (Nj − np̂j )2
T =
np̂j
j=1
#{j | Tj∗ ≥ t}
valor p ≈
r
Ejemplo
I Parámetro estimado: λ̂ = 2.9.
I Valor del estadístico según la muestra: t = 19.887
I Simulación:
1. Generar 30 v.a. Poisson con media 2.9.
2. λ̂sim : estimación de λ según esta muestra.
3. pi∗ : Probabilidad de tomar el valor i según una Poisson de
parámetro λ̂sim .
4. Calcular T ∗ .
5. valor p: proporción de valores de T ∗ mayores a 19.887.
Test de Kolmogorov-Smirnov si hay parámetros no
especificados
Caso continuo
H0 ): Las v. a. Y1 , . . . , Yn provienen de una distribución F con
parámetros desconocidos θ1 , . . . , θm .
I Tomar una muestra Y1 , . . . , Yn .
I Estimar los parámetros a partir de la muestra: Θ̂ = (θ̂1 , . . . , θ̂m ).
I Calcular el estadístico a partir de la distribución con parámetros
estimados:
D = sup Fe (x) − FΘ̂ (x) .
x
I d ← valor de D observado.
.
I Repetir el procedimiento r veces, para obtener D1∗ , . . . , Dr∗ :
#{j | D ∗ ≥ d
valor p ≈
r