Академический Документы
Профессиональный Документы
Культура Документы
Validacin de hiptesis de un
proceso de Poisson no homogneo
Georgina Flesia
FaMAF
22 de mayo, 2014
Bondad de ajuste
Se tienen k muestras, k 2,
H
0
) Los datos de todas las muestras provienen de una misma
distribucin.
Test de Kruskal-Wallis.
El problema de las dos muestras
R(x
i
): rango de x
i
, i -simo elemento de la muestra 1, entre los
n +m valores.
i =1
R(x
i
).
Ejemplo:
Muestra 1: 1, 7, 5, 4. Ordenamiento: 1, 2, 3, 4, 5, 7, 9.
Muestra 2: 3, 2, 9.
R = 1 + 4 + 5 + 6 = 16
.
Test de suma de rangos
R = suma de los rangos de la primera muestra. Estadstico
distribucin de R, o
simulacin.
Muestras chicas
P
n,m
(r ): probabilidad que de dos conjuntos de datos igualmente
distribuidos, de tamaos n y m respectivamente, la suma de los
rangos de los datos del primer conjunto sea menor o igual a r .
Notacin:
P
n,m
(r ) = P
H
0
(R r )
Clculo de P
n,m
(r )
Denicin recursiva de P
n,m
(r ):
P
n,m
(r ) =
n
n +m
P
n1,m
(r n m) +
m
m+n
P
n,m1
(r ).
Condiciones iniciales:
P
1,0
(k) =
_
0 k 0
1 k > 0.
P
0,1
(k) =
_
0 k < 0
1 k 0.
Clculo recursivo del valor p
P
H
0
(R r ) = 1 P
H
0
(R r 1).
H
0
: Las dos muestras estn igualmente distribuidas.
Bajo la hiptesis H
0
, todos los ordenamientos de los n +m
valores son igualmente probables.
Notacin:
N = n +m.
x
1
, . . . , x
n
: elementos de la primera muestra.
R(x
i
): rango del elemento x
i
, i = 1 . . . n.
R = R(x
1
) + +R(x
n
) tiene una distribucin aproximadamente
normal:
R E[R]
_
Var(R)
N(0, 1).
Parmetros de la distribucin de R.
E[R(x
i
)] =
N
j =1
j
1
N
=
N + 1
2
.
E[R] =
n
i =1
E[R(x
i
)] = n
N + 1
2
.
Var(R(x
i
)) =
(N 1)(N + 1)
12
cov(R(x
i
), R(x
j
)) =
N + 1
2
Var(R) = n m
N + 1
12
Distribucin de R
Bajo la hiptesis H
0
y para n y m grandes:
W =
R n
N + 1
2
_
n m
N + 1
12
N(0, 1)
) si r n
N + 1
2
2P(Z > r
) caso contrario.
r
=
r
n (N + 1)
2
_
n m(N + 1)
12
Ejemplo
H
0
: si los n +m datos son distintos, todos los ordenamientos son
igualmente probables.
Simulacin:
Estimar:
P(R r ) =
#{i | R
i
r }
k
, P(R r ) =
#{i | R
i
r }
k
.
Caso de datos repetidos
Si las muestras tienen datos repetidos, se utiliza como rango el
promedio de los rangos de dichos valores.
Ejemplo:
Muestra 1: 2, 3, 4.
Muestra 2: 3, 5, 7.
Ordenamiento:
2, 3, 3 , 4, 5, 7
R = 1 + 2.5 + 4 = 7.5.
R
i
: rango de la i -sima muestra.
n = n
1
+ +n
m
: nmero total de datos u observaciones.
H
0
: todas las muestras estn igualmente distribuidas todos
los ordenamientos de los n datos son igualmente probables.
E[R
i
] = n
i
n + 1
2
.
Estadstico:
R =
12
n(n + 1)
m
i =1
(R
i
n
i
(n + 1)/2)
2
n
i
.
Si se observa R = y, entonces
valor p = P
H
0
(R y).
H
0
) Las llegadas diarias a un sistema ocurren de acuerdo a un
Proceso de Poisson no homogneo.
=
_
T
0
(x) dx, T: long. del da.
r
i =1
N
i
r
, S
2
=
r
i =1
(N
i
N)
2
r 1
.
Si H
0
es cierta, N y S
2
deberan ser aproximadamente iguales.
Notar que H
0
no especica la media de la distribucin (), por lo
tanto debe ser estimada.
Denotamos P
m
(A) como la probabilidad bajo H
0
, suponiendo
que la media es m:
valor p = 2 min{P
m
(T t ), P
m
(T t )} .
Repetir k veces.
Estimar
P(T t ) =
#{i | T
i
t }
k
, P(T t ) =
#{i | T
i
t }
k
.
Se han observado N
i
tiempos de llegada el da i -simo:
X
i ,1
, X
i ,2
, . . . , X
i ,N
i
, . i = 1, . . . , r .
N = N
1
+ +N
r
: nmero total de llegadas.
R
i
: rango de la i -sima muestra (da).
R =
12
N(N + 1)
r
i =1
(R
i
N
i
(N + 1)/2)
2
N
i
.
Si H
0
es cierta,
R
2
r 1
.
Valor observado de R = y:
valor p = 2 min{P
H
0
(R y), P
H
0
(R y)}
= 2 min
_
P(
2
r 1
y), P(
2
r 1
y)
_
Test chi-cuadrado
calcular T = S
2
/N.
i =1
(R
i
N
i
(N + 1)/2)
2
N
i
= 14.425.
Prueba chi-cuadrado:
P(
2
4
14.425) = 0.006
En el tiempo (y
j 1
, y
j
) ocurri una llegada en el total de r das,
por lo que se estima que en un da hay un promedio de 1/r
llegadas.
Si
(t ) es la f. de intensidad, :
E[N(y
j
) N(y
j 1
)] =
_
y
j
y
j 1
(t ) dt =
1
r
.
Se puede elegir
(t ) =
1
(y
j
y
j 1
) r
, y
j 1
< t < y
j
.
Proceso de Poisson homogneo
N = N
1
+N
2
+ +N
r
: nmero total de llegadas, valor conocido
H
0
) Los N tiempos de llegada estn uniformemente distribuidos
en un da (o intervalo (0, T).)
Proceso de Poisson homogneo
Estadstico de Kolmogorov-Smirnov:
D = max
0xT
F
e
(x)
x
T