Академический Документы
Профессиональный Документы
Культура Документы
CAPÍTULO II
IMPUTACIÓN DE DATOS
2.1 Introducción
1
, X α, β
(2.1)
f ( x) β α
0 , para el resto de X
Los parámetros y de esta variable son constantes reales con
GRÀFICO 2.1
Efectos de la Imputación en el análisis de datos multivariados
Densidad de la Distribución Uniforme
f(x)
1
β β
1 x2 β2 α2
E ( X ) xf(x)dx x dx
α β α 2(β α) α 2(β α) 2(β α)
β 2 α2 (β α)(β α) βα
μ (2.2)
2(β α) 2(β α) 2
GRÁFICO 2.2
Efectos de la Imputación en análisis de datos multivariados
Media de la distribución uniforme
f (x )
x
2
Además si X ~ U α, β ,
28
β β
1 1 1 x3
E(X ) x f(x)dx x
β α α
2 2
dx
2
x 2
dx
β α β α 3 α
1 β3 α3
1 β3 α3
β α β 2 αβ α 2
β α 3 3 β α 3 3 β α
2
β 2 αβ α 2 α β β 2 αβ α 2 α 2 2α β 2
Var(X)
3 2 3 4
4 β 2 αβ α 2 3 α 2 2α β 2
4β 2 4α 4α 2 3α 2 6α 3β 2
12
β 2 2α α 2
β α 2
12 12
(2.3)
GRÁFICO 2.3
Efectos de la Imputación en análisis de datos multivariados
Números en el intervalo X Є ( , )
f (x )
a b c d β
← Δ → ← Δ →
1
, X α, β
f ( x) β α
0 , para el resto de X
Además, el intervalo (a, b) está incluido en α, β al igual que (c, d), esto es:
Si a,b α, β y c, d α, β
x (2.4)
Por tanto P X a, b P X c, d
Caso particular: Si 1 y 10 ; X U ( 1, 10 )
1
X 1,10
f ( x) 9
0 resto de X
si a 2, b 5
5
1 1 3
P X 2 , 5 dx 5 2
2
9 9 9
si c 1, d 4
4
1 1 3
P X 1, 4 dx 4 1 entonces x 3
1
9 9 9
aleatoria es uniforme.
3
probabilidad de que algo ocurra en dicho intervalo, no es .
9
si h 1, i 6 entonces x 6 1 5
6
1 1 5
P X 1,6 9 dx 9 6 1 9
1
31
0 si X α (2.5)
xα
P(X x) F(x) si α X β
β α
1 si X β
0 si X 0
Si X U ( 0 , 1 ) ; F(x) x si X (0 , 1)
1 si X 1
esto es F x x , x 0 , 1 lo cual significa que:
continua X es:
M X (t) E e Xt e
Xt
f ( x ) dx (2.6)
Uniforme
32
M X (t) E(e tX ) e
tX
f(x)dx ,
1 1
M X (t) e
tX
dx e tX dx
* e tX α * e tβ e tα
1 1 β 1 1
t t
e tβ e tα
, t 0
t β α
(2.7)
una muestra aleatoria de una población que tiene una distribución dada.
Cuadro 2.1
Efectos de la Imputación en el Análisis de Datos Multivariados
Contraste de Hipótesis de la Prueba de Bondad de Ajuste
muestrales.
parámetro conocido 3
Tabla 2.1
Efectos de la Imputación en el análisis de datos multivariados
Prueba de Bondad de Ajuste
Frecuencia Probabilidad
De acuerdo i Observada Poisson ei a los
fi 3
resultados 0 18 0.050 22.000 obtenidos
1 53 0.149 65.700
mediante la 2 103 0.224 98.600 prueba de
3 107 0.224 98.600
4 82 0.168 73.900
bondad de 5 46 0.101 44.440
ajuste, el valor
6 18 0.050 22.200
p es 0.998, 7 10 0.022 9.680 por lo tanto no
8 3 0.012 5.280
existe evidencia
Elaborado por: G. Cuenca
estadística suficiente para rechazar la
Cuadro 2.2
Efectos de la Imputación en el análisis de datos multivariados
Prueba de Bondad de Ajuste
H0: La distribución de la población donde se obtuvo la muestra es Poisson 3
vs.
H1: No es verdad H0
m
(f i e i ) 2
Estadístico de Prueba es :
i 1
ei
= 6.828
Valor p = 0,998
Elaborado por: G. Cuenca
34
muestra es Poisson 3 .
0 si X X (1)
k
F̂n (x) si X (k) X X (k 1) ; si k 1,2,..., n 1
n
1 si X X (n)
Cuadro 2.3
Efectos de la Imputación en el Análisis de Datos Multivariados
Contraste de Hipótesis de la Prueba de Kolmogorov-Smirnov
j= 1,2,3,4,5
Tabla 2.2
Efectos de la Imputación en el análisis de datos multivariados
Matriz de Datos de variables aleatorias independientes con
distribución Normal (0, 1)
Tamaño de muestra n=4
0.464 0.137 2.455 -0.323 -0.068
0.906 -0.513 -0.525 0.595 0.881
-0.482 1.678 -0.057 -1.229 -0.486
-1.787 -0.261 1.237 1.046 -0.508
Elaborado por: G. Cuenca
Tabla 2.3
Efectos de la Imputación en el análisis de datos multivariados
Prueba de Kolmogorov-Smirnov
Xn ˆ (x)
F F0(x) ˆ (x) F (x)
max Fn 0
20
Cuadro 2.4
Efectos de la Imputación en el análisis de datos multivariados
Prueba de Kolmogorov-Smirnov
H0: La distribución de la población donde se obtuvo la muestra es Normal(0,1)
vs.
H1: No es verdad H0
Estadístico de Prueba es : max F ˆ (x) F (x) = 0.149
n 0
Valor p = 0.766
Elaborado por: G. Cuenca
en los números que genera, ya que estos números deben cumplir ciertas
X 2 respectivamente.
recurrencia es la siguiente:
X n 1 ( aX n c) mod m , (2.8)
Donde
investigador;
TABLA 2.4
Efectos de la Imputación en el análisis de datos multivariados
Método Congruencial Mixto
Números pseudos aleatorios del generador
Números
n Xn (5Xn+7)/8 Xn+1
Uniformes
0 4 3+3/8 3 0.375
1 3 2+6/8 6 0.750
2 6 4+5/8 5 0.625
3 5 4+0/8 0 0.000
4 0 0+7/8 7 0.875
5 7 5+2/8 2 0.250
6 2 2+1/8 1 0.125
7 1 1+4/8 4 0.500
8 4 3+3/8 3 0.375
9 3 2+6/8 6 0.750
10 6 4+5/8 5 0.625
11 5 4+0/8 0 0.000
12 0 0+7/8 7 0.875
X n 1 (5 X n 7) mod 8
X n 1 (5 X n 7) mod 8
si n 0
X 1 (5 X 0 7) mod 8
5(4) 7 27 3
3 3.375
8 8 8
3
donde es el residuo y al dividir 3 para 8, el resultado es el
8
si n 1
X 2 (5 X 1 7) mod 8
5(3) 7 22 6
2 2.75
8 8 8
6
donde el residuo es y al dividir 6 para 8, el resultado es el
8
si n 2
X 3 (5 X 2 7) mod 8
5(6) 7 37 5
4 4.62
8 8 8
5
donde el residuo es y al dividir 5 para 8, el resultado es el
8
0.125 y 0.500.
períodos indeseables.
Elaborado
por: G. Cuenca
TABLA 2.5
Efectos de la Imputación en el análisis de datos multivariados
Método Congruencial Mixto
Números pseudoaleatorios del generador X n 1 7 X n 7 mod10
Números
n Xn (7Xn+7)/10 Xn+1
Uniformes
0 7 5+6/10 6 0.600
1 6 4+9/10 9 0.900
2 9 7+0/10 0 0.000
3 0 0+7/10 7 0.700
4 7 5+6/10 6 0.600
5 6 4+9/10 9 0.900
6 9 7+0/10 0 0.000
es 7:
43
X n 1 7 X n 7 mod10
si n 0
X 1 (7 X 0 7) mod 10
7(7) 7 56 6
5 5.600
10 10 10
6
donde es el residuo y al dividir 6 para 10, el resultado es el
10
si n 1
X 2 (7 X 1 7) mod10
7(6) 7 49 9
4 4.900
10 10 10
9
donde es el residuo y al dividir 9 para 10, el resultado es el
10
si n 2
X 3 (7 X 2 7) mod 10
7(9) 7 70 0
7 7.000
10 10 10
0
donde es el residuo y al dividir 0 para 10, el resultado es el
10
si n 3
44
X 4 (7 X 3 7) mod 10
7 ( 0) 7 7 7
0 0.700
10 10 10
7
donde es el residuo y al dividir 7 para 10, el resultado es el
10
completo”. [1]
relación de recurrencia:
X n 1 aX n mod m , (2.9)
TABLA 2.6
Efectos de la imputación en el análisis de datos multivariados
Método Congruencial Multiplicativo
Números pseudoaleatorios del generador X n 1 5 X n mod 32
Números
n Xn 5Xn / 32 Xn+1
Uniformes
0 5 0+25/32 25 0.781
1 25 3+29/32 29 0.906
2 29 4+17/32 17 0.531
3 17 2+21/32 21 0.656
4 21 3+9/32 9 0.281
5 9 1+13/32 13 0.406
6 13 2+1/32 1 0.031
7 1 0+5/32 5 0.156
8 5 0+25/32 25 0.781
9 25 3+29/32 29 0.906
10 29 4+17/32 17 0.531
11 17 2+21/32 21 0.656
número generado.
X n 1 5 X n mod 32
si n 0
X 1 5X 0 mod 32
5(5) 25 25
0 0.781
32 32 32
25
donde es el residuo y al dividir 25 para 32, el resultado es el
32
si n 1
X 2 5X 1 mod 32
5(25) 125 29
3 3.906
32 32 32
29
donde el residuo es y al dividir 29 para 32, el resultado es el
32
si n 2
X 3 5X 2 mod 32
5(29) 145 17
4 4.531
32 32 32
17
donde el residuo es y al dividir 17 para 32, el resultado es el
32
0.031 y 0.156.
inversa. [1]
x, a partir de:
F(x) y
F -1 ( F ( x )) F 1 (y)
x F 1 (y) (2.10)
deseada.
1 x / (2.11)
e si x 0
f(x)
0 si x 0
1 ex / si x 0 (2.12)
P(X x) F(x)
0 si x 0
Aplicando el método de la transformada inversa, se tiene que si
0 y 1:
1 ex / y
ex / 1 y
ln e x / ln(1 y)
x ln(1 y) (2.13)
50
ejemplo y=0.25.
x 2 ln(1 0.25)
x 0.575
2
1 x
1
f ( x) e2 x (2.14)
2
hacer uso del Teorema del Límite Central el cual establece que la
51
se aproxima al infinito.
conoce que:
1 1
y
2
2 12
X i n
Z i 1 (2.15)
n
12
tiene que:
12 12
X i 12 X i 12(1 / 2)
12 (2.16)
Z i 1
i 1
X i 6
1 1 i 1
12. 12 .
12 12
X
estándar esto es, X ~ N ( , 2 ) , entonces Z es normal
estándar.
transformada inversa.
(2.18)
pi 1 P(X i) pi ; i 0
i 1