Вы находитесь на странице: 1из 32

8.

Comparacin de poblaciones

Informtica. Universidad Carlos III de Madrid

Tema 8: Comparacin de poblaciones

1. 2. 3. 4. 5.

Introduccin Comparacin de dos medias usando muestras independientes Comparacin de dos medias usando datos emparejados Comparacin de dos proporciones Comparacin de dos varianzas en poblaciones normales

Informtica. Universidad Carlos III de Madrid

1. Introduccin
Poblacin 1 Poblacin 2

X1
1

X2
2

POBLACIONES NO OBSERVABLES

X 11

X 12 X 13 ... X 1n1

X 21

X 22 X 23 ... X 2 n2

x1
12 s

1 = 2 ?

12 = 22 ?
Informtica. Universidad Carlos III de Madrid

x2
2 2 s
3

Ejemplo Tomamos una muestra de rodamientos de dos fabricantes distintos y medimos su capacidad de carga (peso que admite hasta deformacin) Son diferentes ambos tipos de rodamientos?

Ejemplo Se tienen dos sistemas diferentes para acceder a la red. Se toman un conjunto de tiempos de acceso para cada sistema. Cul es ms rpido?

Ejemplo Se tienen los pesos de nios y nias recin nacidos en un hopital durante Semana Santa. A la vista de esos datos Pesan al nacer los nios igual que las nias?
Informtica. Universidad Carlos III de Madrid
4

Tema 8: Comparacin de poblaciones

1. 2. 3. 4. 5.

Introduccin Comparacin de dos medias usando muestras independientes Comparacin de dos medias usando datos emparejados Comparacin de dos proporciones Comparacin de dos varianzas en poblaciones normales

Informtica. Universidad Carlos III de Madrid

2. Comparacin de dos medias usando muestras independientes

X1 =

X 1i
i =1

n1

2 = S 1

( X
i =1

n1

1i

X1 )

n1

n1 1

X2 =

X 2i
i =1

n2

n2

2 = S 2

( X
i =1

n2

2i

X2 )

n2 1

1 2 ?
Con poblaciones normales o muestras grandes...

12 X 1 N 1 , n1
2 12 2 X 1 X 2 N 1 2 , + n n 1 2

2 2 X 2 N 2 , n 2

Informtica. Universidad Carlos III de Madrid

2. Comparacin de dos medias usando muestras independientes

1 2 ?

2 12 2 X 1 X 2 N 1 2 , + n n 1 2

(X

X 2 ) ( 1 2 )

2 1

n1

2 2

N ( 0,1)

n2

Intervalo de confianza
2 12 2 + IC (1 ) : 1 2 x1 x2 z / 2 n n 1 2

desv. tpica del estimador parmetro estimacin valor de tablas Informtica. Universidad Carlos III de Madrid
7

2. Comparacin de dos medias usando muestras independientes

1 2 ?

2 12 2 X 1 X 2 N 1 2 , + n n 1 2

(X

X 2 ) ( 1 2 )

2 1

n1

2 2

N ( 0,1)

n2

Intervalo de confianza
2 12 2 + IC (1 ) : 1 2 x1 x2 z / 2 n n 1 2

1 1 IC (1 ) : 1 2 x1 x2 z / 2 + n1 n2
Informtica. Universidad Carlos III de Madrid

2 si 12 = 2

Muestras grandes
2 12 s 2 s IC (1 ) : 1 2 x1 x2 z / 2 + n1 n2

1 1 T IC (1 ) : 1 2 x1 x2 z / 2 s + n1 n2

2 2 n S + n S ( 1) ( 1) 1 2 2 2 = 1 S T n1 + n2 2

Con muestras grandes, la aproximacin a la normal sigue siendo vlida si sustituimos parmetros por estimaciones

Poblaciones normales
(muestras pequeas)
2 12 s 2 s IC (1 ) : 1 2 x1 x2 tv; / 2 + n1 n2

2 S 2 S 1 2 + n1 n2 2 2 2 2 1 S1 1 S2 + n1 1 n1 n2 1 n2

1 1 T IC (1 ) : 1 2 x1 x2 tn1 + n2 2; / 2 s + n1 n2
Informtica. Universidad Carlos III de Madrid
9

Ejemplo

Se quiere elegir entre dos tipos de material textil para construir sistemas de amarre. Para ello se mide la tensin de rotura de varias cintas de prueba utilizando dos tipos de material. Se toman 24 datos usando el 1 = 2 . Se toman material M1, obtenindose x1 = 87 (kg/mm) y s adems 30 datos usando el material M2, obtenindose x2 = 75 , s 2 = 2.3 Se sabe que las tensiones de rotura se distribuyen como una normal. Se supondr, adems, que las varianzas de ambas poblaciones son iguales.

Si las varianzas son iguales, las muestras pequeas, pero las poblaciones son normales

1 1 T IC (1 ) : 1 2 x1 x2 tn1 + n2 2; / 2 s + n1 n2

Hay evidencia a favor de M1 (el intervalo no tiene al 0) M1 aventaja a M2 entre 10.87 y 13.13 unidades por trmino medio, (con unaInformtica. confianza del 95%) Universidad Carlos III de Madrid

10

Contrastes de hiptesis
PASO 1: PASO 2:

PASO 3:

Muestras grandes

N(0,1)

H0 : 1 = 2 ; H1 : 1 2
(a)

2 12 = 2

Poblaciones normales N(0,1)

H0 : 1 2 ; H1 : 1 > 2
(b)

tn1 + n2 2
12 22
N(0,1)

H0 : 1 2 ; H1 : 1 < 2
(c)

tv
v

Informtica. Universidad Carlos III de Madrid

2 S 2 S 1 2 + n1 n2 2 2 2 2 1 S 1 S 1 2 + n1 1 n1 n2 1 n2
11

Contrastes de hiptesis
PASO 1:

PASO 4: Regin de rechazo

H0 : 1 = 2 ; H1 : 1 2
(a)

Rechazo H0 Acepto H0

Rechazo H0

(a)

z /2 t / 2

z /2 t /2
Rechazo H0

H0 : 1 2 ; H1 : 1 > 2
(b) (b)

Acepto H0

z t

H0 : 1 2 ; H1 : 1 < 2
(c)

Rechazo H0

Acepto H0

(c)

z t

La regin de rechazo est donde seala H1 Informtica. Universidad Carlos III de Madrid

12

Ejemplo

Se quiere comparar la precisin de dos calibres diferentes. Para ello se comparan las mediciones realizadas en 100 clavos procedentes del mismo lote de fabricacin. Se miden 50 clavos con un calibre y los otros 50 con otro calibre distinto. Cmo son las mediciones medias de cada calibre?

Los clavos son del mismo tipo. Las diferencias entre los calibres no se deben a los clavos Es esa diferencia significativa?

x1 x2

1 2 ?

Muestras grandes Varianzas tal vez distintas


Informtica. Universidad Carlos III de Madrid
13

Ejemplo

Se quiere comparar la precisin de dos calibres diferentes. Para ello se comparan las mediciones realizadas en 100 clavos procedentes del mismo lote de fabricacin. Se miden 50 clavos con un calibre y los otros 50 con otro calibre distinto. Cmo son las mediciones medias de cada calibre?

Los clavos son del mismo tipo. Las diferencias entre los calibres no se deben a los clavos Es esa diferencia significativa?

Rechazo H0 Acepto H0

Rechazo H0

-1.96
Rechazamos H0
La diferencia entre las medias es significativa

1.96

Informtica. Universidad Carlos III de Madrid

14

Tema 8: Comparacin de poblaciones

1. 2. 3. 4. 5.

Introduccin Comparacin de dos medias usando muestras independientes Comparacin de dos medias usando datos emparejados Comparacin de dos proporciones Comparacin de dos varianzas en poblaciones normales

Informtica. Universidad Carlos III de Madrid

15

3. Comparacin de dos medias usando datos emparejados


De cada elemento: 2 datos Ejemplo: Antes/despus de cierto cambio Antes/despus de un tratamiento Con distintos aparatos de medida X1 Elemento 1 Elemento 2 Elemento 3 ... Elemento n X11 X12 X13 ... X1n X2 X21 X22 X23 ... X2n Y Y1 =X11 -X21 Y2 =X12 -X22 Y3 =X13 -X23 ... Yn =X1n -X2n

1
1 = 2 ?

2
Y = 0 ?

Y
Como en temas anteriores
16

Informtica. Universidad Carlos III de Madrid

Ejemplo

Se quiere comparar la precisin de un calibre analgico y uno digital. Para ello mide la longitud de 95 tornillos del mismo tipo. Cada tornillo se ha medido dos veces, una vez con un calibre digital (muy preciso) y una segunda vez con un calibre analgico (menos preciso). Hay diferencias?

Y=diferencia entre la medicin digital y la analgica

Estadstico de contraste

y 0 T0 = / n S y

Como la muestra es grande


17

Informtica. Universidad Carlos III de Madrid

Ejemplo

Se quiere comparar la precisin de un calibre analgico y uno digital. Para ello mide la longitud de 95 tornillos del mismo tipo. Cada tornillo se ha medido dos veces, una vez con un calibre digital (muy preciso) y una segunda vez con un calibre analgico (menos preciso). Hay diferencias?

y 0 T0 = / n S y

Como |t0|>1.96 Rechazamos H0 La diferencia media observada entre ambos calibres es pequea, pero significativa

Informtica. Universidad Carlos III de Madrid

18

Tema 8: Comparacin de poblaciones

1. 2. 3. 4. 5.

Introduccin Comparacin de dos medias usando muestras independientes Comparacin de dos medias usando datos emparejados Comparacin de dos proporciones Comparacin de dos varianzas en poblaciones normales

Informtica. Universidad Carlos III de Madrid

19

4. Comparacin de dos proporciones poblacionales

Poblacin 1 Proporcin de individuos con cierto atributo p1

Poblacin 2 Proporcin de individuos con cierto atributo p2

muestra n1

muestra n2

1 p

2 p

p1=p2?

Informtica. Universidad Carlos III de Madrid

20

4. Comparacin de dos proporciones poblacionales

Poblacin 1 Proporcin de individuos con cierto atributo p1

Poblacin 2 Proporcin de individuos con cierto atributo p2

muestra n1

muestra n2

1 p

2 p

Informtica. Universidad Carlos III de Madrid

21

Intervalo de confianza

Contraste de hiptesis

PASO 1:

PASO 2:

PASO 3:

H0 : p1 = p2 ; H1 : p1 p2

Muestras grandes

N(0,1)

H0 : p1 p2 ; H1 : p1 > p2
con

PASO 4:

H0 : p1 p2 ; H1 : p1 < p2

La regin de rechazo est donde seala H1

Informtica. Universidad Carlos III de Madrid

22

Ejemplo

Aprueban la Estadstica el mismo porcentaje de chicas que de chicos en Ingeniera Industrial?

Tomamos una muestra de alumnos: examen de junio del 2003 Alumnos de 1 de I. Industrial

270 alumnos 225 chicos. 30% de aprobados 45 chicas. 42% de aprobados

0 = p

1 + n2 p 2 225 0.30 + 45 0.42 n1 p = = 0.32 225 + 45 n1 + n2

z0 =

1 p 2 p 1 1 0q 0 + p n1 n2

0.30 0.42 1 1 + 0.32 0.68 225 45

= 1.57
Rechazo H0 Acepto H0 Rechazo H0

Como

| z0 |< z0.025 = 1.96

La diferencia encontrada en la muestra no es significativa al 5%. No podemos rechazar que ambos tengan la misma probabilidad de aprobar

-1.96

1.96

Informtica. Universidad Carlos III de Madrid

23

Tema 8: Comparacin de poblaciones

1. 2. 3. 4. 5.

Introduccin Comparacin de dos medias usando muestras independientes Comparacin de dos medias usando datos emparejados Comparacin de dos proporciones Comparacin de dos varianzas en poblaciones normales

Informtica. Universidad Carlos III de Madrid

24

5. Comparacin de dos varianzas en poblaciones normales

2 = S 1

( X
i =1

n1

1i X 1 )

n1 1
2 12 / 2 ?

2 = S 2

( X
i =1

n2

2i X 2 )

n2 1

Con poblaciones normales

2 2 S1 / 1 F = 2 2 Fn1 1,n2 1 / S 2 2

Distribucin F de Fisher

Fg1 , g2
grados de libertad del numerador grados de libertad del denominador 25

Informtica. Universidad Carlos III de Madrid

5. Comparacin de dos varianzas en poblaciones normales

Perfil parecido a la chi-cuadrado La asimetra disminuye al aumentar los grados de libertad La moda est cerca del 1
Informtica. Universidad Carlos III de Madrid
26

5. Comparacin de dos varianzas en poblaciones normales


2 2 S1 / 1 F = 2 2 Fn1 1,n2 1 / S 2 2

Informtica. Universidad Carlos III de Madrid

27

5. Comparacin de dos varianzas en poblaciones normales

Intervalo de confianza

Informtica. Universidad Carlos III de Madrid

28

Ejemplo

Se quiere comparar la precisin de dos calibres diferentes. Para ello se comparan las mediciones realizadas en 100 clavos procedentes del mismo lote de fabricacin. Se miden 50 clavos con un calibre y los otros 50 con otro calibre distinto. Cmo son las mediciones medias de cada calibre?

12 = 7.4 s

2 2 s = 21.9

F49,49;0.975 = 0.57 F49,49;0.025 = 1.76

El intervalo est lejos de contener el 1 Hay mucha evidencia de que las varianzas son distintas El calibre 1 es mucho ms preciso que el 2 Informtica. Universidad Carlos III de Madrid

29

5. Comparacin de dos varianzas en poblaciones normales

Contraste de hiptesis

2 / 2 S F = 12 12 Fn1 1,n2 1 / S 2 2
Estadstico de contraste Distribucin de referencia

2 S F0 = 12 S 2

F0 Fn1 1,n2 1

Informtica. Universidad Carlos III de Madrid

30

PASO 1:

PASO 2:

PASO 4:

2 2 H 0 : 12 = 2 ; H1 : 12 2

(a)

2 S F0 = 12 S 2

Rechazo H0 Acepto H0

Rechazo H0

(a) F

n1 1, n2 1;1 / 2

Fn1 1,n2 1; / 2

2 2 H 0 : 12 2 ; H1 : 12 > 2

Acepto H0

Rechazo H0

(b) (b)
PASO 3: Rechazo H0

Fn1 1,n2 1;
Acepto H0

H 0 : ; H1 : <
2 1 2 2 2 1

2 2

(c)

F0 Fn1 1,n2 1
(c)

Fn1 1,n2 1;1


La regin de rechazo est donde seala H1

Informtica. Universidad Carlos III de Madrid

31

Ejemplo

En el problema de la eleccin entre dos tipos de material para construir sistemas de amarre, supusimos que eran varianzas iguales. Sabiendo que las poblaciones son normales, contrastar esa igualdad

2 2 H 0 : 12 = 2 ; H1 : 12 2

=2 2 = 2.3 Material M2: 30 datos, s 1 Material M1: 24 datos, s


Acepto H0

22 f0 = = 0.76 2 2.3

Rechazo H0

Rechazo H0

Se acepta, con un nivel de significacin del 5% que las varianzas son iguales La diferencia observada en la varianza de las muestras, no es significativa

F23,29;0.975 = 0.44

F23,29;0.025 = 2.17

Informtica. Universidad Carlos III de Madrid

32

Вам также может понравиться