Вы находитесь на странице: 1из 69

Slide 1

Esther Flores U. ESTADSTICA II

Slide 2

ELEMENTARY STATISTICS by Mario Triola - 2004


Presentaciones originales de Pearson Addison
Wesley.
Interpretadas, traducidas y adaptadas por Esther Flores
Ugarte para fines acadmicos de la asignatura de
Estadstica II
Universidad Continental de Ciencias e Ingenieria
Huancayo- Per

Esther Flores U. ESTADSTICA II

Captulo 9
Slide 3
Inferencias acerca de dos muestras
9-1 Panorama General
9-2 Inferencias acerca de dos proporciones

9-3Inferencias acerca de dos medias:


muestras independientes
9-4 Inferencias acerca de pares relacionados
9-5 Comparacin de la variacin en dos
muestras

Esther Flores U. ESTADSTICA II

Slide 4

Seccin 9-1 & 9-2


Panorama general de
inferencia acerca de dos
proporciones

Esther Flores U. ESTADSTICA II

Slide 5

SEMANA 6

Esther Flores Ugarte

ESTADSTICA II

Panorama General

Slide 6

Existen situaciones de importancia en las


cuales es necesario comparar
dos conjuntos de datos muestrales.

Esther Flores U. ESTADSTICA II

Inferencia acerca de dos


proporciones

Slide 7

Requisitos:
1. Tenemos proporciones de dos muestras
aleatorias simples que son independientes.
2. Para ambas muestras, el nmero de xitos
es de al menos 5 (np 5) y el nmero de
fracasos es de al menos 5 (nq 5).

Esther Flores U. ESTADSTICA II

Notacin para
dos proporciones

Slide 8

Para la poblacin 1, permitimos que:


p1 = proporcin poblacional
n1 = tamao de la muestra
x1 = Nmero de xitos en la muestra

^
p1 = x1 (la proporcin muestral)
n1

q^1 = 1 ^
p1
Se adjunta los significados correspondientes a:
p2, n2 , x2 , ^p2. y ^q2 , que provienen de la poblacin 2
Esther Flores U. ESTADSTICA II

Proporcin muestral
agrupada p1 y p2

Slide 9

La proporcin agrupada de p1 y
se denota por p.

x1 + x2

p= n +n
1
2

q =1p
Esther Flores U. ESTADSTICA II

p2

Estadstico de prueba para dos


Slide 10
proporciones
Para H0: p1 = p2 , H0: p1 p2 ,
H1: p1 p2 ,

z=

H0: p1 p2

H1: p1 < p2 , H1: p 1> p2

^ )(p p )
( p^1 p
2
1
2

pq
pq
n1 + n2

Esther Flores U. ESTADSTICA II

Estadstico de prueba para dos


Slide 11
proporciones
Para H0: p1 = p2 , H0: p1 p2 ,
H1: p1 p2 ,

Donde

p1 p 2 = 0
p^

p=

x1 + x2
n1 + n 2

x1
= n
1

H0: p1 p2

H1: p1 < p2 , H1: p 1> p2


(supuesto en la hiptesis nula)
y

p^

x2
=
n2

Esther Flores U. ESTADSTICA II

q=1p

Slide 12

Ejemplo:

Para la data muestral presentada en la


siguiente tabla, use un nivel de significancia del 0.05
para probar la aseveracin de que los conductores
afroamericanos detenidos por la polica tienen mayor
proporcin de infracciones que los conductores blancos.

Esther Flores U. ESTADSTICA II

Slide 13

Ejemplo:
n1= 200
H0: p1 = p2, H1: p1 > p2

x1 = 24

^p1 = x1 = 24 = 0.120

p = x1 + x2 = 24 + 147 = 0.106875
n1 + n2 200+1400
q = 1 0.106875 = 0.893125.

n1 200
n2 = 1400
x2 = 147
^p2 = x2 = 147 = 0.105
n2 1400

Esther Flores U. ESTADSTICA II

Slide 14

Ejemplo:
n1= 200

(0.120 0.105) 0

z=

x1 = 24

(0.106875)(0.893125) + (0.106875)(0.893125)
200
1400

^p1 = x1 = 24 = 0.120
n1 200

z = 0.64

n2 = 1400
x2 = 147
^p2 = x2 = 147 = 0.105
n2 1400

Esther Flores U. ESTADSTICA II

Slide 15

Ejemplo:
n1= 200

x1 = 24

^p1 = x1 = 24 = 0.120
n1 200
n2 = 1400
x2 = 147
^p2 = x2 = 147 = 0.105
n2 1400

z = 0.64
Es una prueba de cola derecha, por lo
que P-value es el rea a la derecha del
estadstico de prueba z = 0.64. El Pvalue es 0.2611.
Ya que el P-value es 0.2611 es mayor
que el nivel de significancia = 0.05,
no rechazamos Ho.

Esther Flores U. ESTADSTICA II

Slide 16

Ejemplo:
n1= 200

x1 = 24

^p1 = x1 = 24 = 0.120
n1 200
n2 = 1400
x2 = 147
^p2 = x2 = 147 = 0.105
n2 1400

z = 0.64
Debido a que no rechazamos la hiptesis
nula, concluimos que existe suficiente
evidencia sustentar la aseveracin que la
proporcin de infracciones de
conductores afroamericanos es igual a la
proporcin de infracciones de
conductores blancos.

Esther Flores U. ESTADSTICA II

Slide 17

Ejemplo:

Valor p
n1= 200

x1 = 24

^p1 = x1 = 24 = 0.120
n1 200
n2 = 1400
x2 = 147
^p2 = x2 = 147 = 0.105
n2 1400

Esther Flores U. ESTADSTICA II

Intervalo de confianza
Slide 18

p1 - p2

Estimacin de

( p^1 p^2 ) E < ( p1 p2 ) < ( p^1


Donde E =

^ )+
p
2

p^1 q^1
p^2 q^2
n1 + n2

Esther Flores U. ESTADSTICA II

Example: para los datos del ejercicio anterior

Slide 19

encuentre el intervalo de confianza de la diferencia de


proporciones poblacionales para el 90% del nivel de
confianza.

n1= 200

E = z

x1 = 24

p^1 q^1
p^2 q^2
n1 + n2

^
p1 = x1 = 24 = 0.120 E = 1.645
n1 200
n2 = 1400
x2 = 147
^
p2 = x2 = 147 = 0.105
n2 1400

E = 0.400

Esther Flores U. ESTADSTICA II

(.12)(.88)+(0.105)(0.895)
200
1400

Slide 20

Ejemplo:
n1= 200 (0.120 0.105) 0.040 < ( p1 p2) < (0.120 0.105) + 0.040
0.025 < ( p1 p2) < 0.055
x1 = 24

^
p1 = x1 = 24 = 0.120

n1 200
n2 = 1400
x2 = 147
^
p2 = x2 = 147 = 0.105
n2 1400

Esther Flores U. ESTADSTICA II

Slide 21

Seccin 9-3
Inferencia acerca de dos
medias : Muestras
independientes.
Created by Erin Hodgess, Houston, Texas

Esther Flores U. ESTADSTICA II

Definiciones

Slide 22

Dos muestras : Independientes


Los valores muestrales seleccionados de una
poblacin no estn relacionados de ninguna
manera pareados con los valores muestrales
seleccionados de otra poblacin.
Si los valores de una muestra estn
relacionados con los valores de otra muestra ,
las muestras son dependientes.
A dichas
muestras se las conoce como datos pareados o
relacionados.
Esther Flores U. ESTADSTICA II

Requisitos

Slide 23

1. 1 y 2 se desconocen y no se hace una


suposicin sobre la igualdad de ambas.
2. Las muestras son independientes.
3. Ambas muestras provienen del muestreo
aleatorio simple.
4. Una ambas condiciones son satisfechas:
Las dos muestras son de tamao grande (con
n1 > 30 y n2 > 30) ambas muestras provienen
de poblaciones con distribucin normal.

Esther Flores U. ESTADSTICA II

Estadstico de prueba

Slide 24

Para dos medias independientes:

(x
1 x2) (1 2)
=
2.
2
s
s1
2
+
n2
n1

Esther Flores U. ESTADSTICA II

Grados de libertad

Slide 25

Triola utiliza el estimado sencillo y conservador: gl=


el ms pequeo n1 1 y n2 1.
Los programas de cmputo utilizan un estimado
ms exacto, usan la frmula siguiente:

gl =
s1
Donde A= n
1

.2

(A + B)^2
2.
2
B
A
+
n1 -1 n2 - 1
s2.2
B=
n2

Esther Flores U. ESTADSTICA II

Prueba de hiptesis

Slide 26

Para dos medias:


Grados de libertad : gl: n1 1 ( el ms pequeo) and n2 1.
P-value:

Table A-3.

Valores crticos:

Table A-3.

Esther Flores U. ESTADSTICA II

McGwire Versus Bonds

Slide 27

El conjunto de datos en el Appendix B incluye


las distancias de home runs hit en el record de
la temporada ejecutados por Mark McGwire y
Barry Bonds. Las estadsticas muestrales se
presentan a continuacin . Use un nivel de
significancia de 0.05, para probar la aseveracin
de que las distancias vienen de poblaciones con
medias diferentes.

Esther Flores U. ESTADSTICA II

McGwire Versus Bonds


McGwire

Bonds

70

73

418.5

403.7

45.5

30.6

Esther Flores U. ESTADSTICA II

Slide 28

McGwire Versus Bonds


Afirmacin: 1 2
Ho : 1 = 2
H1 : 1 2
= 0.05

n1 1 = 69
n2 1 = 72
df = 69
t.025 = 1.994
Esther Flores U. ESTADSTICA II

Slide 29

McGwire Versus Bonds

Slide 30

Estadstico de prueba para dos


medias independientes:

(x
1 x2) (1 2)
=
2
.2
s1
s2
+
n2
n1

Esther Flores U. ESTADSTICA II

McGwire Versus Bonds

t =

(418.5 403.7) 0
45.52
70

= 2.273
Esther Flores U. ESTADSTICA II

30.62
73

Slide 31

McGwire Versus Bonds


Afirmacin: 1 2
Ho : 1 = 2
H1 : 1 2
= 0.05

Esther Flores U. ESTADSTICA II

Slide 32

McGwire Versus Bonds


Afirmacin:
1 2
Ho : 1 = 2
H1 : 1 2

Slide 33

Existe evidencia significativa para aseverar


que hay una diferencia entre el promedio
de home run distances de Mark McGwire y
Barry Bonds.

= 0.05

No se acepta Ho

Esther Flores U. ESTADSTICA II

Intervalos de confianza

Slide 34

(x1 x2) E < (1 2) < (x1 x2) + E

Donde; E =

s2
s
+
n2
n1

Esther Flores U. ESTADSTICA II

2
1

McGwire Versus Bonds

Slide 35

Usando la data proporcionada en el ejercicio


anterior, construya un intervalo de confianza del
95% para estimar la diferencia entrela media de
los home run distances de Mark McGwire and
Barry Bonds.

E = t

s2
s
+
n2
n1

2
1

E = 1.994

45.5
70

E = 13.0
Esther Flores U. ESTADSTICA II

30.6
73

McGwire Versus Bonds

Slide 36

(418.5 403.7) 13.0 < (1 2) < (418.5 403.7) + 13.0


1.8 < (1 2) < 27.8

Tenemos una confianza del 95% para afirmar que los


lmites de 1.8 ft y 27.8 ft contienen realmente las
diferencias de las medias de las dos poblacionales.

Esther Flores U. ESTADSTICA II

Slide 37

SEMANA 7

Esther Flores Ugarte

ESTADSTICA II

Slide 38

Seccin 9-4
Inferencias a partir de
datos apareados
Created by Erin Hodgess, Houston, Texas

Esther Flores U. ESTADSTICA II

Requisitos

Slide 39

1. Los datos muestrales consisten en datos


apareados.
2. Las muestras son aleatorias simples.
3. Cualquiera o ambas de estas condiciones es
satisfecha: el nmero de datos apareados de
datos muestrales es grande(n > 30) o los pares de
valores tienen diferencias que se toman de una
poblacin con una distribucin aproximadamente
normal.
Esther Flores U. ESTADSTICA II

Notacin para datos apareados

Slide 40

= valor medio de las diferencias d para la


poblacin de todos los datos apareados

valor medio de las diferencias d para los datos

muestrales apareados (igual a la media de los valores

xy)
sd
= Desviacin estndar de las diferencias d para la
muestra de datos apareados.
d = diferencia individual entre los valores en un solo
dato apareado.
n

nmero de pares de datos.


Esther Flores U. ESTADSTICA II

Estadstico de prueba para datos


apareados

t=

Slide 41

d d
sd
n

Donde los grados de libertad son = n 1

Esther Flores U. ESTADSTICA II

P-values y valores crticos

Slide 42

Use la Tabla A-3 (distribucin t).

Esther Flores U. ESTADSTICA II

Intervalos de confianza
d E < d < d + E
Donde

E = t/2

sd
n

Grados de libertad = n 1

Esther Flores U. ESTADSTICA II

Slide 43

Temperaturas reales y
pronosticadas

Slide 44

La informacin en la tabla siguiente, est referida a


cinco temperaturas mnimas reales y cinco
temperaturas que se pronosticaron cinco das. Se
trata de datos apareados puesto que cada par de
valores representa al mismo da. Las temperaturas
pronosticadas parecen ser muy diferentes, de las
temperaturas reales, pero existe la suficiente
evidencia para concluir que la diferencia media no es
de cero? Use el nivel de significancia de 0.05 para
probar la aseveracin de que existe una diferencia
entre las temperaturas mnimas reales y las
temperaturas mnimas pronosticadas cinco das
antes.
Esther Flores U. ESTADSTICA II

Temperaturas reales y
pronosticadas

Esther Flores U. ESTADSTICA II

Slide 45

Temperaturas reales y
pronosticadas

Slide 46

d = 13.2 9 (promedio de las


diferencias)
s = 10.7
n=5
t/2 = 2.776 (de la Tabla A-3 con 4 grados
de libertad y 0.05 en dos colas)

Esther Flores U. ESTADSTICA II

Temperaturas reales y
pronosticadas

Esther Flores U. ESTADSTICA II

Slide 47

Temperaturas reales y
pronosticadas
H0: d = 0
H1: d 0

Slide 48

d d = 13.2 0 = 2.759
t = sd
10.7
n

Esther Flores U. ESTADSTICA II

Slide 49

H0 : d = 0
H1: d 0

d d = 13.2 0 = 2.759
t = sd
10.7
n

Debido a que el estadstico de prueba no cae


en la regin crtica no rechazamos Ho.

Esther Flores U. ESTADSTICA II

Temperaturas reales y
pronosticadas
H0: d = 0
H1: d 0

Slide 50

d d = 13.2 0 = 2.759
t = sd
10.7
n

La data muestral no proporciona suficiente


evidencia para sostener la afirmacin de que
las temperaturas reales y las pronosticadas
hace cinco das son diferentes.
Esther Flores U. ESTADSTICA II

Temperaturas reales y
pronosticadas

Slide 51

Para el mismo ejercicio anterior,


construya , un intervalo de confianza
de 95% de d, el cual es el valor de la
media de las diferencias de las
temperaturas bajas reales y cinco
pronosticadas.

Esther Flores U. ESTADSTICA II

Temperaturas reales y
pronosticadas

E = t/2

sd
n

E = (2.776)(

10.7
5

= 13.3

Esther Flores U. ESTADSTICA II

Slide 52

Temperaturas reales y
pronosticadas
d E < d < d + E
13.2 13.3 < d < 13.2 + 13.3
26.5 < d < 0.1

Esther Flores U. ESTADSTICA II

Slide 53

Slide 54

Seccin 9-5
Comparacin de la
variacin en dos
muestras
Created by Erin Hodgess, Houston, Texas

Esther Flores U. ESTADSTICA II

Medidas de variacin

Slide 55

s = desviacin estndar muestral

= desviacin estndar poblacional


s2 = varianza muestral

2 = varianza poblacional

Esther Flores U. ESTADSTICA II

Requisitos

Slide 56

1.
Las
dos
poblaciones
son
independientes una de la
otra.
2. Las dos poblaciones estn
distribuidas normalmente.

Esther Flores U. ESTADSTICA II

Notacin para pruebas de hiptesis con dos


Slide 57
varianzas o desviaciones estndar
2

= la mas grande de dos varianzas


muestrales
1

= Tamao de la muestra que tiene la


varianza ms grande
1

SE SUGIERE TENERLO EN CUENTA , PARA


CRITERIO DE ESTADISTICO DE PRUEBA

Esther Flores U. ESTADSTICA II

Notacin para pruebas de hiptesis con dos


Slide 58
varianzas o desviaciones estndar

= varianza de la poblacin de donde se


obtiene la muestra con la varianza ms
grande.
1

Los smbolos s2 , n2 , y 2 se utilizan para la


otra muestra y la otra poblacin.
2

Esther Flores U. ESTADSTICA II

Caractersticas de la
distribucin F

Slide 59

La distribucin F no es simtrica
Los valores de la distribucin F no pueden
ser negativos
La forma exacta de la distribucin F
depende de dos diferentes grados de
libertad.

Esther Flores U. ESTADSTICA II

Estadstico de prueba para las


Slide 60
pruebas de hiptesis con dos
varianzas

F=

s
s

1
2

es la ms grande de las dos varianzas muestrales

Valores criticos: Use la tabla A-5, obtenemos los


valores crticos de F con los siguientes criterios:
1. Nivel de significancia .
2. Grados de libertad del numerador (gl1) = n1 1
3. Grados de libertad del denominador (gl2) = n2 1
Esther Flores U. ESTADSTICA II

Slide 61

Todas las pruebas de una cola sern de


cola derecha.
Todas las pruebas de dos colas necesitarn
solo el valor crtico a la derecha
Cuando los grados de libertad no se
encuentran exactamente, use los valores
crticos de ambos lados como un intervalo.
Interpole solo si el estadstico de prueba
cae dentro del intervalo.
Esther Flores U. ESTADSTICA II

Slide 62

Si las dos poblaciones tienen


s12
varianzas iguales, s22 entonces F=
ser cerca de 1,porque
valores cercanos.

Esther Flores U. ESTADSTICA II

s y s2 son
1

Slide 63

Si las dos poblaciones tienen


radicalmente varianzas diferentes ,
entonces F ser un nmero grande.
2

Recuerde que la varianza muestral ms grande ser s1 .

Esther Flores U. ESTADSTICA II

Slide 64

Por lo tanto , un valor de F


cercano a
1, proporcionar
evidencia
en
favor
de
la
2
2
conclusin de que 1 = 2 .
Pero
un valor grande de
F
mostrar evidencia en contra de
la conclusin de la igualdad de
las varianzas poblacionales.
Esther Flores U. ESTADSTICA II

Coca Cola Versus Pepsi

Slide 65

El conjunto de datos 17 del Apndice B, incluye


los pesos (en libras ) de las muestras de Coca
Cola regular y Pepsi regular. Presentamos a
continuacin las estadsticas muestrales. Use el
nivel de significancia de 0.05 Para probar la
aseveracin de que los pesos de ambas bebidas
tienen la misma desviacin estndar.
Coca Cola Regular

Pepsi Regular

36

36

0.81682

0.82410

0.007507

0.005701

Esther Flores U. ESTADSTICA II

Slide 66

Esther Flores U. ESTADSTICA II

Slide 67

Esther Flores U. ESTADSTICA II

Coca Cola Versus Pepsi

Slide 68

Asever.: 1 = 2
2

Ho : =
2
1
2
1

H1 : 2

2
2
2

= 0.05
Valor de F =
=

s12

s22
0.007507 2
0.005701 2

= 1.7339

El valor crtico se ha obtenido de


la tabla, tomando 40gl.

Esther Flores U. ESTADSTICA II

Coca Cola Versus Pepsi

Slide 69

Asever: 1 = 2
2

Ho : =
2
1
2
1

H1 : 2

2
2
2

= 0.05

Existe suficiente evidencia para afirmar que las dos


varianzas son iguales.
Esther Flores U. ESTADSTICA II

Вам также может понравиться