Вы находитесь на странице: 1из 45

Diapositivas Estadistica y Diseo Experimental - segunda unidad

- Mg. Mario Pelaez Osorio

ESTIMACION PUNTUAL Y DE
INTERVALO
Una poblacion se describe por su distribucion
de probabilidad y sus parametros.
Para una poblacion cuantitativa, la ubicacion
y forma se describe por y .
Para una poblacion binomial, la ubicacion y
forma esta determinada por P.
Si no se conocen los valores de los parmetros ,
hacemos inferencias sobre ellos utilizando la
2006 Brooks/Cole
informacin de la muestra. Copyright
A division of Thomson Learning, Inc.

Metodos de Inferencia
Ejemplos:
Un consumidor quiere estimar el precio
promedio de viviendas similares en la ciudad
antes de poner su casa en el mercado.
Estimacion: Estimar , el promedio de los precios.

Un fabricante quiere saber si un nuevo tipo de


acero es ms resistente que un tipo de acero
antiguo.
Prueba de Hipotesis: El Nuevo promedio de resistencia,
es igual al antiguo promedio, ? Copyright 2006 Brooks/Cole

A division of Thomson Learning, Inc.

Metodos de Inferencia
Estimacion:
Estimar o predecir el valor del parametro
cual es el valor mas probable de o P?
Prueba de Hipotesis:
Tomar una decision acerca del valor de un
parametro, con base en una idea preconcebida.

La muestra proviene de una poblacion con


= 10 o P = 0.20?

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Metodos de Inferencia
Los procedimientos estadisticos son
importantes porque dan dos tipos de
informacion:
Metodos para hacer la inferencia
Una medida numerica de la bondad
o confiabilidad de la inferencia
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Definiciones
Un estimador es una regla, que nos dice
como calcular una estimacion con la
informacion de la muestra.
Estimacion Puntual:.Se calcula un
solo numero para estimar el parametro
Estimacion de Intervalo: Dos
numeros se calculan para formar un
intervalo dentro del cual se espera est
el parametro.

El Margen de Error (E)


95% de todas las estimaciones caen dentro
de 1.96 desviaciones estandares del
parametro de interes.
Margen de error: Es el maximo error de estimacion
calculado como:

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Estimacion de Medias y Proporciones


Para poblacion cuantitativa

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Ejemplo
Un propietario toma una muestra al azar de 64
casas similares a la suya y encuentra que el precio
medio de venta es de $ 252.000 , con una
desviacin estndar de $ 15.000. Estime el precio
de venta promedio para todas las viviendas
similares en la ciudad.

Para poblacion binomial

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Estimacion de Intervalo

Ejemplo
Un tcnico de control de calidad quiere estimar
la proporcin de latas de refrescos que estn mal
llenadas .
l toma una muestra al azar de 200 latas de
refresco y se encuentra 10 latas mal llenadas

Calcular dos numeros del intervalo [a, b] en el


cual se confia que contiene el parametro de
interes.
Confianza significa con alta probabilidad,
medida usando un nivel de confianza, 1
.
1- = 0.90; 0.95; 0.98; 0.99

Cuando 1- = 0.95 y el
estimador tiene
distribucion normal.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Estimacion de Intervalo
No conocemos el valor del parametro. 95% de
los intervalos contendran el parametro .
Estimador 1.96 EE

Parametro 1.96 EE

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Nivel de confianza
Para cambiar el nivel de confianza, 1-, elija un
valor z que deje un area 1- en el centro de la
distribucion z .
Area de cola
z
/2

Funciona
Funciona
Funciona
Falla

Slo si el estimador cae en las reas de la cola


el intervalo dejar de incluir el parmetro .
Copyright 2006 Brooks/Cole
Esto sucede slo el 5% de las veces.
A division of Thomson Learning, Inc.

.05
.025
.01

1.645
1.96
2.33

.005

2.58

100(1-)% Intervalo de confianza: Estimador z/2EE


Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Ejemplo

Intervalo de confianza para la media y


la proporcion poblacional

Una muestra aleatoria de n = 50 hombres mostr


una ingesta media diaria de productos lcteos
igual a 756 gramos con una desviacin estndar
de 35 gramos . Encuentre un intervalo de
confianza del 95% para la media de la poblacin

Para poblacion cuantitativa,

Para poblacion binomial

x 1.96

756 1.96

35

50

756 9.70

o 746.30 < < 765.70 gramos.


Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Ejemplo

Ejemplo

Encuentre un intervalo de confianza del 99%


para la ingesta diaria promedio de la poblacin
de productos lcteos para los hombres.
x 2.58

756 2.58

35

756 12.77
n
50
or 743.23 < < 768.77 grams.
El intervalo debe ser ms ancho para compensar el
aumento de la confianza de encerrar el verdadero valor
Copyright 2006 Brooks/Cole
de .

A division of Thomson Learning, Inc.

De una muestra aleatoria de n = 150 estudiantes


universitarios , 104 dijeron que haban jugado en un
equipo de ftbol juvenil. Estimar la proporcion de
estudiantes universitarios que jugaban al ftbol en su
juventud con un intervalo de confianza del 98 %.

p 2.33

.69(.31)
p q 104

2.33
150
150
n

.69 .09

o 0.60 < P < 0.78


Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Estimacion de la diferencia entre


dos medias

Estimacion de la diferencia entre


dos medias

A veces estamos interesados en comparar las medias de dos


poblaciones, por ejemplo:
El promedio de crecimiento de plantas alimentadas mediante
dos tipos de nutrientes diferentes .
Las puntuaciones medias de los estudiantes enseados con dos
mtodos de enseanza diferentes.

Comparamos los dos promedios haciendo


inferencias acerca de 1-2, la diferencia de los
dos promedios poblacionales.
Si los dos promedios poblacionales son los
mismos entonces: 1-2 = 0.
La mejor estimacion de 1-2 es la
diferencia de las dos medias muestrales,

Para hacer esta comparacin

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Distribucion muestral de:


x1 x2

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Estimando 1-
2
Para muestras grandes , las estimaciones
puntuales y su margen de error , as como los
intervalos de confianza se basan en la
distribucin normal estndar .

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Ejemplo
Ingesta diaria

Men

Women

Tamao de muestra

50

50

Media muestral

756

762

Desv. Estand. Muest.

35

30

Comparar la ingesta diaria promedio de productos


lcteos de hombres y mujeres usando un intervalo de
confianza del 95 %.
s2 s2
( x1 x2 ) 1.96 1 + 2
n1 n2
352 302 6 12.78
(756 762) 1.96
+
50 50

Ejemplo, continuacion

Podra llegar a la conclusin, sobre la base de este intervalo


de confianza , que hay una diferencia en la ingesta diaria
promedio de los productos lcteos para los hombres y las
mujeres?
Este intervalo contiene el valor 1-
2= 0. Por tanto es posible
que 1 = 2. No se puede llegar a la conclusin de que existe
una diferencia en la ingesta diaria promedio de los productos
lcteos para los hombres y las mujeres .

or - 18.78 < 1 2 < 6.78.


Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Seleccion del tamao muestral


1).- Escoja B, el limite de error de su estimacin y un
coeficiente de confianza
2).- Despeje el tamao muestral n de:
Z/2 x EE(estimador) B
3).- Para un problema de dos muestras, haga n1 = n2 = n

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Ejemplo

Resumen
I. Tipos de Estimadores
1. Estimacion puntual: Un numero calculado para estimar el
parametro poblacional.
2. Intervalo : Dos numeros calculados para formar un
intervalo que contiene el parametro.
II. El Margen de error mide la maxima distancia entre el
estimador y el verdadero valor del parametro.
III. Intervalos de confianza para muestras grande

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Pruebas de hipotesis para


muestras grandes
(Modelo normal)

El razonamiento utilizado en una prueba de hiptesis


es similar al proceso en un tribunal. Al tratar a una
persona por un delito, el jurado o Juez tiene que
decidir entre una de dos posibilidades:
La persona es culpable.
La persona es inocente.
Al inicio, la persona se supone inocente.
El fiscal presenta pruebas, tratando de rechazar la
hiptesis original de inocencia, y la conclusin de que
la persona es culpable
Si el proceso no presenta suficiente evidencia de
culpabilidad, se mantiene la suposicin de
inocencia
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Procedimiento de una prueba


de Hipotesis
1. La hipotesis nula, H0:
Se asume verdadera hasta que
podamos probar lo contrario.
2. La hipotesis alternativa, Ha:
Sera aceptada como verdadera si
podemos rechazar H0
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio
Procedimiento de una prueba de Hipotesis

3. La estadistica de prueba: valor calculado o


experimental y su Valor P:
Una estadstica calculada a partir de la muestra
que nos permite rechazar o no rechazar H0, y
Una probabilidad, obtenida con el valor
experimental que mide si el valor experimental
es probable o improbable, suponiendo H0 es
verdad.
4. La region de rechazo:
Una regla que nos dice para qu valores de la
estadstica de prueba, la hiptesis nula debe ser
Copyright 2006 Brooks/Cole
rechazada.
A division of Thomson Learning, Inc.

Procedimiento de una prueba de Hipotesis

5. Conclusion:
Rechazar H0 o No rechazar H0, junto
con una declaracin sobre la fiabilidad de
su conclusin.
Cmo decidir cundo rechazar H0?
Depende del nivel de significancia , el
riesgo mximo tolerable que desea tener
de cometer un error, si decide rechazar
H0.
Frecuentemente, el nivel de significancia
es = .01 o = .05.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Ejemplo 1

Ejemplo 1

El alcalde de una pequea ciudad afirma que el


ingreso promedio en su ciudad es $ 35.000, con
una desviacin estndar de $ 5,000. Tomamos una
muestra de 64 familias, y encontramos que su
ingreso promedio es de $ 30.000. Es correcta su
afirmacin?
1-2. Queremos poner a prueba la hiptesis :

3. La mejor estimacin de la media poblacional es la media


muestral, $30,000:

Por el Teorema del Limite Central la media muestral tiene


distribucion normal con media = 35,000 error estandar
EE = 5000/8 = 625.

La media muestral, $30,000 tiene


z = (30,000 35,000)/625 = -8 desviaciones estandares
debajo de la media.

La probabilidad de observar una media muestral


30000 de una poblacion con = 35,000 (asumiendo H0 )
es cerca de cero.

H0: = 35,000 (el alcalde esta en lo correcto) versus


Ha: 35,000 (el alcalde esta equivocado)
Al inicio se asume que H0 es verdadera y = 35,000.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Prueba de hipotesis de una


muestra 30 para

Ejemplo 1
4. De la regla emprica, valores de ms de tres desviaciones
estndar de distancia de la media se consideran
extremadamente improbable. Un valor Z < -3 sera muy poco
probable que ocurra si H0 es verdadera, y dara razn para
rechazar H0.
5. Puesto que la media de la muestra , $30,000 es poco probable;
decidimos rechazar H0: = 35,000 y concluimos que la
afirmacion del alcalde es incorrecta.
6. La probabilidad que = 35,000 y que se tenga una media
muestral tan pequea (30000) por casualidad es casi cero.

Tomamos una muestra aleatoria con n 30 de


una poblacion con media y desviacion
estandar .
Asumimos:
1. es conocida o
2. s ya que n es grande
La hipotesis de prueba es
H0:
= 0 versus Ha: 0

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Estadistica de Prueba
Inicialmente suponemos que H0 es verdadera. La
media muestral es nuestra mejor estimacion de
, y usamos la forma estandarizada como
Estadistica de Prueba:

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Prueba estadistica
Si H0 es verdadera el valor de x debe estar cerca
a 0, y z cerca a 0. Si H0 es falso, x estara muy
lejos de 0, y z estara muy lejos de 0, indicado
que debemos rechazar H0.

x tiene distribucion normal con media 0 y

desviacion estandar:

/ n
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Probable o improbable?
Luego de calcular el valor experimental de la
estadistica de prueba, calculamos su Valor P:

Valor-P: La probabilidad de observar, por


casualidad, un valor experimental extremo o
incluso ms extremo de lo que hemos
calculado. Si H0 es rechazada esta es la
probabilidad de tomar una decisin incorrecta.

Ejemplo 02
El rendimiento diario de una planta qumica
tiene un promedio de 880 Kg. durante varios aos.
El gerente de control de calidad quiere saber si este
promedio ha cambiado. El selecciona al azar 50
das y registra un rendimiento promedio de 871 Kg.
con una desviacin estndar de 21 Kg.

Si esta probabilidad es muy pequea, menos de un


nivel de significancia , H0 es rechazada.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Ejemplo 02
Cual es la probabilidad que ocurra este valor de
z=-3.03 o mas extremo por casualidad? (si H0 es
verdadera)

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Ejemplo 02
Para tomar una decisin clara, al inicio del estudio
escogemos un nivel de significacin = 0.01.
Si el Valor-P es menor que , H0 es rechazada como
falsa. Usted informa de que los resultados son
estadisticamente significativos al nivel .
Si el Valor-P es mayor que , H0 no se rechaza. Usted
informa de que los resultados no son significativos al
nivel .

Esta es una ocurrencia poco


probable, que pasa alrededor de
2 veces en 1000, cuando
Copyright
Brooks/Cole
suponemos
2006
= 880!
A division of Thomson Learning, Inc.

Ya que nuestro valor-P =.0024 es menor que 0.01,


rechazamos H0 y concluimos que el rendimiento
medio a cambiado significativamente
al nivel 0.01.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Ejemplo

La Region de rechazo
Si = .01, Cual seria el valor valor critico tabular
Z/2 que marca la linea divisoria entre no
rechazo y rechazo H0?

Cual sera el valor critico Z/2 que corta el


area
/2 = 0.01/2 = .005 en la cola
de la distribucion z normal?
Para el ejemplo 02,
z = -3.03 cae en la
region de rechazo
de H0 al nivel 1%.

Si P < , H0 es rechazada.
Si P > , H0 No es rechazada.

El valor critico ocurre cuando el valor-P = . Este


valor se llama valor tabular o valor critico.
Zc > Z/2

implica P < ,

H0

se rechaza.

Zc < Z/2

implica P > ,

2006se
Brooks/Cole
HCopyright
NO
rechaza.
0

A division of Thomson Learning, Inc.

PRUEBAS UNILATERALES
(una cola)

A veces estamos interesados en una detectar


una diferencia direccional especfica para .
La hipotesis ALTERNATIVA a probar es de
una cola:
Ha:
> 0 o
Ha: < 0
La region de rechazo y el valor-P se obtienen
solamente para un lado de la distribucion

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Region de rechazo: Rechazar H0 si z > 2.58 o z < -2.58.


Si el valor calculado (ZC) cae en la region de rechazo, su
Copyright 2006 Brooks/Cole
valor-P sera menor que = 0.01.
A division of Thomson Learning, Inc.

Ejemplo 03
El propietario de una casa toma al azar una muestra
de 64 casas similares a la suya y encuentra que el
precio medio de venta es de $ 252.000, con una
desviacin estndar de $ 15.000. Es esta evidencia
suficiente para concluir que el precio medio de
venta es mayor de $ 250,000? Use = .01.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Calculo del valor P

Valor critico tabular


Cual es el valor tabular de Z que deja a la
derecha un area de = 0.01?
En nuestro ejemplo,

La probabilidad que los resultados de la muestra


(o mas extremos) ocurran por casualidad, cuando
= 250,000.

z = 1.07 no cae en la
region de rechazo de
H0 entonces NO se
rechaza. No hay
suficiente evidencia
para afrimar que

Como el Valor-P es mayor


que = .01,
H0 NO se rechaza.

> $250,000.

No hay suficiente evidencia


que
2006 Brooks/Cole
> Copyright
$250,000.

Region de Rechazo H0 : Rechazar si ZC >Copyright


2.33.2006 Brooks/Cole
A division of Thomson Learning, Inc.

A division of Thomson Learning, Inc.

Significancia estadistica

La regla de la Region critica y la regla del


Valor-P siempre producen resultados identicos.

El metodo del Valor-P es preferible porque:


La computadora reporta siempre los
Valores-P
Se puede evaluar el resultado de la prueba
para cualquier nivel de significancia.
Qu debe hacer si usted es el experimentador
Copyright 2006 Brooks/Cole
y nadie le da un nivel de significacin?
A division of Thomson Learning, Inc.

Si el Valor-P es menor que 0.01, Rechazar H0.


El resultado es MUY significativo.
Si el Valor-P esta entre 0.01 y 0.05, Rechazar
H0. El resultado es Significativo.
Si el valor-P esta entre 0.05 y 0.10, No
rechazar H0. Pero el resultado tiende hacia la
significancia.
Si el Valor-P es mayor que 0.10, No rechazar
H0. El resultado no es estadisticamente
significativo
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Dos tipos de error

Dos tipos de error

Hay dos tipos de error que pueden


ocurrir en una prueba de hipotesis.
Realidad Culpable

Inocente

Poblacion H0 verdad
(Acept H0)
Decision

H0 falsa
(Rechaza H0)

H0 Verdad
(Acept H0)

Error tipo II

Decision
Culpable

Correct

Error

Inocente

Error

Correct

Correcto

H0 falsa
Error tipo I
(Rechaza H0)

Correcto

Definicion:
= P(Error Tipo I) = P(rechazar H0 cuando H0 es verdadera)
=P(Error Tipo II) = P(aceptar H0 cuando H0 es falsa)

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

OTRAS PRUEBAS PARA


n30
La proporcion muestral y la diferencia de dos
medias muestrales tambien siguen la
distribucion normal cuando el tamao de
muestra es grande.
De manera general la formula para encontrar
el valor Zc sera:

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Queremos mantener las probabilidades de


error tan pequeas como sea posible.
El valor es el nivel de significancia, y esta
controlado por el experimentador.
El valor de es muy dificil de controlar.
Mas bien que interpretar aceptamos H0 como
verdadero sin proporcionar una medida de la
fiabilidad, interpretamos como No rechazar
H0. y se debe recolectar mas informacion
Copyright 2006 Brooks/Cole
Interpretacion: No hay suficiente evidencia
para Rechazar H .
A division of Thomson Learning,0Inc.

Prueba para la diferencia de dos


medias poblacionales
La hiptesis de inters implica la diferencia,
12, en la siguiente forma:
H0: 12 = D0 versus
Ha: una de las tres: 12 D0
12 < D0
12 > D0
donde D0 es alguna diferencia de interes,
Copyright 2006 Brooks/Cole
usualmente 0.
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Distribucion muestral de:


x1 x2

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Ejemplo 04
Promedio de consumo diario

Prueba para la diferencia de dos


medias poblacionales

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Calculo del valor-P

Hombres Mujeres

Tamao de muestra

50

50

Media muestral

756

762

Desviacion estandar muestral

35

30

La probabilidad de observar valores de z


tan lejos de z = 0 cuando, 12 = 0.

Hay alguna diferencia en la ingesta diaria promedio de


productos lcteos para los hombres frente a las mujeres? Use
= .05.
H0 : 1 2 = 0
Prueba estadistica :
x x2 0
ZC 1
s12 s 22
+
n1 n 2

Ha : 1 2 0
=

756 762 0
352 30 2
+
50
50

= .92

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Dado que el Valor-P > = 0.05,


No se rechaza H0. No hay
suficiente evidencia para concluir
que los hombres y mujeres tienen
diferente consumo promedio
Copyright 2006
Brooks/Cole
diario de productos
lacteos.
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Ejemplo 05

Prueba para una proporcion


poblacional P

Independientemente de la edad, aproximadamente el 20%


de adultos en USA participan en actividades de ejercicios
fsicos al menos dos veces por semana. Una muestra
aleatoria de 100 adultos mayores de 40 aos encontr que
solo 15 se ejercitan al menos dos veces por semana. Esta
es evidencia de una disminucin en la participacin
despus de los 40? Use = 0.05.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Region de rechazo

Resumen

Cual es el valor tabular z que divide en dos


regiones con = 0.05 de area en la cola
izquierda?
El valor calculado es
,
zc = -1.25 no cae en la
region de rechazo de H0.
No hay suficiente
evidencia que P < 0.20
para mayores de 40 aos.

I. Partes de una Prueba de Hipotesis


1. Hipotesis nula: Lo contrario a la hipotesis alernativa
2.

Hipotesis alternativa: La hipotesis que el investigador


quiere probar.

3.

Valor experimental o Valor calculado y su Valor-P:


Evidencia muestral calculada con los datos de la muestra.

4.

Region de rechazo, valor tabular, nivel de significancia:


Valores que dividen el area de rechazo y no rechazo de H0

5.

Conclusion: Rechazar o no rechazar la hiptesis nula


interpretando en trminos del contexto del problema.

Region de rechazo: Rechazar H0 si Zc < -1.645,


es decir si el valor-P < = 0.05.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Resumen
II.Tipos de Error en la Prueba y Significancia Estadistica

Resumen

1.

El nivel de significancia es la probabilidad de rechazar


H0
cuando en realidad esta es verdadera. Es el riesgo
de comenter error en la decision de rechazar H0

2.

El Valor-P Se obtiene con el valor calculado Zc, es la


probabilidad de observar un valor calculado ms extremo:
Cuando el Valor P es muy pequeo (P<0.05), el resultado de la
prueba es mas significativo
3.

Cuando el valor P < nivel de significancia ,


Rechazamos H0. Esto sucede cuando la estadistica de
prueba excede al valor critico o valor tabular.

4.

El Error tipo II, es la probabilidad de aceptar H 0


cuando en realidad es falsa.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Introduccion
Hay pruebas de hipotesis y estimaciones
de muestras pequeas para:

PRUEBAS PARA
MUESTRAS PEQUEAS

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.


, la media de una poblacion normal

12, la diferencia de dos medias
poblacionales

2, La varianza de una poblacion
normal
La razn de dos varianzas
poblacionales.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Propiedades de la distribucion t

Distribucin t de Student

Cuando una muestra de tamao nes


pequea utilizamos la distribucion t de
Student , con parametro: n-1 grados de
libertad.

Forma de campana
y simetrica.
Mas variable que z

Podemos usar esta distribucion para la prueba


de hipotesis y estimacion intervalica de la
Copyright 2006 Brooks/Cole
media poblacional .
A division of Thomson Learning, Inc.

La forma depende de los grados de


libertad, n-1.
Cuando n aumenta la distribucion de t y z se
aproximan.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Uso de la Tabla t

La tabla 4 da los valores de t con el valor


critico en la cola de la distribucion t.
Con el indice r = df y el valor de alfa para
hallar t, el valor que deja un area a la
derecha.
Para una muestra de tamao n =
10, encuentre el valor de t que
deja un area 0.025 en la cola
derecha.
Fila = gl = r = n 1 = 9
Indice de columna= = .025
t.025 = 2.262
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Inferencia de muestras
pequeas para la media

Los procedimientos bsicos son los mismos


que los utilizados para muestras grandes.

Inferencia de muestras
pequeas para la media

Un intervalo confidencial del


100(1)% para la media :

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Ejemplo

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Ejemplo

Un sistema de riego est diseado para que el tiempo


promedio de riego de los aspersores no sea mayor de
15 segundos. Una prueba de 6 sistemas dio los
tiempos siguientes: 17, 31, 12, 17, 13, 25
Este Sistema esta funcionando segun las especificaciones? Use = .05.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Datos: 17, 31, 12, 17, 13, 25


Primero, calculamos la media y desviacion
estandar muestral, usando la calculadora
cientifica o con las formulas:

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Ejemplo
Datos: 17, 31, 12, 17, 13, 25
Calculamos el valor experimental y region de
rechazo unilateral con =.05.

Conclusion
Datos: 17, 31, 12, 17, 13, 25
Comparamos el valor experimental con la region
de rechazo y concluimos:

Region de rechazo:
Rechazar H0 si t > 2.015.

Conclusion: tc = 1.38 No cae en la region de rechazo. No


hay suficiente evidencia que indique que el tiempo
promedio de activacion de los aspersores es mayor que 15.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Aproximacion del Valor - P


Usando la Tabla 4.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

El Valor-P exacto
Usando una computadora
Valor -P = 0.113 > 0.10
como se determino con la
aproximacion.

One-Sample T: Times
Test of mu = 15 vs > 15

Como el valor observado tc = 1.38


esta entre 1.156 y 1.476,
0.10 < Valor-P
< 0.15
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Variable
Times

N
6

Mean
StDev
19.1667 7.3869

SE Mean
3.0157

95%
Lower
Bound
13.0899

T
1.38

P
0.113

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Prueba para la diferencia


de dos medias

Prueba para la diferencia


de dos medias
La formula para muestras grandes:

Para probar:
H0: 12 = D0 versus
Ha: una de tres
donde D0 es una diferencia hipotetica, usualmente
Copyright 2006 Brooks/Cole
= 0.
A division of Thomson Learning, Inc.

Prueba para la diferencia de dos medias


En lugar de estimar cada varianza poblacional por
separado, se estima la varianza comn, llamada tambin
varianza mancomunada o conjunta.

No tiene distribucion z o t , y no puede usarse


para inferencia de muestras pequeas.
Tenemos que hacer una suposicin ms:
que las varianzas poblacionales, aunque
desconocidas, son iguales.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Intervalo de confianza para la


diferencia de dos medias
Recuerde los supuestos:

Y obtenemos la estadistica de prueba:

1. Muestras aleatorias e
independientes
2. Poblaciones normales

Que tiene distribucion t con


r = n1+n2-2 grados de
libertad
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

3. Varianzas poblacionales
iguales.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Ejemplo

Ejemplo Usar el metodo del Valor P

Dos Metodos de Instruccion se comparan para


medir el tiempo que les toma a los alumnos
ensamblar eficientemente un dispositivo. A cada
grupo diferente se les instruye mediante un mtodo
distinto. Hay diferencia entre los dos metodos?
Use = .01.
Tiempo de
ensamblado

Metodo 1

Metodo 2

Tamao de
muestra

10

12

Media

35

31

Desv. Estand.
Muestral

4.9

4.5

H0 : 1 2 = 0
Ha : 1 2 0

tc =

x1 x 2 0
1
1

s c2
+
n1 n 2

Ejemplo

Metodo 1 Metodo 2

Tamao de
muestra

10

12

Media

35

31

Desv. Estand.
Muestral

4.9

4.5

Varianza comun :
s2 =

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

gl= n1 + n2 2 = 10 + 12 2 = 20

Tiempo de
ensamblado

(n1 1)s12 + (n 2 1)s 22


n1 + n 2 2

tc =

9( 4.9 2 ) + 11( 4.52 )


=
= 21.942
20
= 1.99

35 31
1 1
21.942 +
10 12

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Prueba para la diferencia


de dos medias
.025 < ( Valor P) < .05

Cmo se puede saber si el supuesto de igualdad


de varianzas poblacionales es razonable?

0.05 < Valor P < 0.10


P > = 0.01,
H0 no se rechaza.
No hay suficiente evidencia
para probar la diferencia de
metodos de instruccion

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Ejemplo

Prueba de diferencia pareada


(2 muestras dependientes)
A veces, el supuesto de muestras independientes
se viola intencionalmente, lo que resulta en una
prueba de 2 muestras relacionadas o prueba de
datos emparejados.
Al disear el experimento de esta manera,
podemos eliminar una variabilidad no deseada
mediante el anlisis de las diferencias,
di = x1i x2i
para ver si hay una diferencia en las dos medias
de la poblacin, 12.
Copyright 2006 Brooks/Cole

Tipo A

Auto

10.6

9.8

12.3

9.7

8.8

Tipo B

10.2

9.4

11.8

9.1

8.3

Para comparar el desgaste de dos marcas de llantas A y B


se asignaron al azar en cada uno de 5 autos. Luego de un
recorrido especificado se registro la cantidad de desgaste
de cada llanta. Hay evidencia para indicar una diferencia
en el promedio de desgaste para los dos tipos de llantas?
Pero las muestras no son independientes.
Los pares de respuestas estn
relacionados porque las mediciones se
realizan en el mismo auto.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

A division of Thomson Learning, Inc.

Prueba para la diferencia de dos


medias (muestras relacionadas)

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Auto

Tipo A

10.6

9.8

12.3

9.7

8.8

Tipo B

10.2

9.4

11.8

9.1

8.3

Diferencia

0.4

0.4

0.5

0.6

0.5

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Auto

Tipo A

10.6

9.8

12.3

9.7

8.8

Tipo B

10.2

9.4

11.8

9.1

8.3

Diferencia

0.4

0.4

0.5

0.6

0.5

Region rechazo: Rechazar H0


si t > 2.776 o t < -2.776.
Conclusion: como tc = 12.8,
rechazamos H0 . Hay
diferencia significativa en el
promedio de desgaste de los
neumticos para las dos
marcas de neumticos.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Inferencia para una varianza


poblacional
A veces, el parmetro principal de inters no
es la media poblacional sino ms bien la
varianza poblacional 2. Escogemos una
muestra aleatoria de una poblacion normal.
La varianza muestral s2 puede usarse en la
forma:

que tiene una distribucion Ji-cuadrado con


r = n - 1 grados de libertad.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Nota adicional
Se puede construir un intervalo confidencial para este
experimento usando:

Una vez que haya diseado el experimento de pares,


debe analizar como un experimento emparejado. Si el
experimento no est diseado como un experimento
emparejado con antelacin, no utilice este
procedimiento.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Inferencia para una varianza poblacional


La tabla 5 nos da los valores criticos para la
distribucion Ji-cuadrado con r grados de libertad.

Por ejemplo, el valor


critico Ji-cuadrado con
0.05 en la cola derecha
con r = 5 es 2 =11.07.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Inferencia para una


varianza poblacional

Ejemplo
Un fabricante de cemento afirma que su cemento
tiene una resistencia a la compresin con una
desviacin estndar de 10 kg / cm2 o menos. Una
muestra de n = 10 mediciones produjo una media
y desviacin estndar de 312 y 13.96
respectivamente.
H0: 2 102 (afirmacion
correcta)
Ha: 2 > 102 (afirmacion
incorrecta)

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

c2 =

(n 1)s 2 9(13.96 2 )
=
= 17.5
100
10 2
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Aproximacion del Valor-P

Ejemplo
Estos datos dan suficiente evidencia para rechazar la
afirmacion del fabricante? Use = .05.

0.025 < Valor-P < 0.05


Como P < = .05, Se
rechaza H0 .
Se rechaza la afirmacion
del fabricante

Region rechazo: Rechazar H0


si 2 > 16.919 ( = .05).
Conclusion: Como 2= 17.5,
H0 es rechazada. La desviacion
estandar Copyright
de la resistencia
es
2006 Brooks/Cole
division of Thomson Learning, Inc.
mayor deA 10

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Inferencia para dos varianzas poblacionales


Podemos hacer inferencias acerca de la razn de dos
varianzas poblacionales. Elegimos dos muestras
aleatorias independientes de tamao n1 y n2 de
distribuciones normales.
Si las dos varianzas poblacionales son iguales

Inferencia para dos varianzas


poblacionales
La Tabla 6 da los valores criticos para la
estadistica F

Por ejemplo, el valor


critico F con area 0.05
en la cola derecha de la
distribucion con r1 = 5 y
r2 = 8 es F =3.69.

Tiene distribucion F con r1 = n1 - 1 y


r2 = n2 - 1 grados de libertad (degrees of freedom).

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Inferencia para dos varianzas


poblacionales

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Ejemplo
Un experimentador ha realizado un experimento de
laboratorio utilizando dos grupos de ratas. El quiere
probar H0: 1 = 2, pero primero quiere asegurarse
de que las varianzas poblacionales son iguales.
Standard (2)

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Experimental (1)

10

11

Media

13.64

12.42

Desviacion
estandar

2.3

5.8

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Ejemplo

Ejemplo
Standard (2) Experimental (1)
Tamao de
muestra n =

10

11

Desviacion
2.3
estandar muestral

5.8

La region de rechazo es de dos colas con = .05, pero


solamente necesitamos hallar el valor critico de la cola
derecha, que tiene /2 = .025 de area a la derecha.
De la tabla 6 , con r1=10 y r2 = 9, rechazamos H0 si F > 3.96.

La desviacion estandar mas grande la denominamos


de la muestra 1, para forzar que la prueba tome
Copyright 2006 Brooks/Cole
valores en la cola derecha de la distribucion
F.
A division of Thomson Learning, Inc.

CONCLUSION: Rechazamos H0. las varianzas poblacionales


son distintas. No podemos asumir varianzas homogeneas para
la prueba t !
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Analisis de datos categoricos

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

El Experimento Multinomial

Introduccion
Muchos experimentos resultan en medidas que
son cualitativas o categricas en vez de
cuantitativas.
Personas mayores de 18 clasificados segun
nivel educativo
Autos clasificados segun procedencia
Condicion de actividad (ocupado, desocupado,
no PEA)

Estos datos tiene las caracteristicas de un


experimento multinomial. Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

El Experimento Binomial

Es un caso especifico del experimento


multinomial con k = 2 categorias
Categorias 1 y 2: exito y fracaso
p1 y p2:
pyq
O1 y O2:
x y n-x
Hacemos inferencias acerca de p
(y q = 1 - p)

En el experimento multinomial hacemos inferencias sobre


2006 Brooks/Cole
todas la proporciones, p1, p2, p3 pCopyright
k.division of Thomson Learning, Inc.
A

1. Consiste de n pruebas o ensayos identicos.


2. Cada prueba resulta en una de k categorias.
3. La probabilidad de que el resultado cae en una
categora particular i para un simple ensayo es
pi y permanece constante de ensayo en
ensayo. La suma de todas las k probabilidades,
p1+p2 ++ pk = 1.
4. Los ensayos son independientes.
5.

Estamos interesados en el nmero de resultados


en cada categora, O1, O2 , Ok con O1 + O2 +

+ Ok = n.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Estadistica Ji-Cuadrada de Pearson


Suponga que n=100 pelotas se lanzan en 7 cajas y
sabemos que la probabilidad que una pelota caiga en la
primera caja es p1=0.15 cuantas pelotas esperariamos
que caiga en la primera caja?
Tenemos un valor anticipado para pi y queremos usar la
informacion muestral para probar nuestro supuesto.

El numero esperado de veces que los resultados


ocurriran es Ei = npi. Si las cantidades observadas,
Oi, estn demasiado lejos de lo que afirma la
hiptesis nula H0, lo mas probable es que H0 sea
rechazada.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Prueba de bondad del ajuste

Estadistica Ji-Cuadrada de Pearson

Cuando H0 es verdad, las diferencias O-E seran


pequeas, pero grandes cuando H0 es falsa.
Buscar valores altos de  basado en la distribucin Jicuadrado con un nmero determinado de grados de
libertad.

El investigador usa la hiptesis nula para


especificar el modelo que cree es verdadero.
Se mide una sola variable cualitativa, y se
especifican los k valores exactos para cada uno de
las pi.
Los valores esperados de cada celda se obtienen:
Ei = npi
Los grados de libertad r=df = k-1

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Ejemplo

Ejemplo

Se lanza un dado 300 veces con los resultados


siguientes:
Resultado
1
Numero de veces 50

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

2
39

3
45

4
62

5
61

6
43

El dado esta construido correctamente o esta sesgado?

Calculamos los valores esperados de celda:


Ei = npi = 300(1/6) = 50
Resultado

Oi

50

39

45

62

61

43

Ei

50

50

50

50

50

50

Estadistica de prueba y region de rechazo:

Este es un experimento multinomial con k = 6 y O1 O6


dados en la tabla.
H0: p1= 1/6; p2 = 1/6;p6 = 1/6 (dado correcto)
Ha: al menos una pi es diferente de 1/6 (dado sesgado)

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

No rechazar H0. No hay suficiente


evidencia para indicar que el dado
Copyright 2006 Brooks/Cole
este sesgado
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Notas

Tablas de Contingencia

m m m
m
m m

Para que la aproximacion Ji cuadrado sea exacta


se recomienda que los Ei 5 para todas las
celdas.
Esta prueba de bondad de ajuste es diferente a
las vistas anteriormente ya que el investigador
usa H0 para el modelo que cree verdadero.
H0: modelo correcto
Ha: modelo incorrecto

La prueba Ji-cuadrado siempre es unilateral a la


derecha
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

(tablas cruzadas)

Relacion entre dos variables categoricas


El experimenador mide dos variables cualitativas

Tipo de defecto y el turno de produccion de un mueble


Categoria de edad y condicion de actividad de una
persona.
Categoria de Ingreso economico y sector economico
(servicios, construccion, manufactura, comercio, otros) de un trabajador

Resume los datos encontrando las frecuencias


bidimensionales observadas en cada interseccion de
niveles de categoria en una Tabla de contingencia.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Tabla de Contingencia f x c
Esta tabla tiene f filas y c columnasfc celdas en total.
1

O11

O12

O1c

O21

O22

O2c

Or1

Or2

Orc

Estudiamos la asociacion entre las dos variables cualitativas.


Un metodo de clasificacion es dependiente del otro?
La distribucin de las mediciones en las distintas categoras
de la variable 1 depende de las categoras de la variable 2?
Si no, las variables son independientes.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Prueba de independencia Ji-cuadrado


H0: los dos metodos de clasificacion son independientes
Ha: los dos metodos de clasificacion son Dependientes

Oij Es la frecuencia observada para la fila i y columna j.


Eij = npij Es la frecuencia esperada
Si H0 es verdadera y las clasificaciones son independientes,
pij = pipj = P(cae en fila i)P(cae en fila j)
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Prueba de independencia Ji-cuadrado

Ejemplo
Los defectos de muebles se clasifican segn el tipo de
defecto y el turno en el que se fabrico.
Turno

Esta estadistica de prueba tiene aproximadamente


una distribucion teorica Ji-cuadrado con:
r = (filas-1)(columnas-1) grados
de libertad.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Calculamos las frecuencias esperadas. Por ejemplo:

Chi-Square Test: 1, 2, 3
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts
1
2
3 Total
1
15
26
33
74
Chi-Sq = 19.178, DF = 6, P-Value
22.51 22.99 28.50
= 0.004
2.506 0.394 0.711
2

21
20.99
0.000

31
21.44
4.266

17
26.57
3.449

69

45
38.94
0.944

34
39.77
0.836

49
49.29
0.002

128

13
11.56
0.179

5
11.81
3.923

20
14.63
1.967

38

Total

94

96

119

309

Tipo

Total

15

26

33

74

21

31

17

69

45

34

49

128

13

20

38

Total

94

96

119

309

Los datos presentan evidencia que indique que el tipo de


defecto en el mueble varia con el turno en el cual el mueble fue
fabricado? Pruebe al nivel 1% .
H0 : El tipo de defecto es independiente del turno
2006 Brooks/Cole
Ha : El tipo de defecto dependeCopyright
del turno

A division of Thomson Learning, Inc.

EJEMPLO 02:
Los trabajadores en Lima Metropolitana con
mayor nivel educativo tienen un mayor nivel de ingreso econmico?
H0: El nivel de ingreso es independiente del nivel educativo alcanzado
Ha: El nivel de ingreso depende del nivel educativo alcanzado

Rechazar H0 si X2c>16.812 con r=2*3 = 6 g.l.


Copyright 2006 Brooks/Cole

Rechazar H0. El tipo de defecto en el mueble


depende
del turno.
A division
of Thomson
Learning, Inc.

Fuente: Bases de datos EPE INEI Copyright


junio 2006
2015Brooks/Cole
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Comparacion de poblaciones Multinomiales


A veces los investigadores disean un experimento para el que
el nmero de unidades experimentales que caen en un conjunto
de categoras se fija de antemano.
Ejemplo: Un experimentador selecciona 900 pacientes tratados
para prevenir la gripe. Selecciona 300 de cada uno de los tres
tipos: Sin vacuna, una vacuna y dos vacunas
SinVacuna

Una
Vacuna

Dos
vacunas

Gripe

Total

300

300

300

Comparacion de poblaciones Multinomiales


Cada una de las c columnas cuyos totales se han fijado de
antemano, es en realidad un solo experimento multinomial.
La prueba Ji-cuadrado de independencia con (r-1)(c-1) grados
de libertad equivale a una prueba de homogeneidad de c
poblaciones multinomiales
Sin vacuna

Total

Una
vacuna

Dos
vacunas

Gripe

r1
r2

Sin gripe

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

r1

Sin gripe
Total

Total

r2
300

300

300

n = 900

n = 900

El total de columna ha sidoCopyright


fijado
de Brooks/Cole
antemano!
2006
A division of Thomson Learning, Inc.

Hay tres experimentos binomiales


Copyright
Brooks/Cole
La probabilidad de tener gripe es independiente del
tipo2006
de prevencion?

A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio
Ejemplo
Muestras aleatorias de 200 votantes en cada uno de los cuatro
distritos fueron encuestados y se les pregunto si votara por el
candidato A en una eleccin municipal.

Un problema de votantes
Primero calcular las frecuencias esperadas:

Distrito
1

Total

Vota por A

76

53

59

48

236

No vota por A

124

147

141

152

564

Total

200

200

200

200

800

Existe evidencia que indique que la fraccion de votantes que favorecen


a A es distinta en los 4 distritos?

H0: la proporcion a favor de A es independiente del distrito


Ha: la proporcion a favor de A depende del distrito

H0: p1 = p2 = p3 = p4
Brooks/Cole
donde pi = fraccion que vota A en cadaCopyright
uno 2006
de los
distritos
A division of Thomson Learning, Inc.

Ya sabemos que hay diferencias entre los cuatro distritos,


cules son la naturaleza de estas diferencias? Veamos las
proporciones a favor del candidato A en las cuatro
distritos
3
59/200 =
0.30(a,b)

1
76
59.00
4.898

2
53
59.00
0.610

3
59
59.00
0.000

4
48
59.00
2.051

Total
236

124
141.00
2.050

147
141.00
0.255

141
141.00
0.000

152
141.00
0.858

564

Rechazar H0. hay suficiente evidencia para demostrar que la


Total
200
200
200 de 200
800
Copyright
2006 Brooks/Cole
fraccion
de votantes
a favor
A varia
por distrito
A division of Thomson Learning, Inc.

Otras aplicaciones

Un problema de votacion

Distrito
1
2
Vota 76/200= 53/200 =
A
0.38(a)
0.27(b)

Chi-Square Test: 1, 2, 3, 4
Chi-Sq = 10.722, DF = 3, P-Value = 0.013
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts

4
48/200 =
0.24(b)

El candidato A solamente esta regular en el primer distrito, y bajo


Copyright 2006 Brooks/Cole
en los demas distritos. Debera mejorar su campaa.
A division of Thomson Learning, Inc.

Prueba de bondad de ajuste


Sirve para demostrar si los datos son consistentes
con alguna distribucion teorica de probabilidad
como: Normal, Poisson, Exponencial, etc. Es decir si
una muestra proviene de una poblacion normal o de
otra forma
H0: Los datos se ajustan al modelo teorico
Ha: Los datos no se ajustan al modelo teorico
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio
Durante la segunda guerra mundial cayeron sobre Londres 535
bombas El rea afectada fue dividida en 576 sectores iguales
Bombas/rea (k)
Frecuencia (Ok)

0
229

1
211

2
93

3
35

4
7

5
1

Total
576

El nmero promedio de bombas por sector es 535/576= 0.929.


La probabilidad que caigan k bombas en un sector, segn la
distribucion Poisson Px  k 
Bombas/area
Probabilidad Poisson
E = Prob x 576

0
1
0.395 0.367
228
211


!

2
0.17
98

3
4
5
0.053 0.012 0.003
31
7
2

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Para la Ji-cuadrado de Pearson:


1. Los valores observados O1, O2, ,Ok deben
satisfacer las condiciones de un experimento
multinomial o de una comparacion de
poblaciones multinomiales.
2. Las frecuencias esperadas E1, E2, , Ek
deberian ser igual o mayor a 5.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

El Diseo de un Experimento

Supuestos


Supuestos

Cuando no se cumple la condicion #2 se tienen


las siguientes opciones:

1. Elegir un tamao de muestra mas grande. Cuanto


mayor sea el tamao de la muestra, ms cerca la
distribucin de Ji-cuadrado se aproximar a la
distribucin de su estadstica de prueba X2.
2. Si es posible combine una o mas de las categorias
que tienen frecuencias esperadas pequeas.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

El plan de muestreo o diseo experimental


determina la forma en que la muestra es
seleccionada.
En un estudio observacional, el experimentador
registra datos que ya existen. Ejemplo: las encuestas.
Experimentacion, el experimentador controla una o
mas condiciones en las unidades experimentales y
registra las respuestas a esos cambios.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Ejemplo 1

Definiciones
Una unidad experimental es el objeto en el que
se toma una medicion (o mediciones).
Un factor es una variable independiente cuyos
valores son controlados por el experimentador.
Un nivel es el grado de intensidad de un factor.
Un tratamiento es una combinacion especifica
de niveles de factor.
La respuesta es la variable que es medida por el
experimentador.

Un grupo de personas se divide aleatoriamente en


un grupo experimental y un grupo control. Al grupo
de control se le aplica una prueba de aptitud despus
de haber tomado un desayuno completo. Al grupo
experimental se le aplica la misma prueba sin haber
tomado ningn desayuno.
Unidad Experimental = persona
Factor = comida
Puntaje en la
Desayuno o
Respuesta =
Niveles =
prueba
no desayuno

Tratamientos:Desayuno o no desayuno

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Ejemplo 2
En un partido de futbol son muchos los factores que influyen en el
nmero de goles anotados, el entrenamiento, el entrenador, el jugador,
etc. Diseamos el siguiente experimento: Se elijen dos factores que se
pueden controlar: la distancia y ngulo de tiro al arco. Se definen 3
niveles para cada factor. Para la distancia a 4, 8 y 12 metros del arco y
ngulo de tiro: 45, 90 y 135. Se toma una muestra representativa de
jugadores. Cada jugador lanza 5 tiros y registra el nmero de goles. Para
cada posicin se utiliza 4 jugadores. Se sortean las posiciones a los
jugadores
Unidad Experimental = jugador Factor1 = Distancia
Respuesta = #Goles (0-5)
Niveles1 = 4m; 8m ;12m
Factor2 = Angulo tiro
Tratamientos:
Niveles2 = a45 ; a90; a135
T1= 4m a45; T2= 4m a90; T3= 4m a135;
T4= 8m a45; T5= 8m a90; T6= 8m a135;
Copyright 2006 Brooks/Cole
T7= 12m a45; T8= 12m a90; T9= 12m
a135
A division
of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

El Analisis de Varianza (ANVA)


La variable respuesta tiene una variabilidad total
Esta varianza se divide en partes que pueden
atribuirse a varios factores.
Estas partes pueden usarse para determinar los
efectos de los factores en la variable respuesta.
Factor 1
Variacion Total

Factor 2
Variacion aleatoria
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Supuestos para el ANVA


1. Las observaciones dentro de cada grupo estan
normalmente distribuidas con una varianza
comun 2.
2. Las suposiciones respecto al procedimiento de
muestreo son especificadas para cada diseo.

Diseo Completamente Aleatorizado


Una clasificacion en una direccion
En el DCA un factor tiene k niveles diferentes.
Los k niveles corresponden a k poblaciones normales,
los que corresponden con los tratamientos.
Estas k poblaciones tienen la misma media, o al
menos una media es diferente de la otras?

El ANVA es un procedimiento robusto cuando los


tamaos muestrales son iguales y cuando los datos
tienen forma de campana
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Ejemplo
En un experimento para determinar el efecto de la
nutricion en la capacidad de concentracion de
estudiantes de escuelas elementales. Doce nios fueron
divididos aleatoriamente en tres grupos y asignados a
un plan de alimentacin diferente. La respuesta fue la
capacidad de concentracin en minutos durante la
lectura de la maana.
No Desayuno

Desayuno
ligero

Desayuno
completo

8
7
9

14
16
12

10
12
16

13

17

15

a = 3 tratamientos.
los promedios de
concentracion son
diferentes?
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

El Analisis de Varianza (ANVA)

Muestras aleatorias de tamao n1, n2, ,nk se


toman de k poblaciones con medias 1, 2,,
k y con varianza comun 2.
Sea yij la j-esima medida en la i-esima muestra.
La variacion total de la variable respuesta se
mide con la Suma de Cuadrados Total

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Formulas ANVA

El Analisis de Varianza (ANVA)


La Suma de Cuadrados Total (SCT) se
descompone en dos partes:
 SCR (Suma de Cuadrados Tratamientos):
mide la variacion entre las k muestras.
 SCE (Suma de Cuadrados del Error):
mide la variacion dentro de las k muestras

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

El Problema del Desayuno


No Desayuno

Desayuno
ligero

Desayuno
completo

14

10

16

12

12

16

13

17

15

T1 = 37

T2 = 59

T3 = 53

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

La tabla ANVA para el DCA

Fuente de Variacin
Tratamientos

T = 149

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Suma de Grados de Cuadrado Medio


Cuadrados Libertad
SCR
SCR
a-1
CMR =
a 1

Error

SCE

N-a

Total

SCT

N-1

CME =

Fc
Fc =

CMR
CME

SCE
N a

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

El Problema del Desayuno

Prueba de igualdad de medias


H 0 : 1 = 2 = 3 = ... = k
H a : al menos una media es diferente

Fuente
Tratamientos

gl
2

SC
64.6667

CM
32.3333

Error
Total

9
11

58.25
122.9167

6.4722

Fc
5.00

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

2 es la varianza comun de las k poblaciones.


CME = SCE/(N a) es la estimacion de 2
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

La prueba F de Fisher
Rechazamos H 0 usando siempre una prueba de
cola derecha.
Cuando H 0 es verdad, F tiene distribucion
r1 = (a 1) y r2 = (N a) grados de libertad.

H 0 : 1 = 2 = 3 = ... = a
CMR
CME
Rechazar H 0 si F > F con a 1 y N-a g.l.

Prueba : F =

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Metodo Tukey para


comparacion de medias

Metodo de Tukey

Basado en el rango estudentizado, la diferencia


entre la mayor y menor media de las k medias
muestrales ( k = a = numero de tratamientos).
El mtodo asume que los tamaos de las
muestras son iguales y calcula una "regla" que
mide la distancia requerida entre cualquier par
de medias para declarar una diferencia
significativa
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

El Problema del Desayuno


cual de las tres medias poblacionales son diferentes?

Medias

No
Desayuno
T1 = 37

Desayuno
ligero
T2 = 59

Desayuno
completo
T3 = 53

37/4 = 9.25

59/4 = 14.75

53/4 = 13.25

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

El Problema del Desayuno


Las medias muestrales ordenadas de menor a mayor:

La diferencia entre 9.25 y 13.25 es


menor que T = 5.02, no hay diferencia Podemos declarar una
diferencia significativa
significativa.
Como 14.75-9.25 = 5.50 > 5.02

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

entre "sin desayuno" y


"desayuno ligero",
pero no entre los otros
pares

si hay diferencia significativa entre las


medias problacionales 1 y 2.
Copyright 2006 Brooks/Cole

A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Ejemplo
Diseo en Bloques Completo al Azar - DBCA

Es un diseo con a tratamientos y con b


bloques, entonces el total de observaciones es
N = ab.
El propsito de bloqueo es eliminar o aislar la
variabilidad de bloque a bloque que podra ocultar el
efecto de los tratamientos
Este diseo usa bloques de k unidades
experimentales homogeneas o similares, con una
unidad dentro de cada bloque asignados
aleatoriamente a cada tratamiento Copyright 2006 Brooks/Cole

Una empresa ensambladora de computadoras


desea presentar 3 modelos de computadora.
Efecta un sondeo en 4 lugares (bloques)
registrando el nmero de posibles compras del
pblico que frecuenta los lugares de venta. Se
obtiene los siguientes resultados:
Lugares
.Tratamiento = modelo de
computadora (a = 3)

Modelo

11

13

16

10

15

17

20

12

Bloque = lugar (b = 4)
Las ventas promedio son diferentes
para los tres modelos?

A division of Thomson Learning, Inc.

El Analisis de Varianza
La SCT se divide en 3 partes:
 SCR (Suma de cuadrados de los tratamientos)
 SCB (Suma de cuadrados de bloques)
 SCE (Suma de cuadrados del Error): mide la
variacion aleatoria o error experimental

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

10

15

13

10

Formulas para DBCA


C=

T2
N

donde T = Yij

SCT = Yij2 C
2

SCR =
SCB =

Ti
C donde : Ti = total_tratamiento i
b
B j2

C donde B j = total_bloq ue j
a
SCE = SCT - SCR - SCB
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio
El problema de los modelos de computadoras

La Tabla ANVA - DBCA

Lugares
Modelo

Ti

11

13

16

10

50

Cuadrados Medios

15

17

20

12

64

CMR = SCR/(a-1)

10

15

13

10

48

CMB = SCB/(b-1)

Bj

36

45

49

32

162

Grados de libertad

Total = ab 1 = N -1
Tratamiento = a 1
b 1
Bloque =
Error = ab (a 1) (b-1) =
(a-1)(b-1)

CME = SCE/(a-1)(b-1)

Fuente

gl

SC

CM

Fc

Tratamientos

a -1

SCR

SCR/(a-1)

CMR/CME
CMB/CME

Bloques

b -1

SCB

SCB/(b-1)

Error

(b-1)(a-1)

SCE

SCE/(b-1)(a-1)

Total

N -1

SCT

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Prueba para las medias de


bloques y tratamientos
H 0 : 1 = 2 = 3 = ...

versus

H a : al menos una media es diferente

Para probar H 0 : los tratamientos o bloques son iguales


Fuente

gl

SC

CM

Tratamientos

38

19

10.06

Bloques

61.6667

20.5556

10.88

Error

11.3333

1.8889

Total

11

111

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

CMR
CMB
(o F =
)
CME
CME
RchazarH0 si F > F cona - 1 (o b 1) y (b 1)(k 1) .
Prueba: F =

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Metodo Tukey
Fuente

gl

SC

CM

Modelos

38

19

10.06

Lugares
(Bloques)

61.6667

20.5556

10.88

Error

11.3333

1.8889

Total

11

122.9167

Aunque no es de importancia
primordial, observe que los
bloques (locales) tambin
fueron significativamente
diferentes
(F = 10.88)
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Use el metodo de Tukey para determinar cuales de los


tres modelos difieren de los demas.
A
Medias

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Ordenar las medias de menor a mayor

T1 = 50

T2 = 64

T3 = 48

50/4 = 12.5

64/4 = 16

48/4 = 12

Como la diferencia entre 12 y 12.5 es menor que


T = 2.98,no hay diferencia significativa.
Hay diferencia entre las medias poblacionales C y B.
Asimismo hay diferencia entre las medias A y B

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Una diferencia significativa en las ventas solamente ocurre con el


Copyright 2006 Brooks/Cole
modelo B.
A division of Thomson Learning, Inc.

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

Probabilidad Normal de residuos

Herramientas de diagnostico
Muchos programas de computo tienen
opciones para verificar los supuestos de
poblacion normal y el supuesto de igualdad
de varianzas

 Si la hiptesis de normalidad es vlida, el grafico debe


parecerse a una lnea recta, inclinada hacia arriba en la
derecha.
 La normalidad tambien se demuestra con la prueba
Kolmogorov - Smirnov.

1. Grafico de Probabilidad Normal


2. Grafico de Residuos versus estimados
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

Residuos versus pronostico


Si la hiptesis de igualdad de varianzas es vlida, el grafico
debe aparecer como una dispersin aleatoria alrededor de la
lnea central de cero sin ningn patron. Asimismo la prueba
Levene demuestra la homogeneidad de varianzas

(02) Una empresa opera 4 maquinas tres turnos al dia.


De los registros de produccin, se obtienen los datos
siguientes sobre el nmero de fallas. Pruebe la
hiptesis de que el nmero de fallas es independiente
del turno. Encuentre el valor P de esta prueba?
MAQUINAS
TURNO
1
2
3

Copyright 2006 Brooks/Cole


A division of Thomson Learning, Inc.

A
41
31
15

B
20
11
17

C
12
9
16

D
16
14
10

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

(03) Se realizo una encuesta para determinar si las


horas de sueo por noche son independientes de la
edad. La tabla siguiente son las horas de sueo entre
semana de una muestra de personas de 49 aos o
menos y en otra muestra de personas de 50 aos o
mas. Determine si las horas de sueo son
independientes de la edad. Cul es el valor P y su
conclusin?

(04) Un comerciante de autos realiza una prueba para


determinar si la cantidad de tiempo en minutos que
necesita para una afinacin de motor depende de si se
emplea el mtodo de un analizador computarizado o
un analizador electrnico. El tamao del auto es un
factor de variabilidad del tiempo de afinacin. Los
datos obtenidos son los siguientes. Pruebe si existe
diferencia significativa entre los mtodos.

Horas de sueo
Edad

Tamao
menos 6 6 a 6.9

7 a 7.9

8 a mas

Total

49 o menos

38

60

77

65

240

50 o mas

36

57

75

92

260

74

117

152

157

500

Total

(05) Un factor importante en la eleccin de un sistema


para la administracin de datos es el tiempo necesario
para aprender el sistema. Para evaluar tres sistemas de
administracin de archivos (A, B, C) una empresa disea
una prueba con cinco operadores. Como se considera
que la variabilidad entre los operadores es un factor
significativo, se capacita a cada uno de los cinco
operadores en cada uno de los tres sistemas. Realice una
prueba para determinar si existe diferencia significativa
entre los tiempos (horas) necesarios para aprender a
usar cada uno de los tres sistemas.
Operador
1
2
3
4
5

A
16
19
14
13
18

Sistema
B
16
17
13
12
17

C
24
22
19
18
22

Compacto
Mediano
Grande

Analizador
Computarizado Electronico
50
42
55
44
63
46

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio
(01) Se realiz un estudio para comparar el rendimiento
(millas/galon) de gasolina en automviles para tres frmulas de
gasolina. A era una frmula sin plomo y 87 octanos, B era una
frmula sin plomo y 91 octanos y C era una frmula sin plomo de
87 octanos con 15% de etanol. Se utilizaron cuatro automviles,
todos ellos de la misma marca y modelo, y cada frmula se prob en
cada uno de los autos. El uso de cada frmula en el mismo auto
tiene el efecto de eliminar la variabilidad de un auto a otro.
a.Los datos presentan suficiente evidencia para indicar diferencias
en distancia media en millas por galn para las tres frmulas de
gasolina?
b.Hay suficiente evidencia de una diferencia en distancia media
para los cuatro automviles?

(02)Se realiz un experimento para comparar los efectos de


cuatro productos qumicos diferentes, A, B, C y D, para
producir textiles resistentes al agua. Se selecciono un rollo de
tela, se cort en cuatro partes y todas stas se asignaron al
azar para recibir uno de los cuatro productos qumicos, A, B, C
y D. Este proceso se repiti tres veces, produciendo as un
diseo de bloque aleatorizado. Este diseo, con mediciones de
resistencia a la humedad, se muestra en el cuadro siguiente
(bajas lecturas indican baja penetracin de humedad.
Identifique los bloques y tratamientos e investigue
cualesquiera diferencias en medias de tratamiento. Hay
diferencias entre los productos qumicos? El bloqueo ha sido
eficaz en este experimento?

Automvil
Frmula

25.7

27.0

27.3

26.1

27.2

28.1

27.9

27.7

26.1

27.5

26.8

27.8

(03) Se tomaron muestras de agua de un ro en cuatro lugares


diferentes para determinar si la cantidad de oxgeno disuelto,
una medida de la contaminacin del agua, variaba de un lugar
a otro. Los lugares 1 y 2 se seleccionaron arriba de una planta
industrial, un lugar cerca de la orilla y otro a mitad del ro; el
lugar 3 estaba adyacente a la descarga del agua industrial de
la planta; y el lugar 4 estaba ligeramente aguas abajo a mitad
del ro. Cinco especmenes del agua se seleccionaron al azar en
cada lugar, pero un espcimen, correspondiente al lugar 4, se
perdi en el laboratorio. Los datos y un anlisis de varianza
con SPSS se dan a continuacin (a mayor contaminacin,
lecturas ms bajas de oxgeno disuelto).

C
9.9
A
10.1
B
11.4
D
12.1

D
13.4
B
12.9
A
12.2
C
12.3

B
12.7
D
12.9
C
11.4
A
11.9

(04) Un psiclogo clnico deseaba comparar tres mtodos para


reducir niveles de hostilidad en estudiantes universitarios, con el uso
de cierto examen psicolgico. Se tomaron las calificaciones altas de
este examen como indicio de gran hostilidad. Once estudiantes que
obtuvieron calificaciones altas y casi iguales se emplearon en el
experimento. Cinco fueron seleccionados al azar de entre los 11
casos problema y tratados con el mtodo A, tres fueron tomados al
azar de los seis estudiantes restantes y tratados con el mtodo B y
los otros tres estudiantes fueron tratados con el mtodo C. Todos los
tratamientos continuaron durante todo un semestre, al final del
semestre el examen psicolgico se aplic de nuevo. b. Los datos dan
suficiente evidencia para indicar una diferencia en respuesta media
de estudiantes a los tres mtodos despus del tratamiento? .

A
B
C

73
54
79

83
74
95

76
71
87

68

80

Diapositivas Estadistica y Diseo Experimental - segunda unidad


- Mg. Mario Pelaez Osorio

(05) Prueba para accidentes industriales que se distribuyen


de manera uniforme Se realiz un estudio de 147 accidentes
industriales que requirieron atencin mdica. De tales
accidentes, 31 ocurrieron en lunes, 42 en martes, 18 en
mircoles, 25 en jueves y 31 en viernes. Pruebe la
aseveracin de que los accidentes ocurren con proporciones
iguales en los cinco das de trabajo. Si las proporciones no
son las mismas, qu factores explicaran las diferencias? .

(07) Prueba de bondad de ajuste con


binomial.
La distribucin de una frecuencia que se
sigue:
Nmero de xitos
0
1
2
Frecuencia
89
133
52

una distribucin
observa es como
3
26

a).- Suponiendo que una distribucin binomial tiene n = 3


y p = 1/3, utilice la frmula de la probabilidad binomial
para calcular la probabilidad que corresponde a cada
categora de la tabla.
b).- Utilizando las probabilidades que se calcularon en el
inciso a, determine la frecuencia que se espera para cada
categora.
c).- Utilice un nivel de significancia de 0.05 para probar la
aseveracin de que las frecuencias que se observan
ajustan con una distribucin binomial para la que n = 3 y p
= 1/3 .

(06) Riesgos de trabajo en Estados Unidos. Utilice los datos en la


tabla para probar la aseveracin de que la ocupacin es
independiente de que la causa de muerte sea un homicidio. La
tabla se basa en datos del Departamento del Trabajo de Estados
Unidos. Parece que alguna ocupacin en particular sea ms
propensa a los homicidios? Si as fuera, cul es? .

Causa
muerte

Polica

Cajero

Taxista Vigilante

Homicidio
Otra

82
92

107
9

70
29

59
42

Total

174

116

99

101

Total

318
172
490

(08) Una encuesta encontr que 28% de los administradores de


sistemas de informacin (SI) estaban muy satisfechos con su
trabajo, 46% estaban moderadamente satisfechos con su
trabajo, 12% no estaban ni satisfechos ni insatisfechos, 10%
estaba
ligeramente
insatisfechos
y
4%
estaban
muy
insatisfechos. Suponga que en una muestra de programadores se
encontraron los resultados siguientes.
Use = 0.05 y realice una prueba para determinar si la
satisfaccin con el trabajo en programadores de computadoras es
diferente de la satisfaccin con el trabajo de los administradores
de SI .
Categoria

Nro

Muy satisfechos

105

Moderadamente satisfechos

235

Ni satisfechos ni insatisfechos

55

Ligeramente insatisfechos

90

Muy insatisfechos

15