Вы находитесь на странице: 1из 146

ESTADSTICA INFERENCIAL I

INGENIERA EN GESTIN EMPRESARIAL


LNI. BENITO RODRGUEZ CABRERA
PABELLN DE ARTEAGA
ABRIL 2015

FECHAS
11 DE ABRIL: UNIDAD 1
18 DE ABRIL: UNIDAD 2
02 DE MAYO: UNIDAD 3
09 DE MAYO: UNIDAD 4
16 DE MAYO: UNIDAD 5

FORMAS DE CALIFICAR
TAREAS:

30%
TRABAJO EN CLASE: 20%
EXAMEN ESCRITO:
50%
TOTAL
100%

UNIDAD 1
Introduccin a la estadstica inferencial.
1.1 Breve historia de la estadstica.
1.2 Concepto de estadstica.
1.3 Estadstica descriptiva.
1.4 Estadstica inferencial.
1.5 Breve introduccin a la inferencia estadstica.
1.6 Teora de decisin en estadstica.
1.7 Componentes de una investigacin estadstica.
1.8 Recoleccin de datos.
1.9 Estadstica parametrica (poblacin y muestra aleatoria).
1.10 Aplicaciones.

UNIDAD 2
Inferencia estadstica: estimacin.
2.1 Conceptos bsicos.
2.2 Distribuciones de muestreo.
2.3 Estimacin puntual.
2.4 Estimacin de intervalo.
2.5 Intervalos de confianza para medias.
2.6 Intervalos de confianza para diferencia entre medias.
2.7 Intervalos de confianza para proporciones.
2.8 Intervalos de confianza para diferencias entre proporciones.
2.9 Intervalos de confianza para varianzas.
2.10 Intervalos de confianza para razones de dos varianzas.

UNIDAD 3
Pruebas de hiptesis con una muestra.
3.1 Metodologa para la prueba de hiptesis.
3.2 Hiptesis nula y alternativa.
3.3 Error tipo I y error tipo II.
3.4 Pruebas de hiptesis Z para la media (desviacin

estndar poblacional conocida).


3.5 Pruebas para proporciones.
3.6 Seleccin del tamao de muestra ( para estimar la
media poblacional).
3.7 Seleccin del tamao de muestra (para estimar la
proporcin poblacional).

UNIDAD 4
Pruebas de hiptesis con dos muestras y varias muestras de datos

numricos.
4.1 Introduccin.
4.2 Distribuciones normal y t de Student.
4.3 Pruebas de significancia.
4.4 Comparacin de dos muestras independientes: Pruebas t para las

diferencias entre dos medias.


4.5 Prueba de Fisher para varianzas y de igualdad de las varianzas de
dos poblaciones normales.
4.6 Comparaciones de dos muestras pareadas
4.7 Modelo totalmente aleatorio: anlisis de varianza de un factor.
4.8 Seleccin del tamao de muestra para estimar la diferencia de dos
medias.
4.9 Aplicaciones

UNIDAD 5
Pruebas de hiptesis con dos muestras y varias muestras

con datos categricos.


5.1 Prueba Z para la diferencia entre dos proporciones.
5.2 Prueba para la diferencia entre dos proporciones.
5.3 Prueba para la diferencia en n proporciones Z.
5.4 Prueba de independencia (ji-cuadrada).
5.5 Pruebas de contingencia (ji-cuadrada).
5.6 Pruebas de bondad de ajuste.
5.7 Aplicaciones.

UNIDAD 1
Introduccin a la estadstica inferencial.

INTRODUCCIN
Investigacin cientfica
Instituciones gubernamentales
Negocio
Industria

QU ES LA ESTADSTICA
PERSONAS
COMUNES

ESPECIALISTAS

Nmeros

Obtencin de datos

Problemas

Presentacin de datos

Reprobacin

Datos para decisiones

INTERPRETACIN DE LA ESTADSTICA
La palabra tiene su sentido ms amplio para aquellas

personas cuyo trabajo requiere un conocimiento de los


aspectos ms tcnicos de la estadstica.

Para estas personas, la palabra tiene relacin con


aquellos conceptos y tcnicas que se utilizan en la
recopilacin,
organizacin,
resumen,
anlisis,
interpretacin y comunicacin de informacin
numrica.

QU HACE LA ESTADSTICA?
Comunicaci
n

Interpretacin

Recopilacin

ESTADSTICA

Anlisis

Resumen

Organizacin

1.1 HISTORIA DE LA ESTADSTICA


Al igual que ha ocurrido con otras muchas disciplinas, a lo

largo del tiempo se ha pensado que la estadstica es un


procedimiento extraordinariamente complicado.
Desde los comienzos de la civilizacin han existido

formas sencillas de estadstica, pues ya se utilizaban


representaciones grficas y otros smbolos en pieles,
rocas, palos de madera y paredes de cuevas para
contar el nmero de personas, animales o ciertas
cosas.

BABILONIOS
3000 A.C.

EGIPCIOS

Tablillas de
arcilla

Poblacin

Produccin
agrcola

Rentas

Trueque

Control

EVOLUCIN
Desde que los pueblos se organizaron en Estados, sus

gobernantes necesitaron estar informados sobre


aspectos relativos a la cantidad o distribucin de la
poblacin, nacimientos, defunciones, produccin
agrcola y ganadera, bienes muebles e inmuebles,
efectivos militares, etc.

Si bien la Estadstica no fue considerada como ciencia

hasta los siglos XVII o XVIII en Alemania (atribuida a


Achenwall, profesor de la Universidad de gtinger- Baja
Sajonia); quien la identific como la ciencia de las
cosas del Estado; sus orgenes datan de pocas
remotas, pues existen constancias de que los chinos
(2.300 AC); los hebreos, los atenienses y los romanos
formaron censos, principalmente por razones tributarias y
militares.

COMIENZOS

ACTUALIDAD

Relevamiento de datos

Anlisis de informacin

Conteo en general

Interpretacin de datos
Tcnicas de interpretacin

Mtodos
Sutiles

ESTADSTICA

Tcnicas
precisas

1.2 CONCEPTO DE ESTADSTICA


En el lenguaje comn, la palabra se emplea para denotar

un conjunto de calificaciones o de nmeros.


La palabra estadstica ha sido frecuentemente referida a
la informacin cuantitativa o numrica.
Tambin ha sido referida ampliamente a los mtodos que
tratan con la informacin.
Sin embargo, esto debera aclararse y llamar a la
informacin datos estadsticos y a los mtodos
estadsticos.

ESTADSTICA = DISCIPLINA
Este

significado de estadstica en realidad est


relacionado de manera muy cercano con el empleo
analizado anteriormente, debido a que las estadsticas,
consideradas como datos numricos son la materia
prima de la estadstica como disciplina.

DEFINICIN
La estadstica se refiere a un conjunto de mtodos

para manejar la obtencin, presentacin y anlisis de


observaciones numricas. Sus fines son describir al
conjunto de datos obtenidos y tomar decisiones o
realizar generalizaciones acerca de las caractersticas
de todas las posibles observaciones bajo
consideracin.

TIPOS DE ESTADSTICA

En resumen, la estadstica como disciplina o rea de

estudio incluye tanto tcnicas descriptivas como


inferenciales. Incluye la obtencin y tratamiento de datos
numricos y el empleo de mtodos estadsticos con fines
inferenciales. Ms especficamente

1.3 ESTADSTICA DESCRIPTIVA


La estadstica descriptiva se refiere a aquella parte

del estudio que incluye la obtencin, organizacin,


presentacin
y
descripcin
de
informacin
numrica.

La estadstica descriptiva o deductiva trata del recuento,

ordenacin y clasificacin de los datos obtenidos por las


observaciones. Se construyen tablas y se representan
grficos que permiten simplificar la complejidad de los
datos que intervienen en la distribucin.

Asimismo, se calculan parmetros estadsticos que

caracterizan la distribucin. No se hace uso del clculo de


probabilidades y nicamente se limita a realizar
deducciones directamente a partir de los datos
parmetros obtenidos.
Debido a que el objetivo de este tipo de manejo de datos
es describir las caractersticas importantes de la
informacin obtenida, generalmente se le denomina
estadstica descriptiva. En otras palabras.

1.4 ESTADSTICA INFERENCIAL


La estadstica inferencial o inferencia estadstica es

una tcnica mediante la cual se obtienen


generalizaciones o se toman decisiones en base a
una informacin parcial o incompleta obtenida
mediante tcnicas descriptivas.

El arte de obtener con confianza conclusiones sobre el

modo de proceder del fenmeno que se estudia es el


objeto de las diversas tcnicas existentes de inferencia
estadstica.
La estadstica inferencial o inductiva plantea y resuelve el
problema de establecer previsiones y conclusiones
generales sobre una poblacin a partir de los resultados
obtenidos de una muestra.
Los modelos estadsticos actan de puente entre lo
observado (muestra) y lo desconocido (poblacin). Su
construccin y estudio estn basados en el clculo de
probabilidades.

As pues, la inferencia estadstica es la metodologa

tendente a hacer:
Descripciones
Predicciones
Comparaciones
Generalizaciones de una poblacin estadstica
A partir de la informacin contenida en una muestra.
Utiliza resultados obtenidos mediante la estadstica
descriptiva y se apoya fuertemente en el clculo de
probabilidades

1.5 INTRODUCCIN A LA ESTADSTICA


INFERENCIAL
EJEMPLO
El

investigador se encuentra estudiando una gran


poblacin (personas, o tornillos, o palomas, o
automviles, o lo que sea) y quiere disponer de algunos
valores (promedios, desvos, tendencias, forma de la
distribucin, etctera) que sean vlidos en forma general,
para toda la poblacin en estudio.
Sin embargo, le resulta imposible acceder a toda la
informacin, medir la variable analizada en todos y cada
uno de los integrantes de la poblacin.

Qu hace?.
Estudia toda la poblacin?
inventa los datos?

SACA MUESTRA DE LA POBLACIN

MUESTRA
Modelo reducido a escala de la poblacin
Importante:
Al tomar la muestra siempre se producen errores y se

pierden detalles, pero es mucho ms lo que se gana


respecto a la informacin que ella puede proporcionar

CONTENIDO DE LA MUESTRA

Existen numerosas tcnicas para seleccionar muestras.

Este paso es de importancia vital en un estudio


estadstico, porque las conclusiones que se obtienen
dependen muy esencialmente de las muestras
analizadas.
Las tcnicas que proporcionan las mejores muestras
son las aleatorias, en las que cualquier integrante de
la poblacin tiene la misma probabilidad de ser
elegido.

FORMULAS TAMAO MUESTRA


DESCONOCIENDO
TAMAO DE LA
POBLACIN

CONOCIENO
TAMAO DE LA
POBLACIN

Algunos valores estandarizados (z) en funcin de grado

de confiabilidad asumido (para dos colas):


99 % ------------- z = 2, 58 (Empleado con frecuencia)
95 % ------------- z = 1, 96 (El ms empleado)
90 % ------------- z = 1, 64

EJERCICIOS
CONOCIENDO LA POBLACIN
Ejemplo No. 1: A cuntas familias tendramos que

estudiar para conocer la preferencia del mercado en


cuanto a las marcas de shampoo para beb, si se conoce
que el nmero de familias con bebs en el sector de
inters es de 15,000? Seguridad = 95%; Precisin = 3%;
Proporcin esperada = asumamos que puede ser
prxima al 5%; si no tuviese ninguna idea de dicha
proporcin utilizaramos el valor p = 0.5 (50%) que
maximiza el tamao muestral.

SUSTITUYENDO

RESULTADO

200 FAMILIAS

PROGRAMAS ESTADSTICOS

EJERCICIOS
DESCONOCIENDO LA POBLACIN
Ejemplo No. 2: A cuntas familias tendramos que

estudiar para conocer la preferencia del mercado en


cuanto a las marcas de shampoo para beb, si se
desconoce la poblacin total?
Seguridad = 95%;
Precisin = 3%;
Proporcin esperada = asumamos que puede ser
prxima al 5%; si no tuvisemos ninguna idea de dicha
proporcin utilizaramos el valor p = 0.5 (50%) que
maximiza el tamao muestral

SUSTITUYENDO

RESULTADO
203 FAMILIAS

FACTORES INFLUYENTES
La cantidad de elementos que integran la muestra (el

tamao de la muestra) depende de mltiples factores,


como:
El dinero y el tiempo disponibles para el estudio,
La importancia del tema analizado,
La confiabilidad que se espera de los resultados,
Las caractersticas propias del fenmeno analizado.

A partir de la muestra seleccionada se realizan algunos

clculos y se estima el valor de los parmetros de la


poblacin tales como:
la media,
la varianza,
la desviacin estndar,
la forma de la distribucin,
etctera.

ESTIMACIN DE PARMETROS

1.6 Teora de decisin en estadstica.

TIPOS DE DECISIONES
1.- Decisin sin riesgo entre mercancas inconmensurables

(mercancas que no pueden ser medidas bajo las mismas


unidades). Toneladas / mantequilla
2.- Eleccin bajo impredecibilidad. (datos no predecibles)
3.- Eleccin intemporal: estudio del valor relativo que la

gente asigna a dos o ms bienes en diferentes momentos


del tiempo.
4.- Decisiones sociales: decisiones tomadas en grupo o

bajo una estructura organizativa.

PASOS PARA TOMAR UNA DECISIN


1. Problema.
2. Necesidad de mejora.
3. Decisin.
4. Alternativas.
5.

Mejor alternativa.

1.7 Componentes de una investigacin


estadstica.

1.8 Recoleccin de datos.

PASOS PARA LA RECOLECCIN DE DATOS


1. Definir los objetivos de la investigacin o del

experimento.
2. Definir la variable y la poblacin de inters.
3. Definir los esquemas para recolectar y medir los datos.

(forma de recolectar datos)


4. Determinar las tcnicas idneas para realizar el

anlisis de datos: descriptivas o inferenciales.

1.9 Estadstica paramtrica (poblacin y


muestra aleatoria).
Condiciones que debe reunir una muestra:
Homogeneidad:

debe

ser

extrada

de

la

misma

poblacin.
Independencia: las observaciones no deben estar
mutuamente condicionadas entre s.
Representatividad: la muestra debe ser el mejor reflejo
posible del conjunto del cual proviene.

Estadsticas y parmetros
Cuando estos trminos describen las caractersticas de

una poblacin, se llaman parmetros.


Cuando describen las caractersticas de la muestra, se
llaman estadsticos.
Una estadstica es una caracterstica de una muestra y
un parmetro es una caracterstica de la poblacin.

Poblacin (finitas / Infinitas)


Muestra Aleatoria
Muestreo aleatorio simple (datos sin secuencia)
Muestreo sistemtico (datos con secuencia)
Muestreo estratificado (divisin por grupos) (pequea

variacin grupos diferentes)


Muestreo racimo (Divisin por grupos) (variacin
considerable grupos iguales) geogrficamente iguales

UNIDAD 2
INFERENCIA ESTADSTICA: ESTIMACIN

UNIDAD 2
Inferencia estadstica: estimacin.
2.1 Conceptos bsicos.
2.2 Distribuciones de muestreo.
2.3 Estimacin puntual.
2.4 Estimacin de intervalo.
2.5 Intervalos de confianza para medias.
2.6 Intervalos de confianza para diferencia entre medias.
2.7 Intervalos de confianza para proporciones.
2.8 Intervalos de confianza para diferencias entre proporciones.
2.9 Intervalos de confianza para varianzas.
2.10 Intervalos de confianza para razones de dos varianzas.

INTRODUCCIN
La Estadstica descriptiva y la teora de la Probabilidad

van a ser los pilares de un nuevo procedimiento


(Estadstica Inferencial) con los que se va a estudiar el
comportamiento global de un fenmeno.
La probabilidad y los modelos de distribucin junto con
las tcnicas descriptivas, constituyen la base de una
nueva forma de interpretar la informacin suministrada
por una parcela de la realidad que interesa investigar.

INFERENCIA ESTADSTICA
Los mtodos bsicos de la estadstica inferencial son la

estimacin y el contraste de hiptesis, que juegan un


papel fundamental en la investigacin.

OBJETIVO DE LA ESTIMACIN
1. Calcular los parmetros de la distribucin de medias o

2.
3.
4.
5.

proporciones mustrales de tamao n, extradas de una


poblacin de media y varianza conocidas.
Estimar la media o la proporcin de una poblacin a
partir de la media o proporcin muestral.
Utilizar distintos tamaos mustrales para controlar la
confianza y el error admitido.
Contrastar los resultados obtenidos a partir de
muestras.
Visualizar grficamente, mediante las respectivas
curvas normales, las estimaciones realizadas.

En la mayora de las investigaciones resulta imposible

estudiar a todos y cada uno de los individuos de la


poblacin ya sea por el coste que supondra, o por la
imposibilidad de acceder a ello.
Mediante la tcnica inferencial obtendremos conclusiones
para una poblacin no observada en su totalidad, a partir
de estimaciones o resmenes numricos efectuados
sobre la base informativa extrada de una muestra de
dicha poblacin.

ESQUEMA GENERAL

ESTIMACIN DE PARMETROS

IMPORTANTE
Si el objetivo del tratamiento estadstico inferencial, es

efectuar generalizaciones acerca de la estructura,


composicin o comportamiento de las poblaciones no
observadas, a partir de una parte de la poblacin, ser
necesario que la parcela de poblacin examinada sea
representativa del total.
Por ello, la seleccin de la muestra requiere unos
requisitos que lo garanticen, debe ser representativa
y aleatoria.

Adems, la cantidad de elementos que integran la

muestra (el tamao de la muestra) depende de mltiples


factores, como el dinero y el tiempo disponibles para el
estudio, la importancia del tema analizado, la
confiabilidad que se espera de los resultados, las
caractersticas propias del fenmeno analizado, etctera.
As, a partir de la muestra seleccionada se realizan
algunos clculos y se estima el valor de los
parmetros de la poblacin tales como la media, la
varianza, la desviacin estndar, o la forma de la
distribucin, etc.

2.1 CONCEPTOS BSICOS


POBLACIN: Conjunto de elementos sobre los que se

observa un carcter comn. Se representa con la letra N.


MUESTRA: Conjunto de unidades de una poblacin.
Cuanto ms significativa sea, mejor ser la muestra. Se
representa con la letra n.
UNIDAD DE MUESTREO: Est formada por uno o ms
elementos de la poblacin. El total de unidades de
muestreo constituyen la poblacin. Estas unidades son
disjuntas entre s y cada elemento de la poblacin
pertenece a una unidad de muestreo.

PARMETRO: Es un resumen numrico de alguna variable

observada de la poblacin. Los parmetros normales que se


estudian son:

ESTIMADOR: Un estimador * de

un parmetro , es un
estadstico que se emplea para conocer el parmetro
desconocido.
ESTADSTICO: Es una funcin de los valores de la muestra.
Es una variable aleatoria, cuyos valores dependen de la
muestra seleccionada. Su distribucin de probabilidad, se
conoce como Distribucin muestral del estadstico.

ESTIMACIN: Este trmino indica que a partir de lo

observado en una muestra (un resumen estadstico con


las medidas que conocemos de Descriptiva) se extrapola
o generaliza dicho resultado muestral a la poblacin total,
de modo que lo estimado es el valor generalizado a la
poblacin.
Consiste en la bsqueda del valor de los parmetros
poblacionales objeto de estudio. Puede ser puntual o
por intervalo de confianza:

Puntual: cuando buscamos un valor concreto.


Intervalo

de confianza: cuando determinamos un


intervalo, dentro del cual se supone que va a estar el
valor del parmetro que se busca con una cierta
probabilidad

CONTRATE DE HIPTESIS: Consiste en determinar si

es aceptable, partiendo de datos mustrales, que la


caracterstica o el parmetro poblacional estudiado tome
un determinado valor o est dentro de unos determinados
valores.
NIVEL DE CONFIANZA: Indica la proporcin de veces
que acertaramos al afirmar que el parmetro est
dentro del intervalo al seleccionar muchas muestras

2.2 DISTRIBUCIONES DE MUESTREO


La

tarea que nos ocupa ahora es conocer las


distribuciones de la probabilidad de ciertas funciones de
la muestra, es decir, variables aleatorias asociadas al
muestreo o estadsticos mustrales.
stos sern tiles para hacer inferencia respecto a los
parmetros desconocidos de una poblacin. Por ello se
habla de distribuciones mustrales, ya que estn
basados en el comportamiento de las muestras.

Distribucin muestral: su comportamiento probabilstico

depender del que tenga la variable X y del tamao de


las muestras.
Sea una poblacin donde se observa la variable aleatoria
X. Esta variable X, tendr una distribucin de
probabilidad, que puede ser conocida o desconocida, y
ciertas caractersticas o parmetros poblacionales.
El problema ser encontrar una funcin que proporcione
el mejor estimador de .
El estimador, T, del parmetro debe tener una
distribucin concentrada alrededor de y la varianza
debe ser lo menor posible.

UNIDAD 2
Inferencia estadstica: estimacin.

UNIDAD 2
Inferencia estadstica: estimacin.
2.1 Conceptos bsicos.
2.2 Distribuciones de muestreo.
2.3 Estimacin puntual.
2.4 Estimacin de intervalo.
2.5 Intervalos de confianza para medias.
2.6 Intervalos de confianza para diferencia entre medias.
2.7 Intervalos de confianza para proporciones.
2.8 Intervalos de confianza para diferencias entre proporciones.
2.9 Intervalos de confianza para varianzas.
2.10 Intervalos de confianza para razones de dos varianzas.

OBJETIVO UNIDAD
El objetivo de esta unidad es mostrar como a travs de

las distribuciones de muestreo es posible hacer


inferencias acerca de la poblacin, a partir de valores
observados de las estadsticas mustrales.

2.1 CONCEPTOS BSICOS


ESTIMACIN
Puntual
Por intervalos
Suponga que un vendedor de computadoras

quiere estimar la
ganancia promedio en la venta de cierto modelo de la marca X. La
estimacin se podra efectuar a travs de un solo numero, por
ejemplo 18%, o estimar una ganancia entre el 12 y 20%
dependiendo del cliente y el volumen de compra

PROCEDIMIENTO
El

procedimiento de estimacin puntual utiliza la


informacin de la muestra para obtener un solo nmero
o punto que estima el parmetro objetivo.
El procedimiento de estimacin por intervalo hace uso
de la informacin de la muestra para obtener dos
nmeros que se supone van a incluir el parmetro de
estudio.
En cada caso la estimacin real se hace mediante un
estimador que es una regla que establece como utilizar
los datos de la muestra, para determinar el valor (o
valores) que utilizamos como estimacin puntual (o por
intervalo).

ESTIMADOR = MEDIA MUESTRAL


Si se desea obtener una estimacin por intervalo de un

parmetro, se tiene que utilizar los datos de la muestra


para calcular dos puntos. Con los cuales se espera con
una probabilidad alta que el parmetro objetivo se
encuentre en el intervalo que forman dichos puntos.

x
i 1

2.2. DISTRIBUCIONES DE MUESTREO


Distribucin de Muestreo: todos los valores posibles

que puede asumir un estadstico muestral, calculados a


partir de muestras del mismo tamao y extrado en forma
aleatoria de la misma poblacin
Distribucin de Muestreo de la Media. (teorema del
lmite central)
Conoce la varianza = distribucion normal estandar
Desconoce la varianza = distribucion t student

Distribucin de Muestreo de la Varianza. Ji-cuadrada


Varianzas de dos poblaciones
Distribucin F
Grados de libertad
Estimacin Puntual y por Intervalos.

2.3 ESTIMACIN PUNTUAL (PROBLEMA 1)


2.1. La agencia para la Proteccin Ambiental (EPA) y la

Universidad de Florida cooperaron recientemente en


cierto estudio de los posibles efectos de oligoelementos
en agua potable con respecto a la forma de clculos
renales. Enseguida se indican datos con respecto a la
edad, la concentracin de calcio en el agua potable para
consumo casero (medida por partes por milln), y, el
habito de fumar. Se obtuvieron datos de individuos con
problemas recurrentes de clculos renales que viven en
los estados de ambas Carolinas y en los estados de las
Montaas Rocallosas

TABLA OBTENIDA

(a) Estimar la concentracin media de calcio en el agua

potable para los pacientes con clculos en las Carolinas.


Establecer un lmite para el error de estimacin
2S
2 * 16.6
x
11.30
11.30 1.5363 (9.7637,12.8363)
n
467

b) Estimar la diferencia en el promedio de las edades de

los pacientes con clculos renales en las Carolinas y en


las Rocallosas. Establecer un lmite de error de
estimacin
S X2 S Y2
10.2 2 9.8 2
X Y 2

45.10 46.4 2

1.3 1.7036 (3.0036,0.4036)


n
n
467
191

(c) Estimar y establecer un lmite de dos desviaciones

estndar para la diferencia en las proporciones de los


pacientes con clculos renales en las Carolinas y en las
Rocallosas que eran fumadores al momento del estudio

p 1 q1 p 2 q 2
( p 1 p 2 ) 2

n
m
(0.78 0.61) 2

0.78 * .22 0.61 * 0.39

0.17 0.083 (0.087,0.253)


467
191

PROBLEMA 2
2.2 Un auditor se encuentra interesado en conocer el

importe de las cuentas por cobrar en cierta empresa.


Para estimar est deuda obtiene una muestra aleatoria
de 20 cuentas por cobrar de las 500 cuentas de dicha
empresa. Los datos se presentan de la manera siguiente
(cantidades en dlares).

TABLA OBTENIDA

2S x
n

197.1 40.6326 (156.4674,237.7326)

2.4 ESTIMACIN POR INTERVALOS Y


PROPIEDADES
Un estimador puntual es con frecuencia inadecuado

como estimacin de un parmetro, ya que raramente


coincide con el parmetro.
Una situacin alternativa es la estimacin por intervalos
de la forma [Li, Ls], donde Li es el limite inferior y Ls es el
limite superior.
Un estimador por intervalo es una regla que especifica el
mtodo que utiliza las mediciones de la muestra para
calcular los nmeros que forman los extremos del
intervalo.
En el caso ideal seria conveniente que el intervalo tuviera
dos propiedades

PROPIEDADES

2.4 Intervalos de confianza para .


La construccin de intervalos de confianza permite

estimar el valor de un parmetro ante la imposibilidad de


calcular el valor real. Mediante el uso de las funciones de
distribucin derivadas del muestreo efectuaremos la
estimacin cuando se muestrea de una poblacin que se
distribuye normal, ya sea que se conozca o no la varianza
poblacional.

2.4.1 Intervalo de confianza para con varianza


conocida (
Se X1, X2,...Xn una muestra aleatoria de una distribucin

normal con media desconocida El inters es construir


un intervalo de confianza de 100 ( 1 - ) % para con
varianza conocida 2. La construccin de dicho intervalo
se hace con base al mejor estimador de , explcitamente
la media muestral .

Z 1 / 2
Z 1 / 2
X
1
X

n
n

P X

Z 1
2

Z 1

Se midi la resistencia a la ruptura por torcimiento de un

cierto tipo de tela en un lote con los siguientes resultados


(en psi): 182, 172, 176, 178. La desviacin estndar
basada en la experiencia previa es de 5 psi, Encuentre un
intervalo de confianza del 99% para la resistencia
promedio de la ruptura por torcimiento del lote.

P X

Z 1
2

Z 1

Un fabricante de fibras sintticas que desea estimar la

tensin de ruptura media de una fibra. Disea un


experimento para observar las tensiones de ruptura en
libras, de 1 6 hilos del proceso seleccionados azar. Las
tensiones son 20.8, 20.6, 21.0, 20.9, 19.9, 20.2, 19.8,
19.6, 20.9,.21.1, 20.4, 20.6, 19.7, 19.6, 20.3 v 20.7.
Supngase que la tensin de ruptura de una fibra se
encuentra modelada por una distribucin normal con
desviacin estndar de 0.45 Libras. Construir un intervalo
de confianza estimado del 98% para la tensin de ruptura
promedio de la fibra.
Respuesta [20.1196,20.6427]

2.4.2 Intervalos de confianza para con


varianza desconocida ( 2)
En esta seccin tratamos la forma de construir un

intervalo de confianza para la media de una distribucin


normal con varianza desconocida. Es necesario que el
supuesto de normalidad es una restriccin que debe
cumplirse para que las inferencias que realicemos sean
vlidas. Es decir la calidad de nuestras inferencias ser
funcin del tamao de muestra y de la semejanza de la
distribucin de la poblacin de la cual se muestrea a la
distribucin normal.

Encontramos la distribucin de muestreo cuando la


media y la varianza 2 son desconocidos, la variable
aleatoria tiene una distribucin t de Student con n - 1
grados de libertad. Si se toman valores t/2,(n-1) y -t/2,(n-1) en
la distribucin t, con t(n-1) grados de libertad puede
escribirse:

X
T
S
n

P t ,n 1 t t ,n 1 P t ,n 1
t ,n1 1

S
2
2
2
2

S
, n 1 x
n

,X

, n 1 x
n

PASOS
Los pasos para construir un intervalo de confianza para la

media de cuando no se conoce la varianza 2X, son:

1. Elegir el nivel de confianza (1 - a) al cual se desea realizar la

inferencia, considerando que a mayor confianza elegida, mayor


longitud de intervalo y por lo tanto menor precisin en la estimacin.
2. Obtener el valor t /2,(n-1) de las tablas de la distribucin t de Student.
3. Efectuar el clculo de la media y desviacin estndar muestral.
4. Calcular los extremos del intervalo.

La interpretacin asociada al intervalo nos indica que con una

confianza del 100 (1 - )%, el intervalo calculado contendr al


parmetro. Es decir a la media poblacional .

Debido a la variabilidad en los descuentos por los

automviles entregados a cambio, la ganancia por auto


nuevo vendido por un distribuidor de automviles varia de
uno a otro. Las ganancias por ventas (en cientos de
dlares); registradas la semana pasada, fueron 2.1, 3.0,
1.2, 6.2, 4.5 y 5.1. Obtener un intervalo de confianza de
95% para la ganancia media por venta.
Respuesta (1.684, 5.6825)

En un proceso qumico se han producido, en promedio

800 toneladas de cierto producto por da. Las


producciones diarias para la semana pasada fueron 785,
805, 790, 793 y 802 toneladas. Estimar a partir de los
datos la media de la produccin diaria con un coeficiente
de confianza de 90 %.
Respuesta (787.0528, 802.947)

2.4.3 Intervalo de confianza para el parmetro de proporcin


p cuando se muestrea una distribucin binomial
Se menciono que una aplicacin importante del teorema

del lmite central, es la aproximacin de distribuciones


discretas a la normal cuando el tamao de muestra es
suficientemente, grande. Entonces es posible construir un
intervalo de confianza para una proporcin a travs de la
variable aleatoria.

p p
p (1 p )
n

En trminos generales, un intervalo de 100(1-a) de

confianza para p estara dado por

p Z 1 2

p (1 p )
, p Z
1
2
n

p (1 p )

Si deseamos corregir por continuidad el intervalo de

100(1 a)% de confianza para p est dada por (pocos


datos) pero recomendable

p Z 1 2

p (1 p ) 1
, p Z
1
2
n
2n

p (1 p ) 1

n
2n

EJERCICIOS
Se hizo un estudio en relacin con la ratificacin de un

dirigente sindical. En respuesta a la pregunta "Si Votara


por ratificar al dirigente?", hubo 250 respuestas si"; 125 ,
"no", y 75 respuestas indecisas. Halle una estimacin
para la proporcin poblacional que votar por ratificar al
dirigente utilizando un intervalo de confianza de 95%.
Respuesta (0.5096,0.6014)

El

departamento de anlisis de mercados de una


compaa productora de caf instantneo realiz un
estudio entre hombres casados para determinar la
proporcin de stos que prefieren su marca. Veinte de
100 entrevistados contestaron afirmativamente. Utilice un
intervalo de confianza del 95% para estimar la proporcin
de todas los varones casados que prefieren la marca de
caf instantneo.
Respuesta (0.107,0.293)

CONTINUEN CON LOS EJERCICIOS

UNIDAD 3
PRUEBAS DE HIPTESIS CON UNA
MUESTRA

UNIDAD 3
Pruebas de hiptesis con una muestra.
3.1 Metodologa para la prueba de hiptesis.
3.2 Hiptesis nula y alternativa.
3.3 Error tipo I y error tipo II.
3.4 Pruebas de hiptesis Z para la media (desviacin

estndar poblacional conocida).


3.5 Pruebas para proporciones.
3.6 Seleccin del tamao de muestra ( para estimar la
media poblacional).
3.7 Seleccin del tamao de muestra (para estimar la
proporcin poblacional).

HIPTESIS
Hiptesis:

es una aseveracin de una poblacin


elaborado con el propsito de poner a prueba, para
verificar si la afirmacin es razonable se usan datos.

Por tanto, la prueba de hiptesis es un procedimiento

basado en la evidencia muestral y la teora de


probabilidad; se emplea para determinar si la hiptesis es
una afirmacin razonable.

3.1 METODOLOGA PARA LA PRUEBA DE


HIPTESIS
PASO 1

PASO 2

PASO 3

PASO 4

Paso 5

Establecer la hiptesis nula y alternativa


Afirmaciones acerca de la poblacin
Nivel de significacin
Probabilidad de rechazar la H=0 =nivel riesgo
Estadstico de prueba
Z= 30 o ms, t= menos de 30
Formulacin de regla de decisin
Condiciones especficas de rechazo
Tomar una muestra, llegar a una decisin
Estadstico de prueba vs valor crtico

3.2 HIPTESIS NULA Y ALTERNATIVA


En estadstica, una hiptesis nula (Ho) es una

hiptesis construida para anular o refutar, con el


objetivo de apoyar una hiptesis alternativa. El
planteamiento de la hiptesis nula siempre
contiene un signo de igualdad con respecto al
valor especificado del parmetro. Cuando se la
utiliza, la hiptesis nula se presume verdadera
hasta que una evidencia estadstica en la forma de
una prueba de hiptesis indique lo contrario. El
uso de la hiptesis nula es polmico.

PRUEBA DE HIPTESIS
Es un procedimiento, basado en la evidencia de la

muestra y en la teora de las probabilidades, usado para


determinar si la hiptesis es una afirmacin razonable y
debera no ser rechazada o si no es razonable debera
ser rechazada

HIPTESIS ALTERNATIVA
La hiptesis alternativa (H1) es cualquier hiptesis que

difiera de la hiptesis nula. El planteamiento de la


hiptesis alternativa nunca contiene un signo de igualdad
con respecto al valor especificado del parmetro.

3.3 ERROR DE TIPO I Y ERROR DE TIPO II


Si rechazamos una hiptesis cuando debiera ser

aceptada diremos que se ha cometido un error de


tipo I, la probabilidad de cometer un error tipo I se
denota por el smbolo . Por otra parte, si
aceptamos una hiptesis que debiera ser
rechazada, diremos que se ha cometido un error
de tipo II, la probabilidad de cometer un error tipo
II se denota por el smbolo . En ambos casos se
ha producido un juicio errneo

PROBLEMA
Una muestra aleatoria de 100 muertes registradas en

Estados Unidos el ao pasado muestra una vida


promedio de 71.8 aos. Suponga una desviacin
estndar poblacional de 8.9 aos, esto parece indicar
que la vida media de hoy en da es mayor que
70 aos? Utilice un nivel de significancia de 0.05

SOLUCIN
1.Se trata de una distribucin muestral de medias con

desviacin estndar conocida.

Una empresa elctrica fabrica focos que tienen una

duracin que se distribuye de forma aproximadamente


normal con una media de 800 horas y una desviacin
estndar de 40 horas. Si una muestra aleatoria de 30
focos tiene una duracin promedio de 788 horas,
muestran los datos suficiente evidencia para decir que la
duracin media ha cambiado?
Utilice un nivel de significancia del 0.04.
1- /2

Solucin:
1. Se trata de una distribucin muestral de medias con

desviacin estndar conocida.


2. Datos:
= 800 horas; = 40 horas; x = 788 horas;
n = 30; = 0.04
3. Ensayo de hiptesis
Ho; = 800 horas
H1; 800 horas

4. Regla de Decisin:

Si 2.052 ZR 2.052 No se rechaza Ho


Si ZR < -2.052 si ZR > 2.052 Se rechaza Ho
5. Clculos:

4. Regla de Decisin:

Si 2.052 ZR 2.052 No se rechaza Ho


Si ZR < -2.052 si ZR > 2.052 Se rechaza Ho
5. Clculos:

3.4 PRUEBAS DE HIPTESIS Z PARA LA MEDIDA


(DESVIACIN ESTNDAR POBLACIONAL
CONOCIDA)
El Instituto Elctrico Edison publica cifras del nmero

anual de Kilowatt-hora que gastan varios aparatos


electrodomsticos. Se afirma que una aspiradora gasta
un promedio mnimo de 46 kilowatt-hora al ao. Si una
muestra aleatoria de 12 hogares que se incluye en un
estudio planeado indica que las aspiradoras gastan un
promedio de 42 kilowatt-hora al ao con una desviacin
estndar de11.9 kilowatt-hora, esto sugiere con un nivel
de significancia de 0.05 que las aspiradoras gastan, en
promedio, menos de 46 kilowatt-hora anualmente?
Suponga que la poblacin de kilowatt-hora es normal.

SOLUCIN
1. Datos:
m0 = 46 kilowatt-hora, s= 11.9 kilowatt-hora
x = 42 kilowatt-hora
n = 12, a= 0.05
2. Hiptesis:
Ho: m 46 H1: m < 46
3. Estadstico de Prueba: Como la varianza de la

poblacin es desconocida y el tamao de muestra es


menor de 30 utilizaremos la distribucin t de Student en el
clculo del estadstico.

2. Percentil: (11) t 0.95 1.796


5.- Justificacin y decisin:
Como 1.16 > -1.796, no se rechaza Ho y se concluye

con un nivel de significancia del 0.05 que no existen


suficientes evidencias para afirmar que el nmero
promedio de kilowatt-hora que gastan al ao las
aspiradoras sea menor de 46 KW la hora.
t = ALFA, n-1

3.5 PRUEBAS PARA PROPORCIONES


El Muestreo
Muestreo es tomar una porcin de una poblacin como

subconjunto representativo de dicha poblacin. Para que


la muestra, al menos tericamente, sea representativa de
la poblacin, debe seleccionarse siguiendo un
procedimiento que permita a cualquiera de todas las
posibles muestras del mismo tamao contenidas en la
poblacin, tener igual oportunidad de ser seleccionada.
Este procedimiento es el muestreo aleatorio

EJEMPLO
El expendio Pollos Deliciosos asegura que 90% de sus

rdenes se entregan en menos de 10 minutos. En una


muestra de 100 rdenes, 82 se entregaron dentro de ese
lapso. Puede concluirse en el nivel de significancia 0,01,
que menos de 90% de las rdenes se entregan en menos
de 10 minutos

3.6 SELECCIN DEL TAMAO DE MUESTRA


(PARA ESTIMAR LA MEDIDA DE POBLACIN)
Una empresa que se dedica a hacer en cuestas se queja

de que un agente realiza en promedio 53 encuestas por


semana. Se ha introducido una forma ms moderna de
realizar las encuetas y la empresa quiere evaluar su
efectividad. Los nmeros de encuestas realizadas en una
semana por una muestra aleatoria de agentes son:
53 57 50 55 58 54 60 52 59 62 60 60 51 59 En el nivel de
significancia 0,05, puede concluirse que la cantidad
media de entrevistas realizadas por los agentes es
superior a 53 por semana? Evale el valor p.

UNIDAD 4
Pruebas de hiptesis con dos muestras y
varias muestras de datos numricos.

UNIDAD 4
Pruebas de hiptesis con dos muestras y varias muestras de datos

numricos.
4.1 Introduccin.
4.2 Distribuciones normal y t de Student.
4.3 Pruebas de significancia.
4.4 Comparacin de dos muestras independientes: Pruebas t para las

diferencias entre dos medias.


4.5 Prueba de Fisher para varianzas y de igualdad de las varianzas de
dos poblaciones normales.
4.6 Comparaciones de dos muestras pareadas
4.7 Modelo totalmente aleatorio: anlisis de varianza de un factor.
4.8 Seleccin del tamao de muestra para estimar la diferencia de dos
medias.
4.9 Aplicaciones

4.2 DISTRIBUCIN NORMAL Y DISTRIBUCIN T


DE STUDENT
En estadstica y probabilidad se llama distribucin normal,

distribucin de Gauss o distribucin gaussiana, a una de


las distribuciones de probabilidad de variable continua
que con ms frecuencia aparece en fenmenos reales.
La grfica de su funcin de densidad tiene una forma
acampanada y es simtrica respecto de un determinado
parmetro. Esta curva se conoce como campana de
Gauss

En probabilidad y estadstica, la distribucin t (de Student)

es una distribucin de probabilidad que surge del


problema de estimar la media de una poblacin
normalmente distribuida cuando el tamao de la muestra
es pequeo.
Aparece de manera natural al realizar la prueba t de
Student para la determinacin de las diferencias entre
dos medias muestrales y para la construccin del
intervalo de confianza para la diferencia entre las medias
de dos poblaciones cuando se desconoce la desviacin
tpica de una poblacin y sta debe ser estimada a partir
de los datos de una muestra.

La distribucin t de Student es la distribucin de

probabilidad del cociente

Donde

Z tiene una distribucin normal de media nula y


varianza 1
V tiene una distribucin chi-cuadrado con grados de
libertad
Z y V son independientes
Si es una constante no nula, el cociente es una

variable aleatoria que sigue la distribucin t de Student no


central con parmetro de no-centralidad .

4.3 PRUEBAS DE SIGNIFICANCIA


Las

pruebas de significancia estadstica son un


procedimiento que brinda un criterio objetivo para calificar
las diferencias que se presentan al comparar los
resultados de dos muestras, con el objetivo de explicar si
dichas diferencias se mantienen dentro de los lmites
previstos por el diseo estadstico (un error y una
confianza esperados) o si, por el contrario, la diferencia
entre ellas resulta lo suficientemente grande como para
inferir que ha ocurrido un cambio real en el indicador

4.4 COMPARACIN DE DOS MUESTRAS


INDEPENDIENTES: PRUEBAS T PARA LAS DIFERENCIAS
ENTRE NORMALES.
Para comparar las medias de dos muestras aleatorias
procedentes
de
dos
poblaciones
normales
e
independientes, se utiliza el procedimiento Prueba T para
muestras independientes, y para ello, se selecciona:
ANALIZAR
COMPARAR MEDIAS
PRUEBA T PARA MUESTRAS INDEPENDIENTES

T student para 2 muestras independientes


EJEMPLO DE 2 MUESTRAS SOBRE EL USO DE DIETA.
H0: La media de peso inicial es igual en ambos grupos
Se denotar por {X1, X2,...,Xn} e {Y1,Y2,...,Ym} al peso

observado en cada uno de los sujetos sometidos a la


dieta A y a la dieta B respectivamente. En general no se
exigir que coincida el nmero de observaciones en cada
uno de los grupos que se comparan, de modo que en el
ejemplo n=40 y m=35.
El t test para dos muestras independientes se basa en el
estadstico:

Usualmente se toma como referencia el rango de datos

en el que se concentra el 95% de la probabilidad


OTRO METODO POR RANGOS

4.5 PRUEBA DE FISHER PARA VARIANZAS Y DE


IGUALDAD DE LAS VARIANZAS DE DOS POBLACIONES
NORMALES.