Вы находитесь на странице: 1из 48

1

DISTRIBUCIONES MUESTRALES
Por qu muestrear?
Muestrear es una forma de sacar conclusines sobre el grupo entero (poblacin)
basados en informacin estadstica obtenida de un pequeo grupo (muestra) para
infererir estadsticamente. Sabemos que:
X

1 n
Xj,
n j 1

1
N

ah
h 1

s2

_
1 n
(
X

X
)2

i
n 1 j 1

1
N

(a
h 1

)2

El estudio de las distriuciones muestrales tiene como objetivos:


1. Estimacin entre cuales valores, limites de confianza , est un parmetro de la
poblacin
2. Realizar pruebas de hiptesis

OBJETIVO uno. Estimar parmetros por intervalos, construyendo un intervalo


que contenga el parmetro poblacional, mediante un estimador, una vez fijado un
grado de confianza fijada a priori por el experimentador.
En una muestra aleatoria se calcula estimadores que son los estadisticos de los
parmetros poblacionales, por lo cual al seleccionar varias muestras de una
poblacin, se obtendrn varios valores del estadstico y por lo tanto este estimador
del parmetro es una variable aleatoria. Luego tiene una funcin de probabilidad
asociada al estimador .

QU SON LAS DISTRIBUCIONES MUESTRALES?


Como los valores de un estadstico, tal como X , varan de una muestra aleatoria a
otra, se le puede considerar como una variable aleatoria con su correspondiente
distribucin de frecuencias.
Suponga que se han seleccionado muestras aleatorias de tamao 20 en una
poblacin grande. Se calcula la media muestral X para cada muestra; la coleccin
de todas estas medias muestrales se puede ilustrar en la siguiente figura:

Ejemplo 1. Se eligen muestras ordenadas de tamao 2, con reemplazo, de la


poblacin de valores 0, 2, 4 y 6 (caso en el cual una urna contiene 4 fichas
enumeradas con el 0, el 2, el 4 y el 6). Encuentre:

, la media poblacional.

, la desviacin estndar poblacional.


x, la media de la distribucin muestral de medias.

, la desviacin estndar de la distribucin muestral de medias.


Adems, grafique las frecuencias para la poblacin y para la distribucin
muestral de medias.
Solucin:
a. La media poblacional . La poblacion tiene 4 elementos: valores 0, 2, 4 y 6:

b. La desviacin estndar de la poblacin es:

Suponga urna tiene 4 fichas con los nmeros 0, 2, 4 y 6. Se extraen dos con
reposicin. Se obtienen 16 posibles muestras de tamao dos y cada muestra tiene
su media aritmtica ( y cada muestra tiene su varianza, pero sta ahora no la
calculamos). Es 16 la cantidad total de las posibles muestras de tamao dos, de la
poblacin simulada de los 4 fichas, con dichos nmeros. Queremos saber, de estos
16 valores :

Cul es le media aritmetica ( de los 16 valores de X , cuando se hace con


reemplazo)

Cul es la varianza de las medias muestrales (de los 16 valores de X , con


reemplazo)

Conocer

una distribucin muestral de un estimador, por ejemplo, conocer la


distriucin muestral de la media aritmtica, es conocer:
1. la media aritmtica de todas las posibles medias de las muestras,
es decir , la esperanza de X .
2. la varianza de todas las posibles medias aritmeticas.
3. como tambin es necesario conocer cul es la funcion de
probabilidad que sigue el estimador!.
A continuacin se listan los elementos de la distribucin muestral de la media y
la correspondiente distribucin de frecuencias.
A:_La media aritmtica de todas las posibles muestras, en este caso de todos los 16 posibles
valores que puede tomar una muestra de tamao n=2, con reemplazo, tomada de una poblacin
de tamao N=4; equivale a decir calcular la media aritmtica de todas las posibles medias
aritmticas de una muestra de tamao dos con reemplazo, o decir, calcular una Esperanza
matemtica especfica de las medias aritmticas de una muestra de tamao dos, con reemplazo,
que proviene de una poblacin de tamao cuatro:

4
B.-) Ahora vamos a calcular la desviacin estndar de los 16 valores de X , esdecir , la
desviacin estndar de todas las medias muestrales posibles, que en este caso son 16
valores de X de la distribucin muestral de medias es:

Por separado, conociendo la desviacin estndar de la poblacin que es (2,236), el valor anterior
se puede tambien hallar con el siguiente clculo:

Hemos comprobado (no demostrado) que la media aritmtica de todas las posibles muestras (de
la distribucin muestral de medias) tiene una media igual a la media poblacional. Para cualquier
tamao de la muestra y cualquier poblacin, se tiene que
E( X )

Tambien, hemos comprobado (con reemplazo) que:


V (X )

2
n

Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de medias


ser normal sin importar el tamao de la muestra.

Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la


muestra debe ser mayor o igual a 30, para que la distribucin muestral tenga una forma
acampanada. Mientras mayor sea el tamao de la muestra, ms cerca estar la distribucin
muestral de ser normal.

Para muchos propsitos, la aproximacin normal se considera buena si se cumple n=30. La


forma de la disitribucin muestral de medias sea aproximadamente normal, an en casos donde
la poblacin original es bimodal, es realmente notable.

( ver anexo uno una teora del a distribucin muestral)

TEOREMA DEL LMITE CENTRAL


Si se seleccionan muestras aleatorias de n observaciones de una poblacin con media
y desviacin estndar , entonces, cuando n es grande, la distribucin muestral de medias
tendr aproximadamente una distribucin normal con una media igual a y una desviacin
estndar de
mayor.

. La aproximacin ser cada vez ms exacta a medida de que n sea cada vez

DISTRIBUCIN MUESTRAL DE LAS MEDIAS


Vamos a obtener experimentalmente la distribucin de las medias muestrales. Para
ello consideremos la siguiente poblacin:

Consideremos todas las muestras de tamao 2 posibles, mediante muestreo


aleatorio simple (con reemplazamiento). Hallamos la distribucin de probabilidad de
la media muestral

Como se puede observar:

Si la poblacin es finita y la extraccin simultnea o sin reposicin, la desviacin


tpica va multiplicada por la siguiente expresin:

Donde N = tamao de la poblacin y n = tamao de la muestra


EJEMPLO 2. La variable X de una poblacin toma cualquiera de los (N=4) cuatro
valores 2,4,6,8, que al simular una poblacin, tomaremos muestras de tamao dos
(n=2) con repeticin. En total existen 16 muestras posibles que se pueden
seleccionar de esta poblacin. Resultando la siguiente tabla, en la cual X 1 es el
primer valor observado de los dos que componen la 1, 2, 3, .., 16 muestra y X 2
es el segundo valor de las respectivas muestras. Es X el promedio de los dos valore
observados y representa la media de cada muestra, por lo cual X toma 16 valores.
Muestra

X1

X2

Media Muestral

8
X
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.

2
2
2
2
4
4
4
4
6
6
6
6
8
8
8
8

2
4
6
8
2
4
6
8
2
4
6
8
2
4
6
8

2
3
4
5
3
4
5
6
4
5
6
7
5
6
7
8

En la practica jams se toman tantas muestras, sino una especial, la cul es parte de
la distribucin. Con base en la muestra se hace inferencia acerca de la Poblacin.
Distribucin de la media muestra con tamao de muestra 2
Media
muestral
2
3
4
5
6
7
8
Total

Nmero de
muestras
1
2
3
4
3
2
1
16

Probabilidad P ( x )
1/16
2/16
3/16
4/16
3/16
2/16
1/16
1

La distribucin emprica muestral de la media se representa grficamente

Aun cuando se pueda construir una distribucin de frecuencias relativas emprica de


una estadstica muestral al tomar un gran nmero de muestras de igual tamao de la
misma poblacin y luego distribuirlas de acuerdo a los resultados muestrales reales,

9
se puede llega a definir una relacin funcional entre todos los resultados posibles y
sus probabilidades correspondientes

Distribucin muestral de medias


Si tenemos una muestra aleatoria de una poblacin N( ), se sabe (Teorema del
lmite central) que la fdp (funcion densidad de probabilidad) de la media muestral es
tambin normal con media y varianza 2/n. Esto es exacto para poblaciones
normales y aproximado (buena aproximacin con n>30) para poblaciones
cualesquiera. Es decir

es el error tpico, o error estndar de la media.

Cmo usamos esto en nuestro problema de estimacin?


1 problema: No hay tablas para cualquier normal, slo para la normal
estndar (la llamada Z); pero haciendo la transformacin (llamada tipificacin)

una variable , com el estimador X , con media y desviacin


transforma en una normal estndar z.

se

2.Se denomina nievel de confianza, que el investigador se da como la


probabilidad que el intervalo que estime o calcule, contenga el parmetro de la
poblacin, que en nuestro caso es la media poblacional
Llamando z al valor de una variable normal tipificada que deja a su derecha
un rea bajo la curva de , es decir, que la probabilidad que la variable sea
mayor que ese valor es (estos son los valores que ofrece la tabla de la
normal). Llamando -z al valor de una variable normal tipificada que deja a su
izquierda un rea bajo la curva de , es decir, que la probabilidad que la
variable sea menor que ese valor es (estos son los valores que ofrece la
tabla de la normal)
Por ejemplo, supongamos un nivel de confianza del 5%, es decir, = 0,05.
Como lo muestra la figura siguiente, para un rea bajo la curva normal
estndar, es -z=-1,96 y es z=1,96. El rea entre -z = -1,96 y z =1,96
es 0.95= 1-

10

0.5

0.5

0.025

0.025
0.475

-z

-1.96=-Z

0.475
0

1.96= Z z

Podremos construir intervalos de la forma siguiente, para los que la


probabilidad es (1 - .

Teniendo en cuenta la simetra de la normal y manipulando algebracamente

11
que tambin se puede escribir de la siguiente forma, siendo L 1 con el signo menos y
L2 con el signo mas

Pr X Z 2
X Z 2 100 1 %
n
n

o, haciendo nfasis en que

es el error estndar de la media, EE(

Recurdese que la probabilidad de que el intervalo contenga a es (1 - . A un


intervalo de este tipo se le denomina intervalo de confianza con un nivel de
confianza del 100(1 - )%, o nivel de significacin de 100%. El nivel de confianza
habitual es el 95%, en cuyo caso =0,05 y z
estimacin puntual y se dice que

=1,96. Al valor

/2

se le denomina

III.
es ESTADSTICA
un estimador de

DIST. MUESTRAL
MEDIA CUANDO
VARIANZA ES CONOCIDA
MEDIA CUANDO
VARIANZA ES DESCONOCIDA

X N ,
n

x-
N(0,1)

a) n es grande
S

x N ,
n

x-
N(0,1)
s
n

b) n es pequeo
S

x N ,
n

VARIANZA
proporcin

x-
t n 1
s
n

12

En las Distribuciones Muestrales , recordamos que la distribucin normal es una distribucin


continua, en forma de campana en donde la media, la mediana y la moda tienen un mismo valor
y es simtrica.
Sabemos que cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao de
una poblacin normal, la distribucin muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la formula de la distribucin normal con
y
, entonces la frmula para calcular la probabilidad del comportamiento del
estadstico, en este caso la media de la muestra , quedara de la siguiente manera:

y para poblaciones finitas y muestro con reemplazo:

Ejemplo:Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40 horas.
Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de
menos de 775 horas.
Solucin:

Este valor se busca en la tabla de z

La interpretacin sera que la probabilidad de que la media de la muestra de 16 focos sea menor
a 775 horas es de 0.0062.

13
Ejemplo:Las estaturas de 1000 estudiantes estn distribuidas aproximadamente en forma normal
con una media de 174.5 centmetros y una desviacin estndar de 6.9 centmetros. Si se extraen
200 muestras aleatorias de tamao 25 sin reemplazo de esta poblacin, determine:
a. El nmero de las medias muestrales que caen entre 172.5 y 175.8 centmetros.
b. El nmero de medias muestrales que caen por debajo de 172 centmetros.
Solucin:
Como se puede observar en este ejercicio se cuenta con una poblacin finita y un muestreo sin
reemplazo, por lo que se tendr que agregar el factor de correccin. Se proceder a calcular el
denominador de Z para slo sustituirlo en cada inciso.

a.

(0.7607)(200)=152 medias muestrales

b.

14

(0.0336)(200)= 7 medias muestrales

DISTRIBUCIN MUESTRAL DE LAS PROPORCIONES


EJEMPLO.Vamos a obtener experimentalmente la distribucin de las proporciones
muestrales. Para ello consideremos el conjunto de figuras:

La proporcin poblacional de tringulos es 1/4.


Consideremos todas las muestras de tamao 2 posibles, mediante muestreo
aleatorio simple (con reemplazamiento). Hallamos la distribucin de probabilidad de
la proporcin muestral (nombrada por

):

15
Calculamos su esperanza matemtica y la varianza:

V(X)= E(X2)-(E(X))2
= E(X2)-( )2

El nmero de xitos x de una muestra de tamao n, se distribuye de forma binomial


B(n, p); si la aproximamos a una normal ser
dividiendo x por n se tiene que:

. Como

=x/n

Si la poblacin es finita y la extraccin simultnea o sin reposicin, la desviacin


tpica va multiplicada por la siguiente expresin:

Donde N = tamao de la poblacin y n = tamao de la muestra


EJERC:De la poblacin que consta de 4 circulos de color blanco, azul, rojo y verde,
extrae todas las muestra posible de tamao 2 de dos formas distintas:
a) Simultnea (sin reposicin y sin que importe el orden)
b) Sucesiva sin reposicin (importa el orden).
Calcula la distribucin de probabilidad de la proporcin muestral y con ella la
esperanza y la varianza. Comprueba el resultado
2. En una localidad de 6000 habitantes, la proporcin de menores de 16 aos es
p=1/4.
a) Cul es la distribucin de la proporcin de menores de 16 aos en muestras
de 50 habitantes de dicha poblacin?.

16
b) Halla la probabilidad de que, en una muestra de 50 habitantes, haya entre
14 y 20 habitantes menores de 16 aos?.
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que
queremos investigar la proporcin de artculos defectuosos o la proporcin de alumnos
reprobados en la muestra. La distribucin muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribucin se genera de igual manera que la distribucin
muestral de medias, a excepcin de que al extraer las muestras de la poblacin se calcula el
estadstico proporcin (p=x/n en donde "x" es el nmero de xitos u observaciones de inters y
"n" el tamao de la muestra) en lugar del estadsitico media.

Una poblacin binomial est estrechamente relacionada con la distribucin muestral de


proporciones; como consecuencia de esta relacin, las afirmaciones probabilsticas referentes a
la proporcin muestral pueden evaluarse usando la aproximacin normal a la binomial,
siempre que:
np 5

n(1-p)

5.

Cualquier evento se puede convertir en una proporcin si se divide el nmero obtenido entre el
nmero de intentos. La frmula que se utilizar para el clculo de probabilidad en una
distribucin muestral de proporciones est basada en la aproximacin de la distribucin normal a
la binomial . Esta frmula nos servir para calcular la probabilidad del comportamiento de la
proporcin en la muestra.

A esta frmula se le puede agregar el factor de correccin de


necesarias.

si se cumple con las condiciones

17
Ejemplo: Se ha determinado que 60% de los estudiantes de una universidad grande fuman
cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la
proporcin de la muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solucin:Este ejercicio se puede solucionar por dos mtodos. El primero puede ser con la
aproximacin de la distribucin normal a la binomial y el segundo utilizando la frmula de la
distribucin muestral de proporciones.
Aproximacin de la distribucin normal a la binomial:
Datos: n=800 estudiantes; p=0.60 ; x= (.55)(800) = 440 estudiantes
p(x 440) = ?.

Media= np= (800)(0.60)= 480

p(x 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer
una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.
NOTA: a 440 se le resta 0.5 para corregir en parte el pasar de una distribucin discreta (binomial)
a una continua (normal estndar). Pero este problema tambien se puede resolver aplicando
directamente la distribucin binomial, pero es ms largo

Distribucin Muestral de Proporciones. Datos: n=800 estudiantes ; P=0.60 ; p= 0.55


p(p 0.55) = ?

18

Observe que este valor es igual al obtenido en el mtodo de la aproximacin de la distribucin


normal a la binomial, por lo que si lo buscamos en la tabla de "z" nos da la misma probabilidad
de 0.0017. Tambin se debe de tomar en cuenta que el factor de correccin de 0.5 se esta
dividiendo entre el tamao de la muestra, ya que estamos hablando de una proporcin.
La interpretacin en esta solucin, estara enfocada a la proporcin de la muestra, por lo que
diramos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa
universidad, la proporcin de estudiantes que fuman cigarrillos sea menor al 55% es del
0.17%.
Ejemplo: Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios
pueden presentar una reaccin adversa a l, ms an, se piensa que alrededor del 3% de los
usuarios tienen tal reaccin. Si una muestra aleatoria de 150 personas con malestar estomacal
usa el medicamento, encuentre la probabilidad de que la proporcin de la muestra de los
usuarios que realmente presentan una reaccin adversa, exceda el 4%.
a. Resolverlo mediante la aproximacin de la normal a la binomial
b. Resolverlo con la distribucin muestral de proporciones
Aproximacin de la distribucin normal a la binomial:
Datos: n=150 personas ; p=0.03 ; x= (0.04)(150) = 6 personas;
Media = np= (150)(0.03)= 4.5

p(x>6) = ?

p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al
extraer una muestra de 150 personas, mas de 6 presentarn una reaccin adversa.
a. Distribucin Muestral de Proporciones . Datos: n=150 personas ; P=0.03 ; p=
0.04
p(p>0.04) = ?

19

Observe que este valor es igual al obtenido y la interpretacin es: existe una probabilidad del
17% de que al tomar una muestra de 150 personas se tenga una proporcin mayor de 0.04
presentando una reaccin adversa.

DISTRIBUCIN MUESTRAL DE DIFERENCIA DE MEDIAS


Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviacin
estndar
1, y la segunda con media
2 y desviacin estndar
2. Ms an, se elige una
muestra aleatoria de tamao n1 de la primera poblacin y una muestra independiente aleatoria
de tamao n2 de la segunda poblacin; se calcula la media muestral para cada muestra y la
diferencia entre dichas medias. La coleccin de todas esas diferencias se llama distribucin
muestral de las diferencias entre medias o la distribucin muestral del estadstico

La distribucin es aproximadamente normal para n 1 30 y n2 30. Si las poblaciones son


normales, entonces la distribucin muestral de medias es normal sin importar los tamaos de las
muestras.

20
En ejercicios anteriores se haba demostrado que

deducir que

y que

y que

, por lo que no es difcil

La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de medias
es:

Ejemplo:En un estudio para comparar los pesos promedio de nios y nias de sexto grado en
una escuela primaria se usar una muestra aleatoria de 20 nios y otra de 25 nias. Se sabe que
tanto para nios como para nias los pesos siguen una distribucin normal. El promedio de los
pesos de todos los nios de sexto grado de esa escuela es de 100 libras y su desviacin
estndar es de 14.142, mientras que el promedio de los pesos de todas las nias del sexto grado
de esa escuela es de 85 libras y su desviacin estndar es de 12.247 libras. Si

representa el

promedio de los pesos de 20 nios y es el promedio de los pesos de una muestra de 25 nias,
encuentre la probabilidad de que el promedio de los pesos de los 20 nios sea al menos 20
libras ms grande que el de las 25 nias.
Solucin: Datos:

= 100 libras ;

= 85 libras ;

= 14.142 libras;

= 12.247 libras

n1 = 20 nios ; n2 = 25 nias
=?

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de nios sea al
menos 20 libras ms grande que el de la muestra de las nias es 0.1056.

21
Ejemplo: Uno de los principales fabricantes de televisores compra los tubos de rayos catdicos a
dos compaas. Los tubos de la compaa A tienen una vida media de 7.2 aos con una
desviacin estndar de 0.8 aos, mientras que los de la B tienen una vida media de 6.7 aos con
una desviacin estndar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34
tubos de la compaa A tenga una vida promedio de al menos un ao ms que la de una muestra
aleatoria de 40 tubos de la compaa B.
Solucin: Datos:

= 7.2 aos ,

= 6.7 aos;

= 0.8 aos;

= 0.7 aos

nA = 34 tubos ; nB = 40 tubos
=?

Ejemplo: Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrndose una


desviacin estndar de 1.23km/L para la primera gasolina y una desviacin estndar de
1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en
42 autos.
a. Cul es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de
0.45km/L que la segunda gasolina?
b. Cul es la probabilidad de que la diferencia en rendimientos promedio se encuentre
entre 0.65 y 0.83km/L a favor de la gasolina 1?.
Solucin:En este ejercicio no se cuenta con los parmetros de las medias en ninguna de las dos
poblaciones, por lo que se supondrn que son iguales.
Datos:
a.

= 1.23 Km/Lto;
=?

= 1.37 Km/Lto; n1 = 35 autos

; n2 = 42 autos

22

b.
?

La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre


entre 0.65 y 0.83 Km/Lto a favor de la gasolina 1 es de 0.0117.
DISTRIBUCIN MUESTRAL DE DIFERENCIA DE PROPORCIONES
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse
utilizando proporciones o porcentajes. A continuacin se citan algunos ejemplos:
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones
muestrales, la distribucin muestral de diferencia de proporciones es aproximadamente normal
para tamaos de muestra grande (n1p1 5, n1q1 5,n2p2 5 y n2q2 5). Entonces p1 y p2 tienen

23
distribuciones muestrales aproximadamente normales, as que su diferencia p 1-p2 tambin tiene
una distribucin muestral aproximadamente normal.

Cuando se estudi a la distribucin muestral de proporciones se comprob que


, por lo que no es difcil deducir que

y que

y que

.
La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de
proporciones es:

Ejemplo: Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en
sus opiniones sobre la promulgacin de la pena de muerte para personas culpables de
asesinato. Se cree que el 12% de los hombres adultos estn a favor de la pena de muerte,
mientras que slo 10% de las mujeres adultas lo estn. Si se pregunta a dos muestras aleatorias
de 100 hombres y 100 mujeres su opinin sobre la promulgacin de la pena de muerte,
determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que
el de las mujeres.
Solucin: Datos: PH = 0.12; PM = 0.10; nH = 100 ; nM = 100
p(pH-pM

0.03) = ?

Se recuerda que se est incluyendo el factor de correccin de 0.5 por ser una distribucin
binomial y se est utilizando la distribucin normal.

24

Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte,


al menos 3% mayor que el de mujeres es de 0.4562.
Ejemplo: Se sabe que 3 de cada 6 productos fabricados por la mquina 1 son defectuosos y
que 2 de cada 5 objetos fabricados por la mquina 2 son defectuosos; se toman muestras de
120 objetos de cada mquina:
a. cul es la probabilidad de que la proporcin de artculos defectuosos de la mquina 2
rebase a la mquina 1 en por lo menos 0.10?
b. cul es la probabilidad de que la proporcin de artculos defectuosos de la mquina 1
rebase a la mquina 2 en por lo menos 0.15?
Solucin: Datos: P1 = 3/6 = 0.5 P2 = 2/5 = 0.4 n1 = 120 objetos n2 = 120 objetos
a. p(p2-p1 0.10) = ?

Otra manera de hacer este ejercicio es poner P1-P2:

25

La probabilidad de que exista una diferencia de proporciones de artculos defectuosos de


por lo menos 10% a favor de la mquina 2 es de 0.0011.
b. p(p1-p2
0.15)=?

La probabilidad de que exista una diferencia de proporciones de artculos defectuosos de por lo


menos 15% a favor de la mquina 1 es de 0.2357.
Problemas propuestos
1. Se sabe que la resistencia a la ruptura de cierto tipo de cuerda se distribuye normalmente
con media de 2000 libras y una varianza de 25,000 lbs 2. Si se selecciona una muestra
aleatoria de 100 cuerdas; determine la probabilidad de que en esa muestra:
a. La resistencia media encontrada sea de por lo menos 1958 libras.
b. La resistencia media se mayor de 2080 libras.

26
1. Como parte de un proyecto general de mejoramiento de la calidad, un fabricante textil
decide controlar el nmero de imperfecciones encontradas en cada pieza de tela. Se
estima que el nmero promedio de imperfecciones por cada pieza de tela es de 12,
determine la probabilidad de que en la prxima pieza de tela fabricada se encuentren:
a. Entre 10 y 12 imperfecciones.
b. Menos de 9 y ms de 15 imperfecciones.
1. En una prueba de aptitud la puntuacin media de los estudiantes es de 72 puntos y la
desviacin estndar es de 8 puntos. Cul es la probabilidad de que dos grupos de
estudiantes, formados de 28 y 36 estudiantes, respectivamente, difieran en su puntuacin
media en:
a. 3 ms puntos.
b. 6 o ms puntos.
c. Entre 2 y 5 puntos.
1. Un especialista en gentica ha detectado que el 26% de los hombres y el 24% de las
mujeres de cierta regin del pas tiene un leve desorden sanguneo; si se toman muestras
de 150 hombres y 150 mujeres, determine la probabilidad de que la diferencia muestral de
proporciones que tienen ese leve desorden sanguneo sea de:
a. Menos de 0.035 a favor de los hombres.
b. Entre 0.01 y 0.04 a favor de los hombres.
1. Una urna contiene 80 bolas de las que 60% son rojas y 40% blancas. De un total de 50
muestras de 20 bolas cada una, sacadas de la urna con remplazamiento, en cuntas
cabe esperar
a.
b.
c.
d.

Igual nmero de bolas rojas y blancas?


12 bolas rojas y 8 blancas?
8 bolas rojas y 12 blancas?
10 mas bolas blancas?

1. Los pesos de 1500 cojinetes de bolas se distribuyen normalmente con media de 2.40
onzas y desviacin estndar de 0.048 onzas. Si se extraen 300 muestras de tamao 36
de esta poblacin, determinar la media esperada y la desviacin estndar de la
distribucin muestral de medias si el muestreo se hace:
a. Con remplazamiento
b. Sin remplazamiento
1. La vida media de una mquina para hacer pasta es de siete aos, con una desviacin
estndar de un ao. Suponga que las vidas de estas mquinas siguen aproximadamente
una distribucin normal, encuentre:
a. La probabilidad de que la vida media de una muestra aleatoria de 9 de estas
mquinas caiga entre 6.4 y 7.2 aos.
b. El valor de la

27
a la derecha del cual caera el 15% de las medias calculadas de muestras aleatorias de tamao
nueve.
1. Se llevan a cabo dos experimentos independientes en lo que se comparan dos tipos
diferentes de pintura. Se pintan 18 especmenes con el tipo A y en cada uno se registra el
tiempo de secado en horas. Lo mismo se hace con el tipo B. Se sabe que las
desviaciones estndar de la poblacin son ambas 1.0. Suponga que el tiempo medio de
secado es igual para los dos tipo de pintura. Encuentre la probabilidad de que la diferencia
de medias en el tiempo de secado sea mayor a uno a favor de la pintura A.

Respuestas a los problemas propuestos:


1. a) 0.9960 b) 0
2. a) 0.3221 b) 0.3122
3. a) 0.2150 b) 0.0064 c) 0.4504
4. a) 0.2227 b) 0.2848
5. a) 6 b) 9 c) 2 d) 12
6. a)
7. a) 0.6898 b) 7.35
8. 0.0013

b)

ligeramente menor que 0.008

ESTIMACION POR INTERVALO


El objetivo principal de la estadstica inferencial es la estimacin, esto es que mediante el
estudio de una muestra de una poblacin se quiere generalizar las conclusiones al total de la
misma..
.

Como se puede observar las dos distribuciones tienen un mismo valor en el parmetro slo que
la distribucin muestral de medias tiene una menor varianza, por lo que la media se convierte en
un estimador eficiente e insesgado.
ESTIMACIN POR INTERVALOS

28
Un estimado de intervalo o intervalo de confianza (IC). Un intervalo de confianza se calcula
siempre seleccionando primero un nivel de confianza, que es una medida de el grado de
fiabilidad en el intervalo.
Ejemplo:Encuentre el valor de z para un nivel de confianza del 95%.
Solucin 1:Se utilizar la tabla que tiene el rea bajo la curva de grficamente sera:

hasta z. Si lo vemos

El nivel de confianza bilateral est dividido en partes iguales bajo la curva:

En base a la tabla que se esta utilizando, se tendr que buscar el rea de 0.975, ya que cada
extremo o cola de la curva tiene un valor de 0.025.

Por lo que el valor de z es de 1.96.


Solucin 2:Si se utiliza una tabla en donde el rea bajo la curva es de 0 a z:

En este caso slo se tendr que buscar adentro de la tabla el rea de 0.475 y el resultado del
valor de z ser el mismo, para este ejemplo 1.96.

29
Solucin 3:Para la tabla en donde el rea bajo la curva va desde z hasta

Se busca el valor de 0.025 para encontrar z de 1.96.


Independientemente del valor del Nivel de Confianza este ser el procedimiento a seguir para
localizar a z. En el caso de que no se encuentre el valor exacto se tendr que interpolar.
ESTIMACIN PARA LA MEDIA
Es conocido de nosotros durante este curso, que en base a la distribucin muestral de medias
que se gener en el tema anterior, la formula para el calculo de probabilidad es la siguiente:

. Como en este caso no conocemos el parmetro y lo queremos estimar por medio


de la media de la muestra, slo se despejar de la formula anterior, quedando lo siguiente:

De esta formula se puede observar que tanto el tamao de la muestra como el valor de z se
conocern. Z se puede obtener de la tabla de la distribucin normal a partir del nivel de confianza
establecido. Pero en ocasiones se desconoce
por lo que en esos casos lo correcto es utilizar
otra distribucin llamada "t" de student si la poblacin de donde provienen los datos es normal.
Para el caso de tamaos de muestra grande se puede utilizar una estimacin puntual de la
desviacin estndar, es decir igualar la desviacin estndar de la muestra a la de la poblacin
(s= ).
Ejemplos:Se encuentra que la concentracin promedio de zinc que se saca del agua a partir de
una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro.
Encuentre los intervalos de confianza de 95% y 99% para la concentracin media de zinc en el
ro. Suponga que la desviacin estndar de la poblacin es 0.3.
Solucin:La estimacin puntual de
es 1.96, por lo tanto:

es = 2.6. El valor de z para un nivel de confianza del 95%

30

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo ser
ms amplio:

El intervalo de confianza proporciona una estimacin de la presicin de nuestra


estimacin puntual. Si es realmente el valor central de intervalo, entonces estima
sin error. La mayor parte de las veces, sin embargo, no ser exactamente igual a y la
estimacin puntual es errnea. La magnitud de este error ser el valor absoluto de la
diferencia entre y , y podemos tener el nivel de confianza de que esta diferencia no

exceder

Como se puede observar en los resultados del ejercicio se tiene un error de estimacin
mayor cuando el nivel de confianza es del 99% y ms pequeo cuando se reduce a un
nivel de confianza del 95%.
1. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente distribuida
de forma normal con una desviacin estndar de 40 horas. Si una muestra de 30 focos
tiene una duracin promedio de 780 horas, encuentre un intervalos de confianza de 96%
para la media de la poblacin de todos los focos que produce esta empresa.
Solucin:

Con un nivel de confianza del 96% se sabe que la duracin media de los focos que
produce la empresa est entre 765 y 765 horas.

31

CONCEPTOS CLAVES
1. Un intervalo de confianza aporta ms informacin que un estimador puntual
cuando se quiere hacer inferencias sobre parmetros poblacionales.
2. Existen intervalos de confianza bilaterales y unilaterales.
3. La amplitud de un intervalo de confianza est determinado por: el nivel de
confianza establecido ;la variabilidad de los datos; el tamao de la muestra.
4. En un estudio Caso-Control o uno de Cohorte, es posible (y frecuentemente
deseable) construir intervalos de confianza para Odds Ratios y Riesgos
Relativos.
5. Un intervalo de confianza permite verificar hiptesis planteadas acerca de
parmetros poblacionales

Intervalos de confianza
Concepto de Intervalo de Confianza.
En el contexto de estimar un parmetro poblacional, un intervalo de confianza es un
rango de valores (calculado en una muestra) en el cual se encuentra el verdadero
valor del parmetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parmetro se encuentre en el intervalo
construido se denomina nivel de confianza, y se denota 1- . La probabilidad de
equivocarnos se llama nivel de significancia y se simboliza . Generalmente se
construyen intervalos con confianza 1- =95% (o significancia =5%). Menos
frecuentes son los intervalos con 10% o =1%.
Para construir un intervalo de confianza, se puede comprobar que la distribucin
Normal Estndar cumple 1:
P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de probabilidades o un programa
computacional que calcule probabilidades normales).
Luego, si una variable X tiene distribucin N( ,
cumple:

), entonces el 95% de las veces se

32
Despejando

en la ecuacin se tiene:

El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un


intervalo de confianza al 95% para la media cuando la variable X es normal y
es conocido.
II- Intervalo de confianza para un promedio:
Generalmente, cuando se quiere construir un intervalo de confianza para la media
poblacional , la varianza poblacional
es desconocida, por lo que el intervalo para
construido al final de II es muy poco prctico.
Si en el intervalo se reemplaza la desviacin estndar poblacional
estndar muestral s, el intervalo de confianza toma la forma:

por la desviacin

La cual es una buena aproximacin para el intervalo de confianza de 95% para con
desconocido. Esta aproximacin es mejor en la medida que el tamao muestral
sea grande.
Cuando el tamao muestral es pequeo, el intervalo de confianza requiere utilizar la
distribucin t de Student (con n-1 grados de libertad, siendo n el tamao de la
muestra), en vez de la distribucin normal (por ejemplo, para un intervalo de 95%
de confianza, los lmites del intervalo ya no sern construidos usando el valor 1,96).
Ejemplo:
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de
depresin (mayor puntaje significa mayor depresin).
2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14
14 15 15 16 16 16 16 16 16
16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 20 20
Para construir un intervalo de confianza para el puntaje promedio poblacional,
asumamos que los datos tienen distribucin normal, con varianza poblacional
desconocida. Como
es desconocido, lo estimamos por s =18,7. Luego, un intervalo
de confianza aproximado es:

33

Luego, el intervalo de confianza para es (13,2 , 15,8). Es decir, el puntaje


promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.

III. INTERVALO DE CONFIANZA PARA UNA PROPORCIN.


En este caso, interesa construir un intervalo de confianza para una proporcin o un
porcentaje poblacional (por ejemplo, el porcentaje de personas con hipertensin,
fumadoras, etc.)
Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:

O bien:

Donde p es el porcentaje de personas con la caracterstica de inters en la poblacin


(o sea, es el parmetro de inters) y p (barra) es su estimador muestral.
Luego, procediendo en forma anloga al caso de la media, podemos construir un
intervalo de 95% de confianza para la proporcin poblacional p.

Ejemplo:
En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres
mayores de 15 aos en la Regin Metropolitana, se encontr que el 17.6% eran
hipertensas. Un intervalo de 95% de confianza para la proporcin de mujeres
hipertensas en la Regin Metropolitana est dado por:

Luego, la proporcin de hipertensas vara entre (0,139 , 0,212) con una confianza de
95%.

34
CLCULO DEL TAMAO DE LA MUESTRA PARA ESTIMAR UNA MEDIA
Parece razonable que para un nivel de confianza fijo, sea posible determinar un tamao de la
muestra tal que el error de estimacin sea tan pequeo como queramos, para ser mas preciso,
dado un nivel de confianza y un error fijo de estimacin , se puede escoger un tamao de
muestra n tal que P(
) = Nivel de confianza. Con el propsito de determinar n. El error
mximo de estimacin esta dado por:

Si se eleva al cuadrado ambos lados de esta ecuacin y se despeja n de la ecuacin resultante,


obtenemos:

Como n debe de ser un nmero entero, redondeamos hacia arriba todos los resultados
fraccionarios.
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de
estimacin se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

Ejemplos:
1. Un bilogo quiere estimar el peso promedio de los ciervos cazados en el estado de
Maryland. Un estudio anterior de diez ciervos cazados mostr que la desviacin estndar
de sus pesos es de 12.2 libras. Qu tan grande debe ser una muestra para que el
bilogo tenga el 95% de confianza de que el error de estimacin es a lo ms de 4 libras?
Solucin:

35
En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza
en que difiere en menos de 4 libras de .
2. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normal
con una desviacin estndar de 40 horas. De qu tamao se necesita una muestra si se
desea tener 96% de confianza que la media real est dentro de 10 horas de la media
real?

Se necesita una muestra de 68 focos para estimar la media de la poblacin y tener un


error mximo de 10 horas.
Qu pasara si en lugar de tener un error de estimacin de 10 horas slo se requiere un
error de 5 horas?

Se puede observar como el tamao de la muestra aumenta, pero esto tiene como
beneficio una estimacin ms exacta.
3. Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y se desea
saber de que tamao debe de ser la muestra. El muestreo se realizar sin reemplazo.
Solucin:
Como se tiene una poblacin finita y un muestreo sin reemplazo es necesario utilizar la formula
con el factor de correccin.

Si se tiene una poblacin finita de 300 focos slo se tiene que extraer de la poblacin una
muestra sin reemplazo de 56 focos para poder estimar la duracin media de los focos restantes
con un error mximo de 10 horas.

NOTA. Estimacin del tamao muestral


Antes de realizar un estudio de inferencia estadstica sobre una variable, lo primero
es decidir el nmero de elementos, N, a elegir en la muestra aleatoria. Para ello
consideremos que el estudio se basara en una variable de distribucin normal, y nos
interesa obtener para un nivel de significacin dado, una precisin (error) d.

36
Para ello, recordemos que un intervalo de confianza para una media en el caso
general, se escribe como:

Si N es suficientemente grande, la distribucin


de Student se aproxima a la
distribucin normal. Luego una manera de obtener la precisin buscada consiste en
elegir N con el siguiente criterio:

Donde
es una estimacin puntual a priori de la varianza de la muestra. Para
obtenerla nos podemos basar en una cota superior conocida por nuestra experiencia
previa, o simplemente, tomando una muestra piloto que sirve para dar una idea
previa de los parmetros que describen una poblacin.
Ejemplo . Se ha estudiado que la variable altura de los individuos de una
poblacin, es una variable que se distribuye de modo gaussiana.
Para ello se tom una muestra de 25 individuos (que podemos considerar piloto),
que ofreci los siguientes resultados:

Calcular el tamao que debera tener una muestra para que se obtuviese un intervalo
de confianza para la media poblacional con un nivel de significacin
y con una precisin de d=1 cm.

(al

Solucin:
Buscamos un intervalo de confianza preciso, tal que el tamao de la muestra, N,
deber ser :

37
Por tanto, si queremos realizar un estudio con toda la precisin requerida en el
enunciado se debera tomar una muestra de 694 individuos. Esto es una indicacin
de gran utilidad antes de comenzar el estudio. Una vez que el muestreo haya sido
realizado, debemos confirmar que el error para el nivel de significacin dado es
inferior o igual a 1 cm, utilizando la muestra obtenida.

CLCULO DEL TAMAO DE LA MUESTRA PARA ESTIMAR UNA PROPORCIN


Se desea saber que tan grande se requiere que sea una muestra para asegurar que el error al
estimar P sea menor que una cantidad especfica .

Elevando al cuadrado la ecuacin anterior se despeja n y nos queda:

Esta frmula est algo engaosa, pues debemos utilizar p para determinar el tamao de la
muestra, pero p se calcula a partir de la muestra. Existen ocasiones en las cuales se tiene una
idea del comportamiento de la proporcin de la poblacin y ese valor se puede sustituir en la
frmula, pero si no se sabe nada referente a esa proporcin entonces se tienen dos opciones:

Tomar una muestra preliminar mayor o igual a 30 para proporcionar una estimacin de P.
Despus con el uso de la frmula se podra determinar de forma aproximada cuntas
observaciones se necesitan para proporcionar el grado de precisin que se desea.
Tomar el valor de p como 0.5 ya que sustituyendo este en la frmula se obtiene el tamao
de muestra mayor posible. Observe el siguiente ejemplo:

Se desconoce el valor de P, por lo que se utilizarn diferentes valores y se sustituirn en la


formula para observar los diferentes tamaos de muestras. El nivel de confianza que se utilizar
es del 95% con un error de estimacin de 0.30.

38

0.10

3.84

0.20

6.82

0.30

8.96

0.40

10.24

0.50

10.67

0.60

10.24

0.70

8.96

0.80

6.82

0.90

3.84

Como se puede observar en la tabla anterior cuando P vale 0.5 el tamao de la muestra alcanza
su mximo valor.

39
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de
estimacin se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

Ejemplos:
1. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton,
Canad, se encuentra que 340 estn suscritas a HBO. Qu tan grande se requiere que
sea una muestra si se quiere tener 95% de confianza de que la estimacin de P est
dentro de 0.02?
Solucin:
Se tratarn a las 500 familias como una muestra preliminar que proporciona una
estimacin de p=340/500=0.68.

Por lo tanto si basamos nuestra estimacin de P sobre una muestra aleatoria de tamao
2090, se puede tener una confianza de 95% de que nuestra proporcin muestral no
diferir de la proporcin real por ms de 0.02.
2. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qu
proporcin del electorado conoce la opinin de ella, respecto al uso de fondos estatales
para pagar abortos. Qu tamao de muestra se necesita si se requiere un confianza del
95% y un error mximo de estimacin de 0.10?
Solucin:
En este problema, se desconoce totalmente la proporcin de residentes que conoce la opinin
de la legisladora, por lo que se utilizar un valor de 0.5 para p.

40

Se requiere un tamao de muestra de 97 residentes para que con una confianza del 95% la
estimacin tenga un error mximo de 0.10.
CLCULO DEL TAMAO DE LA MUESTRA PARA ESTIMAR LA DIFERENCIA DE MEDIAS
Si se recuerda a la distribucin muestral de diferencia de medias se tiene que error esta dado
por:

En esta ecuacin se nos pueden presentar dos casos:

Los tamaos de muestra son iguales.


Los tamao de muestra son diferentes .

Para el primer caso no se tiene ningn problema, se eleva al cuadrado la ecuacin y se despeja
n ya que n1 es igual a n2.

Para el segundo caso se pondr una n en funcin de la otra. Este caso se utiliza cuando las
poblaciones son de diferente tamao y se sabe que una es K veces mayor que la otra.

Ejemplo:
Un director de personal quiere comparar la efectividad de dos mtodos de entrenamiento para
trabajadores industriales a fin de efectuar cierta operacin de montaje. Se divide un nmero de
operarios en dos grupos iguales: el primero recibe el mtodo de entrenamiento 1, y el segundo,
el mtodo 2. Cada uno realizar la operacin de montaje y se registrar el tiempo de trabajo. Se

41
espera que las mediciones para ambos grupos tengan una desviacin estndar
aproximadamente de 2 minutos. Si se desea que la estimacin de la diferencia en tiempo medio
de montaje sea correcta hasta por un minuto, con una probabilidad igual a 0.95, cuntos
trabajadores se tienen que incluir en cada grupo de entrenamiento?

Cada grupo debe contener aproximadamente 31 empleados.


Clculo del Tamao de la Muestra para Estimar la Diferencia de Proporciones
Si se recuerda a la distribucin muestral de diferencia de medias se tiene que error esta dado
por:

En esta ecuacin se nos pueden presentar dos casos:

Los tamaos de muestra son iguales.


Los tamao de muestra son diferentes .

Para el primer caso no se tiene ningn problema, se eleva al cuadrado la ecuacin y se despeja
n ya que n1 es igual a n2.

Para el segundo caso se pondr una n en funcin de la otra. Este caso se utiliza cuando las
poblaciones son de diferente tamao y se sabe que una es K veces mayor que la otra.

Ejemplo:

42
Una compaa de productos alimenticios contrat a una empresa de investigacin de
mercadotecnia , para muestrear dos mercados, I y II, a fin de comparar las proporciones de
consumidores que prefieren la comida congelada de la compaa con los productos de sus
competidores. No hay informacin previa acerca de la magnitud de las proporciones P 1 y P2. Si la
empresa de productos alimenticios quiere estimar la diferencia dentro de 0.04, con una
probabilidad de 0.95, cuntos consumidores habr que muestrear en cada mercado?

Se tendr que realizar encuestas a 1201 consumidores de cada mercado para tener una
estimacin con una confianza del 95% y un error mximo de 0.04.
Problemas propuestos
1. Se prob una muestra aleatoria de 400 cinescopios de televisor y se encontraron 40
defectuosos. Estime el intervalo que contiene, con un coeficiente de confianza de 0.90, a
la verdadera fraccin de elementos defectuosos.
2. Se planea realizar un estudio de tiempos para estimar el tiempo medio de un trabajo,
exacto dentro de 4 segundos y con una probabilidad de 0.90, para terminar un trabajo de
montaje. Si la experiencia previa sugiere que
= 16 seg. mide la variacin en el tiempo
de montaje entre un trabajador y otro al realizar una sola operacin de montaje, cuntos
operarios habr que incluir en la muestra?
3. El decano registr debidamente el porcentaje de calificaciones D y F otorgadas a los
estudiantes por dos profesores universitarios de matemticas. El profesor I alcanz un
32%, contra un 21% para el profesor II, con 200 y 180 estudiantes, respectivamente.
Estime la diferencia entre los porcentajes de calificaciones D y F otorgadas por los dos
profesores. Utilice un nivel de confianza del 95% e interprete los resultados.

4. Suponga que se quiere estimar la produccin media por hora, en un proceso que produce
antibitico. Se observa el proceso durante 100 perodos de una hora, seleccionados al
azar y se obtiene una media de 34 onzas por hora con una desviacin estndar de 3
onzas por hora. Estime la produccin media por hora para el proceso, utilizando un nivel
de confianza del 95%.
5. Un ingeniero de control de calidad quiere estimar la fraccin de elementos defectuosos en
un gran lote de lmparas. Por la experiencia, cree que la fraccin real de defectuosos
tendra que andar alrededor de 0.2. Qu tan grande tendra que seleccionar la muestra si
se quiere estimar la fraccin real, exacta dentro de 0.01, utilizando un nivel de confianza
fe 95%?
6. Se seleccionaron dos muestras de 400 tubos electrnicos, de cada una de dos lneas de
produccin, A y B. De la lnea A se obtuvieron 40 tubos defectuosos y de la B 80. Estime la
diferencia real en las fracciones de defectuosos para las dos lneas, con un coeficiente de
confianza de 0.90 e interprete los resultados.
7. Se tienen que seleccionar muestras aleatorias independientes de n 1=n2=n observaciones
de cada una de dos poblaciones binomiales, 1 y 2. Si se desea estimar la diferencia entre
los dos parmetros binomiales, exacta dentro de 0.05, con una probabilidad de 0.98. qu

43
tan grande tendra que ser n?. No se tiene informacin anterior acerca de los valores P 1 y
P2, pero se quiere estar seguro de tener un nmero adecuado de observaciones en la
muestra.
8. Se llevan a cabo pruebas de resistencia a la tensin sobre dos diferentes clases de
largueros de aluminio utilizados en la fabricacin de alas de aeroplanos comerciales. De la
experiencia pasada con el proceso de fabricacin se supone que las desviaciones
estndar de las resistencias a la tensin son conocidas. La desviacin estndar del
larguero 1 es de 1.0 Kg/mm2 y la del larguero 2 es de 1.5 Kg/mm 2. Se sabe que el
comportamiento de las resistencias a la tensin de las dos clases de largueros son
aproximadamente normal. Se toma una muestra de 10 largueros del tipo 1 obtenindose
una media de 87.6 Kg/mm2, y otra de tamao 12 para el larguero 2 obtenindose una
media de 74.5 Kg/mm2. Estime un intervalo de confianza del 90% para la diferencia en la
resistencia a la tensin promedio.
9. Se quiere estudiar la tasa de combustin de dos propelentes slidos utilizados en los
sistemas de escape de emergencia de aeroplanos. Se sabe que la tasa de combustin de
los dos propelentes tiene aproximadamente la misma desviacin estndar; esto es
1=
= 3 cm/s. Qu tamao de muestra debe utilizarse en cada poblacin si se desea que el error
en la estimacin de la diferencia entre las medias de las tasas de combustin sea menor que 4
cm/s con una confianza del 99%?.
2

Respuesta a los Problemas propuestos


1.
2.
3.
4.
5.
6.
7.
8.
9.

0.07532 P 0.1246
n= 44
0.0222 P1- P2 0.1978
33.412
34.588
n= 6147
0.059 PB-PA 0.141
n= 1086
12.22
13.98
12
n= 8
EJERCICIOS
ESTIMACIN DE PARMETROS
POR INTERVALOS DE CONFIANZA

Media poblacional
Ejercicio 1)Una muestra de 10 hombres de una gran ciudad dio para sus estaturas
(distribucin normal) una media de 1,72 m. y una varianza de 0,13 m. Se trata de

44
estimar un intervalo de confianza para la media de las alturas de todos los
habitantes varones de dicha ciudad, con un coeficiente de riesgo de 5%.
Ejercicio 2)En una muestra de 35 caballos de carrera entrenados, por estudios
previos se conoce las pulsaciones del corazn, siendo la media de 85 pulsac/min y
la desviacin tpica de 15 pulsac/min.
Hallar los lmites de confianza del 95 % y del 99 % para el aumento medio
verdadero de las pulsaciones del corazn.
Ejercicio 3) Una empresa mayorista solicita al fabricante torres de molinos que
puedan soportar vientos de 80 km./h. La empresa quiere determinar si las torres
se ajustan a esta especificacin, para ello selecciona una muestra aleatoria de 3
molinos, los que en promedio soportan vientos de 76 km./h con un S de 2 km./h.
Estime si el valor est o no incluido en la especificacin del fabricante, con un
coeficiente de riesgo del 5 %.
Ejercicio 4) En una plantacin de mandarinas se eligieron al azar 50 plantas,
contndose la produccin por planta, result en promedio 1512 mandarinas,
siendo el desvo de la poblacin de 108 mandarinas.
Se desea conocer entre que valores estar el verdadero valor pensando que
la probabilidad de equivocarnos es 1 cada 100 y 5 cada 100.
Ejercicio 5)Un nutricionista animal desea estimar el contenido vitamnico de cierto
alimento. Toma una muestra de n = 49 y se encuentra que el contenido promedio
de vitaminas por cada 100 gramos es de 12 mg y que el desvo poblacional es de
2 mg.
Encontrar los lmites de confianza del 95 % para el promedio poblacional. Se
supone que la distribucin del contenido vitamnico es normal.
Ejercicio 6) Las siguientes observaciones corresponden al nmero de plantas
nacidas en 20 parcelas en un ensayo de sorgo llevado a cabo en un
establecimiento
1. N
planta
s

2. N
parcel
as

3.
4.
5.
6.
7.

9. 2
10.
11.
12.
13.

12
13
14
15
16

5
6
4
2

45
8. 17

14.

En base a estos datos hallar los lmites de confianza a) de 99 % y b) 95 %


para el promedio del nmero de plantas de sorgo que crecern en todo el
establecimiento.
Ejercicio 7). Las edades al morir, para una muestra de 9 individuos fallecidos de
tuberculosis, dan una media de 49 aos y una desviacin estndar de 5 aos.
Suponiendo normal la distribucin, hallar lmites de confianza del 95 % para la
media.
Ejercicio 8) Los rendimientos de 10 plantas de frutillas en un ensayo de
uniformidad fueron: 239, 176, 235, 217, 234, 216, 318, 190, 181 y 225 gr.
Calcule los lmites de confianza para la media poblacional, al 95% y 99%.
Ejercicio 9)Las larvas de algunas mariposas monarcas concentran glucsidos
cardacos a partir de plantas de algodn, que las hacen repugnantes para los
pjaros, los cuales las evitan despus de un primer encuentro.
Supngase que las mariposas han sido recolectadas en una localidad y que se han
medido las concentraciones de glucsidos en relacin a sus pesos. Los datos
resultantes son; la media= 0,200 g. y S2= 0,012 para n= 75.
Construir un intervalo de confianza del 95% para la verdadera media de la
poblacin.

Proporcin poblacional
Ejercicio 10) Una urna contiene una proporcin desconocida de fichas rojas y
blancas. Una muestra aleatoria de 60 fichas, seleccionada con reposicin indic
que el 70 % de ellas eran rojas. Hallar los lmites de confianza a) 95 % y b) 99 %
para la proporcin real de fichas rojas en la urna.
Ejercicio 11) Se arroja una moneda al aire 200 veces, obtenindose 90 veces
caras. Construir un intervalo de confianza del 90% para la verdadera probabilidad
"P" de obtener cara.
ANEXO UNO

A.-TEORA DE LAS DISTRIBUCIONES MUESTRALES


Dadas n variables independientes, la funcin de probabilidad conjunta es igual al
producto de sus marginales:
f ( x, y ) f ( x ). f ( y )

x e y son independientes

46
Luego para n variables aleatorias independientes:
n

f ( x1, x2 ,...... xn ) f ( x1 ) f ( x2 )....... f ( xn )

f (x )
i

i 1

Sea f(x) la funcin de densidad de una variable aleatoria X, observada para cierta
poblacin y sea n el tamao de la Muestra. La muestra es aleatoria, en el sentido
que cada muestra produce un resultado posible y distinto, con Xi como valor
considerado de las n observaciones de las muestras. Entonces:
X1 es el valor de la variable que corresponde a la primera observacin y as
sucesivamente, por tanto X 1 , X 2 ..... X n es considerado un vector aleatorio, de los
n valores observados de una muestra, la cual para que sea aleatoria se definen los
requisitos siguientes:
I)

La funcin de densidad de una variable aleatoria X permanece constante


de prueba a prueba, e igual a la funcin de densidad.
f ( x1 ) f ( x2 ) ....... f ( xn ) f ( X )

II)

Independencia entre las pruebas.


n

P( M ) f ( x1 , x2 ,......xn ) f ( x1 ) f ( x2 )....... f ( xn ) f ( xi )
i 1

Sean X1

, X2 ,...., Xn independientes. Entonces:


E ( X i ) i
V X i i2

1.00.-MEDIA Y VARIANZA DE LA MEDIA MUESTRAL


Sean n variables
finitas. Y sea

X1

, X2 ,...., Xn

:X

independientes con esperanza y variancia

Sn = X i X 1 X 2 ...... X n
i 1

Entonces , utilizando propiedades de Esperanza y de Variancia:


n

i 1

i 1

i 1

E(Sn) = E ( X i ) E ( X i ) i =n
y como las variables son independientes:
n

i 1

i 1

2
V(Sn) V ( X i ) V ( X i ) i =n 2
i 1

Definiendo :

X
i 1

Sn
n

, entonces:

47
Sn
)
n
Sn
V (X ) V ( )
n

1
1
E ( Sn) n
n
n
1
1
2
2
V
(
Sn
)

n
n2
n2

E( X ) E(

Luego, X es una variable aleatoria que se distribuye con media y variancia :


E( X )

V (X )

NOTA: Suponemos muestreo con reemplazo


muestreo sin reemplazo y poblacin infinita

NOTA: Veamos lo siguiente, para la suma de n variables aleatorias S n:


n

Sn = X i X 1 X 2 ...... X n

Sea

i 1

Se dispone entonces de n variables aleatorias independientes X1 ,X2


idnticamente distribuidas.

,....,Xn

La esperanza de la suma muestral de n variables:


n

i 1

i 1

i 1

E(Sn) = E ( X i ) E ( X i ) n

La varianza de la suma muestral de n variables :


n

i 1

i 1

i 1

2
2
V(Sn) V ( X i ) V ( X i ) i n

Se tipifica la V,A Sn, para aplicar el teorema del lmite central:

S n E S n
V Sn

S n n
n 2

S n n

N (0,1)

La expresin anterior se divide por n y se tiene la tipificacin para la media


muestral

pero

S n n
n

Sn

n
n n


para n X ~ N ,

N (0,1)

48
La teora de probabilidades nos permite encontrar las distribuciones de
probabilidades asociadas e estos estadsticos que, para determinar no solo su
funcin de probabilidad sino , tambin, su esperanza E() y su varianza V()

2.00.-La esperanza y la varianza de la varianza muestral

La varianza muestral de la varianza de una muestra aleatoria X1, X2 ,..., Xn de tamao n,


se define como

Observacin: conviene sealar en estos momentos que la gran mayora de estadsticos o


estimadores que aparecen en inferencia estadstica pueden expresarse en funcin de
medias y varianzas muestrales, que afectan a una o varias poblaciones univariantes o
multivariantes.

Вам также может понравиться