Академический Документы
Профессиональный Документы
Культура Документы
DISTRIBUCIONES MUESTRALES
Por qu muestrear?
Muestrear es una forma de sacar conclusines sobre el grupo entero (poblacin)
basados en informacin estadstica obtenida de un pequeo grupo (muestra) para
infererir estadsticamente. Sabemos que:
X
1 n
Xj,
n j 1
1
N
ah
h 1
s2
_
1 n
(
X
X
)2
i
n 1 j 1
1
N
(a
h 1
)2
, la media poblacional.
Suponga urna tiene 4 fichas con los nmeros 0, 2, 4 y 6. Se extraen dos con
reposicin. Se obtienen 16 posibles muestras de tamao dos y cada muestra tiene
su media aritmtica ( y cada muestra tiene su varianza, pero sta ahora no la
calculamos). Es 16 la cantidad total de las posibles muestras de tamao dos, de la
poblacin simulada de los 4 fichas, con dichos nmeros. Queremos saber, de estos
16 valores :
Conocer
4
B.-) Ahora vamos a calcular la desviacin estndar de los 16 valores de X , esdecir , la
desviacin estndar de todas las medias muestrales posibles, que en este caso son 16
valores de X de la distribucin muestral de medias es:
Por separado, conociendo la desviacin estndar de la poblacin que es (2,236), el valor anterior
se puede tambien hallar con el siguiente clculo:
Hemos comprobado (no demostrado) que la media aritmtica de todas las posibles muestras (de
la distribucin muestral de medias) tiene una media igual a la media poblacional. Para cualquier
tamao de la muestra y cualquier poblacin, se tiene que
E( X )
2
n
. La aproximacin ser cada vez ms exacta a medida de que n sea cada vez
X1
X2
Media Muestral
8
X
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
2
2
2
2
4
4
4
4
6
6
6
6
8
8
8
8
2
4
6
8
2
4
6
8
2
4
6
8
2
4
6
8
2
3
4
5
3
4
5
6
4
5
6
7
5
6
7
8
En la practica jams se toman tantas muestras, sino una especial, la cul es parte de
la distribucin. Con base en la muestra se hace inferencia acerca de la Poblacin.
Distribucin de la media muestra con tamao de muestra 2
Media
muestral
2
3
4
5
6
7
8
Total
Nmero de
muestras
1
2
3
4
3
2
1
16
Probabilidad P ( x )
1/16
2/16
3/16
4/16
3/16
2/16
1/16
1
9
se puede llega a definir una relacin funcional entre todos los resultados posibles y
sus probabilidades correspondientes
se
10
0.5
0.5
0.025
0.025
0.475
-z
-1.96=-Z
0.475
0
1.96= Z z
11
que tambin se puede escribir de la siguiente forma, siendo L 1 con el signo menos y
L2 con el signo mas
Pr X Z 2
X Z 2 100 1 %
n
n
=1,96. Al valor
/2
se le denomina
III.
es ESTADSTICA
un estimador de
DIST. MUESTRAL
MEDIA CUANDO
VARIANZA ES CONOCIDA
MEDIA CUANDO
VARIANZA ES DESCONOCIDA
X N ,
n
x-
N(0,1)
a) n es grande
S
x N ,
n
x-
N(0,1)
s
n
b) n es pequeo
S
x N ,
n
VARIANZA
proporcin
x-
t n 1
s
n
12
Ejemplo:Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40 horas.
Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de
menos de 775 horas.
Solucin:
La interpretacin sera que la probabilidad de que la media de la muestra de 16 focos sea menor
a 775 horas es de 0.0062.
13
Ejemplo:Las estaturas de 1000 estudiantes estn distribuidas aproximadamente en forma normal
con una media de 174.5 centmetros y una desviacin estndar de 6.9 centmetros. Si se extraen
200 muestras aleatorias de tamao 25 sin reemplazo de esta poblacin, determine:
a. El nmero de las medias muestrales que caen entre 172.5 y 175.8 centmetros.
b. El nmero de medias muestrales que caen por debajo de 172 centmetros.
Solucin:
Como se puede observar en este ejercicio se cuenta con una poblacin finita y un muestreo sin
reemplazo, por lo que se tendr que agregar el factor de correccin. Se proceder a calcular el
denominador de Z para slo sustituirlo en cada inciso.
a.
b.
14
):
15
Calculamos su esperanza matemtica y la varianza:
V(X)= E(X2)-(E(X))2
= E(X2)-( )2
. Como
=x/n
16
b) Halla la probabilidad de que, en una muestra de 50 habitantes, haya entre
14 y 20 habitantes menores de 16 aos?.
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que
queremos investigar la proporcin de artculos defectuosos o la proporcin de alumnos
reprobados en la muestra. La distribucin muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribucin se genera de igual manera que la distribucin
muestral de medias, a excepcin de que al extraer las muestras de la poblacin se calcula el
estadstico proporcin (p=x/n en donde "x" es el nmero de xitos u observaciones de inters y
"n" el tamao de la muestra) en lugar del estadsitico media.
n(1-p)
5.
Cualquier evento se puede convertir en una proporcin si se divide el nmero obtenido entre el
nmero de intentos. La frmula que se utilizar para el clculo de probabilidad en una
distribucin muestral de proporciones est basada en la aproximacin de la distribucin normal a
la binomial . Esta frmula nos servir para calcular la probabilidad del comportamiento de la
proporcin en la muestra.
17
Ejemplo: Se ha determinado que 60% de los estudiantes de una universidad grande fuman
cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la
proporcin de la muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solucin:Este ejercicio se puede solucionar por dos mtodos. El primero puede ser con la
aproximacin de la distribucin normal a la binomial y el segundo utilizando la frmula de la
distribucin muestral de proporciones.
Aproximacin de la distribucin normal a la binomial:
Datos: n=800 estudiantes; p=0.60 ; x= (.55)(800) = 440 estudiantes
p(x 440) = ?.
p(x 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer
una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.
NOTA: a 440 se le resta 0.5 para corregir en parte el pasar de una distribucin discreta (binomial)
a una continua (normal estndar). Pero este problema tambien se puede resolver aplicando
directamente la distribucin binomial, pero es ms largo
18
p(x>6) = ?
p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al
extraer una muestra de 150 personas, mas de 6 presentarn una reaccin adversa.
a. Distribucin Muestral de Proporciones . Datos: n=150 personas ; P=0.03 ; p=
0.04
p(p>0.04) = ?
19
Observe que este valor es igual al obtenido y la interpretacin es: existe una probabilidad del
17% de que al tomar una muestra de 150 personas se tenga una proporcin mayor de 0.04
presentando una reaccin adversa.
20
En ejercicios anteriores se haba demostrado que
deducir que
y que
y que
La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de medias
es:
Ejemplo:En un estudio para comparar los pesos promedio de nios y nias de sexto grado en
una escuela primaria se usar una muestra aleatoria de 20 nios y otra de 25 nias. Se sabe que
tanto para nios como para nias los pesos siguen una distribucin normal. El promedio de los
pesos de todos los nios de sexto grado de esa escuela es de 100 libras y su desviacin
estndar es de 14.142, mientras que el promedio de los pesos de todas las nias del sexto grado
de esa escuela es de 85 libras y su desviacin estndar es de 12.247 libras. Si
representa el
promedio de los pesos de 20 nios y es el promedio de los pesos de una muestra de 25 nias,
encuentre la probabilidad de que el promedio de los pesos de los 20 nios sea al menos 20
libras ms grande que el de las 25 nias.
Solucin: Datos:
= 100 libras ;
= 85 libras ;
= 14.142 libras;
= 12.247 libras
n1 = 20 nios ; n2 = 25 nias
=?
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de nios sea al
menos 20 libras ms grande que el de la muestra de las nias es 0.1056.
21
Ejemplo: Uno de los principales fabricantes de televisores compra los tubos de rayos catdicos a
dos compaas. Los tubos de la compaa A tienen una vida media de 7.2 aos con una
desviacin estndar de 0.8 aos, mientras que los de la B tienen una vida media de 6.7 aos con
una desviacin estndar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34
tubos de la compaa A tenga una vida promedio de al menos un ao ms que la de una muestra
aleatoria de 40 tubos de la compaa B.
Solucin: Datos:
= 7.2 aos ,
= 6.7 aos;
= 0.8 aos;
= 0.7 aos
nA = 34 tubos ; nB = 40 tubos
=?
= 1.23 Km/Lto;
=?
; n2 = 42 autos
22
b.
?
23
distribuciones muestrales aproximadamente normales, as que su diferencia p 1-p2 tambin tiene
una distribucin muestral aproximadamente normal.
y que
y que
.
La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de
proporciones es:
Ejemplo: Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en
sus opiniones sobre la promulgacin de la pena de muerte para personas culpables de
asesinato. Se cree que el 12% de los hombres adultos estn a favor de la pena de muerte,
mientras que slo 10% de las mujeres adultas lo estn. Si se pregunta a dos muestras aleatorias
de 100 hombres y 100 mujeres su opinin sobre la promulgacin de la pena de muerte,
determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que
el de las mujeres.
Solucin: Datos: PH = 0.12; PM = 0.10; nH = 100 ; nM = 100
p(pH-pM
0.03) = ?
Se recuerda que se est incluyendo el factor de correccin de 0.5 por ser una distribucin
binomial y se est utilizando la distribucin normal.
24
25
26
1. Como parte de un proyecto general de mejoramiento de la calidad, un fabricante textil
decide controlar el nmero de imperfecciones encontradas en cada pieza de tela. Se
estima que el nmero promedio de imperfecciones por cada pieza de tela es de 12,
determine la probabilidad de que en la prxima pieza de tela fabricada se encuentren:
a. Entre 10 y 12 imperfecciones.
b. Menos de 9 y ms de 15 imperfecciones.
1. En una prueba de aptitud la puntuacin media de los estudiantes es de 72 puntos y la
desviacin estndar es de 8 puntos. Cul es la probabilidad de que dos grupos de
estudiantes, formados de 28 y 36 estudiantes, respectivamente, difieran en su puntuacin
media en:
a. 3 ms puntos.
b. 6 o ms puntos.
c. Entre 2 y 5 puntos.
1. Un especialista en gentica ha detectado que el 26% de los hombres y el 24% de las
mujeres de cierta regin del pas tiene un leve desorden sanguneo; si se toman muestras
de 150 hombres y 150 mujeres, determine la probabilidad de que la diferencia muestral de
proporciones que tienen ese leve desorden sanguneo sea de:
a. Menos de 0.035 a favor de los hombres.
b. Entre 0.01 y 0.04 a favor de los hombres.
1. Una urna contiene 80 bolas de las que 60% son rojas y 40% blancas. De un total de 50
muestras de 20 bolas cada una, sacadas de la urna con remplazamiento, en cuntas
cabe esperar
a.
b.
c.
d.
1. Los pesos de 1500 cojinetes de bolas se distribuyen normalmente con media de 2.40
onzas y desviacin estndar de 0.048 onzas. Si se extraen 300 muestras de tamao 36
de esta poblacin, determinar la media esperada y la desviacin estndar de la
distribucin muestral de medias si el muestreo se hace:
a. Con remplazamiento
b. Sin remplazamiento
1. La vida media de una mquina para hacer pasta es de siete aos, con una desviacin
estndar de un ao. Suponga que las vidas de estas mquinas siguen aproximadamente
una distribucin normal, encuentre:
a. La probabilidad de que la vida media de una muestra aleatoria de 9 de estas
mquinas caiga entre 6.4 y 7.2 aos.
b. El valor de la
27
a la derecha del cual caera el 15% de las medias calculadas de muestras aleatorias de tamao
nueve.
1. Se llevan a cabo dos experimentos independientes en lo que se comparan dos tipos
diferentes de pintura. Se pintan 18 especmenes con el tipo A y en cada uno se registra el
tiempo de secado en horas. Lo mismo se hace con el tipo B. Se sabe que las
desviaciones estndar de la poblacin son ambas 1.0. Suponga que el tiempo medio de
secado es igual para los dos tipo de pintura. Encuentre la probabilidad de que la diferencia
de medias en el tiempo de secado sea mayor a uno a favor de la pintura A.
b)
Como se puede observar las dos distribuciones tienen un mismo valor en el parmetro slo que
la distribucin muestral de medias tiene una menor varianza, por lo que la media se convierte en
un estimador eficiente e insesgado.
ESTIMACIN POR INTERVALOS
28
Un estimado de intervalo o intervalo de confianza (IC). Un intervalo de confianza se calcula
siempre seleccionando primero un nivel de confianza, que es una medida de el grado de
fiabilidad en el intervalo.
Ejemplo:Encuentre el valor de z para un nivel de confianza del 95%.
Solucin 1:Se utilizar la tabla que tiene el rea bajo la curva de grficamente sera:
hasta z. Si lo vemos
En base a la tabla que se esta utilizando, se tendr que buscar el rea de 0.975, ya que cada
extremo o cola de la curva tiene un valor de 0.025.
En este caso slo se tendr que buscar adentro de la tabla el rea de 0.475 y el resultado del
valor de z ser el mismo, para este ejemplo 1.96.
29
Solucin 3:Para la tabla en donde el rea bajo la curva va desde z hasta
De esta formula se puede observar que tanto el tamao de la muestra como el valor de z se
conocern. Z se puede obtener de la tabla de la distribucin normal a partir del nivel de confianza
establecido. Pero en ocasiones se desconoce
por lo que en esos casos lo correcto es utilizar
otra distribucin llamada "t" de student si la poblacin de donde provienen los datos es normal.
Para el caso de tamaos de muestra grande se puede utilizar una estimacin puntual de la
desviacin estndar, es decir igualar la desviacin estndar de la muestra a la de la poblacin
(s= ).
Ejemplos:Se encuentra que la concentracin promedio de zinc que se saca del agua a partir de
una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro.
Encuentre los intervalos de confianza de 95% y 99% para la concentracin media de zinc en el
ro. Suponga que la desviacin estndar de la poblacin es 0.3.
Solucin:La estimacin puntual de
es 1.96, por lo tanto:
30
Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo ser
ms amplio:
exceder
Como se puede observar en los resultados del ejercicio se tiene un error de estimacin
mayor cuando el nivel de confianza es del 99% y ms pequeo cuando se reduce a un
nivel de confianza del 95%.
1. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente distribuida
de forma normal con una desviacin estndar de 40 horas. Si una muestra de 30 focos
tiene una duracin promedio de 780 horas, encuentre un intervalos de confianza de 96%
para la media de la poblacin de todos los focos que produce esta empresa.
Solucin:
Con un nivel de confianza del 96% se sabe que la duracin media de los focos que
produce la empresa est entre 765 y 765 horas.
31
CONCEPTOS CLAVES
1. Un intervalo de confianza aporta ms informacin que un estimador puntual
cuando se quiere hacer inferencias sobre parmetros poblacionales.
2. Existen intervalos de confianza bilaterales y unilaterales.
3. La amplitud de un intervalo de confianza est determinado por: el nivel de
confianza establecido ;la variabilidad de los datos; el tamao de la muestra.
4. En un estudio Caso-Control o uno de Cohorte, es posible (y frecuentemente
deseable) construir intervalos de confianza para Odds Ratios y Riesgos
Relativos.
5. Un intervalo de confianza permite verificar hiptesis planteadas acerca de
parmetros poblacionales
Intervalos de confianza
Concepto de Intervalo de Confianza.
En el contexto de estimar un parmetro poblacional, un intervalo de confianza es un
rango de valores (calculado en una muestra) en el cual se encuentra el verdadero
valor del parmetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parmetro se encuentre en el intervalo
construido se denomina nivel de confianza, y se denota 1- . La probabilidad de
equivocarnos se llama nivel de significancia y se simboliza . Generalmente se
construyen intervalos con confianza 1- =95% (o significancia =5%). Menos
frecuentes son los intervalos con 10% o =1%.
Para construir un intervalo de confianza, se puede comprobar que la distribucin
Normal Estndar cumple 1:
P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de probabilidades o un programa
computacional que calcule probabilidades normales).
Luego, si una variable X tiene distribucin N( ,
cumple:
32
Despejando
en la ecuacin se tiene:
por la desviacin
La cual es una buena aproximacin para el intervalo de confianza de 95% para con
desconocido. Esta aproximacin es mejor en la medida que el tamao muestral
sea grande.
Cuando el tamao muestral es pequeo, el intervalo de confianza requiere utilizar la
distribucin t de Student (con n-1 grados de libertad, siendo n el tamao de la
muestra), en vez de la distribucin normal (por ejemplo, para un intervalo de 95%
de confianza, los lmites del intervalo ya no sern construidos usando el valor 1,96).
Ejemplo:
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de
depresin (mayor puntaje significa mayor depresin).
2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14
14 15 15 16 16 16 16 16 16
16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 20 20
Para construir un intervalo de confianza para el puntaje promedio poblacional,
asumamos que los datos tienen distribucin normal, con varianza poblacional
desconocida. Como
es desconocido, lo estimamos por s =18,7. Luego, un intervalo
de confianza aproximado es:
33
O bien:
Ejemplo:
En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres
mayores de 15 aos en la Regin Metropolitana, se encontr que el 17.6% eran
hipertensas. Un intervalo de 95% de confianza para la proporcin de mujeres
hipertensas en la Regin Metropolitana est dado por:
Luego, la proporcin de hipertensas vara entre (0,139 , 0,212) con una confianza de
95%.
34
CLCULO DEL TAMAO DE LA MUESTRA PARA ESTIMAR UNA MEDIA
Parece razonable que para un nivel de confianza fijo, sea posible determinar un tamao de la
muestra tal que el error de estimacin sea tan pequeo como queramos, para ser mas preciso,
dado un nivel de confianza y un error fijo de estimacin , se puede escoger un tamao de
muestra n tal que P(
) = Nivel de confianza. Con el propsito de determinar n. El error
mximo de estimacin esta dado por:
Como n debe de ser un nmero entero, redondeamos hacia arriba todos los resultados
fraccionarios.
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de
estimacin se convierte en:
Ejemplos:
1. Un bilogo quiere estimar el peso promedio de los ciervos cazados en el estado de
Maryland. Un estudio anterior de diez ciervos cazados mostr que la desviacin estndar
de sus pesos es de 12.2 libras. Qu tan grande debe ser una muestra para que el
bilogo tenga el 95% de confianza de que el error de estimacin es a lo ms de 4 libras?
Solucin:
35
En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza
en que difiere en menos de 4 libras de .
2. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normal
con una desviacin estndar de 40 horas. De qu tamao se necesita una muestra si se
desea tener 96% de confianza que la media real est dentro de 10 horas de la media
real?
Se puede observar como el tamao de la muestra aumenta, pero esto tiene como
beneficio una estimacin ms exacta.
3. Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y se desea
saber de que tamao debe de ser la muestra. El muestreo se realizar sin reemplazo.
Solucin:
Como se tiene una poblacin finita y un muestreo sin reemplazo es necesario utilizar la formula
con el factor de correccin.
Si se tiene una poblacin finita de 300 focos slo se tiene que extraer de la poblacin una
muestra sin reemplazo de 56 focos para poder estimar la duracin media de los focos restantes
con un error mximo de 10 horas.
36
Para ello, recordemos que un intervalo de confianza para una media en el caso
general, se escribe como:
Donde
es una estimacin puntual a priori de la varianza de la muestra. Para
obtenerla nos podemos basar en una cota superior conocida por nuestra experiencia
previa, o simplemente, tomando una muestra piloto que sirve para dar una idea
previa de los parmetros que describen una poblacin.
Ejemplo . Se ha estudiado que la variable altura de los individuos de una
poblacin, es una variable que se distribuye de modo gaussiana.
Para ello se tom una muestra de 25 individuos (que podemos considerar piloto),
que ofreci los siguientes resultados:
Calcular el tamao que debera tener una muestra para que se obtuviese un intervalo
de confianza para la media poblacional con un nivel de significacin
y con una precisin de d=1 cm.
(al
Solucin:
Buscamos un intervalo de confianza preciso, tal que el tamao de la muestra, N,
deber ser :
37
Por tanto, si queremos realizar un estudio con toda la precisin requerida en el
enunciado se debera tomar una muestra de 694 individuos. Esto es una indicacin
de gran utilidad antes de comenzar el estudio. Una vez que el muestreo haya sido
realizado, debemos confirmar que el error para el nivel de significacin dado es
inferior o igual a 1 cm, utilizando la muestra obtenida.
Esta frmula est algo engaosa, pues debemos utilizar p para determinar el tamao de la
muestra, pero p se calcula a partir de la muestra. Existen ocasiones en las cuales se tiene una
idea del comportamiento de la proporcin de la poblacin y ese valor se puede sustituir en la
frmula, pero si no se sabe nada referente a esa proporcin entonces se tienen dos opciones:
Tomar una muestra preliminar mayor o igual a 30 para proporcionar una estimacin de P.
Despus con el uso de la frmula se podra determinar de forma aproximada cuntas
observaciones se necesitan para proporcionar el grado de precisin que se desea.
Tomar el valor de p como 0.5 ya que sustituyendo este en la frmula se obtiene el tamao
de muestra mayor posible. Observe el siguiente ejemplo:
38
0.10
3.84
0.20
6.82
0.30
8.96
0.40
10.24
0.50
10.67
0.60
10.24
0.70
8.96
0.80
6.82
0.90
3.84
Como se puede observar en la tabla anterior cuando P vale 0.5 el tamao de la muestra alcanza
su mximo valor.
39
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de
estimacin se convierte en:
Ejemplos:
1. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton,
Canad, se encuentra que 340 estn suscritas a HBO. Qu tan grande se requiere que
sea una muestra si se quiere tener 95% de confianza de que la estimacin de P est
dentro de 0.02?
Solucin:
Se tratarn a las 500 familias como una muestra preliminar que proporciona una
estimacin de p=340/500=0.68.
Por lo tanto si basamos nuestra estimacin de P sobre una muestra aleatoria de tamao
2090, se puede tener una confianza de 95% de que nuestra proporcin muestral no
diferir de la proporcin real por ms de 0.02.
2. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qu
proporcin del electorado conoce la opinin de ella, respecto al uso de fondos estatales
para pagar abortos. Qu tamao de muestra se necesita si se requiere un confianza del
95% y un error mximo de estimacin de 0.10?
Solucin:
En este problema, se desconoce totalmente la proporcin de residentes que conoce la opinin
de la legisladora, por lo que se utilizar un valor de 0.5 para p.
40
Se requiere un tamao de muestra de 97 residentes para que con una confianza del 95% la
estimacin tenga un error mximo de 0.10.
CLCULO DEL TAMAO DE LA MUESTRA PARA ESTIMAR LA DIFERENCIA DE MEDIAS
Si se recuerda a la distribucin muestral de diferencia de medias se tiene que error esta dado
por:
Para el primer caso no se tiene ningn problema, se eleva al cuadrado la ecuacin y se despeja
n ya que n1 es igual a n2.
Para el segundo caso se pondr una n en funcin de la otra. Este caso se utiliza cuando las
poblaciones son de diferente tamao y se sabe que una es K veces mayor que la otra.
Ejemplo:
Un director de personal quiere comparar la efectividad de dos mtodos de entrenamiento para
trabajadores industriales a fin de efectuar cierta operacin de montaje. Se divide un nmero de
operarios en dos grupos iguales: el primero recibe el mtodo de entrenamiento 1, y el segundo,
el mtodo 2. Cada uno realizar la operacin de montaje y se registrar el tiempo de trabajo. Se
41
espera que las mediciones para ambos grupos tengan una desviacin estndar
aproximadamente de 2 minutos. Si se desea que la estimacin de la diferencia en tiempo medio
de montaje sea correcta hasta por un minuto, con una probabilidad igual a 0.95, cuntos
trabajadores se tienen que incluir en cada grupo de entrenamiento?
Para el primer caso no se tiene ningn problema, se eleva al cuadrado la ecuacin y se despeja
n ya que n1 es igual a n2.
Para el segundo caso se pondr una n en funcin de la otra. Este caso se utiliza cuando las
poblaciones son de diferente tamao y se sabe que una es K veces mayor que la otra.
Ejemplo:
42
Una compaa de productos alimenticios contrat a una empresa de investigacin de
mercadotecnia , para muestrear dos mercados, I y II, a fin de comparar las proporciones de
consumidores que prefieren la comida congelada de la compaa con los productos de sus
competidores. No hay informacin previa acerca de la magnitud de las proporciones P 1 y P2. Si la
empresa de productos alimenticios quiere estimar la diferencia dentro de 0.04, con una
probabilidad de 0.95, cuntos consumidores habr que muestrear en cada mercado?
Se tendr que realizar encuestas a 1201 consumidores de cada mercado para tener una
estimacin con una confianza del 95% y un error mximo de 0.04.
Problemas propuestos
1. Se prob una muestra aleatoria de 400 cinescopios de televisor y se encontraron 40
defectuosos. Estime el intervalo que contiene, con un coeficiente de confianza de 0.90, a
la verdadera fraccin de elementos defectuosos.
2. Se planea realizar un estudio de tiempos para estimar el tiempo medio de un trabajo,
exacto dentro de 4 segundos y con una probabilidad de 0.90, para terminar un trabajo de
montaje. Si la experiencia previa sugiere que
= 16 seg. mide la variacin en el tiempo
de montaje entre un trabajador y otro al realizar una sola operacin de montaje, cuntos
operarios habr que incluir en la muestra?
3. El decano registr debidamente el porcentaje de calificaciones D y F otorgadas a los
estudiantes por dos profesores universitarios de matemticas. El profesor I alcanz un
32%, contra un 21% para el profesor II, con 200 y 180 estudiantes, respectivamente.
Estime la diferencia entre los porcentajes de calificaciones D y F otorgadas por los dos
profesores. Utilice un nivel de confianza del 95% e interprete los resultados.
4. Suponga que se quiere estimar la produccin media por hora, en un proceso que produce
antibitico. Se observa el proceso durante 100 perodos de una hora, seleccionados al
azar y se obtiene una media de 34 onzas por hora con una desviacin estndar de 3
onzas por hora. Estime la produccin media por hora para el proceso, utilizando un nivel
de confianza del 95%.
5. Un ingeniero de control de calidad quiere estimar la fraccin de elementos defectuosos en
un gran lote de lmparas. Por la experiencia, cree que la fraccin real de defectuosos
tendra que andar alrededor de 0.2. Qu tan grande tendra que seleccionar la muestra si
se quiere estimar la fraccin real, exacta dentro de 0.01, utilizando un nivel de confianza
fe 95%?
6. Se seleccionaron dos muestras de 400 tubos electrnicos, de cada una de dos lneas de
produccin, A y B. De la lnea A se obtuvieron 40 tubos defectuosos y de la B 80. Estime la
diferencia real en las fracciones de defectuosos para las dos lneas, con un coeficiente de
confianza de 0.90 e interprete los resultados.
7. Se tienen que seleccionar muestras aleatorias independientes de n 1=n2=n observaciones
de cada una de dos poblaciones binomiales, 1 y 2. Si se desea estimar la diferencia entre
los dos parmetros binomiales, exacta dentro de 0.05, con una probabilidad de 0.98. qu
43
tan grande tendra que ser n?. No se tiene informacin anterior acerca de los valores P 1 y
P2, pero se quiere estar seguro de tener un nmero adecuado de observaciones en la
muestra.
8. Se llevan a cabo pruebas de resistencia a la tensin sobre dos diferentes clases de
largueros de aluminio utilizados en la fabricacin de alas de aeroplanos comerciales. De la
experiencia pasada con el proceso de fabricacin se supone que las desviaciones
estndar de las resistencias a la tensin son conocidas. La desviacin estndar del
larguero 1 es de 1.0 Kg/mm2 y la del larguero 2 es de 1.5 Kg/mm 2. Se sabe que el
comportamiento de las resistencias a la tensin de las dos clases de largueros son
aproximadamente normal. Se toma una muestra de 10 largueros del tipo 1 obtenindose
una media de 87.6 Kg/mm2, y otra de tamao 12 para el larguero 2 obtenindose una
media de 74.5 Kg/mm2. Estime un intervalo de confianza del 90% para la diferencia en la
resistencia a la tensin promedio.
9. Se quiere estudiar la tasa de combustin de dos propelentes slidos utilizados en los
sistemas de escape de emergencia de aeroplanos. Se sabe que la tasa de combustin de
los dos propelentes tiene aproximadamente la misma desviacin estndar; esto es
1=
= 3 cm/s. Qu tamao de muestra debe utilizarse en cada poblacin si se desea que el error
en la estimacin de la diferencia entre las medias de las tasas de combustin sea menor que 4
cm/s con una confianza del 99%?.
2
0.07532 P 0.1246
n= 44
0.0222 P1- P2 0.1978
33.412
34.588
n= 6147
0.059 PB-PA 0.141
n= 1086
12.22
13.98
12
n= 8
EJERCICIOS
ESTIMACIN DE PARMETROS
POR INTERVALOS DE CONFIANZA
Media poblacional
Ejercicio 1)Una muestra de 10 hombres de una gran ciudad dio para sus estaturas
(distribucin normal) una media de 1,72 m. y una varianza de 0,13 m. Se trata de
44
estimar un intervalo de confianza para la media de las alturas de todos los
habitantes varones de dicha ciudad, con un coeficiente de riesgo de 5%.
Ejercicio 2)En una muestra de 35 caballos de carrera entrenados, por estudios
previos se conoce las pulsaciones del corazn, siendo la media de 85 pulsac/min y
la desviacin tpica de 15 pulsac/min.
Hallar los lmites de confianza del 95 % y del 99 % para el aumento medio
verdadero de las pulsaciones del corazn.
Ejercicio 3) Una empresa mayorista solicita al fabricante torres de molinos que
puedan soportar vientos de 80 km./h. La empresa quiere determinar si las torres
se ajustan a esta especificacin, para ello selecciona una muestra aleatoria de 3
molinos, los que en promedio soportan vientos de 76 km./h con un S de 2 km./h.
Estime si el valor est o no incluido en la especificacin del fabricante, con un
coeficiente de riesgo del 5 %.
Ejercicio 4) En una plantacin de mandarinas se eligieron al azar 50 plantas,
contndose la produccin por planta, result en promedio 1512 mandarinas,
siendo el desvo de la poblacin de 108 mandarinas.
Se desea conocer entre que valores estar el verdadero valor pensando que
la probabilidad de equivocarnos es 1 cada 100 y 5 cada 100.
Ejercicio 5)Un nutricionista animal desea estimar el contenido vitamnico de cierto
alimento. Toma una muestra de n = 49 y se encuentra que el contenido promedio
de vitaminas por cada 100 gramos es de 12 mg y que el desvo poblacional es de
2 mg.
Encontrar los lmites de confianza del 95 % para el promedio poblacional. Se
supone que la distribucin del contenido vitamnico es normal.
Ejercicio 6) Las siguientes observaciones corresponden al nmero de plantas
nacidas en 20 parcelas en un ensayo de sorgo llevado a cabo en un
establecimiento
1. N
planta
s
2. N
parcel
as
3.
4.
5.
6.
7.
9. 2
10.
11.
12.
13.
12
13
14
15
16
5
6
4
2
45
8. 17
14.
Proporcin poblacional
Ejercicio 10) Una urna contiene una proporcin desconocida de fichas rojas y
blancas. Una muestra aleatoria de 60 fichas, seleccionada con reposicin indic
que el 70 % de ellas eran rojas. Hallar los lmites de confianza a) 95 % y b) 99 %
para la proporcin real de fichas rojas en la urna.
Ejercicio 11) Se arroja una moneda al aire 200 veces, obtenindose 90 veces
caras. Construir un intervalo de confianza del 90% para la verdadera probabilidad
"P" de obtener cara.
ANEXO UNO
x e y son independientes
46
Luego para n variables aleatorias independientes:
n
f (x )
i
i 1
Sea f(x) la funcin de densidad de una variable aleatoria X, observada para cierta
poblacin y sea n el tamao de la Muestra. La muestra es aleatoria, en el sentido
que cada muestra produce un resultado posible y distinto, con Xi como valor
considerado de las n observaciones de las muestras. Entonces:
X1 es el valor de la variable que corresponde a la primera observacin y as
sucesivamente, por tanto X 1 , X 2 ..... X n es considerado un vector aleatorio, de los
n valores observados de una muestra, la cual para que sea aleatoria se definen los
requisitos siguientes:
I)
II)
P( M ) f ( x1 , x2 ,......xn ) f ( x1 ) f ( x2 )....... f ( xn ) f ( xi )
i 1
Sean X1
X1
, X2 ,...., Xn
:X
Sn = X i X 1 X 2 ...... X n
i 1
i 1
i 1
i 1
E(Sn) = E ( X i ) E ( X i ) i =n
y como las variables son independientes:
n
i 1
i 1
2
V(Sn) V ( X i ) V ( X i ) i =n 2
i 1
Definiendo :
X
i 1
Sn
n
, entonces:
47
Sn
)
n
Sn
V (X ) V ( )
n
1
1
E ( Sn) n
n
n
1
1
2
2
V
(
Sn
)
n
n2
n2
E( X ) E(
V (X )
Sn = X i X 1 X 2 ...... X n
Sea
i 1
,....,Xn
i 1
i 1
i 1
E(Sn) = E ( X i ) E ( X i ) n
i 1
i 1
i 1
2
2
V(Sn) V ( X i ) V ( X i ) i n
S n E S n
V Sn
S n n
n 2
S n n
N (0,1)
pero
S n n
n
Sn
n
n n
para n X ~ N ,
N (0,1)
48
La teora de probabilidades nos permite encontrar las distribuciones de
probabilidades asociadas e estos estadsticos que, para determinar no solo su
funcin de probabilidad sino , tambin, su esperanza E() y su varianza V()