Вы находитесь на странице: 1из 18

Resumen de Inferencia estadstica

Inferencia estadstica Estudia cmo sacar conclusiones generales para toda la poblacin a partir del estudio de una muestra, y el grado de fiabilidad o significacin de los resultados obtenidos.

Muestreo
Muestreo probabilstico Consiste en elegir una muestra de una poblacin al azar. Podemos distinguir varios tipos: Muestreo aleatorio simple: Para obtener una muestra, se numeran los elementos de la poblacin y se seleccionan al azar los n elementos que contiene la muestra. Muestreo aleatorio sistemtico: Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los dems hasta completar la muestra. Muestreo aleatorio estratificado: Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de individuos de cada estrato proporcional al nmero de componentes de cada estrato.

EJEMPLO
1.- En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de actividades de ocio que gustan ms a sus habitantes. Para ello van a ser encuestados 100 individuos elegidos al azar. a) Explicar qu procedimiento de seleccin sera ms adecuado utilizar: muestreo con o sin reposicin. Por qu? b) Como los gustos cambian con la edad y se sabe que en el barrio viven 2.500 nios, 7.000 adultos y 500 ancianos, posteriormente se decide elegir la muestra anterior utilizando un muestreo estratificado. Determinar el tamao muestral correspondiente a cada estrato. Resolucin: a) Todas las frmulas que hemos estudiado de teora del muestreo y de inferencia estadstica presuponen que las poblaciones son infinitas o que, si no lo son, el muestreo aleatorio se realiza con reposicin. b) Para efectuar un muestreo aleatorio estratificado, ser necesario que la muestra refleje fielmente los estratos existentes en la poblacin; deben considerarse los estratos formados por: nios, adultos y ancianos. El tamao muestral de cada estrato deber ser proporcional a la presencia del mismo en la poblacin original: Poblacin total: 2500 + 7000 + 500 = 10 000. Con los datos del problema en cada estrato tenemos: n1 100 = n1 = 25 nios. 2500 10000 n2 100 = n2 = 70 adultos. 7000 10000 n3 100 = n3 = 5 ancianos. 500 10000

INFERENCIA ESTADSTICA

2.- En cierta cadena de centros comerciales trabajan 150 personas en el departamento de personal, 450 en el departamento de ventas, 200 en el departamento de contabilidad y 100 en el departamento de atencin al cliente. Con objeto de realizar una encuesta laboral, se quiere seleccionar una muestra de 180 trabajadores. a) Qu tipo de muestreo deberamos utilizar para la seleccin de la muestra si queremos que incluya a trabajadores de los cuatro departamentos mencionados? b) Qu nmero de trabajadores tendramos que seleccionar en cada departamento atendiendo a un criterio de proporcionalidad? a) Utilizaremos un muestreo aleatorio estratificado, ya que queremos que haya representantes de cada uno de los departamentos. b) Poblacin total: N = 150+450+200+100 = 900 Con los datos del problema en cada estrato tenemos: n1 180 = n1 = 30 trabajadores de personal. 900 150 n2 180 = n2 = 90 trabajadores de ventas. 450 900 n3 180 = n3 = 40 trabajadores de contabilidad. 200 900 n4 180 = n4 = 20 trabajadores de atencin al cliente. 100 900

Estimacin de la media de una poblacin


Teorema central del lmite Si una poblacin tiene media y desviacin tpica , y tomamos muestras de tamao n (n>30, cualquier tamao si la poblacin es "normal"), las medias de estas muestras siguen aproximadamente la distribucin N , n Consecuencias: Permite averiguar la probabilidad de que la media de una muestra concreta est en un cierto intervalo. Permite calcular la probabilidad de que la suma de los elementos de una muestra est, a priori, en un cierto intervalo.

N , n i =1 Inferir la media de la poblacin a partir de una muestra.

EJEMPLO
1.- La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribucin normal de media 1,62 m y la desviacin tpica 0,12 m. Cul es la probabilidad de que la media de una muestra aleatoria de 100 alumnas sea mayor que 1.60 m? Resolucin:

INFERENCIA ESTADSTICA

ya que el La distribucin de las medias muestrales sigue una ley N x , n

tamao de la muestra n > 30. N 1,62;


0,12 = N(1,62; 0,012) 100

1,60 - 1,62 P(X 1,60) = P Z = P(Z -1,66) = P(Z 1,66) = 0,9515 0,012

2.- Las bolsas de sal envasadas por una mquina tienen = 500 g y = 35 g. Las bolsas se empaquetaron en cajas de 100 unidades. a) Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete sea menor que 495 g. b) Calcular la probabilidad de que una caja 100 de bolsas pese ms de 51 kg. Resolucin:

ya que el La distribucin de las medias muestrales sigue una ley N x , n

tamao de la muestra n > 30. N 500;


35 = N(500; 3,5) 100

495 - 500 P(X 495) = P Z = P (Z -1,43) = P (Z 1,43) = 1-P (Z 1,43) = 0,0764 3,5
b) Para calcular la probabilidad de que una caja 100 de bolsas pese ms de 51 kg. Suponemos que una bolsa debe pesar, por trmino medio 510 gramos: 510 - 500 P(X 510) = P Z = P(Z 2,86) = 1-P(Z 2,86) = 0,0021 3,5 3.- Sea la poblacin de elementos: {22,24, 26}. a) Escriba todas las muestras posibles de tamao dos, escogidas mediante muestreo aleatorio simple. b) Calcule la varianza de la poblacin. c) Calcule la varianza de las medias muestrales. a) Las muestras posibles de tamao dos, escogidas mediante muestreo aleatorio simple, es decir sin reemplazamiento son: {(22, 24), (22, 26), (24, 26)} b) Para calcular la varianza de la poblacin, hallamos antes la media poblacional. 22 + 24 + 26 = = 24 3 Luego la varianza es: (22 24) 2 + (24 24) 2 + (26 24) 2 8 2 = = 3 3 c) La media aritmtica de todas las medias muestrales, x , es

23 + 24 + 25 = 24 3 La desviacin tpica de todas las medias muestrales, x , es

x =

2 =
x

(23 24) 2 + (24 24) 2 + (25 24) 2 2 = 3 3


3

INFERENCIA ESTADSTICA

Estimacin de la proporcin de una poblacin


Se denomina distribucin muestral de proporciones de tamao n, L(P), al conjunto formado por todas las proporciones de una cierta poblacin P que pose determinada caracterstica p. L(P) se pq . distribuye segn una ley normal N p, n

EJEMPLOS
1.- a) Una mquina produce tornillos, de los cuales se sabe que un 5% son defectuosos, que se empaquetan en cajas de 400 unidades. Cmo se distribuye la proporcin de tornillos en las cajas? b) Calcular la probabilidad de que la proporcin de los tornillos defectuosos de una caja determinada sea mayor que el 7%. Resolucin: a) Como la proporcin de tornillos defectuosos es p = 0,05 y el tamao de la muestra es n = 400, la distribucin es de tipo normal siendo: p = p = 0,05 pq 0,05.(1 - 0,05) = = 0,0011 p = n 400 Es decir la distribucin normal N(0,05; 0,011)

0,07 - 0,05 b) P(X 0,07) = P Z = P(Z 1,82) = 1-P(Z 1,82) = 0,0344 0,011

3.- Una poblacin est formada por 3 elementos, con valores 1, 2 y 3. a) Escribe todas las muestras simples de tamao 2 que pueden extraerse. b) Calcula la media y desviacin tpica de la distribucin muestral de proporciones de cifras impares. Resolucin: a) Las muestras simples de tamao 2 son {(1,2), (1,3), (2,3)} b) La distribucin muestral de proporciones de cifras impares es {1/2, 1, 1/2}. La media y la desviacin tpica son: p = p = p =

0,5 + 1 + 0,5 2 = 3 3

1 (0,5 - 2/3) 2 + (1 - 2/3) 2 + (0,5 - 2/3) 2 = 6 3

Intervalos caractersticos
El nivel de confianza (p) se designa mediante 1 - . El nivel de significacin se designa mediante . El valor crtico (k) como z /2 . P(Z>z /2) = /2 P[-z /2 < z < z /2] = 1-

En una distribucin N(, ) el intervalo caracterstico correspondiente a una probabilidad p = 1 - es: ( - z /2 , + z /2 )


INFERENCIA ESTADSTICA 4

1- 0.90 0.95 0.99

/2 0.05 0.025 0.005

z /2 1.645 1.96 2.575

Intervalos caractersticos ( - 1.645 , + 1.645 ) ( - 1.96 , + 1.96 ) ( - 2.575 , + 2.575 )

Estimacin de la media
Intervalo de confianza para la media El intervalo de confianza, para la media de una poblacin, con un nivel de confianza de 1- , siendo x la media de una muestra de tamao n y la desviacin tpica de la poblacin, es: - Z /2 , + Z /2 n n El error mximo de estimacin es: E = Z /2

Tamao de la muestra:

Z n = /2 E

EJEMPLO
1.- Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los siguientes precios: 95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110. Suponiendo que los precios de este producto se distribuyen segn una ley normal de varianza 25 y media desconocida: a) Cul es la distribucin de la media muestral? b) Determine el intervalo de confianza, al 95%, para la media poblacional. Resolucin: a)La media muestral es: 95 + 108 + 97 + 112 + 99 + 106 + 105 + 100 + 99 + 98 + 104 + 110 + 107 + 111 + 103 + 110 x= = 104 16 b) Para un nivel de confianza del 95% tenemos que 1- = 0,95, /2 = 0,025, luego Z/2 = 1,96 pues P(X<1,96) = 0,975. El intervalo de confianza es: 5 5 x - Z /2 = 104 - 1,96 = (101.55; 106.45) , x + Z /2 ,104 + 1,96 16 16 n n 2.- La media de las estaturas de una muestra aleatoria de 400 personas de una ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es una 2 variable aleatoria que sigue una distribucin normal con varianza 2 = 0,16 m . a) Construye un intervalo, de un 95% de confianza, para la media de las estaturas de la poblacin. b) Cul sera el mnimo tamao muestral necesario para que pueda decirse que la verdadera media de las estaturas est a menos de 2 cm de la media muestral, con un nivel de confianza del 90%?

INFERENCIA ESTADSTICA

Resolucin: a) Para un nivel de confianza del 95% tenemos que 1- = 0,95, /2 = 0,025, luego Z/2 = 1,96 pues P(X<1,96) = 0,975. El intervalo de confianza es: 0,4 0,4 x - Z /2 = 1,75 - 1,96 = (1.7108,1.7892) , x + Z /2 ; 1,75 + 1,96 400 400 n n b) Para un nivel de confianza del 90% tenemos que 1- = 0,90, /2 = 0,05, luego Z/2 = 1,65 pues P(X<1,65) = 0,9500. Como el margen de error es: 0,4 0,4 E = Z /2 0,02 = 1,65 n = 1,65 = 32,9 n = 1082,41 0,02 n n La muestra debe tener al menos 1083 personas.

Estimacin de una proporcin


Si en una poblacin, una determinada caracterstica se presenta en una proporcin p, la proporcin P, de individuos con dicha caracterstica en las muestras de tamao n, se distribuirn segn: PQ N P, n Intervalo de confianza para una proporcin:

P - Z /2 PQ , P + Z /2 PQ n n
El error mximo de estimacin es: E = Z /2

pq n

Tamao de la muestra:

Z n = pq /2 E

EJEMPLO
1.- En una muestra de 300 personas tomadas al azar en una ciudad se encontr que 104 de ellas lean el peridico. Halla, con un nivel de confianza del 90%, la proporcin de habitantes que leen el peridico y el error mximo admisible para la proporcin de habitantes que leen el peridico Resolucin: Una confianza del 90% significa que 1- = 0,10, luego /2 = 0,050, luego tenemos Z/2 = 1,645 pues P(X < 1,645) = 0,95. 104 La proporcin muestral es p = = 0,347. 300 a) Como la muestra n = 104 > 30 podemos sustituir la proporcin poblacional por la muestral y el intervalo de confianza es: 0,347 - 1,645 0,347.0653 ; 0,347 + 1,645 0,347.0653 = (0,302; 0,392) 300 300
INFERENCIA ESTADSTICA 6

b) El error mximo admisible es:

E = Z /2

pq 0,347.0,65 3 = 1645 , = 0,045 n 300

2.- Se desea estimar la proporcin, p, de individuos daltnicos de una poblacin a travs del porcentaje observado en una muestra aleatoria de individuos, de tamao n. a) Si el porcentaje de individuos daltnicos en la muestra es igual al 30%, calcula el valor de n para que, con un nivel de confianza de 0,95, el error cometido en la estimacin sea inferior al 3,1%. b) Si el tamao de la muestra es de 64 individuos, y el porcentaje de individuos daltnicos en la muestra es del 35%, determina, usando un nivel de significacin del 1%, el correspondiente intervalo de confianza para la proporcin de daltnicos de la poblacin. Resolucin: a) Para un nivel de confianza del 95% tenemos que 1- = 0,95, /2 = 0,025, luego Z/2 = 1,96 pues P(X<1,96) = 0,975. Sustituyendo en la expresin del error mximo admisible:

0,3.0,7 pq 1,96 1,96 = 0,031 n = 0,3.0,7. E = Z /2 = 839, 48 n n 0,031 Habr que tomar al menos 840 individuos.
b) Para un nivel de significacin del 1% tenemos un nivel de confianza del 99%, es decir, 1- = 0,99, /2 = 0,005, luego Z/2 = 2,575 pues P(X<2,575) = 0,995. 0,35 - 2,575 0,35.065 ; 0,35 + 2,575 0,35.065 = (0,196; 0,504) 64 64

Contrastes de hiptesis
Hiptesis estadsticas
Un test estadstico es un procedimiento para, a partir de una muestra aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hiptesis previamente emitida sobre el valor de un parmetro desconocido de una poblacin. La hiptesis emitida se designa por H0 y se llama hiptesis nula. La hiptesis contraria se designa por H1 y se llama hiptesis alternativa.

Contrastes de hiptesis
1. Enunciar la hiptesis nula H0 y la alternativa H1. Bilateral Unilateral H0=k H 0 k H0 k H1 k H1 < k H 1> k

2. A partir de un nivel de confianza 1 - o el de significacin . Determinar: El valor z/2 (bilaterales), o bien z (unilaterales) La zona de aceptacin del parmetro muestral (x o P). 3. Calcular: x o P, a partir de la muestra.
INFERENCIA ESTADSTICA 7

4. Si el valor del parmetro muestral est dentro de la zona de la aceptacin, se acepta la hiptesis con un nivel de significacin . Si no, se rechaza.

Contraste Bilateral
Se presenta cuando la hiptesis nula es del tipo H0: = k (o bien H0: p = k) y la hiptesis alternativa, por tanto, es del tipo H1: k (o bien H1: p k).

El nivel de significacin se concentra en dos partes (o colas) simtricas respecto de la media. La regin de aceptacin en este caso no es ms que el correspondiente intervalo de probabilidad para x o P, es decir: - Z /2 , + Z /2 n n o bien: P - Z /2 PQ , P + Z /2 PQ n n

EJEMPLO
1.- Se sabe que la desviacin tpica de las notas de cierto examen de Matemticas es 2,4. Para una muestra de 36 estudiantes se obtuvo una nota media de 5,6. Sirven estos datos para confirmar la hiptesis de que la nota media del examen fue de 6, con un nivel de confianza del 95%? Resolucin: 1. Enunciamos las hiptesis nula y alternativa: H0 : = 6 La nota media no ha variado. H1 : 6 La nota media ha variado. 2. Zona de aceptacin Para = 0.05, le corresponde un valor crtico: z/2 = 1.96. Determinamos el intervalo de confianza para la media: (6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78) 3. Verificacin. Valor obtenido de la media de la muestra: 5,6. 4. Decisin Aceptamos la hiptesis nula H0, con un nivel de significacin del 5%. 2.- Un fabricante de lmparas elctricas est ensayando un nuevo mtodo de produccin que se considerar aceptable si las lmparas obtenidas por este mtodo dan lugar a una poblacin normal de duracin media 2400 horas, con una desviacin tpica igual a 300. Se toma una muestra de 100 lmparas producidas
INFERENCIA ESTADSTICA 8

por este mtodo y esta muestra tiene una duracin media de 2320 horas. Se puede aceptar la hiptesis de validez del nuevo proceso de fabricacin con un riesgo igual o menor al 5%? Resolucin: 1 Enunciamos las hiptesis nula y alternativa: H0 : = 2400 H1 : 2400 2 Zona de aceptacin = 0.05 z = 1.96. Determinamos el intervalo de confianza para la media: 300 300 2400 1,96 = (2341,1; 2458,8) , 2400 + 1,96 100 100 3 Verificacin. Valor obtenido de la media de la muestra: 2320. 4 Decisin Rechazamos la hiptesis nula H0, con un nivel de significacin del 5%. 3.- Se cree que el nivel medio de protombina en una poblacin normal es de 20 mg/100 ml de plasma con una desviacin tpica de 4 miligramos/100 ml. Para comprobarlo, se toma una muestra de 40 individuos en los que la media es de 18.5 mg/100 ml. Se puede aceptar la hiptesis, con un nivel de significacin del 5%? Resolucin: 1 Enunciamos las hiptesis nula y alternativa: H0 : =20 mg/100 ml H1 : 20 mg/100 ml 2 Zona de aceptacin Para = 0.05, le corresponde un valor crtico: z/2 = 1.96. Determinamos el intervalo de confianza para la media: 4 4 20 1,96 = (18,77; 21,23) , 20 + 1,96 40 40 3 Verificacin. Valor obtenido de la media de la muestra: 18.5. 4 Decisin Rechazamos la hiptesis nula H0, con un nivel de significacin del 5%.

Contraste unilateral
Caso 1
La hiptesis nula es del tipo H0: k (o bien H0: p k). La hiptesis alternativa, por tanto, es del tipo H1: < k (o bien H1: p < k). Valores crticos 1- 0.90 0.10 z 1.28

INFERENCIA ESTADSTICA

0.95 0.99

0.05 0.01

1.645 2.33

El nivel de significacin se concentra en una parte o cola. La regin de aceptacin en este caso ser:

- Z/2 , n o bien: P - Z/2 PQ , n

EJEMPLO
1.- Un socilogo ha pronosticado, que en una determinada ciudad, el nivel de abstencin en las prximas elecciones ser del 40% como mnimo. Se elige al azar una muestra aleatoria de 200 individuos, con derecho a voto, 75 de los cuales estaran dispuestos a votar. Determinar con un nivel de significacin del 1%, si se puede admitir el pronstico. Resolucin: 1. Enunciamos las hiptesis nula y alternativa: H0 : p 0.40 La abstencin ser como mnimo del 40%. H1 : p < 0.40 La abstencin ser como mximo del 40%; 2. Zona de aceptacin Para = 0.01, le corresponde un valor crtico: z = 2.33. Determinamos el intervalo de confianza para la media: 0,4 - 2,33 0,4.06 , = (0,3192; ) 200 3. Verificacin. 125 P= = 0,625 200 4. Decisin Aceptamos la hiptesis nula H0. Podemos afirmar, con un nivel de significacin del 1%, que la La abstencin ser como mnimo del 40%. 2.- La duracin de la bombillas de 100 W que fabrica una empresa sigue una distribucin normal con una desviacin tpica de 120 horas de duracin. Su vida media est garantizada durante un mnimo de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y, despus de comprobarlas, se obtiene una

INFERENCIA ESTADSTICA

10

vida media de 750 horas. Con un nivel de significacin de 0,01, habra que rechazar el lote por no cumplir la garanta? Resolucin: 1 Enunciamos las hiptesis nula y alternativa: H0 : 800 H1 : <800 2 Zona de aceptacin = 0.01; z = 2.33 Determinamos el intervalo de confianza: 120 800 2,33 , = (760,46, ) 50 3 Verificacin. x = 750 4 Decisin Rechazamos la hiptesis nula H0. Con un nivel de significacin del 1%. 3.- El control de calidad una fbrica de pilas y bateras sospecha que hubo defectos en la produccin de un modelo de batera para telfonos mviles, bajando su tiempo de duracin. Hasta ahora el tiempo de duracin en conversacin segua una distribucin normal con media 300 minutos y desviacin tpica 30 minutos. Sin embargo, en la inspeccin del ltimo lote producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60 bateras el tiempo medio de duracin en conversacin fue de 290 minutos. Suponiendo que ese tiempo sigue siendo Normal con la misma desviacin tpica: Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de significacin del 2%? Resolucin: 1 Enunciamos las hiptesis nula y alternativa: H0 : 300 H1 : < 300 2 Zona de aceptacin = 0.02; 1- = 0. 98; P(1.96)= 0. 98; Determinamos el intervalo de confianza: 30 300 2,33 , = (290,98, ) 60 3 Verificacin. = 290 4 Decisin Rechazamos la hiptesis nula H0. Con un nivel de significacin del 2%. z = 1.96 .

Caso 2
La hiptesis nula es del tipo H0: k (o bien H0: p k). La hiptesis alternativa, por tanto, es del tipo H1: > k (o bien H1: p > k).

INFERENCIA ESTADSTICA

11

El nivel de significacin se concentra en la otra parte o cola. La regin de aceptacin en este caso ser: , + Z /2 n o bien: , P + Z /2 PQ n

EJEMPLO
1.- Un informe indica que el precio medio del billete de avin entre Canarias y Madrid es, como mximo, de 120 con una desviacin tpica de 40 . Se toma una muestra de 100 viajeros y se obtiene que la media de los precios de sus billetes es de 128 . Se puede aceptar, con un nivel de significacin igual a 0,1, la afirmacin de partida? Resolucin: 1. Enunciamos las hiptesis nula y alternativa: H0 : 120 H1 : > 120 2. Zona de aceptacin Para = 0.1, le corresponde un valor crtico: z = 1.28 . Determinamos el intervalo de confianza: 40 , 120 + 1,28 = (-; 125,12) 100 3. Verificacin. Valor obtenido de la media de la muestra: 128 . 4. Decisin No aceptamos la hiptesis nula H0. Con un nivel de significacin del 10%.

2.- Una marca de nueces afirma que, como mximo, el 6% de las nueces estn vacas. Se eligieron 300 nueces al azar y se detectaron 21 vacas. a) Con un nivel de significacin del 1%, se puede aceptar la afirmacin de la marca? b) Si se mantiene el porcentaje muestral de nueces que estn vacas y 1- = 0.95, qu tamao muestral se necesitara para estimar la proporcin de nueces con un error menor del 1% por ciento? Resolucin: a) 1 Enunciamos las hiptesis nula y alternativa: H0 : p 0.06
INFERENCIA ESTADSTICA 12

H1 : p >0.06 2 Zona de aceptacin = 0.01 z = 2.33. Determinamos el intervalo de confianza: , 0,06 + 2,33 0,06.0,94 = (-; 0,092) 300 3 Verificacin. 21 P= = 0,07 300 4 Decisin Aceptamos la hiptesis nula H0. Con un nivel de significacin del 1%. b) Tenemos que: 1 - = 0, 95 Z/2 = 1, 96 0,01 = 1,96 Luego: n 2501

0,07.0,93 n

n = 50 n = 2500

Errores de tipo I y tipo II


Error de tipo I. Se comete cuando la hiptesis nula es verdadera y, como consecuencia del contraste, se rechaza. Error de tipo II. Se comete cuando la hiptesis nula es falsa y, como consecuencia del contraste se acepta. H0 Aceptar Verdadera Decisn correcta Probabilidad = 1 - ERROR DE TIPO I Probabilidad = Falsa Decisin incorrecta: ERROR DE TIPO II Decisin correcta

Rechazar

La probabilidad de cometer Error de tipo I es el nivel de significacin . La probabilidad de cometer Error de tipo II depende del verdadero valor del parmetro. Se hace tanto menor cuanto mayor sea n.

INFERENCIA ESTADSTICA

13

Relacin de Ejercicios de Contrastes de Hiptesis.


Ponencia Andaluza de Matemticas Aplicadas a las Ciencias Sociales II. 1. La altura en cm. de las caas producidas por una variedad de carrizo en cada cosecha es una variable aleatoria que sigue una ley normal con desviacin tpica a = 16 cm. Para contrastar si la altura media de las caas de la ltima cosecha es de 170 cm, se ha tomado una muestra aleatoria de 64 de estas canas y se han medido sus longitudes, resultando como media muestral x = 166 cm. Son suficientes estos datos para rechazar que la altura media de las caas de la ltima cosecha es de 170 cm, a un nivel de significacin = 0,05? Solucin: Estos datos son suficientes para rechazar, a este nivel, que la altura media de las caas de esta cosecha sea de 170 cm. 2. Un comerciante ha observado durante un largo periodo de tiempo que sus beneficios semanales se distribuyen segn una ley normal con una media de 5000 euros y una desviacin tpica de 520 euros. A finales del ao pasado se abri un supermercado frente a su comercio y l cree que su beneficio semanal medio ha disminuido desde entonces. Para contrastar esta suposicin, ha tomado una muestra aleatoria de 16 semanas del ao actual y ha encontrado que el beneficio semanal medio de esa muestra es de 4700 euros. Puede afirmarse, a un nivel de significacin = 0, 01, que estos datos avalan la creencia del comerciante? Solucin: No se puede afirmar, al nivel 0,01, que los datos de la muestra apoyan la creencia de que el nuevo supermercado ha disminuido el beneficio semanal medio del comerciante. 3. Solo el 75 % de los alumnos de un centro de enseanza realizan correctamente un test psicotcnico que lleva utilizndose mucho tiempo. Para tratar de mejorar este resultado, se modific la redaccin del test, y se propuso a un grupo de 120 alumnos de ese centro, elegidos al azar. De los 120 alumnos a los que se les paso el nuevo test, lo realizaron correctamente 107. Podemos afirmar que la nueva redaccin del test ha aumentado la proporcin de respuestas correctas, a un nivel de significacin = 0,025? Solucin: Podemos afirmar que la nueva redaccin del test ha aumentado la proporcin de respuestas correctas, a un nivel de significacin = 0,025. 4. El peso en vaco de los envases fabricados por una empresa, segn su mtodo usual, es una variable aleatoria que sigue una ley normal con media 20 gramos y una desviacin tpica de 1 gramo. Se desea contrastar si un nuevo proceso de fabricacin no aumenta dicho peso medio. Para ello, se eligen al azar 25 envases fabricados por la nueva tcnica y se encuentra que la media de su peso en vaco es de 20,5 gramos. Se puede afirmar, a un nivel de significacin a = 0,02, que el nuevo proceso ha aumentado el peso medio de los envases? Solucin: A la vista de los datos obtenidos en la muestra, se puede afirmar, al nivel = 0,02, que el nuevo proceso ha aumentado el peso medio de los envases. 5. En unas elecciones municipales de una ciudad, el 42 % de los votantes dieron su voto al partido A. En una encuesta realizada un ao despus a 500 personas con derecho a voto, solo 184 votaran al partido A. Con estos datos, puede afirmarse que ha disminuido la proporcin de votantes a ese partido? Responder a la pregunta anterior con niveles de significacin = 0,01, = 0,025 y = 0,001. Solucin: Los datos permiten afirmar que ha disminuido la proporcin de votantes al partido A a los niveles 0,025 y 0,01, pero no ha disminuido la proporcin al nivel 0,001. 6. En una ciudad, donde la proporcin de fumadores con edad comprendida entre 18 y 20 aos es del 30 %, el ayuntamiento ha realizado una campaa contra el consumo de tabaco. Dos meses despus de terminar dicha campaa, se ha realizado una encuesta a 400 personas de estas edades, elegidas al azar, y se ha encontrado entre ellos a 92 fumadores. Podemos afirmar, a un nivel de significacin = 0,05, que esta campaa ha modificado la proporcin de fumadores entre 18 y 25 aos? Solucin: Estos datos son suficientes para afirmar, al nivel 0,05, que se ha modificado la proporcin de fumadores entre los 18 y 25 anos. 7. Un fabricante de automviles produce dos tipos de un determinado modelo de turismo: el tipo A, con motor de gasolina, y el tipo B, con motor de gasoil. De una muestra aleatoria de 200 turismos de este

INFERENCIA ESTADSTICA

14

modelo, 112 son del tipo B. Proporcionan estos datos suficiente evidencia, a un nivel de significacin = 0,01, de que los clientes prefieren el modelo del tipo B al del tipo A? Solucin: No tenemos evidencias suficientes para afirmar que los clientes prefieren el modelo del tipo B de gasoil, al del tipo A de gasolina, al nivel de significacin = 0,01. 8. Supongamos que 100 neumticos de cierta marca duraron en promedio 21431 kilmetros. Si se supone que la poblacin es normal con una desviacin tpica poblacional de 1295 km, utilizando = 0,05, podemos considerar que la duracin media de los neumticos es inferior a 22000 km? Solucin: Podemos afirmar que la duracin media de los neumticos de dicha marca es menor de 22000 Km., con una probabilidad de error tipo I, , del 5 %. 9. Un constructor afirma que por lo menos el 75% de las casas que construye tienen calefaccin. Se estara de acuerdo con tal afirmacin si una inspecciona aleatoria muestra que 72 de 135 casas cuentan con calefaccin? (Usar = 0,1 ) Solucin: Los datos de la muestra son suficientes para rechazar, a este nivel = 0,1, la afirmacin del constructor de que la proporcin de casas con calefaccin que ste construye no es inferior al 75%. 10. Una compaa textil afirma que a lo sumo el 20 % del pblico compra ropa de lana. Verifica esta afirmacin para = 0,01 , si una encuesta aleatoria indica que 46 de 200 clientes compran ropa de lana. Solucin: Los datos de la muestra no son suficientes para rechazar, a este nivel, que la proporcin del pblico que compra ropa de lana no supera el 20 %. 11. Se sabe que la longitud en cm de una determinada especie de colepteros sigue una distribucin normal de varianza 0,25 cm2. Capturados 6 ejemplares de dicha especie, sus longitudes (en cm) fueron: 2,75 1,72 2,91 2,6 2,64 3,34 Se puede aceptar la hiptesis de que la poblacin tiene una longitud media de 2,656 cm? (Usar = 0,05 ) Solucin: No tenemos evidencias suficientes para rechazar que la longitud media de esa especie de colepteros es de 2.656 cm, con una probabilidad de error tipo I, , del 5 %.
12. La edad de la poblacin que vive en residencias de mayores en Cdiz sigue una distribucin normal

de desviacin tpica 7,3 aos. Se toma una muestra aleatoria simple de tamao 50, y se obtiene una media muestral de 69 anos. Se puede asegurar que la edad media de la poblacin que vive en residencias de mayores en Cdiz es mayor de 70 aos con un nivel de significacin del 5 %? Solucin: Puede decirse que los datos de la muestra no permiten afirmar que la media de edad de esas personas sea mayor que 70 aos, al nivel de significacin = 0,05.
13. Para conocer la produccin media de sus olivos, un olivarero escoge al azar 10 de ellos, pesa su

produccin de aceitunas, y obtiene los siguientes valores, expresados en Kg.: 175, 180, 210, 215, 186, 213, 190, 213, 184, 195. Sabemos que la produccin sigue una distribucin normal con desviacin tpica igual a 15.3 Kg. Con la informacin obtenida, se puede asegurar que la produccin media de un olivo de ese agricultor es menor de 200 Kg? (Usar = 0,05 ) Solucin: Puede decirse que los datos de la muestra confirman que la produccin media de un olivo de ese agricultor es menor de 200 Kg., al nivel de significacin = 0,05.
14. El 40 % de los escolares de cierto pas suelen perder al menos un da de clase a causa de gripes y

catarros. Sin embargo, un estudio sobre 1000 escolares revela que en el ltimo curso hubo 450 en tales circunstancias. Las autoridades defienden que el porcentaje del 40% para toda la poblacin de escolares se ha mantenido. Contrastar con un nivel de significacin del 5 % la hiptesis defendida por las autoridades sanitarias, frente a que el porcentaje ha aumentado, como parecen indicar los datos, explicando claramente a que conclusin se llega. Solucin: Estos datos son suficientes para afirmar, al nivel = 0,05, que el porcentaje de escolares que pierden al menos un da de clase por causa de gripes y catarros ha aumentado, por lo que ese porcentaje es mayor del 40 %. Entonces, la hiptesis mantenida por las autoridades no es correcta.
15. Una de las entradas a cierta ciudad andaluza sufra constantemente retenciones de trfico, de forma

que el tiempo de espera en la cola formada por el semforo all instalado segua una distribucin Normal de media 10 minutos y desviacin tpica 4 minutos. Con el fin de descongestionar ese punto
INFERENCIA ESTADSTICA 15

y bajar la media de tiempo de espera, se habilito una va de acceso auxiliar. Transcurrida una semana se hizo un estudio sobre 36 vehculos y se obtuvo que el tiempo medio de espera en el citado semforo fue de 8.5 minutos. Las autoridades municipales mostraron su satisfaccin y dijeron que la medida haba funcionado, pero la opinin pblica, sin embargo, defiende que la situacin sigue igual. Suponiendo que la desviacin tpica se ha mantenido: a) Plantee un test para contrastar la hiptesis defendida por la opinin pblica frente a la de los responsables municipales. Si se concluye que la media de tiempo de espera baj y realmente no lo hizo, como se llama el error cometido? b) A que conclusin se llega con un nivel de significacin del 5 %? c) A que conclusin se llega con un nivel de significacin del 1 %? Solucin: a) El error se denomina Error tipo I, y la probabilidad de cometer un error de tipo I se denomina . Estos datos son suficientes para afirmar, al nivel = 0,05, que el tiempo medio de espera en dicho semforo ha bajado, por lo que ese tiempo de espera es ahora menor de 10 minutos. Entonces, la hiptesis mantenida por las autoridades municipales es correcta, y la medida de habilitar una va de acceso auxiliar ha descongestionado el trafico en la entrada de dicha ciudad. Sin embargo, para un nivel = 0,01 no se puede rechazar la hiptesis nula, y por tanto el tiempo medio de espera en el semforo sigue siendo de 10 minutos.
16. En un hospital se observ que los pacientes abusaban del servicio de urgencias, de forma que un 30

% de las consultas podan perfectamente haber esperado a concertar una cita con el medico de cabecera, porque no eran realmente urgencias. Puesto que esta situacin ralentizaba el servicio, se realizo una campaa intensiva de concienciacin. Transcurridos unos meses se ha recogido informacin de 120 consultas al servicio, de las cuales slo 30 no eran realmente urgencias: a) Hay personal del hospital que defiende que la campaa no ha mejorado la situacin. Plantee un test para contrastar esta hiptesis frente a que s la mejoro. Si se concluye que la situacin no ha mejorado y realmente s lo hizo, cmo se llama el error cometido? b) A qu conclusin se llega en el test planteado en el apartado anterior con un nivel de significacin del 1%? Solucin: a) El error se denomina Error tipo II. b) La campaa de concienciacin no ha reducido el porcentaje de pacientes (30%) que abusan del servicio de urgencias, al nivel de significacin = 0, 01.
17. El alcalde de una ciudad prometi, en su programa electoral, oponerse a la construccin de una

central de tratamiento de ciertos residuos, puesto que en aquel momento solo un 10 % de los ciudadanos estaban a favor de la central de tratamiento de residuos. En los ltimos das se ha encuestado a 100 personas de las cuales 14 estn a favor de la central. El alcalde afirma sin embargo que el porcentaje de ciudadanos a favor sigue siendo del 10 % o incluso ha disminuido. Tiene razn el alcalde con un nivel de significacin del 2 %? Solucin: No tenemos evidencias suficientes para afirmar que el porcentaje de ciudadanos que estaran a favor de la construccin de la central de tratamiento de residuos es mayor del 10 %, al nivel de significacin = 0,02. Por tanto, los datos de la muestra avalan la opinin del alcalde de que el porcentaje de ciudadanos a favor sigue siendo del 10 % o incluso ha disminuido.
18. Se desea estudiar el gasto mensual de los telfonos mviles, en euros, de los estudiantes

universitarios andaluces. Para ello, se ha elegido una muestra aleatoria de 10 de estos estudiantes, resultando los valores siguientes para el gasto mensual en mvil: 30 60 25 20 25 30 35 45 50 40 Se supone que la variable aleatoria objeto de estudio sigue una distribucin normal de media desconocida y de desviacin tpica igual a 12 euros. a) Se puede asegurar que los estudiantes universitarios andaluces gastan menos de 50 euros mensuales en telfono Mobil? (Usar = 0,01) b) Cul es la desviacin tpica de la media muestral? Solucin: a) Estos datos son suficientes para afirmar, al nivel = 0,01, que los estudiantes universitarios andaluces gastan menos de 50 euros al mes en telfono mvil. b) La desviacin tpica de la media muestral es = 3,795.

INFERENCIA ESTADSTICA

16

19. Una mquina de envasado automtico llena en cada saco una cierta cantidad de determinado

producto. Se seleccionan 20 sacos, se pesa su contenido y se obtienen los siguientes resultados (en kilos): 49, 50,49, 50, 50, 50,49, 50, 50, 50, 49, 50, 50, 51, 52, 48, 50, 51, 51, 51 A partir de esta informacin y suponiendo que la variable, peso de cada saco, se distribuye normalmente con desviacin tpica 1 Kg.: a) Se puede admitir que el peso medio de los sacos que llena la maquina es de aproximadamente 51 kg? (Usar a = 0,01) b) Se puede admitir que el peso medio de los sacos que llena la maquina es menor de 50 Kg? (Usar = 0,05) Solucin: a) Podemos afirmar que la maquina no envasa sacos de aproximadamente 51 kg, al nivel de significacin = 0, 01. b) Podemos decir que los mismos datos apoyan la hiptesis de que el peso medio de los sacos no es inferior a los 50 Kg, al nivel de significacin = 0,05.
20. El consumo de cierto producto sigue una distribucin normal con varianza 300. A partir de una

muestra de tamao 25 se ha obtenido una media muestral igual a 180. a) Halle un intervalo de confianza al 95 % para la media del consumo. b) Se podra afirmar que el consumo medio de este producto no llega a 200? (Usar = 0,05) Solucin a) Un intervalo de confianza al 95% para la media del consumo es (173,21; 186,79). b) Los datos de esta muestra permiten afirmar que el consumo medio de este producto no llega a 200, al nivel de significacin = 0,05.
21. Los estudiantes universitarios de cierto pas dedican al estudio un nmero de horas semanales que

sigue una distribucin normal de media desconocida y de desviacin tpica 7 horas. Si en una muestra de 200 estudiantes se obtuvo una media muestral de 30 horas de estudio semanal. a) Halle un intervalo de confianza al 95 % para el nmero de horas de estudio semanales de los estudiantes universitarios de dicho pas. b) Se podra afirmar que los estudiantes universitarios de ese pas estudian menos de 35 horas semanales? (Usar = 0,01) Solucin: a) Un intervalo de confianza al 95 % para la media de horas de estudio semanales de los universitarios es (29,03; 30,97). b) Podemos afirmar que la media del nmero de horas de estudio semanales de los universitarios es menor de 35 horas, al nivel de significacin = 0,01.
22. La talla de los individuos de una poblacin sigue una distribucin normal de desviacin tpica 8 cm.

Se han determinado las tallas de 25 individuos, encontrndose una media de 168 cm. Se podra afirmar que la talla media de la poblacin es menor de 170 cm? (Usar = 0,03) Solucin: No tenemos evidencias suficientes para afirmar que la talla media de la poblacin es menor de 170 cm, al nivel de significacin = 0,03.
23. Los estudiantes de Bachillerato de una cierta comunidad autnoma duermen un nmero de horas

diarias que se distribuye segn una ley normal de media desconocida y desviacin tpica 3 horas. A partir de una muestra aleatoria de tamao 30 se ha obtenido una media igual a 7 horas. Se podra afirmar que el nmero medio de horas de sueo de los estudiantes de Bachillerato de dicha comunidad autnoma es mayor de 6 horas? (Usar = 0,04) Solucin: En consecuencia, a este nivel = 0,04, los datos de la muestra permiten afirmar que el numero medio de horas de sueno de los estudiantes de Bachillerato de dicha comunidad autnoma es mayor de 6 horas.
24. Las autoridades educativas publican en un estudio que el 25 % de los estudiantes de Bachillerato de

una cierta comunidad autnoma tienen ordenador porttil. A partir de una muestra aleatoria de tamao 300 se ha obtenido que solo 70 de ellos tienen ordenador porttil. Se podra asegurar que las autoridades dicen la verdad? (Usar = 0,06) Solucin: No tenemos evidencias suficientes para afirmar que el porcentaje de estudiantes de Bachillerato que tienen ordenador porttil es distinto del 25%, al nivel de significacin = 0,06. En consecuencia, a este nivel, los datos no permiten rechazar que el estudio se corresponda con la realidad. Por tanto, podemos afirmar que las autoridades educativas dicen la verdad.

INFERENCIA ESTADSTICA

17

25. Un laboratorio farmacutico fabrica un producto para la cada del cabello que envasa en botes, y en el

etiquetado indica que su contenido aproximado es de 100 c.c. Se eligen, al azar, 7 de estos botes y se miden sus contenidos dando el siguiente resultado (en c.c.): 97 101 102 99 98 100 103 Podemos asegurar que la capacidad media de los botes que se fabrican es la indicada en el bote? (Usar = 0,01) (Se sabe que el contenido es una variable aleatoria normal de desviacin tpica 2 c.c.) Solucin: Podemos asegurar que la capacidad media de los botes que se fabrican es la indicada en la etiqueta (100 c.c.), al nivel de significacin = 0,01.
26. Se ha tomado una muestra de precios de un mismo producto en 16 comercios, elegidos al azar en una

ciudad, y se han encontrado los siguientes precios (en euros): 95,108, 97,112, 99,106,105,100, 99, 98,104,110,107,111,103,110. Suponiendo que los precios de este producto se distribuyen segn una ley normal de varianza 25 y media desconocida: a) Cual es la distribucin de la media muestral? b) Se puede afirmar que el precio medio de dicho producto es menor de 105 euros? (Usar = 0,03) Solucin: a) La distribucin de la media muestral sigue una ley Normal con media desconocida (la misma que la media de la poblacin) y desviacin tpica = 5/4 = 1,25. b) No tenemos evidencias suficientes para afirmar que el precio medio de dicho producto en esa ciudad es menor de 105 euros, al nivel de significacin = 0,03.
27. Los alumnos de preescolar de Andaluca tienen una estatura que es una variable aleatoria de media

desconocida y desviacin tpica 16 cm. Si seleccionamos una muestra aleatoria de 100 de tales alumnos y obtenemos una estatura media de 95 cm, a) se puede afirmar que la estatura media de los alumnos de preescolar de Andaluca es menor de 95 cm? (Usar = 0,01) b) se puede afirmar que la estatura media de los alumnos de preescolar de Andaluca es mayor de 100 cm? (Usar = 0,05) Solucin: a) No tenemos evidencias suficientes para afirmar que la estatura media de los alumnos de preescolar de Andaluca es menor de 95 centmetros, al nivel de significacin a = 0,01. Los datos de la muestra no permiten afirmar, a ese nivel, que la estatura media de estos alumnos es menor de 95 cm.
b) No tenemos evidencias suficientes para afirmar que la estatura media de los alumnos de preescolar de Andaluca es mayor de 100 centmetros, al nivel de significacin a = 0,05. Los datos de la muestra no permiten afirmar, a ese nivel, que la estatura media de estos alumnos es mayor de 100 cm

INFERENCIA ESTADSTICA

18

Вам также может понравиться