Вы находитесь на странице: 1из 10

Objetivos

 Determinar el tamaño de muestra adecuado para la realización del estudio.


 Establecer los intervalos de confianza para las variables elegidas al 95%.
 Realizar una prueba de hipótesis para validar la afirmación del investigador.
Desarrollo de la actividad

(Semana 3) Selección de muestra

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a


todos los elementos de una población), se selecciona una muestra, entendiendo
por tal una parte representativa de la población. En ese sentido, escoja un tipo
de muestreo y argumente la viabilidad de esta técnica para la base de datos
dada.

El tipo de muestreo elegido es método coordinado negativo, este consiste en


realizar N ensayos con una distribución de probabilidad uniforme (0,1), asignar
estos números a cada uno de los elementos del universo, ordenar los elementos
respecto a los valores aleatorios y considerar como muestra los elementos
correspondientes a los n (tamaño). La viabilidad de este tipo de muestreo radica
en que ya que no sabemos la procedencia de los datos, usamos un método
donde elegimos los datos con menor probabilidad de ser elegidos para
asegurarnos de que no existe un sesgo en el muestreo debido a parámetros
desconocidos.

Para seleccionar una muestra debe tenerse en cuenta el cómo seleccionar los
elementos que formarán parte de la muestra (tipo de muestreo) y cuántos
elementos debemos seleccionar (Tamaño de muestra).

2. Utilizando la variable género P (6020) determine el tamaño de la muestra


seleccionando adecuadamente y justificando:

a. Fórmula a desarrollar

La fórmula a desarrollar es:

𝑍𝛼2⁄2 𝑁𝑝𝑞
𝑛=
𝑝𝑞𝑍𝛼2⁄2 + (𝑁 − 1)𝑒 2
Donde:

𝑍𝛼2⁄2 = 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎, 𝑝𝑎𝑟𝑎 95% 𝑒𝑠 1.96

𝑝 𝑦 𝑞, 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛 𝑑𝑒 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑦 ℎ𝑜𝑚𝑏𝑟𝑒𝑠

𝑁 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛

𝑒 = 𝑒𝑟𝑟𝑜𝑟 𝑚𝑎𝑥𝑖𝑚𝑜 𝑎𝑑𝑚𝑖𝑠𝑖𝑏𝑙𝑒

𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

1.962 60357 ∗ 0.5 ∗ 0.5


𝑛= = 381.73 ≈ 372
0.5 ∗ 0.5 ∗ 1.962 + (60357 − 1) ∗ 0.052

b. Estimación de la proporción de mujeres

187
𝑝̅ = ≈ 0.5026
372

𝑝𝑞
𝑝̅ ± 𝑍𝛼⁄2 √
𝑛

1 − 0.5026
0.5026 ± 1.96 ∗ √0.5026 ∗
372

0.4518 ≤ 𝜋 ≤ 0.5534

45,18% ≤ 𝜋 ≤ 55,34%

c. Nivel de confiabilidad

Se usara el nivel de confiabilidad 95%, es decir existe un 95% de probabilidad de


que el parámetro a estimar este dentro del intervalo determinado.

d. Error de estimación

El error de estimación está dado por:

𝑝𝑞
𝑍𝛼⁄2 √
𝑛

𝐸𝑟𝑟𝑜𝑟 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖𝑜𝑛: 0.0508 𝑜 5.08%


(Semana 4) Intervalo de confianza para dos variables numéricas

Un investigador, cree determinar que existen diferencias entre los niveles de estudio
de los hombres y las mujeres en Colombia. Para determinar lo anterior, use la
“muestra” encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un


histograma para los hombres y mujeres. Según los resultados, ¿Existen
diferencias?

Histograma hombres

36
Años escolaridad

28
25

3 8 8 9 9 7 4 7 3 5 5 5 2 8 2 1

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 20 25
Conteo

Figura 1. Histograma hombres escolaridad.

Histograma mujeres

51
Años escolaridad

23
20
16
13
3 8 7 8 7 7 7 7 2 6 8 1 2 1

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 20 25
Conteo

Figura 2. Histograma mujeres escolaridad.


La tendencia entre hombres y mujeres según los histogramas parece ser la
misma, los años de escolaridad están concentrados en los valores 0, 5 y 11 años.

2. Asumiendo que los datos son normales, calcule un intervalo de confianza del
95% para estimar, la escolaridad promedio de los hombres y de las mujeres
de forma individual, en los niveles de estudio de Bachiller, Tecnólogo y
Universitario.

Hombres
Media 7.08
Desviación estándar 3.26

3.26
𝐼𝑑𝐶: 7.08 ± 1.96 ∗
√175

6.6 𝑎ñ𝑜𝑠 ≤ 𝜋 ≤ 7.56 𝑎ñ𝑜𝑠

Mujeres
Media 8.04
Desviación estándar 3.72

3.72
𝐼𝑑𝐶: 8.04 ± 1.96 ∗
√197

7.52 𝑎ñ𝑜𝑠 ≤ 𝜋 ≤ 8.55 𝑎ñ𝑜𝑠

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al


95% para estimar la diferencia promedio de escolaridad para los hombres y
mujeres, en los niveles de estudio de Bachiller, Tecnólogo y Universitario.

Para calcular la diferencia de medias se utiliza la siguiente ecuación:


𝜎12 𝜎22 𝜎12 𝜎22
𝑥̅1 − 𝑥̅2 − 𝑍𝛼⁄2 √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅ 2 + 𝑍𝛼⁄2 √ +
𝑛1 𝑛2 𝑛1 𝑛2

Reemplazando los datos tenemos:

3.722 3.262 3.722 3.262


8.04 − 7.08 − 1.96√ + ≤ 𝜇1 − 𝜇2 ≤ 8.04 − 7.08 + 1.96√ +
197 175 197 175

0.25 𝑎ñ𝑜𝑠 ≤ 𝜇1 − 𝜇2 ≤ 1.67 𝑎ñ𝑜𝑠

(Semana 5) Prueba de hipótesis para dos variables nominales

Un investigador, cree determinar que los hombres asisten más a un colegio oficial
que las mujeres en Colombia. Para determinar lo anterior, use la “muestra”
encontrada en la semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial


(P6175) y sexo (P6020), realice un diagrama de barras comparativo para los
hombres y mujeres en un solo gráfico. Según los resultados, ¿Existen
diferencias?

Hombre Mujer Total general


No 15 13 28
Sí 36 42 78
51 55 106

Los resultados de la tabla no coinciden con el tamaño de muestra debido a que


muchos datos están en blanco. Por lo tanto solo se utilizó la información
suministrada por la encuesta.
Asistencia a establecimiento oficial

42
36

15
13

HOMBRE MUJER

No Sí

Figura 3. Asistencia a establecimiento oficial.

Según el diagrama de barras, existe una mayor cantidad de mujeres que asisten a
establecimientos públicos que hombres

2. Con un nivel de confianza del 95%, estime e interprete la proporción de


hombres y de mujeres que asisten a un establecimiento oficial.
Para las mujeres
42
𝑝̅ = ≈ 0.76
55

𝑝𝑞
𝑝̅ ± 𝑍𝛼⁄2 √
𝑛

1 − 0.76
0.76 ± 1.96 ∗ √0.76 ∗
55

0.65 ≤ 𝜋 ≤ 0.87

Para los hombres


36
𝑝̅ = ≈ 0.7
51

𝑝𝑞
𝑝̅ ± 𝑍𝛼⁄2 √
𝑛
1 − 0.7
0.7 ± 1.96 ∗ √0.7 ∗
51

0.57 ≤ 𝜋 ≤ 0.82

3. Realice una prueba de hipótesis para determinar la afirmación del


investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de
lo anterior?

𝐻0 : 𝜇1 = 𝜇2

𝐻1 : 𝜇1 < 𝜇2

𝛼 = 0.05

(𝑛1 − 1)𝜎12 − (𝑛2 − 1)𝜎22


𝜎𝑝2 =
𝑛1 + 𝑛2 − 2

𝑥̅1 − 𝑥̅2
𝑡0 =
1 1
√𝜎𝑝2 (
𝑛1 + 𝑛2 )

(55 − 1)3.722 − (51 − 1)3.262


𝜎𝑝2 = = 2.08
55 + 51 − 2

7.08 − 8.04
𝑡0 = = −3.42
√2.08 ( 1 + 1 )
55 51

𝑡 𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = −1.964

Como el 𝑡0 es mayor que el t critico estamos en la zona de rechazo de la hipótesis


nula y por lo tanto los hombres asisten menos a un colegio oficial que las mueres.
Conclusiones

 Hacer uso adecuado de la determinación del tamaño de muestra es


fundamental para contar con suficientes datos que aseguren que la muestra
es representativa de la población.
 Los intervalos de confianza son útiles al momento de hacer aproximaciones
a los valores posibles para un dato de interés dentro de un intervalo.
 La prueba de hipótesis permite aceptar o rechazar una afirmación con base
en criterios estadísticos bien fundamentados.

Referencias

 Freund. J. Estadística elemental. 1994