Вы находитесь на странице: 1из 10

Tamaño de muestra

Utilizando la variable edad (P6040), realice lo siguiente:


● Realice un histograma y describa la información según la forma y la curtosis de los
datos.

El en histograma se evidencia lo siguiente:

Clase Frecuencia
10 55
20 68
30 56
40 50
50 52
60 42
70 31
80 11
90 5
y mayor... 0

Histograma
80
70
60
Frecuencia

50
40
30
20 Frecuencia
10
0

Clase

En el histograma se puede evidenciar que la asimetría de la distribución en la edad de la


muestra de la población tiene un sesgo positivo, por lo cual la moda del conjunto de datos
es mayor a la mediana y la misma es mayor a la media, adicional a que la curtosis es
platicurtica dado que la frecuencia de los datos no cuenta con grandes variaciones.
 Realice una descripción numérica y descripción como es la población.

porcentaje de
Clase Frecuencia Análisis
participación
10 55 15% El 15% tiene una edad entre los 0 y 10 años
20 68 18% El 18% tiene una edad entre los 10 y 20 años
30 56 15% El 15% tiene una edad entre los 20 y 30 años
40 50 14% El 14% tiene una edad entre los 30 y 40 años
50 52 14% El 14% tiene una edad entre los 40 y 50 años
60 42 11% El 11% tiene una edad entre los 50 y 60 años
70 31 8% El 8% tiene una edad entre los 60 y 70 años
80 11 3% El 3% tiene una edad entre los 70 y 80 años
90 5 1% El 1% tiene una edad entre los 80 y 90 años
Total 370 100%

Se puede evidenciar que la desviación estándar es alta por lo cual los datos no son
simétricos, de igual manera concluimos lo siguiente el 18% de la muestra de la población
tiene una edad de 10 a 20 años y que el 15% tiene entre 20 y 30 años, por otro lado el 28%
entre 30 y 50 años, lo que nos indica que la mayoría de la población se ubica en una edad
menor a los 60 años, por lo cual podemos evidenciar que en los departamentos analizados
las edades más frecuentes son la niñez, la adolescencia, los adultos jóvenes y los adultos,
la menor cantidad está en los adultos mayores, donde también se evidencia que la
desviación estándar ya que los datos no son simétricos.

● Calcule una nueva variable que sea el

En cuanto a la realización de ala variable se tomo en cuenta lo siguiente:

Clase Frecuencia
5 67
10 121
15 125
20 57
y mayor... 0
Histograma
150
Frecuencia 100

50
Frecuencia
0
5 10 15 20 y mayor...
Clase

En el histograma de P6040NEW se puede evidenciar que la asimetría de la distribución en la


edad de la muestra de la población es normal, adicional a que la curtosis es mesocúrtica
dado que la frecuencia de los datos cuenta con variaciones medias.

● Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra,


utilizando la siguiente fórmula:

Donde, se tiene lo siguiente:

Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se


establezca.
S: Es la desviación estándar de la variable.

Es el margen de error absoluto.

Para el calculo de la muestra utilizo lo siguiente:

1.962 ∗ 20.882657
𝑛0 = = 320.891260
0.52
320.891260
𝑛= = 319.193763
320.891260
1+
60356

Así que la muestra a tomar es de 320.

Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen
de error de absoluto que no supere 0.5.
Z=1.96
S=4.5266
Margen de error de 0.5

1.962 4.52662
𝑛0 = = 314.8591
0.52
314.8591
𝑛= = 170.1048
314.8591
1+ 370

Se tomará una muestra de 170

● Teniendo en cuenta los resultados anteriores, realice una selección de elementos


para una muestra, utilizando el algoritmo del coordinado negativo.
A cada individuo se le asigna una probabilidad aleatoria generada de una distribución
uniforme 0,1 luego se ordenan los datos de menor a mayor tomando como referencia la
probabilidad. Luego selecciono los 170 primeros datos

● Compara la media poblacional, con la media muestral y determine la variación


relativa.
Para calcular la variación relativa usamos:

𝑠 20.524209
𝑐𝑣 = ∗ 100% = ∗ 100% = 59.1576%
𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 34.69411
Vemos que la variación relativa es alta, por lo tanto, tenemos en esta nueva muestra mucha
variación de las edades, es decir los datos esta muy dispersos, ahora comparando la edad
poblacional con la edad muestral vemos que la muestral es mayor que la poblacional, es
decir, la edad promedio poblacional es de 33.5486 años y la muestral es de 34.694 años,
vemos que se incremento un poco la edad de esta nueva muestra.
Intervalo de confianza para dos variables numéricas
Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los
hombres y las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base
de la hoja “muestra” y realizar lo siguiente:

● Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para


los hombres y mujeres. Según los resultados, ¿Existen diferencias?

Cuenta de
P6020 P6020
Hombre 163
Mujer 207

250

200

150
Escolaridad

100

50

0
HOMBRE MUJER

Como vemos el grado de escolaridad en las mujeres es mas alto que en los hombres como
vemos hay mas frecuencia de mujeres que hombres, posiblemente eso ayude a que las
mujeres tengas mayor escolaridad.

● Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables.


Realice lectura de resultados.
ESC Hombre ESC Mujeres

Media 6,766871166 Media 7,946859903


Error típico 0,374484478 Error típico 0,334541761
Mediana 6 Mediana 8
Moda 11 Moda 11
Desviación estándar 4,781097751 Desviación estándar 4,813217773
Varianza de la muestra 22,85889571 Varianza de la muestra 23,16706533
Curtosis -0,82165222 Curtosis -0,89303957
Coeficiente de Coeficiente de
asimetría 0,31210214 asimetría -0,09231937
Rango 18 Rango 19
Mínimo 0 Mínimo 0
Máximo 18 Máximo 19
Suma 1103 Suma 1645
Cuenta 163 Cuenta 207
Como vemos el la media del escolaridad de los hombres es menor que la de las
mujeres, ambos tiene desviaciones estándar muestrales muy similares.

● Asumiendo que los datos son normales, calcule un intervalo de confianza del 95%
y determine, la escolaridad de los hombres y de las mujeres de forma individual.
Intervalo de confianza para las mujeres:
4.8132
7.9468 ± 𝑇207−1,0.025
√207
Calculado el 𝑡206 ,0.025 = 1.97 de la tabla de la normal. Se tiene que el intervalo de
confianza con un nivel de significancia del 5% es de
4.8132
7.9468 ± 1.97 ∗
√207

(7.2877,8.6058)

Intervalo de confianza para las Hombres:

4.7810
6.7668 ± 𝑇163−1,0.025
√163
Calculado el 𝑡162 ,0.025 = 1.97 de la tabla de la normal. Se tiene que el intervalo de
confianza con un nivel de significancia del 5% es de
4.7810
6.7668 ± 1.97 ∗
√163

(6.0290,7.5045)

● Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95%
para la diferencia de los niveles de escolaridad para los hombres y mujeres.
4.81322 4.78102
7.9468 − 6.7668 ± 𝑡𝑉,0.025 √ +
207 163
2 2
4.8132 4.7810
[ + ]2
Donde 𝑣 = = 348.96
207 163
2 2
4.81322 4.78102
( 207
) ( 163 )
+
207−1 163−1
Se tiene que v es 349, y calculando la así que calculando 𝑡349,,0.025 = 1.96 el intervalo de
confianza da que es:

4.81322 4.78102
1.18 ± 1.96√ +
207 163
(0.1957,2.1642)

Prueba de hipótesis para dos variables nominales


Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las
mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja de
“muestra” y realizar lo siguiente:

Antes de realizar las siguientes pregunta se planea la siguiente tabla para tener una mejor
comprensión sobre la información que se pretende investigar

Percepción del
encuestado
Sexo No No Sí Total
Responde general
Hombre 12 118 33 163
Mujer 13 153 41 207
Total general 25 271 74 370

Ahora se planea la proporción


Percepción del
encuestado
Sexo Sí No No Total
Responde general
Hombre 20,25% 72,39% 7,36% 100,00%
Mujer 19,81% 73,91% 6,28% 100,00%
Total general 20,00% 73,24% 6,76% 100,00%

● Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y


sexo (P6020), realice un diagrama de barras comparativo para los hombres y
mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?

EL ESTABLECIMIENTO AL QUE ASISTE ... ¿ES


OFICIAL?
80.00%

70.00% 72.39% 73.91%

60.00%

50.00%

40.00%
No Responde

30.00% No

20.00%
20.25% 19.81%
10.00%
7.36% 6.28%
0.00%
Hombre Mujer

de la gráfica comparando hombres con mujeres, los que dicen que si que asistieron a un
colegio oficial (barra azul) es muy poca, para hombres es de 20.25%, mientras que las
mujeres es de 19,81%, esta diferencia muy pequeña, seguido tenemos la información de
los que “No Responde” esta tiene la proporción mas grande en ambos sexos, finalmente
los que responden “No” (barra gris) son muy poquitos en comparación con las otras
respuestas, en ambos notamos que la diferencia entre hombres y mujeres respondiendo a
esta pregunta es muy similar.

Para los siguientes puntos usaremos la fórmula:


𝑝̂ ∗ (1 − 𝑝̂ )
𝑝̂ ± 𝑍𝛼 √
2 𝑛
Con 𝑍0.05 = 1.96 n=370
2

● Con un nivel de confianza del 95%, realice una estimación de los hombres que
asisten a un establecimiento oficial.
Estimamos la proporción de hombres que afirman que asistieron a colegio oficial, la
información la tomamos de la tabla anterior

33
𝑃= = 0.2025
163

0.2025 ∗ (1 − 0.2025)
0.2025 ± 1.96√
163

El intervalo de confianza para la proporción de hombres es (0.1408,0.2641)


Por lo tanto, con una confianza del 95% de que el intervalo de confianza contenga
el verdadero valor de la proporción de hombres que afirman que sí.

● Con un nivel de confianza del 95%, realice una estimación de las mujeres que
asisten a un establecimiento oficial.
41
𝑃= = 0.1981
207

0.1981 ∗ (1 − 0.1981)
0.1981 ± 1.96√
207

El intervalo de confianza para la proporción de mujeres es (0.1438, 0.2523) lo cual


nos indica que con una confianza del 95% el intervalo de confianza contiene el
verdadero valor de la proporción poblacional de las mujeres que afirman que si
asistieron a colegio oficial

● Realice una prueba de hipótesis para determinar la afirmación del investigador.


Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?
Prueba de Hipótesis a trabajar
𝐻0 : 𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 = 𝑃𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑣𝑠 𝐻𝑎 : 𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 > 𝑃𝑀𝑢𝑗𝑒𝑟𝑒𝑠

Estadístico de prueba:

𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 − 𝑃𝑚𝑢𝑗𝑒𝑟𝑒𝑠 − (𝜋1 − 𝜋2 )


𝑍=
𝑃𝑚𝑢𝑗𝑒𝑟𝑒𝑠 ∗ (1 − 𝑃𝑚𝑢𝑗𝑒𝑟𝑒𝑠 )
√𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 ∗ (1 − 𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 ) +
𝑛 𝑚

Información para reemplazar en el estadístico de prueba

n=163 𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 = 0.2025


m=207 𝑃𝑚𝑢𝑗𝑒𝑟𝑒𝑠 = 0.1981
(𝜋1 − 𝜋2 ) = 0

0.2025 − 0.1981 − 0
𝑍= = 0.1049351
√0.2025 ∗ (1 − 0.2025) + 0.1981 ∗ (1 − 0.1981)
163 207

Se calcula el siguiente el valor crítico con un nivel de significancia es del 5%


𝑍𝛼 = 𝑍0.05 = 1.64

El valor critico lo comparamos con el valor de Z, vemos que el valor de Z es menor al


valor crítico, ósea 0.1049 < 1.64 entonces concluimos, con una confianza del 95% que la
proporción de mujeres y hombres que afirman asistir a colegios oficiales es igual.
Ósea la hipótesis nula 𝐻0 𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 = 𝑃𝑚𝑢𝑗𝑒𝑟𝑒𝑠 no se rechaza.

Вам также может понравиться