Вы находитесь на странице: 1из 14

DESARROLLO DEL TRABAJO COLABORATIVO

ESTADISTICA II

PRESENTADO POR:
SONIA RODRIGUEZ TELLEZ 1811980236
ERYKA ORDOÑEZ TRIANA 1811980488
JULIE GOMEZ BARON 1811983500
DEISY ALEJANDRA OCAMPO AREVALO 1811980976
LAURA CAMILA PEÑA COCA 1721980648

PRESENTADO A:
SEBASTIAN MORENO RODRIGUEZ

ADMINISTRACION DE EMPRESAS
POLITECNICO GRAN COLOMBIANO
BOGOTÁ
2018
OBJETIVO GENERAL

Este trabajo colaborativo está basado en el aprendizaje del módulo Estadística en el cual
aprenderemos temas de estadística descriptiva, el muestreo de una población y
estimación de parámetros también planteamientos de pruebas de hipótesis y un análisis
de datos.

OBJETIVOS ESPECIFICOS

Buscamos aprender, evaluar e implementar las distintas metodologías de estadística,


utilizando histograma, población, muestra y variable para hallar los resultados de los datos
solicitados.
Aprendizaje en temas como tamaño muestral, variable en la cual se encuentra cada una
donde podemos medir condiciones dadas en el trabajo colaborativo que será de gran
importancia para aplicar en nuestras vidas.
DESARROLLO DE LA ACTIVIDAD
A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH),
realizada por el DANE[1]. Esta encuesta se hace en las 13 ciudades principales del
Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga, Manizales, Pasto, Pereira,
Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11 ciudades intermedias (Tunja,
Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia,
Sincelejo, San Andrés). Esta encuesta, se solicita información sobre las condiciones de
empleo de las personas (si trabajan, en qué trabajan, cuánto ganan, si tienen seguridad
social en salud o si están buscando empleo), además de las características generales de
la población como sexo, edad, estado civil y nivel educativo, se pregunta sobre sus
fuentes de ingresos. La GEIH proporciona al país información a nivel nacional, cabecera -
resto, regional, departamental, y para cada una de las capitales de los departamentos.

Base de datos: en el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información sobre


las características generales de las personas que respondieron en un mes en particular.
Para este trabajo colaborativo, realice lo siguiente:

(Semana 3) Selección de muestra

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos


los elementos de una población), se selecciona una muestra, entendiendo por tal una
parte representativa de la población. En ese sentido, escoja un tipo de muestreo y
argumente la viabilidad de esta técnica para la base de datos dada. Para seleccionar
una muestra debe tenerse en cuenta el cómo seleccionar los elementos que formarán
parte de la muestra (tipo de muestreo) y cuántos elementos debemos seleccionar
(Tamaño de muestra).

Para sacar nuestra muestra hacemos uso del método aleatorio simple en cada estrato
y así tenemos nuestra muestra total de 1049 individuos, lo que hice inicialmente fue
dividir el censo por estratos o departamentos, de cada uno tomar ciertas cantidades y
finalmente consolidar lo que sería la muestra total de 1049 individuos.

2. Utilizando la variable género P(6020) determine el tamaño de la muestra seleccionando


adecuadamente y justificando:

a. Fórmula a desarrollar
b. Estimación de la proporción de mujeres, según nuestra muestra
determinamos que:
c. Nivel de confiabilidad, 95%
d. Error de estimación, 3%

(Semana 4) Intervalo de confianza para dos variables numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de estudio de
los hombres y las mujeres en Colombia. Para determinar lo anterior, use la “muestra”
encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma


para los hombres y mujeres. Según los resultados, ¿Existen diferencias?
En la realización de los histogramas se tomó el nivel de escolaridad tanto de hombres
como mujeres y se agrupo de la siguiente manera
En el análisis de estos histogramas se ve una tendencia muy similar en los niveles de
escolaridad de hombres y mujeres teniendo presente la relación de cantidad de ellos.
Resalta que en el grado de escolaridad de estudios superiores (17 al 23) se ve más
cantidad de hombres que mujeres aproximadamente un 50% más que las mujeres.

2. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95%
para estimar, la escolaridad promedio de los hombres y de las mujeres de forma
individual, en los niveles de estudio de Bachiller, Tecnólogo y Universitario.

El intervalo de confianza para estimar la escolaridad estará medido por el nivel de


escolaridad y el margen de error, recordemos que nuestra muestra es de 1049 individuos,
de los cuales 501 son hombres y 549 mujeres, dentro del grupo de los hombres tenemos
que: 128 son Bachilleres, 30 Tecnólogos y 43 Universitarios, tal como se muestra en la
siguiente tabla; lo primero que hago es calcular el Promedio de escolaridad, entonces
tomo la sumatoria del nivel de escolaridad para los 128 Bachilleres Hombres de mi
muestra y eso me da como resultado 1476 y lo divido por el total de bachilleres hombres
de la muestra y tengo como resultado un Promedio de escolaridad o Media de 11.53, es
así como primero halle la medio de los niveles de escolaridad de Bachilleres, Tecnólogos
y universitarios, tanto de hombres como mujeres
Luego se debe calcular el sigma o varianza, que es la sumatoria de todos los X, menos
los X promedio y todo elevado al cuadrado sobre "n", y a ese resultado le sacamos raíz
cuadrada.
Para el ejercicio entonces mi X sera el valor de escolaridad, si es bachiller vale en
promedio 11, a ese valor le resto 11.53 que es mi X promedio o Media, luego a ese
resultado le saco raíz cuadrada y tengo un resultado de 0.28, hice ese procedimiento con
los 128 bachilleres, lo mismo para los tecnólogos y universitarios tanto de hombres como
mujeres, continuando con el caso de bachilleres hombres sume los 128 resultados
(0.28+0,22+6,99....) aclaro que no todos los 128 dieron el mismo resultado(0.28), pues
dentro de dicho grupo entran personas que tiene nivel de escolaridad 10, 11, 12 o 14 y
hacen parte de los bachilleres, entonces tenemos que la suma total es de 248 que se
dividen sobre "n" que para bachilleres es 128 personas y al resultado le saco la raiz
cuadrada teniendo un resultado de 1.39, confirmo nuevamente, el mismo proceso es para
hombres y mujeres:

Luego necesito determinar mi margen de error, nos piden utilizar un nivel de


confianza de 95%, lo que equivale a decir 1.96, ese valor se multiplica por el
Zigma y se divide sobre la Raíz cuadrada de N, tenemos entonces para los
bachilleres que: 1.96*(1.39/ 128)=0.24, de la misma manera se aplicó el
procedimiento tanto en hombres como mujeres:
Ya con esta información puedo construir los intervalos de confianza de hombre y
mujeres para los niveles de escolaridad de Bachilleres, Tecnólogos y
Universitarios:

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95%
para estimar la diferencia promedio de escolaridad para los hombres y mujeres, en
los niveles de estudio de Bachiller, Tecnólogo y Universitario.

(Semana 5) Prueba de hipótesis para dos variables nominales


Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las
mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la
semana 3:
1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y
sexo (P6020), realice un diagrama de barras comparativo para los hombres y
mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?

La diferencia que podemos encontrar es que los hombres asisten mas a los
establecimientos oficiales que las mujeres.
2. Con un nivel de confianza del 95%, estime e interprete la proporción de hombres
y de mujeres que asisten a un establecimiento oficial.

Una vez aplicada la fórmula de proporción, podemos confirmar como se hizo en el


diagrama que son los hombres los que asisten más a los establecimientos
oficiales.

3. Realice una prueba de hipótesis para determinar la afirmación del investigador.


Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?

Lo primero es plantear dos hipótesis, una donde se afirma que efectivamente de


los 501 hombres de la muestra, 103 asisten a establecimientos oficiales, la otra
hipótesis seria lo contrario a dicha afirmación, nos dan un nivel de significancia del
5% el cual debemos trabajar en porcentaje, tendremos entonces 0.05; otro
elemento que necesitamos para el cálculo de la hipótesis es el probabilístico de
prueba o P estimado, que se obtiene de dividir la población favorable, es decir las
personas que asisten a establecimientos oficiales (hombre y mujeres) sobre el
total de la muestra
:

Ya con esta información podemos determinar si se acepta o no la


hipótesis, Teniendo en cuenta que alfa es 0.05, la dividimos en dos para cada
región y tenemos un resultado de 0.025, Es necesario hallar dicho valor en la
siguiente tabla de valores de probabilidad
CONCLUSIONES

En estadística se centra en la descripción de un conjunto de observaciones que pueden


ser una población o una muestra, los resultados se pueden considerar exactos.
La concentración de datos es más realista con este método
Al realizar este trabajo nos damos cuenta de que en la enseñanza-aprendizaje en el uso
de casos reales para tratar temas de estadística se consideran de gran utilidad para
comprender de mejor manera la importancia de esta área además de saber su correcta
utilización la cual nos facilitara nuestro trabajo profesional y formación académica.
REFERENCIAS

 Cartillas 1 ,2 3, 4 y 5
 Conferencias
 https://www.netquest.com/blog/es/que-tamano-de-muestra-necesito

Вам также может понравиться