Вы находитесь на странице: 1из 13

1

Foro Colaborativo – Entrega Final

Trabajo colaborativo
Subgrupo 46

Integrantes:

Villa García Marco Aurelio Código: 1821982583


Longas Pórtela Yuri Claritza Código:
Velásquez Pérez Deisi Julieth Código:
Calvo Pinzón Leydi Alejandra Código: 1811981741

Tutor:

Domínguez Andy

Institución Universitaria Politécnico Grancolombiano


Estadística II
Modalidad virtual
Junio de 2019
2

TABLA DE CONTENIDO

1. INTRODUCCIÓN 3

2. (SEMANA 3) SELECCIÓN DE MUESTRA 4

3. (SEMANA 4) INTERVALO DE CONFIANZA PARA DOS VARIABLES

NUMÉRICAS 7

4. (SEMANA 5) PRUEBA DE HIPÓTESIS PARA DOS VARIABLES NOMINALES

10
3

INTRODUCCIÓN

El desarrollo del siguiente trabajo tiene como objetivo organizar, recolectar, resumir, presentar y

analizar datos, así como el estudio de grupos, series de hecho, datos masivos de individuos que tiene

como propósito logar conclusiones para tomar decisiones razonables de acuerdo con tales

observaciones, para obtener los mejores resultados en cuanto aprendizaje, las competencias y

habilidades están relacionadas con la interpretación argumentación y la proposición de soluciones o

conjeturas que a diario nos llevan a tomar decisiones en contextos cotidianos y profesionales

integrando aspectos de autonomía, liderazgo, responsabilidad, creatividad, puntualidad, honestidad

y respeto .

Contexto

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH), realizada

por el DANE [1]. Esta encuesta se hace en las 13 ciudades principales del Colombia (Bogotá,

Medellín, Cali, barranquilla, Bucaramanga, Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio,

Montería, Cartagena) y 11 ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó,

Neiva, Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se solicita

información sobre las condiciones de empleo de las personas (si trabajan, en qué trabajan, cuánto

ganan, si tienen seguridad social en salud o si están buscando empleo), además de las características

generales de la población como sexo, edad, estado civil y nivel educativo, se pregunta sobre sus

fuentes de ingresos. La GEIH proporciona al país información a nivel nacional, cabecera - resto,

regional, departamental, y para cada una de las capitales de los departamentos.


4

(SEMANA 3) SELECCIÓN DE MUESTRA

1. escoja un tipo de muestreo y argumente la viabilidad de esta técnica para la base de datos
dada. Para seleccionar una muestra debe tenerse en cuenta el cómo seleccionar los
elementos que formarán parte de la muestra (tipo de muestreo) y cuántos elementos
debemos seleccionar (Tamaño de muestra).

El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los


elementos que forman el universo y que por lo tanto están descritos en el marco muestral,
tienen idéntica probabilidad de ser seleccionados para la muestra. Sería algo así como hacer
un sorteo justo entre los individuos del universo: asignamos a cada persona un boleto con
un número correlativo, introducimos los números en una urna y empezamos a extraer al azar
boletos. Todos los individuos que tengan un número extraído de la urna formarían la
muestra. Obviamente, en la práctica, estos métodos pueden automatizarse mediante el uso
de ordenadores.
5

Si como investigador deseas ahorrar tiempo y dinero, el muestreo aleatorio simple es uno de
los mejores métodos de muestreo probabilísticos que puedes utilizar. Este método es, sin duda,
el más conveniente y práctico.

El uso de un censo o una muestra depende de varios factores, como el tipo de censo, el grado
de homogeneidad / heterogeneidad, los costos, el tiempo, la factibilidad de estudiar, el grado
de precisión que se necesita, etc

2. Utilizando la variable género P(6020) determine el tamaño de la muestra seleccionando


adecuadamente justificando:

a. Fórmula a desarrollar

Se aplica la fórmula para el cálculo del tamaño de la muestra para poblaciones finitas
debido a que se tiene un nivel de confianza del 95%
6

𝑛0 = 𝑍 2 ∗ 𝑃 ∗ 𝑄
𝐸2

b. Estimación de la proporción de mujeres

Basado en la información proporcionada en el trabajo de Excel

P = Estimación de la proporción de mujeres

P = 53% → 0.53

c. Nivel de confiabilidad

Con el 95% de confianza se aplica lo siguiente:

0.9500 ÷ 2 = 0.4750 → Se busca en la tabla Z y el resultado es 1.96. Por tanto, Z =


1.96

d. Error de estimación

Basado en la información proporcionada en el trabajo de Excel

E = Error de estimación

E = 5% → 0.05

Desarrollo del ejercicio:

Aplicamos la fórmula: Datos

Z = 1.96 (95%)
P = 0.53 (53%)
Q = 0.47 (47%)
E = 0.05 (5%)
7

𝑛0 = 1.962 ∗ 0.53 ∗ 0,47


0.052

𝑛0 = 0.9669
0.0025

𝑛0 = 382.76

Respuesta: El tamaño de la muestra será de 380 individuos tomados de la población


total

(SEMANA 4) INTERVALO DE CONFIANZA PARA DOS VARIABLES


NUMÉRICAS

Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los
hombres y las mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada
en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los
hombres y mujeres. Según los resultados, ¿Existen diferencias?
8

Histograma Escolaridad - Genero


60 56
53
48 46
50
40 34 32
30 27
20 20
20 17
13
10
10
1 3 0 0 0 0
0
1 4 7 10 13 16 19 22 25
HOMBRES 34 32 20 56 17 10 1 0 0
MUJERES 48 46 20 53 27 13 3 0 0
Marca Clase escolaridad

Si existen diferencias entre los niveles de Escolaridad

Muestra 380

2. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% para
estimar, la escolaridad promedio de los hombres y de las mujeres de forma individual,
en los niveles de estudio de Bachiller, Tecnólogo y Universitario.
9

Z 1,96
N 64
Promedio 12,015625
Varianza 2,58705357
Desviación
estándar 1,60843202

Intervalo de
Confianza + 12,4096908
Intervalo de
Confianza - 11,6215592

Con un 95% de confianza la escolaridad promedio de los hombres esta variando


entre 12,4 y 11,6 años

Z 1,96
n= 74
Promedio
X 12,5
Varianza 3,18493151
Desviación
Estándar 1,78463764

Intervalo
Confianza + 12,9066214
Intervalo
Confianza - 12,0933786

Con un 95% de confianza la escolaridad promedio de las mujeres está variando


entre 13 y 12 años
10

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para
estimar la diferencia promedio de escolaridad para los hombres y mujeres, en los
niveles de estudio de Bachiller, Tecnólogo y Universitario.

HOMBRES MUJERES
Prome 12,0 Prome 12,
dio 15 dio 5
1,60 1,7
D.E 8 D.E 8
N 64 N 74
1,9
Z 1,96 Z 6

Diferencia +
0,08040893
Diferencia -
1,05040893

Con un Intervalo de confianza al 95% para estimar la diferencia promedio de


escolaridad para los hombres y mujeres, en los niveles de estudio de Bachiller, Tecnólogo
y Universitario. Se da como resultado que si existe diferencia

(SEMANA 5) PRUEBA DE HIPÓTESIS PARA DOS VARIABLES


NOMINALES

Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las
mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la semana
3:
11

1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo


(P6020), realice un diagrama de barras comparativo para los hombres y mujeres en un
solo gráfico. Según los resultados, ¿Existen diferencias?

ASISTENCIA A ESTABLECIMIENTO
OFICIAL

180
160
140 163
120
100
136 HOMBRES
80 MUJERES
60

34 47
40
20
0
SI NO

Basándonos en la muestra encontramos diferencias, por ejemplo son 163 mujeres que
asisten a un establecimiento oficinal, siendo más las mujeres que los hombres las que
asisten.

2. Con un nivel de confianza del 95%, estime e interprete la proporción de hombres y de


mujeres que asisten a un establecimiento oficial.

SI NO Promedio
136 34 HOMBRES 85
163 47 MUJERES 105
299 81 TOTAL 190

Muestra de 380 personas


12

HOMBRES MUJERES
Promedio 85 Promedio 105
Desviació Desviación
n estándar 1,60 estándar 1,78
Asistencia 136 Asistencia 163
Confianza 1,96 Confianza 1,96

Diferencia -
+ 19,61566868
Diferencia -
- 20,38433132

Con un nivel de confianza del 95% no existe diferencia en la proporción de hombres y de


mujeres que asisten a un establecimiento oficial.

3. Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice
un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?

Confianza 95%
Promedio X 95
Desviación
Estándar 1,78
Tamaño
muestra 380

z 1,96
significancia 0,05
13

Intervalo
Confianza + 94,82
Intervalo
Confianza - 95,18
diferencia -0,36

Podemos decir que nuestro nivel de confianza es del 94,82; que por cada 299
personas asisten a establecimientos públicos de una muestra de 380.

Вам также может понравиться