Вы находитесь на странице: 1из 13

PROYECTO DE ESTADÍSTICA

TEMA:
“COMPARACIÓN DEL PROMEDIO GENERAL
ENTRE HOMBRES Y MUJERES QUE CURSAN LA
MATERIA DE ESTADÍSTICA”

INTEGRANTES:
Carreño Carreño Alex
León Tapia Grace
Ortiz Robayo Anthony
Ureta Andrade Paul

DOCENTE:
Msc. Sandra González

PARALELO: 17

PERIODO:
2S (2018 – 2019)
INTRODUCCIÓN AL TEMA DEL PROYECTO

Hoy en día la equidad de género se practica en casi todos los países del mundo, como es el caso
de Ecuador, sin embargo, es un tema que aún se debate. La equidad de género en la educación es
fundamental, debido a que es una condición necesaria para garantizar la inclusión de amplios
sectores poblacionales como por ejemplo en la economía.

Hoy en día la equidad de género se fomenta como condición necesaria asociada al desarrollo no
sólo económico y social, sino al desarrollo humano. En ESPOL la cantidad de estudiantes mujeres
que estudian carreras de ingeniería cada semestre va en aumento y se tiene la teoría de que su
promedio general no se diferencia mucho al de los hombres. En este proyecto deseamos comparar
el promedio general de estudiantes que cursan la materia de estadística en el II termino 2018-
2019, esta comparación la realizamos entre hombres y mujeres para tener una idea estadística de
cual genero tiene mayor nota general.

En el desarrollo de este trabajo también deseamos analizar los factores que influyen para que los
estudiantes logren obtener una excelente nota académica, ya que es una realidad que actualmente
consideramos al rendimiento académico como único medidor de las capacidades intelectuales de
un estudiante, sin embargo, existen estudios que comprueban que existen otros factores
elementales que garantizan el éxito académico, como son la alimentación, el entorno familiar, el
factor económico, entre otros. En este trabajo estudiaremos como la alimentación y la satisfacción
de la vida del estudiante contribuyen a que un género logre el mejor promedio de notas
estudiantiles.

METODOLOGÍA EMPLEADA PARA LA DETERMINACIÓN DE LA MUESTRA

El presente proyecto estadístico está enfocado en analizar si existe una gran diferencia entre las
notas académicas de estudiantes hombres y mujeres, así como conocer el valor de este,
adicionalmente deseamos comparar el comportamiento de los datos cualitativos, escogidos para
este trabajo, esto lo conseguimos mediante la aplicación de técnicas de estadística descriptiva e
inferencial.

Los datos obtenidos son de naturaleza cualitativa y cuantitativa, por lo que se desarrolló un
análisis descriptivo de las variables escogidas de la sección datos sociodemográficos, apoyo
familiar y hábitos alimentarios. Ha sido fundamental realizar un análisis estadístico bivariado
como pruebas de independencia para tener una idea de la relación entre las variables escogidas y
el género del estudiante.

Para llegar a las conclusiones obtenidas hemos aplicado intervalos de confianza, prueba de
hipótesis, bondad de ajuste y análisis de contingencia.
Determinación del tamaño de la muestra y levantamiento de información

Los datos poblacionales obtenidos del archivo “Base de datos - 1.xlsx”, el cual está conformado
por información proporcionada por 510 estudiantes de la materia de Estadística en Espol, de los
cuales para nuestro trabajo tomamos una muestra de 340 datos, 140 estudiantes mujeres y 140
estudiantes varones.

Fue conveniente tomar el tamaño de la muestra iguales tanto para hombres como mujeres que
estudian distintas carreras con la finalidad de realizar una comparación equitativa de los datos.

ANÁLISIS UNIVARIADO
Datos:

X = mujeres
Y = Hombres
N (muestra total) = 340
n1 (muestra de mujeres) = 170
n2 (muestra de hombres) = 170

Dato sociodemográfico seleccionado:


• Promedio
Otras variables para considerar:
• Alimentación: ¿Desayuna?
• Satisfacción de vida: ¿Soy feliz con mi vida
Los siguientes cálculos se basan en el promedio:

Promedio Mujeres (170)


6,00 6,84 7,00 7,00 7,00 7,15 7,28 7,35 7,41 7,56
6,10 6,90 7,00 7,00 7,03 7,15 7,29 7,36 7,45 7,57
6,15 6,95 7,00 7,00 7,03 7,2 7,31 7,36 7,50 7,58
6,50 6,95 7,00 7,00 7,06 7,2 7,31 7,38 7,51 7,58
6,54 6,99 7,00 7,00 7,09 7,2 7,32 7,39 7,52 7,58
6,60 7,00 7,00 7,00 7,09 7,21 7,32 7,39 7,52 7,59
6,79 7,00 7,00 7,00 7,10 7,22 7,33 7,40 7,54 7,59
6,79 7,00 7,00 7,00 7,11 7,23 7,33 7,40 7,55 7,59
6,81 7,00 7,00 7,00 7,13 7,24 7,34 7,40 7,55 7,60
6,84 7,00 7,00 7,00 7,13 7,26 7,35 7,41 7,56 7,60
7,62 7,69 7,78 7,85 7,90 7,94 8,00 8,00 8,27 8,49
7,62 7,69 7,78 7,85 7,90 7,94 8,00 8,00 8,33 8,50
7,63 7,70 7,80 7,85 7,90 7,99 8,00 8,05 8,33 8,50
7,64 7,73 7,81 7,89 7,91 8,00 8,00 8,05 8,33 8,60
7,65 7,74 7,83 7,89 7,91 8,00 8,00 8,17 8,33 8,72
7,66 7,75 7,83 7,89 7,91 8,00 8,00 8,18 8,35 8,85
7,66 7,76 7,85 7,89 7,94 8,00 8,00 8,21 8,42 8,93

Media X

170
𝑋𝑖 (6.00 + 6.10 + 6.15 + ⋯ … … … … … . . +8.72 + 8.85 + 8.93)
𝑋̅ = ∑ =
𝑛1 170
𝑖=1

𝑋̅ = 7.50
Varianza X

170
2
(X i − ̅
X)2 (6.00 − 7.5)2 + (6.10 − 7.5)2 + ⋯ . + (8.85 − 7.5)2 + (8.93 − 7.5)2
Sx = ∑ =
n1 − 1 170 − 1
i=1

𝑆𝑥 2 = 0.269
Desviación estándar

𝑆𝑥 = √𝑆𝑥 2 = √0.29

𝑆𝑥 = 0.519
Tabla de frecuencia

𝑅𝑎𝑛𝑔𝑜 = 𝑋𝑛 − 𝑋1 𝑅𝑎𝑛𝑔𝑜 = 8.93 – 6.00 𝑅 = 2.93

𝑘 = 1 + 3.32 log(𝑛1) 𝑘 = 1 + 3.32 log(170) 𝑘 = 8.405

𝑅 2.93
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑘
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 8.405 𝐴 = 0.3486
i Clase Marca de Frecuencia Frecuencia Frecuencia Frecuencia
clase absoluta relativa absoluta relativa
acumulada acumulada
1 [6.00 – 6.35) 6,17 3 0.02 3 0.02
2 [6.35 – 6.70) 6,52 3 0.02 6 0.04
3 [6.70 – 7.04) 6,87 37 0.22 43 0.26
4 (7.04 – 7.39) 7,21 31 0.18 74 0.44
5 [7.39 – 7.74) 7,56 37 0.22 111 0.66
6 [7.74 – 8.09) 7,91 42 0.24 153 0.90
7 [8.09 – 8.44) 8,26 10 0.06 163 0.96
8 [8.44 – 8.78) 8,61 7 0.04 170 1

Gráficos

Histograma
45
40
35
30
25
20
15
10
5
0
6,175 6,525 6,87 7,215 7,565 7,915 8,265 8,61

Poligono de frecuencias
45
40
35
30
25
20
15
10
5
0
6,175 6,525 6,87 7,215 7,565 7,915 8,265 8,61
Ojiva
180
160
140
120
100
80
60
40
20
0
6 6,5 7 7,5 8 8,5 9

Promedio Hombres (170)

6,00 6,96 7,00 7,13 7,23 7,39 7,51 7,60 7,75 7,92
6,00 6,98 7,00 7,13 7,25 7,4 7,51 7,60 7,76 7,98
6,00 7,00 7,00 7,14 7,25 7,42 7,52 7,60 7,76 8,00
6,20 7,00 7,00 7,14 7,25 7,43 7,52 7,61 7,78 8,00
6,47 7,00 7,00 7,15 7,30 7,43 7,53 7,64 7,81 8,00
6,67 7,00 7,00 7,17 7,30 7,44 7,55 7,65 7,81 8,00
6,72 7,00 7,00 7,17 7,31 7,44 7,55 7,66 7,82 8,02
6,75 7,00 7,00 7,17 7,32 7,44 7,55 7,66 7,83 8,10
6,77 7,00 7,00 7,18 7,32 7,44 7,55 7,67 7,83 8,12
6,80 7,00 7,00 7,19 7,33 7,45 7,55 7,68 7,83 8,12
6,82 7,00 7,01 7,19 7,33 7,47 7,55 7,69 7,85 8,14
6,85 7,00 7,03 7,19 7,33 7,47 7,55 7,71 7,85 8,24
6,87 7,00 7,05 7,20 7,33 7,47 7,57 7,71 7,86 8,25
6,88 7,00 7,07 7,20 7,35 7,48 7,57 7,73 7,87 8,32
6,90 7,00 7,08 7,20 7,35 7,48 7,57 7,73 7,89 8,33
6,90 7,00 7,10 7,22 7,37 7,50 7,58 7,74 7,9 8,57
6,96 7,00 7,12 7,22 7,39 7,50 7,59 7,75 7,9 8,73

Media X
170
𝑌𝑖 (6.0 + 6.00 + 6.00 + ⋯ … … … … … . . +8.33 + 8.57 + 8.73)
𝑌̅ = ∑ =
𝑛2 170
𝑖=1

𝑌̅ = 7.38

Varianza X

170
̅ )2
(X i − X
2
Sy = ∑
n2 − 1
i=1
(6.00 − 7.38)2 + (6.00 − 7.38)2 + ⋯ + (8.57 − 7.38)2 + (8.73 − 7.38)2
=
170 − 1
𝑆𝑦 2 = 0.201
Desviación estándar

𝑆𝑦 = √𝑆𝑦 2 = √0.201

𝑆𝑦 = 0.448

Tabla de frecuencia

𝑅𝑎𝑛𝑔𝑜 = 𝑋𝑛 − 𝑋1 𝑅𝑎𝑛𝑔𝑜 = 8.73 – 6.00 𝑅 = 2.73

𝑘 = 1 + 3.32 log(𝑛1) 𝑘 = 1 + 3.32 log(170) 𝑘 = 8.405


𝑅 2.73
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑘
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 8
𝐴 = 0.35

i Clase Marca Frecuencia Frecuencia Frecuencia


de Frecuencia Absoluta Relativa Relativa
Clase Absoluta Acumulada Acumulada
1 [6.00 – 6.35] 6,175 4 4 0.024 0.024
2 [6.35 – 6.70] 6,525 2 6 0.012 0.035
3 [6.70 – 7.05] 6,875 40 46 0.235 0.270
4 [7.05 – 7.40] 7,225 40 86 0.235 0.506
5 [7.40 – 7.75] 7,575 49 135 0.288 0.794
6 [7.75 – 8.10] 7,925 25 160 0.147 0.941
7 [8.10 – 8.45] 8,275 8 168 0.047 0.988
8 [8.45 – 8.80] 8,625 2 170 0.012 1

Gráficos

Histograma
60

50

40

30

20

10

0
6,175 6,525 6,875 7,225 7,575 7,925 8,275 8,625
Poligono de frecuencias
60

50

40

30

20

10

0
6,175 6,525 6,875 7,225 7,575 7,925 8,275 8,625

Ojiva
180
160
140
120
100
80
60
40
20
0
6 6,5 7 7,5 8 8,5 9

ANALISIS BIVARIADO

Tabla de contingencia 1:

GÈNERO

Mujeres Hombres TOTAL


Sí 67 57 124
NO DESAYUNA
No 103 113 216
TOTAL 170 170 340
HIPÒTESIS
Ho: El factor “GÈNERO” es estocásticamente independiente del factor “NO DESAYUNA”
Vs
H1: El factor “GÈNERO” no es estocásticamente independiente del factor “NO DESAYUNA”
Con 95%de confianza rechace Ho en favor de H1 si:

Donde:

(𝒕𝒐𝒕𝒂𝒍 𝒅𝒆 𝒇𝒊𝒍𝒂𝒔)(𝒕𝒐𝒕𝒂𝒍 𝒄𝒐𝒍𝒖𝒎𝒏𝒂𝒔)


𝒆𝒊, 𝒋 =
𝒕𝒐𝒕𝒂𝒍

𝒆𝒊, 𝒋 Mujeres Hombres


Sí 62 62
No 108 108

(𝟔𝟕 − 𝟔𝟐)𝟐 (𝟓𝟕 − 𝟔𝟐)𝟐 (𝟏𝟎𝟑 − 𝟏𝟎𝟖)𝟐 (𝟏𝟏𝟑 − 𝟏𝟎𝟖)𝟐


𝒙𝟐 = + + + = 𝟏. 𝟐𝟕
𝟔𝟐 𝟔𝟐 𝟏𝟎𝟖 𝟏𝟎𝟖

(r-1)(k-1) = (2-1)(2-1) = 3.84


Como 1,27 no es mayor a 3.84 , no se rechaza Ho ya que no existe suficiente evidencia, es decir
que El factor “GÈNERO” es estocásticamente independiente del factor “NO DESAYUNA”

Tabla de contingencia 2:

GÈNERO

Mujeres Hombres TOTAL


SOY FELIZ CON Sí 54 59 113
MI VIDA No 8 8 16
Casi si 51 60 111
Casi no 10 7 17
Ni sí, Ni no 47 36 83
TOTAL 170 170 340
HIPÒTESIS
Ho: El factor “GÈNERO” es estocásticamente independiente del factor “SOY FELIZ CON MI
VIDA”

Vs
H1: El factor “GÈNERO” no es estocásticamente independiente del factor “SOY FELIZ CON
MI VIDA”

Con 95%de confianza rechace Ho en favor de H1 si:

Donde:

(𝒕𝒐𝒕𝒂𝒍 𝒅𝒆 𝒇𝒊𝒍𝒂𝒔)(𝒕𝒐𝒕𝒂𝒍 𝒄𝒐𝒍𝒖𝒎𝒏𝒂𝒔)


𝒆𝒊, 𝒋 =
𝒕𝒐𝒕𝒂𝒍
𝒆𝒊, 𝒋 Mujeres Hombres
Sí 56.50 56.50
No 8 8
Casi si 55.5 55.5
Casi no 8.5 8.5
Ni sí, Ni no 41.5 41.5

(𝟓𝟒 − 𝟓𝟔. 𝟓)𝟐 (𝟓𝟗 − 𝟓𝟔. 𝟓)𝟐 (𝟖 − 𝟖)𝟐 (𝟖 − 𝟖)𝟐 (𝟓𝟏 − 𝟓𝟓. 𝟓)𝟐
𝒙𝟐 = + + + +
𝟓𝟔. 𝟓 𝟓𝟔. 𝟓 𝟖 𝟖 𝟓𝟓. 𝟓
(𝟔𝟎 − 𝟓𝟓. 𝟓)𝟐 (𝟏𝟎 − 𝟖. 𝟓)𝟐 (𝟕 − 𝟖. 𝟓)𝟐 (𝟒𝟕 − 𝟒𝟏. 𝟓)𝟐
+ + + +
𝟓𝟓. 𝟓 𝟖. 𝟓 𝟖. 𝟓 𝟒𝟏. 𝟓
(𝟑𝟔 − 𝟒𝟏. 𝟓)𝟐
+ = 𝟑. 𝟔𝟕
𝟒𝟏. 𝟓

(r-1)(k-1) = (2-1)(2-1) = 3.84

Como 3.67 no es mayor a 3.84, no se rechaza Ho, ya que no existe suficiente evidencia, es decir
que El factor “GÈNERO” es estocásticamente independiente del factor “SOY FELIZ CON MI
VIDA”.
ANÁLISIS INFERENCIAL

Intervalo de confianza de la diferencia de medias.

Se va a emplear un nivel de significancia del 5%

Muestra n 𝑥̅ 𝑆2
Mujeres 170 7.50 0.269
Hombres 170 7.38 0.201

Realizar un intervalo de confianza entre las medias utilizando un nivel de significancia del 5%

α = 0.05

2
= 0.025

𝜎12 𝜎22 𝜎12 𝜎22


̅̅̅1 − ̅̅̅
(𝑋 𝑋2 ) − 𝑍∝ √ + ̅̅̅1 − ̅̅̅
≤ 𝜇1 − 𝜇2 ≤ (𝑋 𝑋2 ) + 𝑍∝ √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2

0.27 0.20 7.50 7.38


(7.50 − 7.38) − 1.96√ + ≤ 𝜇1 − 𝜇2 ≤ (7.50 − 7.38) + 1.96√ +
170 170 170 170

0.12 − 1.96(0.034) ≤ 𝜇1 − 𝜇2 ≤ 0.12 + 1.96(0.034)

0.0666 ≤ 𝜇1 − 𝜇2 ≤ 0.1866

Con los datos obtenidos de las muestras se puede afirmar con una confianza del 95% que el
intervalo de confianza esta entre 0.0666 y 0.1866.

Pruebas de Hipótesis diferencia de medias

Consideraciones:
 La muestra es grande, es decir n > 30
 𝜎 𝟐 𝑒𝑠 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎 𝑝𝑎𝑟𝑎 𝑙𝑎𝑠 𝑑𝑜𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠, por lo que se tomara como estimador la
varianza muestral “s”.
Ho: µ1 - µ2 = 0
vs
H1: µ1 - µ2 > 0

Con un 95% de confianza rechace Ho a favor de H1 si:

̅̅̅̅
(𝑋 1 − ̅̅̅̅
𝑋2 )−0
| | > 𝑍∝
𝑠2 𝑠2 2
√ 1+ 2
𝑛1 𝑛2

̅̅̅1 = 7.5
𝑋
̅̅̅2 = 𝑌̅ = 7.38
𝑋
𝑠12 = 0.519
𝑠22 = 0.448
𝑛1 = 𝑛2 = 140

(7.5 − 7.38 ) − 0
= 2.28
𝟐 𝟐
√0.519 + 0.448
170 170

𝑍∝ = 𝑍0.025 = 1.96
2

Se rechaza Ho en favor de H1, debido a que 2.28 > 1.96, es decir µ1> µ2

CONCLUSIONES
• Mediante el análisis de contingencia hemos podido conocer que las respuestas a cómo se
siente respecto a su vida y los hábitos alimenticios de un estudiante son estomáticamente
independientes a su género.
• En este proyecto hemos aplicado las técnicas estadísticas aprendidas durante el curso y a
su vez trabajamos con datos reales de estudiantes que cursaron la materia.
• Logramos identificar mediante el intervalo de confianza que la diferencia del promedio
de notas entre hombres y mujeres se encuentra entre 0.0666 y 0.1866.
• De acuerdo con los cálculos realizados concluimos que el promedio general de las
estudiantes mujeres es superior al de los varones, sin embargo, no hay una gran diferencia
entre los mismos.
RECOMENDACIONES

• Este tipo de investigaciones deben continuar realizándose a mayor escala en nuestro país,
tomando en cuenta otras variables como por ejemplo salarios, oportunidades laborales,
etc., con el fin de tener una idea estadística sobre la equidad de género.
• Es importante escoger la cantidad de datos de la muestra, ya que mientras mayor sea la
muestra tendremos mas certeza de que los resultados obtenidos se apegan a la realidad.
• Es recomendable identificar bien las variables con las que se desea trabajar, ya que de
esto dependerá el éxito de los resultados y la aplicación de estos a la vida cotidiana.

BIBLIOGRAFÍA
✓ GAUDECIO ZURITA HERRERA. (2010). PROBABILIDAD Y ESTADÌSTICA.
Fundamentos y Aplicaciones. Ecuador: Escuela Superior Politécnica del Litoral. 2da
Edición.
✓ Enciclopedia libre Wikipedia (2010) Correlación línea. Texto completo es:
http://es.wikipedia.org/wiki/Correlacion_lineal
✓ Conceptos Básicos de Estadística (S.F). Texto completo en:
http://www.gestiopolis.com/recursos/experto/catsexp/pagans/eco/44/estadistica.htm
✓ Katherine (2008) Estadística Inferencial. Texto completo en:
http://www.mitecnologico.com/iem/Main/EstadisticaInferencial

ANEXOS
▪ Base de datos suministrada para el proyecto
▪ Formulario de preguntas del proyecto

Вам также может понравиться