Вы находитесь на странице: 1из 44

ESTADISTICA DESCRIPTIVA

Unidad 3:
Paso 5 – Presentación de resultados

Entregado por:

Stehafnny Dayana Ayala Rueda


Código: 1007107764
Maylebis Castellar Niz
Código:

Presentado a:
Tutor
MILTON EDUARDO SALGADO

Grupo:
204040_9

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD


ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
BOGOTA JULIO 2019
Introducción

La estadística es una ciencia que utiliza conjuntos de datos numéricos para


obtener, a partir de ellos, inferencias basadas en el cálculo de
probabilidades, también se emplea en los campos científicos investigativos y
analíticos.
Por lo cual podríamos definir la estadística como la ciencia que se encarga de
recopilar, organizar, procesar, analizar e interpretar datos con el fin de
deducir las características de una población objetivo.
Tomamos como referencia la tabla de “Indicadores socioeconómicos de 120
municipios (2019) 16-2, para realizar diagramas de dispersión de las
variables cuantitativas, determinando el tipo de relación que hay entre cada
una de las variables, tambien se hallaron los modelos matemáticos, la
correlación esta indica la fuerza y la dirección de una relación lineal y
proporcionalidad entre dos variables estadísticas, finalmente se relaciona la
información obtenida con el problema planteado, realizamos tablas de
contingencia que nos permiten asociar y analizar dos variables, tambien
realizamos un histograma.
Donde podemos decir que la media es el promedio de los datos, la mediana
es el valor de la variable que ocupa la posición central, la moda es el valor de
la variable que más se repite.
El presente trabajo se refiere al análisis realizado a los indicadores socio
económicos de una muestra de 50 municipios de zonas vulnerables por
pobreza, violencia y ausencia del estado en Colombia entre mayo 28 y junio
10 del 2015; para determinar dicho nivel socio económico se ha realizado un
profundo estudio de las distintas variables en lo transcurrido del periodo
académico del curso Estadística Descriptiva.
La actividad se constituye como un proceso de determinación de cuanto
incluye cada variable en la situación presentada; para lo cual se utilizan
distintas herramientas como diagramas de dispersión, tablas de frecuencias,
entre otros, que facilitan la compresión de los datos permitiendo identificar
las variaciones de estos.
A continuación, llegaremos a diferentes conclusiones, respecto a los
resultados obtenidos con cada uno de los ejercicios.
Justificación

Este trabajo se realiza con el fin de que los estudiantes adquieran


conocimientos y aprendan la importancia de la estadística en la vida laboral,
y su vida cotidiana, además que es muy practica y dinámica ya que podemos
realizar todo mediante graficas que nos permiten hacer más activa una
explicación y así poder trasmitirles a nuestros receptores lo que queremos de
manera más atractiva. Con esta actividad aprendimos que la estadística nos
hace más fácil nuestro trabajo ya que nos brinda información exacta que nos
permite organizar, direccionar, y realizar planes de mejora entre otros a
partir de los datos arrojados.
El ejercicio facilita la interpretación analítica y grafica de la situación para ello
se utilizan varias herramientas, el cual buscan disponer la mayor cantidad de
información para ser puesta en tela de juicio.
Realizar este ejercicio enseña una parte fundamental de cualquier carrera o
trabajo de campo que se pueda ejercer. El análisis y presentación de
resultados es campo fundamental de la vida laboral.
Objetivos

General

Conocer las condiciones de desarrollo territorial, social y humano en el que


viven los habitantes de 50 de los 120 municipios de Colombia aplicando los
conceptos estadísticos y las diferentes maneras de agrupar la información en
relación con los datos obtenidos ordenándolos, representándolos en
diferentes diagramas, partiendo desde nuestra base de datos Indicadores
Socioeconómicos.

Específicos

• Definir conceptos básicos asociados a Regresión y Correlación.


• Identificar dos variables cuantitativas discretas y continuas, y variables
cualitativas de la situación estudiada que puedan estar relacionadas.
• Realizar el diagramas de dispersión de las variables escogidas y
determinar el tipo de relación entre las variables.
• Relacionar la información obtenida con el problema.
• Realizar tablas de frecuencias para datos agrupados y no agrupados.
• Realizar graficas de las tablas de frecuencia obtenidas en los datos
agrupados y no agrupados.
• Calcular las medidas de tendencia central para las variables discretas y
continuas (media, mediana, moda)
• Calcular las medidas de dispersión para las variables discretas y continua.
• Analizar los resultados obtenidos.
• Reconocer los fundamentos básicos de la Estadística Descriptiva y las
etapas dentro de una investigación, por medio de datos tomados de un
fenómeno real, del nuestro entorno.
• Aplicar las medidas estadísticas univariantes, en la solución de diferentes
problemas.
• Aplicar las medidas estadísticas bivariantes, en función de la problemática
de estudio.
Actividades para desarrollar

Aporte Sthefanny Dayana Ayala Rueda


Actividad 1. Ajuste de datos.
Descripción de la actividad.
Para dar inicio a su trabajo, el grupo deberá ajustar la base de datos “Indicadores socioeconómicos 120
municipios (2019) 16-2” trabajada en el periodo, la cual se encuentra en el entorno de aprendizaje
colaborativo, en la carpeta: guía de actividades y rúbrica de evaluación - Paso 2– organización y
presentación, el grupo dejará sólo los primeros 50 datos en cada una de las variables y procederá a
procesarlos como una muestra de la base original.
Actividad 2. Procesamiento de variables

Descripción de la actividad.

Una vez ajustada la base de datos, el grupo deberá tomar mínimo cinco
variables (al menos dos cualitativas, una cuantitativa discreta y una
cuantitativa continua) y procesará para cada variable la información
solicitada a continuación:

cantidad de % Ocupantes en
Grado de % Viviendas con algún
nivel educativo principal resguardos viviendas sin energía
marginación nivel de hacinamiento
indígenas eléctrica

• Caracterizar la variable cualitativa presentando: tabla de frecuencias,


diagrama de barras o circular, moda, tabla de contingencias y
conclusiones.

Variable 1

Medio Muy alto


Grado de Muy bajo Medio
Medio
marginación Medio
Bajo
Medio Bajo
Medio Bajo Muy bajo
Muy bajo Muy alto Muy bajo
Muy bajo Medio Medio
Bajo Muy bajo
Medio
Medio
Bajo Bajo
Medio
Bajo Muy bajo Medio
Bajo Bajo Medio
Bajo Bajo Bajo
Muy bajo Medio Medio
Bajo
Medio Alto
Bajo
Medio Medio Medio
Bajo Medio Medio
Bajo Muy bajo Bajo
TABLA DE FRECUENCIAS:

FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA


DATOS
ABSOLUTA (fi) ACUMULADA RELATIVA PORCENTUAL
MUY BAJO 9 9 0,18 18%
BAJO 17 26 0,34 34%
MEDIO 21 47 0,42 42%
ALTO 1 48 0,02 2%
MUY ALTO 2 50 0,04 4%
50 1 100%

Diagrama de barras o circular:


• Moda

La Moda es la categoría Medio ya que se repite 21 veces

• tabla de contingencias y conclusiones.

Suma de tabla de contingencia


Grado de marginación Total
ALTO 1
BAJO 17
MEDIO 21
MUY ALTO 2
MUY BAJO 9
Total general 50

Conclusiones:

según los datos arrojados en cada uno de los gráficos y teniendo en cuenta
la problemática En qué condiciones de desarrollo territorial, social y humano
se encuentran las comunidades con mayor pobreza extrema en Colombia,
podemos observar que el grado de marginación para los municipios
encuestados, en este caso tomamos una base de 50 municipios es medio ya
que de los 50 municipios 21 viven en un grado de marginación medio, a lo
cual podríamos decir que estos 21 municipios están medianamente aislados
de la sociedad lo que les ocasiona pobreza y deterioro y algunas desventajas
económicas sociales y territoriales, por otro lado tambien observamos que
aunque son 21 municipios en grado media, antes encontramos 17 municipios
en grado bajo y 9 en grado muy bajo lo que significa que estos aún están
más afectados y casi se podría decir que olvidados por el gobierno y la
sociedad en general a lo cual se debe su situación de pobreza y marginación.
teniendo en cuenta estos resultados sería bueno que los entes encargados
tomen medidas correctivas para ayudar a estas personas y tengan un trato
más digno, menos pobreza, derecho a la educación, carreteras de ingreso en
buen estado para sus municipios.
Variable 2

educación media
nivel educativo principal básica primaria
educación media básica primaria
básica primaria básica primaria básica primaria
básica primaria educación secundaria básica secundaria sin terminar
educación media otro
educacion media básica primaria otro
básica secundaria sin terminar básica secundaria sin terminar
otro
educacion media educación secundaria
educación media básica primaria básica primaria
educación secundaria educación media
básica primaria educación media básica primaria
educación secundaria básica primaria
educación media básica primaria básica secundaria sin terminar
educación media básica primaria
educación secundaria básica secundaria sin terminar básica primaria
básica primaria básica primaria básica primaria
básica secundaria sin terminar básica secundaria sin terminar básica secundaria sin terminar
básica primaria otro básica secundaria sin terminar
básica primaria básica secundaria sin terminar básica secundaria sin terminar

TABLA DE FRECUENCIAS:

FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA


DATOS
ABSOLUTA ACUMULADA RELATIVA PORCENTUAL %
básica primaria
20 20 0,4 40%
educacion media 10 30 0,2 20%
otro 4 34 0,08 8%
básica secundaria sin
terminar 11 45 0,22 22%
educación secundaria
5 50 0,1 10%

50 1 100%
• Diagrama de barras o circular:

• Moda

La Moda es la categoría Básica Primaria se repite 20 veces


• tabla de contingencias y conclusiones.

Suma de FRECUENCIA ABSOLUTA (fi)


NIVEL EDUCATIVO PRINCIPAL Total
básica primaria 20
básica secundaria sin terminar 11
educacion media 10
educación secundaria 5
otro 4
(en blanco)
Total general 50
• Para la variable discreta elegida, se deberán calcular las medidas
univariantes de tendencia central:
1 VARIABLE DISCRETA:

cantidad de
0 3
resguardos 0 3
indígenas 0 4
0 4
0
0 0 4
0 0
4
0 0
0 4
0
0 5
0 0
0
5
0
0 1 6
0
1 6
0
0 2 6
0 2 6
0 2 6
0
0 3 6
0 3 6

• Media:

MEDIA DATOS
NO 1,84
AGRUPADOS

Media Datos Agrupados


n 50 Número de Límite Límite Marca de Frecuencia Frecuencia
Min 0 clases inferior superior clase (X) absoluta (f) absoluta f *X
Max 6 1 0,0 0,9 0,4 27 27 11,6
Rango 6 2 0,9 1,7 1,3 2 29 2,6
K 6,643978 7 3 1,7 2,6 2,1 3 32 6,4
A 0,86 4 2,6 3,4 3,0 4 36 12,0
5 3,4 4,3 3,9 5 41 19,3
6 4,3 5,1 4,7 2 43 9,4
7 5,1 6,0 5,6 7 50 39,0

PROMEDIO PARA DATOS AGRUPADOS 50 100,3

MEDIA 2,0
• Mediana,

MEDIANA
DATOS NO 0
AGRUPADOS

Media Datos Agrupados


n 50 Número de Límite Frecuencia Frecuencia
Límite inferior Marca de clase
Min 0 clases superior absoluta f absoluta acumulada
Max 6 1 0,00 0,86 0,4 27 27
Rango 6 2 0,86 1,71 1,3 2 29
K 6,6439784 7 3 1,71 2,57 2,1 3 32
A 0,86 4 2,57 3,43 3,0 4 36
5 3,43 4,29 3,9 5 41
6 4,29 5,14 4,7 2 43
7 5,14 6,00 5,6 7 50

MEDIANA PARA DATOS AGRUPADOS 50

n/2 25
n 50
Fk-1 0
fk 27
Ak 0,86
Lk 0

MEDIANA 0,79

n es el tamaño de la muestra o la suma de todas las frecuencias.


Fk-1 es la frecuencia absoluta acumulada de la clase anterior de la clase de
la mediana.
fk es la frecuencia absoluta de la clase de la mediana.
Ak es la amplitud de la clase de la mediana.
Lk es el límite real inferior de la clase de la mediana.

• Moda.

MODA DATOS NO
0
AGRUPADOS

Moda datos no agrupados


n 50 Número Límite Límite Marca de Frecuencia Frecuencia
Min 0 de clases inferior superior clase absoluta f absoluta
Max 6 1 0,00 0,86 0,4 27 27
Rango 6 2 0,86 1,71 1,3 2 29
K 6,643978 7 3 1,71 2,57 2,1 3 32
A 0,86 4 2,57 3,43 3,0 4 36
5 3,43 4,29 3,9 5 41
6 4,29 5,14 4,7 2 43
7 5,14 6,00 5,6 7 50

50

fi 27 MODA PARA DATOS AGRUPADOS


fi-1 0
fi+1 2
Li 0
ai 0,86
MODA 0,4

Donde:
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase

• Todos los cuartiles.

CUARTILES

N es la muestra 50

Cuartil Posición Valor


Q1 12,5 0,0
Q2 25 0,00 Los cuartiles son los tres valores de la
Q3 37,5 4,0 variable que dividen a un conjunto de datos
Q4 50 6,00 ordenados en cuatro partes iguales. EL 25%.
50% Y 75%

MEDIANA 0,00
• medidas univariantes de dispersión: Rango, Varianza, Desviación típica y
Coeficiente de variación.

MEDIA 2,01
MEDIA^2 4,02
S^2 3,86
S 1,96
CV 98,0
Rango 6,0
n= 50 Frecuenci Frecuencia
numero Límite Límite marca de f*
a Absluta absoluta f *X
de clase inferior superior clase (X)
Min = 0,0 (f) acumulada
Max = 6,0 1 0,0 0,86 0,4 27 27 11,6 0,2 5,0
Rango = 6,0 2 0,9 1,71 1,3 2 29 2,6 1,7 3,3
K= 6,643978 7 3 1,7 2,57 2,1 3 32 6,4 4,6 13,8
A= 0,857 4 2,6 3,43 3,0 4 36 12,0 9,0 36,0
5 3,4 4,29 3,9 5 41 19,3 14,9 74,4
6 4,3 5,14 4,7 2 43 9,4 22,2 44,4
7 5,1 6,00 5,6 7 50 39,0 31,0 217,3

50 100,3 394,2

MEDIA 2,01
MEDIA^2 4,02
S^2 3,86
S 1,96
CV 98,0
Rango 6,0

• Para la variable continúa elegida, se deberán calcular las medidas


univariantes de tendencia central:

1 VARIABLE CONTINUA
29,46 43,24
% Viviendas con algún 41,79 36,19
nivel de hacinamiento 32,30 19,74
34,33
35,14
39,90 34,60
54,56 31,67
36,09 41,64 31,35
30,91 34,96 20,40
35,21
42,79 44,86
42,13
26,77 26,46
29,17
32,51 41,80
37,33 36,79
32,32
29,83
48,67
37,37 31,13
33,34
51,93 49,52
33,30
38,35 22,60 41,05
25,30 34,17 34,18
34,24 32,35 41,65
33,57 49,39 43,32

• Media,

MEDIA PARA
DATOS NO 36,03
AGRUPADOS

• MEDIA PARA DATOS AGRUPADOS


• Mediana,

MEDIANA PARA
DATOS NO 34,78
AGRUPADOS

MEDIANA PARA DATOS AGRUPADOS

n 50 Número de Límite Límite Marca de Frecuencia Frecuencia


Min 19,74 clases inferior superior clase absoluta f absoluta
Max 54,56 1 19,74 24,71 22,2 3 3
Rango 34,82 2 24,71 29,69 27,2 5 8
K 6,643978 7 3 29,69 34,66 32,2 17 25
A 4,97 4 34,66 39,63 37,1 9 34
5 39,63 44,61 42,1 10 44
6 44,61 49,58 47,1 4 48
7 49,58 54,56 52,1 2 50

MEDIANA PARA DATOS AGRUPADOS 50

n/2 25
n 50
Fk-1 25
fk 9
Ak 4,97
Lk 34,66

MEDIANA 34,66

• Moda.

n 50 Número Límite Límite Marca de Frecuencia Frecuencia


Min 19,74 de clases inferior superior clase absoluta f absoluta
Max 54,56 1 19,74 24,71 22,2 3 3
Rango 34,82 2 24,71 29,69 27,2 5 8
K 6,643978 7 3 29,69 34,66 32,2 17 25
A 4,97 4 34,66 39,63 37,1 9 34
5 39,63 44,61 42,1 10 44
6 44,61 49,58 47,1 4 48
7 49,58 54,56 52,1 2 50
MODA PARA DATOS AGRUPADOS
50

fi 17
fi-1 5
fi+1 9
Li 29,69
ai 4,97
MODA 31,43
• Cuartiles

CUARTILES

N es la muestra 50

Cuartil Posición Valor


Q1 12,5 31,8
Q2 25 34,78 Los cuartiles son los tres valores de la
Q3 37,5 41,6 variable que dividen a un conjunto de datos
Q4 50 54,56 ordenados en cuatro partes iguales. EL 25%.
50% Y 75%

MEDIANA 34,78

• medidas univariantes de dispersión: Rango, Varianza, Desviación típica y


Coeficiente de variación.

MEDIA 35,95
MEDIA^2 1292,66
S^2 52,02
S 7,21
CV 20,1
Rango 34,8
2 VARIABLE CONTINUA:

% Ocupantes en
2,07 1,31
viviendas sin energía
0,33 0,41
eléctrica 39,51 0,41
5,29
0,72 4,38
0,98
0,31 0,04
0,71
0,51 1,49
0,89
0,39
0,95 0,57 0,64
0,70 0,57 4,80
1,02 0,93 2,66
1,00 12,82 0,64
1,16 4,65
2,83
1,22
0,98
3,03 0,96
0,62
1,61
21,20
0,32
0,37
4,23 2,08
1,84
0,82 0,51 4,31
0,58 1,72 0,68

• Media,

MEDIA PARA
DATOS NO 2,86
AGRUPADOS

MEDIA PARA DATOS AGRUPADOS

Frecuenci Frecuencia
Número de Límite Límite Marca de
n 50 a absoluta absoluta
clases inferior superior clase (X)
Min 0,04 (f) acumulada f *X
Max 39,51 1 0,04 5,68 2,9 47 47 134,5
Rango 39,46 2 5,68 11,32 8,5 0 47 0,0
K 6,643978 7 3 11,32 16,96 14,1 1 48 14,1
A 5,64 4 16,96 22,59 19,8 1 49 19,8
5 22,59 28,23 25,4 0 49 0,0
6 28,23 33,87 31,1 0 49 0,0
7 33,87 39,51 36,7 1 50 36,7

PROMEDIO PARA DATOS AGRUPADOS 50 205,1

MEDIA 4,1
• Mediana,

MEDIANA PARA
DATOS NO 0,97
AGRUPADOS

MEDIANA PARA DATOS AGRUPADOS:

n 50 Número de Límite Límite Marca de Frecuencia Frecuencia


Min 0,04 clases inferior superior clase absoluta f absoluta
Max 39,51 1 0,04 5,68 2,9 47 47
Rango 39,46 2 5,68 11,32 8,5 0 47
K 6,643978 7 3 11,32 16,96 14,1 1 48
A 5,64 4 16,96 22,59 19,8 1 49
5 22,59 28,23 25,4 0 49
6 28,23 33,87 31,1 0 49
7 33,87 39,51 36,7 1 50

MEDIANA PARA DATOS AGRUPADOS 50

n/2 25
n 50
Fk-1 0
fk 47
Ak 5,64
Lk 0,04

MEDIANA 3,04

n es el tamaño de la muestra o la suma de todas las frecuencias.


Fk-1 es la frecuencia absoluta acumulada de la clase anterior de la clase de
la mediana.
fk es la frecuencia absoluta de la clase de la mediana.
Ak es la amplitud de la clase de la mediana.
Lk es el límite real inferior de la clase de la mediana.
• Moda.

n 50 Número Límite Límite Marca de Frecuencia Frecuencia


Min 0,04 de clases inferior superior clase absoluta f absoluta
Max 39,51 1 0,04 5,68 2,9 47 47
Rango 39,46 2 5,68 11,32 8,5 0 47
K 6,643978 7 3 11,32 16,96 14,1 1 48
A 5,64 4 16,96 22,59 19,8 1 49
5 22,59 28,23 25,4 0 49
6 28,23 33,87 31,1 0 49
7 33,87 39,51 36,7 1 50
MODA PARA DATOS AGRUPADOS
50

fi 47
fi-1 0
fi+1 0
Li 0,04
ai 5,64
MODA 2,86

Donde:
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.

• Cuartiles

CUARTILES

N es la muestra 50

Cuartil Posición Valor


Q1 12,5 0,6
Q2 25 0,97 Los cuartiles son los tres valores de la
Q3 37,5 2,1 variable que dividen a un conjunto de datos
Q4 50 39,51 ordenados en cuatro partes iguales. EL 25%.
50% Y 75%

MEDIANA 0,97
• Medidas univariantes de dispersión: Rango, Varianza, Desviación típica y
Coeficiente de variación.

MEDIA 4,10
MEDIA^2 16,82
S^2 29,61
S 5,44
CV 132,7
Rango 39,5

n= 50 Frecuenci Frecuencia
numero Límite Límite marca de f*
a Absluta absoluta f *X
de clase inferior superior clase (X)
Min = 0,04 (f) acumulada
Max = 39,51 1 0,04 5,68 2,9 47 47 134,5 8,2 384,7
Rango = 39,46 2 5,7 11,32 8,5 0 47 0,0 72,2 0,0
K= 6,643978 7 3 11,3 16,96 14,1 1 48 14,1 199,8 199,8
A= 5,638 4 17,0 22,59 19,8 1 49 19,8 391,0 391,0
5 22,6 28,23 25,4 0 49 0,0 645,8 0,0
6 28,2 33,87 31,1 0 49 0,0 964,1 0,0
7 33,9 39,51 36,7 1 50 36,7 1346,0 1346,0

50 205,1 2321,6

MEDIA 4,10
MEDIA^2 16,82
S^2 29,61
S 5,44
CV 132,7
Rango 39,5

Regresión y correlación entre variables cuantitativas


Identificar dos variables cuantitativas de la situación estudiada que puedan
estar relacionadas y:

Variable
Población total(habitantes) (X)
independiente
Variable Población de 15 años o más
(Y)
dependiente sin Educación básica primaria
Población de 6 820 3030 23 428 7178 255 681 33158
11 623 4496
15 años o más 10 029 3235 41 060 7033 8 691
Población 4065
sin Educación 21 475 6058 19 005 6581 138 226 23855
total(habitant
básica 39 020 10054 31 948 9159 3 176 1182
es) (X) 100 534 16352 22 881 6211 6 647 2301
primaria 65 219 17766
completa (Y) 26 174 6784 18 634 8352 15 454 4577
21 206 7852 18 091 4854 9 545 4202 3 762 879
23 241 4135 5 933 1942 42 164 12072 3 405 1262
21 714 4663 17 322 7094 13 218 2253 26 306 6899
31 166 9840
5 545 1503 2 171 816 5 515 1667
14 011 4172
14 648 3248 17 795 6549 153 817 39270 5 755 1973
57 340 13875 48 839 9479 5 499 1659 3 726 1615
8 896 2279 3 771 1653 21 321 5048 34 829 7027
69 031 15656
72 812 23680 5 814 1809 2 517 1314
14 410 4339
17 545 3906 21 132 7578 3 755 1170 37 986 11702
6 655 2311 2 082 678 14 245 3848 18 096 5890
5 400 2042 51 396 17058 13 225 3426 16 847 5640
16 573 4460
4 115 1278 18 632 3697 6 034 2177
3 511 948
57 717 17366 23 845 5585 18 084 9669 7 051 2121
8 276 2960 4 323 1569 3 574 1138 40 105 14010
57 559 12178 672 641 73296 92 967 18348 10 837 3821
136 123 35495
38 291 14404 10 284 3240 30 097 10041
40 697 8779
12 664 3940 6 084 2232 12 119 4917 9 088 2517
64 269 17995 8 781 3192 48 408 13559 20 857 7013

a. Realizar el diagrama de dispersión de dichas variables y determinar el tipo


de asociación entre las variables.
El tipo de asociación entre las variables es de dispersión lineal ascendente
con una correlación positiva alta.
a. Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?
Población de 15 años o mas sin
Y=
MODELO educación básica primaria completa
y = 0,127x +3363,1
MATEMÁTICO=
X= Población total (habitantes)

R² = 0,9251 COEFICIENTE DE DETERMINACIÓN


R CUADRADO_=
0,92*100%= 92% CONFIABILIAD DEL MODELO MATEMÁTICO
La ecuación de la recta es confiable porque el coeficiente de la determinación
de R2 está cercano a 1 y tiene una correlación excelente
b. Determine el grado de correlación de las dos variables.
R² = 0,9251 RAIZ CUADRADA DE 0,9251
correlacion entre el poblacion total de habitantes yPoblación
COMO SE HALLA:
R= 0,96 de 15 años o más sin Educación básica primaria completaes
EXCELENTE

El grado de relación de las dos variables: Está dado por la raíz cuadrada del
coeficiente de determinación, así: √𝑅 2 cuya representación porcentual seria:
0,96 x 100%= 96%, lo cual señala que las dos variables de porcentaje están
relacionadas entre sí, con un 96%. También se puede afirmar que como el
coeficiente de correlación tiene un valor que se encuentra entre 0.90 y 1
entonces su correlación es excelente.
c. Relacionar la información obtenida con el problema.
Con los datos arrojado podemos observar que si existe una relación entre la
población total de habitantes de los municipios y la población de 15 años o
más sin educación primaria completa ya que con estos datos notamos que a
mayor población mayor persona de 15 años o más sin educación básica
primaria completa entonces el 96% de las personas que habitan en los
municipios en condiciones de desarrollo territorial, social y humano se
encuentran sin la educación básica primaria completa lo que quiere decir que
existe mucho personas que no han terminado su primaria y otras tanta que
ni siquiera la han comenzado razón por la cual son municipios vulnerables y
con alto grado de pobreza, con estos datos el gobierno debería tomar
medidas para mejorar la calidad de vida d ellos habitantes de estos
municipios con el fin de disminuir los embarazos no deseados y ademas
ayudar a la superación profesional, ya que como sabes en la constitución
política de Colombia encontramos que la educación es un derecho que todo
ser humano tiene sin importar la raza, el estrato social discapacidad etc.
d. Realizar regresión múltiple en caso de que se determine dependencia
entre las variables cuantitativas.

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,951166999
Coeficiente de determinación R^2 0,904718659
R^2 ajustado 0,902733631
Error típico 3367,77681
Observaciones 50

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 5169321337 5169321337 455,771249 3,7677E-26
Residuos 48 544412191 11341920,6
Total 49 5713733528

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción 3928,667667 512,425373 7,6668094 7,0451E-10 2898,3674 4958,96793 2898,3674 4958,967933
Variable X 1 0,109109812 0,00511082 21,3487997 3,7677E-26 0,09883383 0,1193858 0,09883383 0,119385799

R² = 0,9047 COEFICIENTE DE DETERMINACION


R CUADRADO=
0,9047*100%= 90% CONFIABILIDAD DEL MODELO MATEMATICO
R² = 0,9047 RAIZ CUADRADA DE 0,9047

Correlacion entre las variables Población


total(habitantes) (x1) y Población de 15 años o más sin
R=0,9511=95%
Educación básica primaria completa (y) es excelente ya
que R esta cerca de 1

Actividad 3. Propuesta de solución a la problemática

Descripción de la actividad.

Finalmente, el grupo deberá responder a la pregunta: ¿Qué alternativa de


solución plantea para la problemática estudiada?, dicha respuesta deberá
estar justificada descriptivamente, es decir para ello (utilizará tablas,
gráficos, medidas, diagramas, entre otros) a partir de los resultados
estadísticos descriptivos realizados en la actividad anterior (50 primeros
datos) y la información obtenida de la problemática planteada.

Teniendo en cuenta la información arrojada a partir de la gráfica grado de


marginación podemos decir que una solución muy importante que el
gobierno debería ofrecerle a los habitantes de los municipios sería una
integración social para ello se puede empezar con invertir dinero en
carreteras ya que este es un factor que afecta a estos municipios y se hacen
poco accesibles por lo cual están olvidados por la sociedad, ademas tambien
hacer más escuelas para que puedan los habitantes de estos municipios
acceder al estudio y asi mejorar su calidad de vida.
Suma de tabla de contingencia
Grado de marginación Total
ALTO 1
BAJO 17
MEDIO 21
MUY ALTO 2
MUY BAJO 9
Total general 50

Esta tabla nos muestra que tienen un nivel de marginación medio, pero en
realidad tambien hay algunos municipios que estan con niveles bajos y muy
bajos, El gobierno debe empezar a optar por mejorar la calidad de vida para
estos municipios, por lo tanto, este estudio debe ser una opción para que
invias, secretaria de educación y otros entes del gobierno realicen proyectos
donde incluyan el mejoramiento de estos municipios.
A raíz de esta marginación el nivel educativo es básica primaria como
podemos observar en la siguiente grafica

Por lo tanto, una alternativa de solución muy acertada podría ser que la
secretaria de educación les capacite para que puedan realizar sus estudios de
manera virtual y a distancia.
Aporte Maylebis Castellar
Descripción de la actividad
Para dar inicio a su trabajo, el grupo deberá ajustar la base de datos
“Indicadores socioeconómicos 120 municipios (2019) 16-2” trabajada
en el periodo, la cual se encuentra en el entorno de aprendizaje colaborativo,
en la carpeta: guía de actividades y rúbrica de evaluación - Paso 2–
organización y presentación, el grupo dejará sólo los primeros 50 datos en
cada una de las variables y procederá a procesarlos como una muestra de la
base original.
Actividad 2. Procesamiento de variables
Descripción de la actividad.
Una vez ajustada la base de datos, el grupo deberá tomar mínimo cinco
variables (al menos dos cualitativas, una cuantitativa discreta y una
cuantitativa continua) y procesará para cada variable la información solicitada
a continuación:
Variable cualitativa
Descripción de la actividad
Caracterizar la variable cualitativa presentando: tabla de frecuencias,
diagrama de barras o circular, moda, tabla de contingencias y conclusiones.
Los cálculos de los parámetros los podrán realizar con el programa Excel o
Infostat,
Las Variables cualitativas escogidas son el tipo de riesgo al que se expone la
población y el grado de Marginación.
Tipo de Riego
al que se
expone la
población frecuencia
Movimientos en
masa 11
Sequías 5
Vulcanismos 9
Heladas 4
Sismos 11
Avenidas
torrenciales 7
Desbordamientos 3
Total 50
Tipo de Riesgo al que se expone la población
Desbordamientos
;3
Avenidas Movimientos en
torrenciales; 7 masa; 11

Sequías; 5
Sismos; 11

Vulcanísmos; 9
Heladas; 4

La moda: Son Las variables Movimientos en masa y Sismos.


Tabla de Contingencia:
GRADO DE MAGINACIÓN
Muy alto Alto Medio Bajo Muy bajo
Movimiento en masa 1 7 2 1
QUE SE EXPONE LA
TIPO DE RIESGO AL

Sequía 2 2 1
POBLACIÓN

Vulcanismo 1 5 3
Heladas 1 3
Sismo 1 4 5 1
Avenidas torrenciales 3 3 1
Desbordamientos 1 2

Conclusiones: De la elaboración de la tabla de contingencia se puede concluir


que la población que está expuesta a mayor riesgo es la de grado de
marginación medio y el riesgo asociado es el de movimiento en masa.
Variable cuantitativa Discreta y Continua
Descripción de la actividad
Para la variable discreta elegida, se deberán calcular las medidas univariantes
de tendencia central: Media, Mediana, Moda. Todos los cuartiles. Así mismo
deberán calcular las medidas univariantes de dispersión: Rango, Varianza,
Desviación típica y Coeficiente de variación.
Población Población
de 15 años de 15 años
o más sin 2
o más sin
2
N° Educación N° Educación
básica básica
primaria primaria
completa completa
1 678 -7.286,74 53.096.579,83 26 5585 -2.379,74 5.663.162,47
2 816 -7.148,74 51.104.483,59 27 6058 -1.906,74 3.635.657,43
3 1278 -6.686,74 44.712.491,83 28 6211 -1.753,74 3.075.603,99
4 1503 -6.461,74 41.754.083,83 29 6549 -1.415,74 2.004.319,75
5 1569 -6.395,74 40.905.490,15 30 6581 -1.383,74 1.914.736,39
6 1653 -6.311,74 39.838.061,83 31 6784 -1.180,74 1.394.146,95
7 1809 -6.155,74 37.893.134,95 32 7033 -931,74 868.139,43
8 1942 -6.022,74 36.273.397,11 33 7094 -870,74 758.188,15
9 2042 -5.922,74 35.078.849,11 34 7178 -786,74 618.959,83
10 2232 -5.732,74 32.864.307,91 35 7578 -386,74 149.567,83
11 2279 -5.685,74 32.327.639,35 36 7852 -112,74 12.710,31
12 2311 -5.653,74 31.964.775,99 37 8352 387,26 149.970,31
13 2960 -5.004,74 25.047.422,47 38 9159 1.194,26 1.426.256,95
14 3030 -4.934,74 24.351.658,87 39 9479 1.514,26 2.292.983,35
15 3192 -4.772,74 22.779.047,11 40 10054 2.089,26 4.365.007,35
16 3235 -4.729,74 22.370.440,47 41 12072 4.107,26 16.869.584,71
17 3240 -4.724,74 22.323.168,07 42 12178 4.213,26 17.751.559,83
18 3248 -4.716,74 22.247.636,23 43 13875 5.910,26 34.931.173,27
19 3697 -4.267,74 18.213.604,71 44 14404 6.439,26 41.464.069,35
20 3906 -4.058,74 16.473.370,39 45 16352 8.387,26 70.346.130,31
21 3940 -4.024,74 16.198.532,07 46 17058 9.093,26 82.687.377,43
22 4135 -3.829,74 14.666.908,47 47 17366 9.401,26 88.383.689,59
23 4202 -3.762,74 14.158.212,31 48 17995 10.030,26 100.606.115,67
24 4663 -3.301,74 10.901.487,03 49 23680 15.715,26 246.969.396,87
25 4854 -3.110,74 9.676.703,35 50 73296 65.331,26 4.268.173.533,19

Medidas Univariantes de Tendencia Central


Media: 7.964,74

Media
∑𝑁
𝑗=1 𝑗 398.237
= = =
𝑁 50
̅ = 7.964,74
Mediana:

Mediana
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 25 = 4.854
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 4.854

Moda: No existe la moda porque ningún dato se repite


Cuartiles

Cuartiles
Primer Cuartil (Q1)
1 1
𝑄1 = 12 + 13 = 2.311 + 2.960 =
2 2
𝑄1 = 2.635,5
Segundo Cuartil (Q2)
𝑄2 = 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 4.854
Tercer Cuartil (Q3)
1 1
𝑄3 = 37 + 38 = 8.352 + 9.159 =
2 2
𝑄3 = 8.759

Medidas univariantes de dispersión:

Rango (R)
𝑅= 50 1 = 73.296 678 =
𝑅 = 72.618
2
Varianza (s ):
∑𝑁=1 2
5.713.733.527,62
𝑠2 = = =
𝑁 50
𝑠 2 = 114.274.670,55
Desviación típica(s=)
𝑠 = √𝑠 2
𝑠 = √114.274.670,55 =
𝑠 = 10.689,93
Coeficiente de variación (V)
𝑠 10.689,93
𝑉= = =
7.964,74
𝑉 = 1,34
Para la variable continúa elegida, se deberán calcular las medidas univariantes
de tendencia central: Media, Mediana, Moda. Todos los cuartiles Así mismo
deberán calcular las medidas univariantes de dispersión: Rango, Varianza,
Desviación típica y Coeficiente de variación.
Los cálculos de los parámetros los podrán realizar con el programa Excel o
Infostat,

% de % de
Población Población
de 15 de 15
años o años o
más más
analfabeta analfabeta
10,82 5,45
3,79 10,13
4,89 17,09
6,38 8,27
5,52 11,02
5,24 4,18
5,14 14,57
9,55 10,18
5,66 9,80
11,27 7,91
9,43 8,31
8,31 4,01
8,52 5,16
10,13 10,56
4,80 2,11
11,36 8,20
7,45 7,16
8,14 10,95
19,47 9,20
5,83 3,46
7,98 9,57
7,13 6,81
4,23 7,57
7,17 13,77
Fórmula de Sturges
𝑐 = 1 + 3,322 ∗ log 𝑁
𝑐 = 1 + 3,322 ∗ 𝐿𝑜𝑔 50 =
𝑐 = 6,64 ≈ 7𝑐𝑙𝑎𝑠𝑒𝑠
Amplitud (a)
𝑀𝑎𝑦𝑜𝑟 𝑚𝑒𝑛𝑜𝑟
𝑎= =
𝑐
19,47 2,11
𝑎= =
7
𝑎 = 2,48
Distribución de frecuencias

% de Población de 15
frecuencias
años o más analfabeta

2,10 4,58 6
4,59 7,07 12
7,08 9,56 16
9,57 12,05 11
12,06 14,54 1
14,55 17,03 2
17,04 19,52 2

50

Medidas Univariantes de Tendencia Central


Media:
𝑁
∑ =1 𝑓 423,47
= = =
𝑁 50
= 8,47

Mediana
𝑁
∑𝑓 1
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 𝐿1 + ( 2 )∗𝑐
𝑓𝑚𝑒𝑑 𝑎𝑛𝑎
Dónde:
L1: Límite inferior de la clase mediana
N: número de datos (frecuencia total)
∑ 𝑓 1: Suma de las frecuencia de la clases inferiores a la clase mediana
fmediana: frecuencia de la clase mediana
C: anchura del intervalo de la clase mediana
La clase mediana es la tercera clase:
50
18
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 7,08 + ( 2 ) ∗ 2,49 =
16

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 8,17

La Moda
∆1
𝑀𝑜𝑑𝑎 = 𝐿1 + ( )∗𝑐
∆1 + ∆2

𝐿1: frontera inferior de la clase modal


∆1: exceso de la frecuencia modal sobre la clase inferior inmediata
∆2 : exceso de la frecuencia modal sobre la clase superior inmediata
c: anchura del intervalo de la clase modal
La clase modal es la tercera clase

4
𝑀𝑜𝑑𝑎 = 7,075 + ( ) ∗ 2,49 =
5+4
𝑀𝑜𝑑𝑎 = 8,18

Cuartiles
Primer Cuartil (Q1)
𝑁
∑𝑓
𝑄1 = 𝐿1 + ( 4
1
)∗𝑐
𝑓𝑐𝑢𝑎𝑟𝑡 𝑙
donde:
L1: Límite inferior de la clase cuartil
N: número de datos (frecuencia total)
∑ 𝑓 1: suma de las frecuencia de la clases inferiores a la clase cuartil
fcuartil: frecuencia de la clase cuartil
c: anchura del intervalo de la clase cuartil
𝑁
∑𝑓 1
𝑄1 = 𝐿1 + ( 4 )∗𝑐
𝑓𝑐𝑢𝑎𝑟𝑡 𝑙
La clase cuartil es la segunda
50
6
𝑄1 = 4,59 + ( 4 ) ∗ 2,49 =
12
𝑄1 = 5,94
Segundo Cuartil (Q2) es igual a la mediana:
𝑄2 = 8,17
Tercer Cuartil (Q3):
3𝑁
∑𝑓 1
𝑄3 = 𝐿1 + ( 4 )∗𝑐
𝑓𝑐𝑢𝑎𝑟𝑡 𝑙
La clase cuartil es la cuarta clase
37,5 34
𝑄3 = 9,57 + ( ) ∗ 2,49 =
11
𝑄3 = 10,36

Medidas de Dispersión:
Rango (R)
𝑅 = 𝑀𝑎𝑦𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 =
𝑅 = 19,47 2,11 =
𝑅 = 17,36

2
Varianza (s )
𝑁 2
2
∑ 𝑗=1 𝑗 211,95
𝑠 = = =
𝑁 50
𝑠 2 = 4,24
Desviación Típica (s):
𝑠 = √𝑠 2 = √4,24
𝑠 = 2,06

Regresión y correlación entre variables cuantitativas

Identificar dos variables cuantitativas de la situación estudiada que puedan


estar

Coeficiente de Variación (V):


𝑠 2,06
𝑉= = =
8,47
𝑉 = 0,24

relacionadas y:
a. Realizar el diagrama de dispersión de dichas variables y determinar el tipo
de asociación entre las variables.
Diagrama de dispersión y = 7E-06x + 3,1979
R² = 0,1405
8

cantidad de servicios publicos


7
6
disponibles 5
4
3
2
1
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
poblacion total (habitantes)

Podemos concluir según el diagrama que si existe correlación entre las dos
variables, que su dirección es positiva
b. Encontrar el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?
𝑦 = 7𝐸 06𝑥 + 3,1979
𝑅² = 0,1405

La intensidad se puede denominar débil, por lo tanto, no es confiable

c. Determinar el grado de relación de las dos variables

𝒓: 𝟎, 𝟑𝟕𝟒𝟖𝟗𝟔𝟒
La correlación entre las variables es mínima
a. Realizar regresión múltiple en caso de que se determine dependencia entre
las variables cuantitativas
Resumen

Estadísticas de la regresión
Coeficiente de0,41406899
correlación múltiple
Coeficiente de0,17145313
determinación R^2
R^2 ajustado 0,13619582
Error típico 3,32155862
Observaciones 50

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 107,302549 53,6512743 4,86290963 0,01203515
Residuos 47 518,539329 11,0327517
Total 49 625,841877

Superior 95,0% Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción 10,7555246 1,11694065 9,62945048 1,0678E-12 8,50852989 13,0025194 8,50852989 13,0025194
Variable X 1 -8,0571E-06 5,4372E-06 -1,48184474 0,14505565 -1,8995E-05 2,8812E-06 -1,8995E-05 2,8812E-06
Variable X 2 -0,61933089 0,31147141 -1,98840366 0,05260798 -1,24593054 0,00726876 -1,24593054 0,00726876

y=10,75-8,057X1-0,619X2

En los datos obtenidos se observa que partir del coeficiente de correlación r2


que nos da un valor de 0,136 un valor que se encuentra entre menor a 0,30
y nos muestra que la relación que existe entre las variables múltiples según
el grado de correlación lineal en nula lo que quiere decir que no hay
correlación entre las variables múltiples.
Regresión y correlación entre variables cuantitativas
Identificar dos variables cuantitativas de la situación estudiada que puedan
estar relacionadas y:

cantidad de
nivel
servicios
mayoritario de
públicos
Sisbén
disponibles

1 4

1 5

2 7

2 5

1 4
1 4
2 4

1 3

1 2

1 2
2 4

1 5

1 4

1 1

1 7

1 3

1 0

2 4

1 3

2 3

1 3

1 1

1 6

1 3

2 5

1 3

1 2

1 1

1 4

1 3

1 3

1 2

1 2

2 5
1 5
1 4

2 3

1 2

1 7
2 3

1 0

1 3

2 1

2 5

1 4

1 4

2 5

1 3

1 4

1 2

• Realizar el diagrama de dispersión de dichas variables y determinar el tipo


de asociación entre las variables.

Nivel mayoritario de sisben vs


Cantidad de servicios publicos
disponibles y = 0,9647x + 2,2245
8
R² = 0,0677
NIVEL MAYORITARIO DE SISBEN

7
6
5
4
3
2
1
0
0 0,5 1 1,5 2 2,5
CANTIDAD DE SERVICIOS PUBLICOS DISPONIBLES

Existe una asociación directa.


• Encontrar el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?

y= 0,09647x+2,2245

R/: 𝑅 2 = 0,0677 Es confiable tiene valor entre 0 y 1.

• Determinar el grado de relación de las dos variables

𝑹 = 𝟎, 𝟎𝟔𝟕𝟕
Presenta un grado de correlación regular

• Relacionar la información obtenida con el problema.


En las dos variables escogidas y según el diagrama de dispersión a mayor nivel
de Sisbén, más cantidad de servicios públicos disponibles.
Va en aumento, lo que quiere decir que se presenta una dispersión positiva
entre las variantes, un aumento dado de X (nivel mayoritario de Sisbén)
determina con exactitud otro de Y (cantidad de servicios públicos disponibles)
• Realizar regresión múltiple en caso de que se determine dependencia entre
las variables cuantitativas

Nivel mayoritario de sisben


2,5
2
1,5
1
0,5
0
0 10 20 30 40 50 60
Cantidad de servicios
publicos disponibles
8
6
4
2
0
0 10 20 30 40 50 60

Relacionar la información obtenida con el problema.

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,260104397
Coeficiente de determinación R^2 0,067654297
R^2 ajustado 0,048230429
Error típico 1,603173827
Observaciones 50

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadradosPromedio de los cuadrados F Valor crítico de F
Regresión 1 8,952016632 8,952016632 3,48305 0,068116274
Residuos 48 123,3679834 2,57016632
Total 49 132,32

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 2,224532225 0,689609252 3,225786515 0,00226 0,837979894 3,611084555 0,837979894 3,611084555
Variable X 1 0,964656965 0,516883987 1,866292995 0,06812 -0,074607946 2,003921875 -0,074607946 2,003921875

En el caso de análisis de varianza se obtiene p-valor menor a 0,05 lo que


significa que el modelo es válido globalmente para hacer una predicción.
El p-valor para la constante (B0) es también menor a 0,05 lo mismo ocurre
para el p-valor correspondiente a B1 lo que quiere decir que ambos
estimadores pueden permanecer en el modelo.
El r2 es de 0,92 los que quiere decir que el 92% de la Población de 15 años
sin Educación Básica Primaria Completa se explica por cambios en la
Población Total
Realizar regresión múltiple en caso de que se determine dependencia entre
las variables cuantitativas.
Actividad 3. Propuesta de solución a la problemática
Descripción de la actividad.
Finalmente, el grupo deberá responder a la pregunta: ¿Qué alternativa de
solución plantea para la problemática estudiada?, dicha respuesta deberá
estar justificada descriptivamente, es decir para ello (utilizará tablas,
gráficos, medidas, diagramas, entre otros) a partir de los resultados
estadísticos descriptivos realizados en la actividad anterior (50 primeros
datos) y la información obtenida de la problemática planteada.
Del diagrama estadístico Tipo de Riesgo al que se Expone la Población se
desprende que la población con mayor exposición los Riesgos están
asociados con Movimiento de Masas y Sismos. De la tabla de contingencia
entre el Grado de Marginación y Tipo de Riesgo al que se expone la población
se desprende que la población expuestas los Riesgos de Movimiento en
Masas y Sismos tienen un grado de marginación medio y bajo, es decir que
están próximos a salir de la condición de marginalidad lo que los motivará a
mudarse a zonas más seguras. En cuanto a la población de 15 años o más
sin educación básica completa se puede notar que el promedio de los
municipios es de 7.965 el cual es un número manejable, que se pueden
identificar y reinsertarlos al sistema educativo con el objeto de especializar la
mano de obra. De la tabla de distribución del %Población con 15 años o más
analfabeta se nota que está concentrada en ciertos municipios ya que la
media, la mediana y la moda tienen valores muy parecido lo que es
indicativo de la concentración de los datos, así como el coeficiente de
variación es bajo. Esto sugiere que las políticas públicas deben dirigirse a
esos lugares con el objeto de combatir esa debilidad en nuestra población.
En cuanto a la relación entre la Población y la Población mayor de 15 años
completa se nota que están altamente relacionadas como lo explica el
coeficiente de determinación y la correlación, lo que puede decirse que la
población de 15 años o más sin educación básica completa es una parte de la
población que guarda proporción en todos los lugares habitados.
Conclusiones

• La Estadística contribuye a documentar los datos y extraer información


que no es posible conocerla con solamente leer los datos.
• El diagrama de dispersión permite representar la relación entre la
variables estudiadas
• El coeficiente de determinación y el de correlación son los parámetros
utilizados para determinar la confiabilidad del modelo y grado de
correlación entre las variables.
• Los municipios encuestados son muy vulnerables y ademas viven altas
condiciones de pobreza.
• Tanto las medidas de dispersión como los gráficos de dispersión sirven
para observar el comportamiento que tiene algunos datos que son objeto
de estudio y que pretenden mostrar la relación que existe entre los
mismos o por el contrario una total desconexión que impiden brindar
soluciones.
• Se realizaron tablas de frecuencia para datos agrupados y no agrupados
teniendo en cuenta que los datos no agrupados son el conjunto de
observaciones que se presentan en su forma original tal y como fueron
recolectados, para obtener información directamente de ellos. mientras
que los datos agrupados son aquellos que ordenamos y clasificamos
cuando la muestra es 20 o mayor.
• Es muy importante para nuestra vida profesional venidera, que
manejemos los conceptos estadísticos de manera clara y con facilidad, de
igual forma le demos el uso más apropiado, siempre en pro de buscar
soluciones a cualquier tipo de problema que se nos pueda presentar en
nuestro diario vivir.
• Las variables cualitativas son aquellas que permiten la expresión de una
característica, una categoría, un atributo o una cualidad.
• las variables cuantitativas son aquellas que solo adoptan valores
numéricos.
• La cantidad de información que se desprende de la realización de los
estudios estadísticos es muy completa y nos da una idea exacta de la
situación que nos permite tomar las decisiones adecuadas que conducen a
las soluciones de los problemas de una población
• Cada estadístico nos da una información específica que nos permite
interpretar la realidad de la información recolectada para el momento que
se hizo el estudio.
Referencias

Jarrell, Stephen B. (1994). Basic Statistics (Special pre-publication edición).


Dubuque, Iowa: Wm. C. Brown Pub. p. 492. ISBN 0-697-21595-4.
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp
151 – 158). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219
Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México
City: Cengage Learning. (pp 675 – 686). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41
Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de
mercados. México City: Cengage Learning. (pp 686 – 695). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9
Ortegón Pava, M. (03,10,2018). Regresión y Correlación lineal. [Archivo de
video]. Recuperado de http://hdl.handle.net/10596/20621
https://campus21.unad.edu.co/ecbti52/mod/forum/discuss.php?d=16509#p
225368
García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid:
Paraninfo. (pp 26 -42). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052300007&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=03f8699ec7ccf10e8745c0ceb7b85bf1
Montero, J. M. (2007). Características de Una Distribución de
Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A. (pp
41-50). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0
Ortegón Pava, M. (2017). Ova_Medidas_Univariantes.Colombia.Recuperado
de http://hdl.handle.net/10596/11577
Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto
Politécnico Nacional. (pp 55-79). Recuperado de
http://site.ebrary.com/lib/unadsp/reader.action?ppg=1&docID=10436604&t
m=1471981857855
Matus, R., Hernández, Martha, and García, E (2010). Estadística. México,
D.F., MX: Instituto Politécnico Nacional, (2010). ProQuest ebrary. (pp 8-15).
Recuperado de
http://site.ebrary.com/lib/unadsp/reader.action?ppg=12&docID=10365616&
tm=1471981556569
Montero, J. M. (2007). Características de Una Distribución de
Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A. (pp
41-50). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0

Вам также может понравиться