Вы находитесь на странице: 1из 13

Paso 4 descripciones de la información

Presentado por
Cecilia Castro Ruiz
Código: 32817304
Grupo 126

Tutora
Esteffi Luz Peña
611

Estadística Descriptiva
204040-611

Universidad Nacional Abierta y a Distancia UNAD

Psicología

CEAD
Barranquilla, Atlántico
Introducción

En este paso cuatro desarrollaremos los diferentes conceptos estadísticos de regresión y


correlación, considerando que regresión es el método que permite la relación funcional
entre dos o más variables y correlación es la forma numérica estadística que evalúa o
mide una variable dependiente con respecto a otra variable independiente.
También, definimos por medio de un mapa mental en donde se visualizan las diferentes
ideas de una forma esquematizada, las cuales se relacionaran entre sí de acuerdo al
tema a tratar, los conceptos teóricos asociados a regresión y correlación de una forma
breve y sencilla como son: Diagrama de dispersión, correlación lineal simple,
coeficiente de determinación R2, correlación positiva y correlación negativa, coeficiente
de correlación línea y como nos ayuda a medir.
Todos, estos laboratorios representados por un diagrama de dispersión utilizando la base
de datos “Indicadores socioeconómicos 125 municipios (2019) 16-1”.
Objetivos Generales
Interpretar las medidas bivariante, en función de la descripción, de la problemática, a
partir del trabajo realizado, con variables cuantitativas, realizados con la base de datos
denominados “Indicadores socioeconómicos 125 (2019) 16-1”.

Objetivos Específicos

 Resumir mediante un mapa mental las medidas bivariantes de regresión,


describiendo ampliamente una de ellas.
 Definir brevemente los conceptos asociados a regresión y correlación como son:
Diagrama de dispersión, correlación lineal simple, coeficiente de terminación
R2, correlación positiva y correlación negativa y responder la pregunta ¿qué es
coeficiente de correlación lineal y como nos ayuda a definir.
 Desarrollar el laboratorio denominado regresión y correlación el cual se
encuentra en el entorno de aprendizaje práctico.
 Realizar el laboratorio tomando la base de datos suministrada “Indicadores
socioeconómicos 125 (2019) 16-1.

Actividad 1. Mapa Mental


REGRESION Y CORRELACIÓN CORRELACION
REGRESIÓN
DIAGRAMA DE
LINEAL SIMPLE
DISPERSIÓPN

REGRESIÓN MULTIPLE

POSIBLEMENTE SE PUEDE EXISTIR


RELACION ENTRE VARIAS VARIABLE
INDEPENDIENTES Y OTRA
DEPENDIENDIENTE

Un marco modificado, ecuación


modificada regresión múltiple Aplicaciones de la regresión Multiple
Y = α + β1 X1 +β3X3 + ∊
Identificación de variables explicativas: Crea un modelo
donde se seleccione la respuesta, descartando las que no
aporten información.

Detección de interacciones entre variables que afectan a


la variable respuesta

Observaciones anómalas
son errores en la entrada de Linealidad La variable respuesta depende
datos que se debe tener linealmente de la variable explicativa, se
mucho cuidado introduce en el modelo no lineal

, son erorescolinealidad
en la entradacuando dos
devariables
datos independientes Normalidad y equidistribución de los residuos la validez
Numero de variables independiente
están relacionadas y están del modelo depende de la misma dispersión para cada
una de las reglas es incluir por lo
incluidas en un modelo, combinación de valores de las variables independiente
menos 20 observaciones por cada
posiblemente ninguna sea
variable independiente número
considerada significativa
menor nos llevará a no poder obtener
conclusiones de tipo II

Actividad 2. Definición de Conceptos.


Descripción de la Actividad:
Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

-Diagrama de dispersión.
-Correlación lineal simple.
-Coeficiente de determinación R2
-Correlación positiva y correlación negativa
-¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

-DIAGRAMA DE DISPERSIÓN
Es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar
los valores de dos variables para un conjunto de datos, los datos se muestran como un
conjunto d puntos cada uno con el valor de una variable, que determina la posición en el
eje horizontal (x) y el valor de la otra variable determinado por la posición en el eje
vertical (y). (Tomado de la enciclopedia Wikipedia).
Los dos conjuntos asociados de puntos aparecen en pares Ejemplo (x, y) mostrándolos
como una nube de puntos.
Se relacionan por la forma de la nube de puntos puede ser una relación negativa,
cuando los valores crecientes de x están asociados con los valores decrecientes de y, o
una relación positiva (x,y) es cuando los valores crecientes de x están asociados con los
vales crecientes de (Y)

Procedimiento para hacer un diagrama de dispersión


1. Recolectar datos pareados (x,y)
2. Rotular el eje x y el eje y
3. Encontrar los valores mínimos y máximo tanto para x como para y, utilizar
estos valores para elaborar la escala de los ejes horizontales x y los ejes
verticales y.
4. Plotear los datos pareados (x, y) cuando hayan dos pares de datos que tengan los
mismos valores, hay que dibujar círculos.
5. Examinar la forma de la nube de puntos para identificar.

-Correlación negativa

Cuando el aumento de x provocará una tendencia a la disminución de y

-Correlación positiva

Aumento de y depende de un aumento de x o un aumento de x provocara una


tendencia a un aumento de y.

- Correlación lineal simple


Se refiere al grado de variación conjunta existente entre dos o mas variables

En la figura (a) muestra cuando mayores son las puntuaciones en una variable,
mayores son las puntuaciones en la otra, cuando ocurre esto los puntos se sitúan
en una línea recta ascendente y hablamos re relación lineal positiva.

En la figura (b) esta situación muestra que mayores son las puntuaciones en una
de las variables menores son en otras los puntos se sitúan en una línea recta
descendente y hablamos de relación lineal negativa.

Actividad 3. Realizar el laboratorio de regresión y correlación


lineal
A partir de la base de datos “Indicadores socioeconómicos 125
municipios (2019) 16-1”, desarrollar el Laboratorio denominado
Regresión y correlación,
a. Identificar dos variables cuantitativas de la situación estudiada
que puedan estar relacionadas.
b. Realizar el diagrama de dispersión de dichas variables y
determinar el tipo de relación entre las variables.
c. Encuentre el modelo matemático que permite predecir el efecto
de una variable sobre la otra. ¿Es confiable?
d. Determine el grado de correlación de las dos variables.
e. Relacionar la información obtenida con el problema.
Establezca al menos 3 nuevos valores independientes para ser
hallados a través del modelo matemático calculado

Laboratorio

a. Identificar dos variables cuantitativas de la situación


estudiada que puedan estar relacionadas.

Nuestras variables cualitativas serán:


. % de Población de 15 años o más analfabeta,
i. % Viviendas con algún nivel de hacinamiento

b. Realizar el diagrama de dispersión de dichas variables y


determinar el tipo de asociación entre las variables.

60,00

50,00

40,00

30,00

20,00

10,00

0,00
0,00 5,00 10,00 15,00 20,00 25,00 30,00

El tipo de asociación es no lineal como se aprecia en la gráfica y


también lo podemos deducir del coeficiente de correlación que
es muy cercano a cero
c. Encuentre el modelo matemático que permite predecir el
efecto de una variable sobre la otra. ¿Es confiable?

Sacando los cálculos en Excel tenemos.

𝑀𝑒𝑑𝑖𝑎𝑠 ∶ 𝑋̅ = 8.29 , 𝑌̅ = 34.94


𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛𝑒𝑠 ∶ 𝜎𝑥 = 3.75 , 𝜎𝑦 = 7.11
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 ∶ 𝑟 = 0.33

La ecuación es de la forma 𝑦 = 𝑎𝑥 + 𝑏 hallemos a y b

34.94
𝑏 = 0.33 ∗ ( ) = 0.63
8.29
𝑎 = 34.94 − 8.29 ∗ 0.63 = 29.69
𝑦 = 0.63𝑥 + 29.69

No es confiable.

d. Determine el grado de relación de las dos variables.

Correlación mínima

e. Relacionar la información obtenida con el problema.

Esto nos muestra que el porcentaje de Población de 15


años o más analfabeta no es proporcional o inversamente
proporcional a los niveles de hacinamientos de las casas
de los municipios.

f. Establezca al menos 3 nuevos valores independientes


para ser hallados a través del modelo matemático
calculado.

x y
9,43 35,63122257
4,23 32,35503948
16,18 39,88202566
Actividad 4. Regresión y correlación múltiple
A partir de la base de datos suministrada “Indicadores
socioeconómicos 125 municipios (2019) 16-1”, cada estudiante,
deberá:

a. Identificar una variable cuantitativa dependiente y varias


variables cuantitativas independientes del estudio de
investigación.
b. Realizar el diagrama de dispersión de dichas variables.
c. Calcular la recta de regresión y el coeficiente de correlación
para probar estadísticamente su relación.
d. Relacionar la información obtenida con el problema.
e. Identificar una variable cuantitativa dependiente y varias
variables cuantitativas independientes del estudio de
investigación.
Dependientes
- % de Población de 15 años o más analfabeta
Independientes:
- Población total(habitantes)
- Población de 15 años o más sin Educación básica primaria
completa
- Lugar que ocupa en el contexto nacional
- cantidad de servicios publicos disponibles

f. Realizar el diagrama de dispersión de dichas variables.

- Población total vs % 15 años o mas analfabetas

30,00

25,00

20,00

15,00

10,00

5,00

0,00
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
- Población de 15 años o más sin Educación básica
primaria completa vs % 15 años o mas analfabetas

30,00

25,00

20,00

15,00

10,00

5,00

0,00
0 20000 40000 60000 80000 100000

- Lugar que ocupa en el contexto nacional vs % 15 años


o mas analfabetas

30,00

25,00

20,00

15,00

10,00

5,00

0,00
0 200 400 600 800 1000 1200
- Cantidad de servicios publicos disponibles vs % 15
años o mas analfabetas

30,00

25,00

20,00

15,00

10,00

5,00

0,00
0 1 2 3 4 5 6 7 8

g. Calcular la recta de regresión y el coeficiente de correlación


para probar estadísticamente su relación.

Media coef de
x y Media X Y VAR X VAR Y correlacion Recta
% de Población de
Población 15 años o más
total(habitantes) analfabeta 45885,4 8,29272 105740,244 3,75221 -0,37709001 y=-0,0000134x+8,9
Población de 15 años
o más sin Educación % de Población de
básica primaria 15 años o más -
completa analfabeta 9254,86 8,29272 14002,05632 3,75221 0,337917209 y=-0,00009x+9,1307
% de Población de
Lugar que ocupa en el 15 años o más
contexto nacional analfabeta 941,6 8,29272 88,04645035 3,75221 0,068175457 y=0,0029x+5,557
% de Población de
cantidad de sercicios 15 años o más -
publicos disponibles analfabeta 3,184 8,29272 1,719827448 3,75221 0,421771159 y=-0,92x+11,22

h. Relacionar la información obtenida con el problema.


Esto nos muestra que no hay ninguna relación lineal entre la variable
% de Población de 15 años o más analfabeta y Población
total(habitantes), Población de 15 años o más sin Educación básica
primaria completa, Lugar que ocupa en el contexto nacional o
cantidad de servicios públicos disponibles lo cual nos dice que el
porcentaje de población de 15 años o más analfabeta no depende
linealmente de las otras variables.

Referencias bibliográficas:

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:


Paraninfo. Paginas. 151 – 158

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.


México City: Cengage Learning. Páginas 675 – 686
Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación
de mercados. México City: Cengage Learning. Páginas 686 – 695
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:
Paraninfo. Paginas. 151 – 158