Вы находитесь на странице: 1из 11

ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE DE LAS DOS VARIABLES

CUANTITATIVAS SELECCIONADAS. (LABORATORIO)

Descripción de la Actividad:

A partir de la base de datos “Indicadores socioeconómicos 125 municipios (2019) 16-1”,

desarrollar el Laboratorio denominado Regresión y correlación, el cual se encuentra en el

Entorno de aprendizaje práctico, en la carpeta Guía para el uso de recursos educativos. El

laboratorio lo puede desarrollar con el programa Infostat o Excel. Donde el estudiante deberá

realizar lo siguiente:

a. Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas.

Las dos variables cuantitativas seleccionas que posiblemente están relacionadas son:

 % de viviendas con piso de tierra, esta se tomará como variable X

 % Ocupantes en viviendas sin energía eléctrica, esta se tomará como la variable Y

b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de

relación entre las variables.


En la siguiente grafica se presenta el diagrama de dispersión referente a la relación entre

las 2 variables seleccionadas anteriormente.

De acuerdo al valor obtenido en el coeficiente de correlación se establece que la relación

entre las 2 variables seleccionas es aceptable.

c. Encuentre el modelo matemático que permite predecir el efecto de una variable

sobre la otra. ¿Es confiable?

Con las operaciones realizadas en Excel se obtuvieron los siguientes resultados:

∑ X = 605.006819
∑Y = 370.14

∑ X*Y = 5062.42

∑ X2 = 5904.7693

∑Y2 = 6316.729902

∑(X)2 = 366033.251

∑(Y)2 = 137005.55

Para hallar la ecuación de la recta que más se ajusta a los datos se utilizaron las siguientes

formulas.

 Para hallar el término a

∑ Y− b ∑X
A=
N

 Para hallar el termino b


N ∑ XY − ∑ X ∑Y
b=
N ∑ X2 − (∑X)2

Reemplazando en las ecuaciones se obtuvieron los siguientes valores

a = −2.358

b = 1.099

La ecuación de la recta que representa el modelo matemático es la siguiente

Y = −2.358 + 1.099X

Para hallar r se empleó la siguiente formula

N ∑ XY − ∑ X ∑ Y
r=
√[N ∑ X2 − (∑ X)2][N ∑ Y2 − (∑ Y)2]

Reemplazando en la ecuación se obtuvo el siguiente resultado

r = 0.8292

r2 = 0.6885

El modelo matemático es confiable ya que el valor de r2 cercano a 1 y de acuerdo a la teoría

cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que se

está intentando explicar. Igualmente se observa que los valores obtenidos con los cálculos
realizados en Excel coinciden con los valores que arroja directamente el programa al realizar

el grafico de dispersión.

Así mismo, la ecuación hace una buena estimación entre las variables debido a que el

coeficiente de determinación R2 explica el 68 % de la información y el valor del coeficiente

de correlación R confirma el grado de relación de las variables, que es del 82 %.

d. Determine el grado de correlación de las dos variables.

De acuerdo a los valores obtenidos del coeficiente de correlación r el grado de correlación de

las dos variables es ACEPTABLE de acuerdo a lo siguiente:

También se observa una correlación positiva, lo que significa que entre una variable y otra la

relación es lineal y directa, de manera que un cambio en una variable predice el cambio en la

otra variable.

e. Relacionar la información obtenida con el problema.

Al observar la gráfica de dispersión y los resultados obtenidos de la ecuación de la recta se

puede establecer que, si existe una alta relación entre la variable de % de viviendas con piso
de tierra y el % ocupantes en viviendas sin energía eléctrica, posiblemente debido a que

cuando las personas se ven obligadas a vivir en casas con pisos en tierra muy probablemente

no cuentan con servicios como la energía eléctrica, debido a la situación de pobreza en la que

se encuentran.

f. Establezca al menos 3 nuevos valores independientes para ser hallados a través del

modelo matemático calculado.

Se seleccionaron los siguientes valores correspondientes a la variable independiente X y se

reemplazaron en la ecuación de la recta

Y = −2.358 + 1.099X

Obteniendo los valores de Y presentados en la siguiente tabla.

Variable Variable
Valor Valor
independiente dependiente

X 5,8 Y 4,0162
X 6,7 Y 5,0053
X 7,2 Y 5,5548
ANÁLISIS DE CORRELACIÓN MÚLTIPLE DE LAS VARIABLES CUANTITATIVAS
SELECCIONADAS.

Descripción de la Actividad:

A partir de la base de datos suministrada “Indicadores socioeconómicos 125 municipios

(2019) 8-3”, cada estudiante, deberá:

a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas

independientes del estudio de investigación.

Las variables cuantitativas seleccionas que posiblemente están relacionadas son:

 % de viviendas con piso de tierra, esta se tomará como variable independiente X1

 Cantidad de resguardos indígenas, esta se tomará como variable independiente X2

 % Ocupantes en viviendas sin energía eléctrica, esta se tomará como la variable

dependiente Y

b. Realizar el diagrama de dispersión de dichas variables.

A continuación se presenta el diagrama de dispersión que relaciona las variables cuantitativas

mencionadas anteriormente.
% Ocupantes en viviendas sin energía

40,00
Cantidad de resguardos
eléctrica

indigenas

20,00
tierra)
10,00

0,00
0,00 10,00 20,00 30,00 indigenas)

c. Calcular la recta de regresión y el coeficiente de correlación para probar

estadísticamente su relación.

Al realizar la regresión a partir de las variables seleccionadas se obtuvo la siguiente tabla

resumen donde se pueden identificar diferentes parámetros, para el posterior análisis.


Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,832049246
Coeficiente de determinación R^2 0,692305948
R^2 ajustado 0,687261783
Error típico 3,628635961
Observaciones 125

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 3614,311605 1807,155803 137,2488759 5,96026E-32
Residuos 122 1606,37387 13,16699894
Total 124 5220,685476

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción -1,991335986 0,545782797 -3,648586943 0,000389162 -3,071767544 -0,910904428 -3,071767544 -0,910904428
Variable X 1 1,089381817 0,066961295 16,26882847 2,39023E-32 0,956825246 1,221938388 0,956825246 1,221938388
Variable X 2 -0,18615729 0,151535444 -1,228473582 0,221633782 -0,486136838 0,113822257 -0,486136838 0,113822257
El coeficiente de correlación es igual a
r = 0.832
El coeficiente de determinación es igual a
𝑟2 = 0.692

La recta de regresión se determina por:

𝑟 = 𝑟 + 𝑟1𝑟1 + 𝑟2𝑟2

Reemplazando en la ecuación los coeficientes obtenidos en el análisis de regresión se


obtiene

𝑟 = −1.991 + 1.089 𝑟1 − 0.186 𝑟2

Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente

de determinación R2 explica aproximadamente el 70% de la información y el valor del

coeficiente de correlación R confirma el grado de relación de las variables, que es del 83

%.

d. Relacionar la información obtenida con el problema.

Al observar los resultados obtenidos de la ecuación de la recta y los coeficientes de

relación y determinación se puede establecer que, si existe una relación ACEPTABLE

entre la variable de % de viviendas con piso de tierra , la cantidad de resguardos

indígenas con él % ocupantes en viviendas sin energía eléctrica, posiblemente debido a

que cuando las personas se ven obligadas a vivir en casas con pisos en tierra muy

probablemente no cuentan con servicios como la energía eléctrica.

Вам также может понравиться