Академический Документы
Профессиональный Документы
Культура Документы
En nuestra vida cotidiana regularmente usamos la estadística para la mayor parte de nuestra
vida, y una parte importante que debemos aprender es sobre el análisis de correlación
simple y regresión simple, para lo que se requiere un cantidad de análisis estadísticos los
cuales a través de diferentes aplicaciones de datos y gráficas, podemos saber la relación de
ellos y la variación de la cantidad.
1
Contenido
INTRODUCCION ................................................................................................................................... 1
OBJETIVOS ........................................................................................................................................... 3
OBJETIVOS GENERALES ................................................................................................................... 3
OBJETIVOS ESPECIFICOS .................................................................................................................. 3
MARCO TEORICO ................................................................................................................................. 4
1. CORRELACION SIMPLE............................................................................................................. 4
1.1. DEFINICION...................................................................................................................... 4
1.2 FORMULA ........................................................................................................................ 5
1.3 EJERCICIO DE APLICACIÓN............................................................................................... 7
2. REGRESION SIMPLE ................................................................................................................. 8
2.1. DEFINICION...................................................................................................................... 8
2.2 FORMULA ........................................................................................................................ 9
2.3 EJERCICIO DE APLICACIÓN............................................................................................. 11
3. DIFERENCIA ENTRE CORRELACION Y REGRESION ................................................................. 13
CONCLUSIONES ................................................................................................................................. 14
BIBLIOGRAFIA .................................................................................................................................... 15
2
OBJETIVOS
OBJETIVOS GENERALES
Conocer cómo se emplean las formulas obtenidas del conjunto de datos y sabes la
OBJETIVOS ESPECIFICOS
3
MARCO TEORICO
1. CORRELACION SIMPLE
1.1. DEFINICION: Permite obtener una relación entre dos conjuntos de puntuaciones.
Donde en la muestra o toma de datos nos damos cuenta que es muy frecuente
encontrar variables que, están relacionados entre si.
Si se tiene n observaciones bidimensionales, cada par de puntos (X, Y) se
representa en un sistema de coordenadas rectangulares por un punto como
parejas de observaciones se tenga.
El diagrama de dispersión representa el par de valores observados de las
variables independientes y dependientes.
Figura Nº1
Fuente: https://www.vitutor.com/estadistica/bi/correlacion.html
4
Figura Nº2
Fuente: https://www.vitutor.com/estadistica/bi/correlacion.html
Figura Nº3
Fuente: http://elmercaderdelasalud.blogspot.pe/2012/02/la-reflexion-critica-v.html
1.2 FORMULA
Coeficiente de Correlación (r ): Representa la intensidad de la observación entre las
variables X y Y mediante al modelo lineal de Pearson.
Podemos tomar Valores desde -1.00 hasta 1.00
Figura Nº4
5
Fuente: http://elmercaderdelasalud.blogspot.pe/2012/02/la-reflexion-critica-v.html
Para la intensidad de la Relación entre dos Conjuntos de Variables utilizamos la
formula.
𝑛(Σ𝑋𝑌) − (Σ𝑋)(Σ𝑌)
𝑟=
√[𝑛(Σ𝑥 2 ) − (Σ𝑥)2 ][𝑛(Σ𝑦 2 ) − (Σ𝑦)2
Coeficiente de Determinación: Mira la proporción total en la variable total
dependiente Y que se explica por la variación en la variación independiente X.
(r)2
Coeficiente de No Determinación: Mide la proporción de la variación total en Y
que no es explicada por la variación en X
1 − (r)2
Correlación De rango: Medir los datos que están o pueden clasificarse de menor a
mayor o viceversa.
La intensidad y la dirección del coeficiente de Rango de Sperman, lo podemos
representar utilizando el mismo esquema del coeficiente de correlación producto.
Σ𝑑 2
𝑅𝑠 = 1 − 6
𝑛(𝑛2 − 1)
Donde
d: es la diferencia entre los rangos para cada par.
n: es el número de observaciones por pares.
6
1.3 EJERCICIO DE APLICACIÓN
En un colegio se realizó una prueba sorprsa para comprobar si estaban preparados
para sus exámenes finales y saber si su maestro enseñaba de acuerdo al cronograma
los resultados en la tabla Nº1
TABLA Nº1
Clasificación de las Notas Prueba Test con las de la Prueba Final
Alum. P.T P.F XY X^2 Y^2 x y d^2
1 08 10 80 64 100 1 1 0
2 10 11 110 100 121 2 2 0
3 12 13 156 144 169 3 3 0
4 15 14 210 225 196 5 4 1
5 16 18 288 256 324 6 7 1
6 13 15 195 169 225 4 5 1
7 18 17 306 324 289 8 6 4
8 17 19 323 289 361 7 8 1
Total 109 117 1668 1571 1785 8
Fuente: Elaboración Propia.
a) Coeficiente de Correlacion
𝑛(Σ𝑋𝑌) − (Σ𝑋)(Σ𝑌)
𝑟=
√[𝑛(Σ𝑥 2 ) − (Σ𝑥)2 ][𝑛(Σ𝑦 2 ) − (Σ𝑦)2
8(1668) − (109)(117)
𝑟=
√[8(1571) − (109)2 ][8(1785) − (117)2
𝑟 = 0.9275
La correlación entre la Prueba de Test (x) y la prueba Final (y) es de 0.92, por tanto
presenta una correlación positiva intensa.
b) Coeficiente de Determinación.
(r)2 = 𝑟 ∗ 𝑟
(r)2 = 0.9275 ∗ 0.9275
7
(r)2 = 0.86
La variación total de la prueba Final (y) es explicada por la Variación en la prueba
de Test (x) en 0.86
c) Coeficiente de No Determinación:
1 − (r)2 = 1 − 0.86
1 − (r)2 = 0.14
La variación total de la prueba Final (y) no es explicada por la Variación en la
prueba de Test (x) en 0.14
a) Coeficiente de Correlación Spearman
Σ𝑑 2
𝑅𝑠 = 1 − 6
𝑛(𝑛2 − 1)
64
𝑅𝑠 = 1 − 6
8(82 − 1)
𝑅𝑠 = 0.23
El Coeficiente de Correlación de rango de Spearman es 0.23, por lo tanto la
correlación no es perfecta y es positiva.
2. REGRESION SIMPLE
8
Figura Nº5
Fuente: http://elmercaderdelasalud.blogspot.pe/2012/02/la-reflexion-critica-v.html
2.2 FORMULA
Figura Nº6
Fuente: http://biplot.usal.es/problemas/regresion/teoria/regsimple.htm
9
Σ𝑦 Σ𝑥
𝑎= −𝑏
n 𝑛
𝑛(Σ𝑥𝑦) − (Σ𝑥)(Σ𝑦)
𝑏=
𝑛(Σ𝑥 2 ) − (Σ𝑥)2
𝑦 = 𝑎 + 𝑏𝑥
c) Error Estandar del Estimador: el error estándar del estimador mide la dispersión
o variación con respecto a la recta de regresión. El error estándar del estimador es
la desviación estándar condicional de la variable dependiente Y dado un valor de la
variable independiente Y.
Σ𝑦 2 − 𝑎Σ𝑦 − 𝑏Σ𝑥𝑦
𝑆𝑦𝑥 = √
𝑛−2
10
2.3 EJERCICIO DE APLICACIÓN
En un colegio de nivel secundario, se hizo diseño una prueba para ver si existía una
relación entre la edad del maestro y los promedios de las notas de los alumos por
clase, los resultados obtenidos se detallan en la tabla Nº2
TABLA Nº2
Pago mensual en soles de un grupo de empleados en un mes determinado
N Edad del Nota de los XY X^2 Y^2
Pro. alumnos
1 48 14 672 2304 196
2 56 13 728 3136 169
3 74 15 1110 5476 225
4 70 13 910 4900 169
5 75 16 1200 5625 256
6 60 17 1020 3600 289
7 78 15 1170 6084 225
461 103 6810 31125 1529
11
𝑛(Σ𝑥𝑦) − (Σ𝑥)(Σ𝑦)
𝑏=
𝑛(Σ𝑥 2 ) − (Σ𝑥)2
7(6810) − (461)(103)
𝑏=
7(31125) − (461)2
𝑏 = 0.03
Σ𝑦 Σ𝑥
𝑎= −𝑏
n 𝑛
103 461
𝑎= − 0.03
7 7
𝑎 = 12.74
𝑦 = 𝑎 + 𝑏𝑥
𝑦 = 12.74 + 0.03𝑥
x=48 14.18
x=56 14.42
x=74 14.96
x=70 14.84
x=75 14.99
x=60 14.54
x=78 15.08
12
3. DIFERENCIA ENTRE CORRELACION Y REGRESION
La correlación entre dos variables es – otra vez puesto en los términos más simples – el
grado de asociación entre las mismas. Este es expresado por un único valor llamado
coeficiente de correlación (r), el cual puede tener valores que oscilan entre -1 y +1. Cuando
“r” es negativo, ello significa que una variable (ya sea “x” o “y”) tiende a decrecer cuando
la otra aumenta (se trata entonces de una “correlación negativa”, correspondiente a un valor
negativo de “b” en el análisis de regresión). Cuando “r” es positivo, en cambio, esto
significa que una variable se incrementa al hacerse mayor la otra (lo cual corresponde a un
valor positivo de “b” en el análisis de regresión).
Mide el grado de relación lineal entre dos variables que varían conjuntamente.Pongamos un
ejemplo, Supongamos que el Gerente de Personal de una empresa de servicios, cree que
quizá haya relación entre el ausentismo y la edad; quiere tomar como punto de referencia a
13
5 trabajadores de distintas edades para desarrollar un modelo de predicción de días de
ausencia, a continuación, los siguientes datos recolectados:
CONCLUSIONES
14
BIBLIOGRAFIA
15