Вы находитесь на странице: 1из 15

INTRODUCCION

En nuestra vida cotidiana regularmente usamos la estadística para la mayor parte de nuestra
vida, y una parte importante que debemos aprender es sobre el análisis de correlación
simple y regresión simple, para lo que se requiere un cantidad de análisis estadísticos los
cuales a través de diferentes aplicaciones de datos y gráficas, podemos saber la relación de
ellos y la variación de la cantidad.

1
Contenido
INTRODUCCION ................................................................................................................................... 1
OBJETIVOS ........................................................................................................................................... 3
OBJETIVOS GENERALES ................................................................................................................... 3
OBJETIVOS ESPECIFICOS .................................................................................................................. 3
MARCO TEORICO ................................................................................................................................. 4
1. CORRELACION SIMPLE............................................................................................................. 4
1.1. DEFINICION...................................................................................................................... 4
1.2 FORMULA ........................................................................................................................ 5
1.3 EJERCICIO DE APLICACIÓN............................................................................................... 7
2. REGRESION SIMPLE ................................................................................................................. 8
2.1. DEFINICION...................................................................................................................... 8
2.2 FORMULA ........................................................................................................................ 9
2.3 EJERCICIO DE APLICACIÓN............................................................................................. 11
3. DIFERENCIA ENTRE CORRELACION Y REGRESION ................................................................. 13
CONCLUSIONES ................................................................................................................................. 14
BIBLIOGRAFIA .................................................................................................................................... 15

2
OBJETIVOS

OBJETIVOS GENERALES

 Conocer cómo se emplean las formulas obtenidas del conjunto de datos y sabes la

relación entre las variables X y Y

OBJETIVOS ESPECIFICOS

 Analizar sus aspectos importantes en la Ingeniería.

 Conocer y calcular el coeficiente de correlación, coeficiente de Rango de Sperman,

Diagrama de Dispersión y la Ecuación de Regresión.

 Interpretar las respuestas dadas por los cálculos.

 Conocer la importancia de la correlación y regresión simple

3
MARCO TEORICO

1. CORRELACION SIMPLE
1.1. DEFINICION: Permite obtener una relación entre dos conjuntos de puntuaciones.
Donde en la muestra o toma de datos nos damos cuenta que es muy frecuente
encontrar variables que, están relacionados entre si.
 Si se tiene n observaciones bidimensionales, cada par de puntos (X, Y) se
representa en un sistema de coordenadas rectangulares por un punto como
parejas de observaciones se tenga.
 El diagrama de dispersión representa el par de valores observados de las
variables independientes y dependientes.

Correlación Directa: La correlación directa se da cuando al aumentar una de las


variables la otra aumenta. La recta correspondiente a la nube de puntos de la
distribución es una recta creciente.

Figura Nº1

Fuente: https://www.vitutor.com/estadistica/bi/correlacion.html

Correlación Inversa: La correlación inversa se da cuando al aumentar una de las


variables la otra disminuye. La recta correspondiente a la nube de puntos de la
distribución es una recta decreciente.

4
Figura Nº2

Fuente: https://www.vitutor.com/estadistica/bi/correlacion.html

Correlación Nula: La correlación nula se da cuando no hay dependencia de ningún


tipo entre las variables. En este caso se dice que las variables son incorreladas y la
nube de puntos tiene una forma redondeada.

Figura Nº3

Fuente: http://elmercaderdelasalud.blogspot.pe/2012/02/la-reflexion-critica-v.html

1.2 FORMULA
Coeficiente de Correlación (r ): Representa la intensidad de la observación entre las
variables X y Y mediante al modelo lineal de Pearson.
Podemos tomar Valores desde -1.00 hasta 1.00

Figura Nº4
5
Fuente: http://elmercaderdelasalud.blogspot.pe/2012/02/la-reflexion-critica-v.html
Para la intensidad de la Relación entre dos Conjuntos de Variables utilizamos la
formula.
𝑛(Σ𝑋𝑌) − (Σ𝑋)(Σ𝑌)
𝑟=
√[𝑛(Σ𝑥 2 ) − (Σ𝑥)2 ][𝑛(Σ𝑦 2 ) − (Σ𝑦)2
Coeficiente de Determinación: Mira la proporción total en la variable total
dependiente Y que se explica por la variación en la variación independiente X.
(r)2
Coeficiente de No Determinación: Mide la proporción de la variación total en Y
que no es explicada por la variación en X
1 − (r)2
Correlación De rango: Medir los datos que están o pueden clasificarse de menor a
mayor o viceversa.
La intensidad y la dirección del coeficiente de Rango de Sperman, lo podemos
representar utilizando el mismo esquema del coeficiente de correlación producto.
Σ𝑑 2
𝑅𝑠 = 1 − 6
𝑛(𝑛2 − 1)
Donde
d: es la diferencia entre los rangos para cada par.
n: es el número de observaciones por pares.

6
1.3 EJERCICIO DE APLICACIÓN
En un colegio se realizó una prueba sorprsa para comprobar si estaban preparados
para sus exámenes finales y saber si su maestro enseñaba de acuerdo al cronograma
los resultados en la tabla Nº1
TABLA Nº1
Clasificación de las Notas Prueba Test con las de la Prueba Final
Alum. P.T P.F XY X^2 Y^2 x y d^2
1 08 10 80 64 100 1 1 0
2 10 11 110 100 121 2 2 0
3 12 13 156 144 169 3 3 0
4 15 14 210 225 196 5 4 1
5 16 18 288 256 324 6 7 1
6 13 15 195 169 225 4 5 1
7 18 17 306 324 289 8 6 4
8 17 19 323 289 361 7 8 1
Total 109 117 1668 1571 1785 8
Fuente: Elaboración Propia.
a) Coeficiente de Correlacion

𝑛(Σ𝑋𝑌) − (Σ𝑋)(Σ𝑌)
𝑟=
√[𝑛(Σ𝑥 2 ) − (Σ𝑥)2 ][𝑛(Σ𝑦 2 ) − (Σ𝑦)2

8(1668) − (109)(117)
𝑟=
√[8(1571) − (109)2 ][8(1785) − (117)2

𝑟 = 0.9275
La correlación entre la Prueba de Test (x) y la prueba Final (y) es de 0.92, por tanto
presenta una correlación positiva intensa.
b) Coeficiente de Determinación.
(r)2 = 𝑟 ∗ 𝑟
(r)2 = 0.9275 ∗ 0.9275

7
(r)2 = 0.86
La variación total de la prueba Final (y) es explicada por la Variación en la prueba
de Test (x) en 0.86
c) Coeficiente de No Determinación:
1 − (r)2 = 1 − 0.86
1 − (r)2 = 0.14
La variación total de la prueba Final (y) no es explicada por la Variación en la
prueba de Test (x) en 0.14
a) Coeficiente de Correlación Spearman
Σ𝑑 2
𝑅𝑠 = 1 − 6
𝑛(𝑛2 − 1)
64
𝑅𝑠 = 1 − 6
8(82 − 1)
𝑅𝑠 = 0.23
El Coeficiente de Correlación de rango de Spearman es 0.23, por lo tanto la
correlación no es perfecta y es positiva.

2. REGRESION SIMPLE

2.1. DEFINICION: Se basa en la búsqueda de un modelo matemático que puede explicar


de la mejor forma posible la relación entre dos variables. A la variable conocida se
le denomina variable independiente (X) y la variable que se va a predecir se le
denomina variable dependiente (Y).

 Las variables independientes y dependientes se asocian linealmente.


 Para cada valor de X existe un grupo de valores Y que se distribuyen en forma
normal.
 La desviación estándar de distribuciones normales son iguales.
 Las medias de estas distribuciones normales de valores Y se encuentran todas
en la recta de regresión.

8
Figura Nº5

Fuente: http://elmercaderdelasalud.blogspot.pe/2012/02/la-reflexion-critica-v.html

2.2 FORMULA

a) Ecuación de Regresión: la relación entre dos variables, la variable independiente


constituye la conocida; en tanto la que predecimos en la variable dependiente.

Figura Nº6

Fuente: http://biplot.usal.es/problemas/regresion/teoria/regsimple.htm

b) Principio de mínimos Cuadrados: Consiste en determinar los valores de "a" y "b


" a partir de la muestra, es decir, encontrar los valores de a y b con
los datos observados de la muestra. El método de estimación es el de Mínimos
Cuadrados, mediante el cual se obtiene

9
Σ𝑦 Σ𝑥
𝑎= −𝑏
n 𝑛
𝑛(Σ𝑥𝑦) − (Σ𝑥)(Σ𝑦)
𝑏=
𝑛(Σ𝑥 2 ) − (Σ𝑥)2

𝑦 = 𝑎 + 𝑏𝑥

Y= es el valor promedio pronosticado de la variable Y para un valor seleccionado


de X.

c) Error Estandar del Estimador: el error estándar del estimador mide la dispersión
o variación con respecto a la recta de regresión. El error estándar del estimador es
la desviación estándar condicional de la variable dependiente Y dado un valor de la
variable independiente Y.

Σ𝑦 2 − 𝑎Σ𝑦 − 𝑏Σ𝑥𝑦
𝑆𝑦𝑥 = √
𝑛−2

Syx= Error estándar de la estimación

n= número de pares de observación

a= intersección y, o valor estimado de (y) cuando X=0

b= intersección de la recta, es decir, el cambio promedio en Y por unidad de


cambio X

Si los valores se distribuyen en forma normal se tiene:

𝕏 ± 1𝑠= representa aproximadamente el 68 % central de los valores

𝕏 ± 1𝑠= representa aproximadamente el 95.5 % central de los valores

𝕏 ± 1𝑠= representa aproximadamente el 99.7 % central de los valores

10
2.3 EJERCICIO DE APLICACIÓN
En un colegio de nivel secundario, se hizo diseño una prueba para ver si existía una
relación entre la edad del maestro y los promedios de las notas de los alumos por
clase, los resultados obtenidos se detallan en la tabla Nº2
TABLA Nº2
Pago mensual en soles de un grupo de empleados en un mes determinado
N Edad del Nota de los XY X^2 Y^2
Pro. alumnos
1 48 14 672 2304 196
2 56 13 728 3136 169
3 74 15 1110 5476 225
4 70 13 910 4900 169
5 75 16 1200 5625 256
6 60 17 1020 3600 289
7 78 15 1170 6084 225
461 103 6810 31125 1529

Fuente: Elaboración Propia


1. Diagrama de dispersión
Gráfico Nº1

Edad de los Profesores vs Notas


18
16
14
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7 8

Fuente: Elaboración Propia


b) La ecuación de Regresión

11
𝑛(Σ𝑥𝑦) − (Σ𝑥)(Σ𝑦)
𝑏=
𝑛(Σ𝑥 2 ) − (Σ𝑥)2
7(6810) − (461)(103)
𝑏=
7(31125) − (461)2
𝑏 = 0.03

Σ𝑦 Σ𝑥
𝑎= −𝑏
n 𝑛

103 461
𝑎= − 0.03
7 7

𝑎 = 12.74

𝑦 = 𝑎 + 𝑏𝑥

𝑦 = 12.74 + 0.03𝑥

c) Pronosticar el valor Y para cada valor en x

x=48 14.18
x=56 14.42
x=74 14.96
x=70 14.84
x=75 14.99
x=60 14.54
x=78 15.08

12
3. DIFERENCIA ENTRE CORRELACION Y REGRESION

CORRELACION: El análisis de correlación se encuentra estrechamente vinculado con el


análisis de regresión y ambos pueden ser considerados de hecho como dos aspectos de un
mismo problema.

La correlación entre dos variables es – otra vez puesto en los términos más simples – el
grado de asociación entre las mismas. Este es expresado por un único valor llamado
coeficiente de correlación (r), el cual puede tener valores que oscilan entre -1 y +1. Cuando
“r” es negativo, ello significa que una variable (ya sea “x” o “y”) tiende a decrecer cuando
la otra aumenta (se trata entonces de una “correlación negativa”, correspondiente a un valor
negativo de “b” en el análisis de regresión). Cuando “r” es positivo, en cambio, esto
significa que una variable se incrementa al hacerse mayor la otra (lo cual corresponde a un
valor positivo de “b” en el análisis de regresión).

REGRESION: La correlación indica la fuerza y la dirección de una relación


lineal y proporcionalidad entre dos variables estadísticas. Se considera que dos variables
cuantitativas están correlacionadas cuando los valores de una de ellas varían
sistemáticamente con respecto a los valoreshomónimos de la otra: si tenemos dos variables
(A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y
viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de
causalidad.
RELACION ENTRE DOS VARIABLES:
Se dice que dos variables X e Y están relacionadas estadísticamente cuando conocida la
primera se puede estimar aproximadamente el valorde la segunda, ejemplos:
Ingresos y gastos de una familia.

Mide el grado de relación lineal entre dos variables que varían conjuntamente.Pongamos un
ejemplo, Supongamos que el Gerente de Personal de una empresa de servicios, cree que
quizá haya relación entre el ausentismo y la edad; quiere tomar como punto de referencia a

13
5 trabajadores de distintas edades para desarrollar un modelo de predicción de días de
ausencia, a continuación, los siguientes datos recolectados:

CONCLUSIONES

 Aprendimos a reconocer y comprende los resultados que nos da cada formula.

 Conocer la relación entre las variables independientes y dependiente (X, Y)

 Conocemos la importancia del análisis de regresión simple y correlación simple en


la Ingeniería Industrial

14
BIBLIOGRAFIA

 PORTILLA, Chimal Enrique (1992) Estadística Primer Curso


 LINCOYAN, Portus Govindea (1992) Curso Práctico De Estadística.
Mc. Graw Hill
 Medidas de Tendencia Central. n.d. En Wikipedia. Consultado Octubre
27, 2017 Fuente:
https://es.wikipedia.org/wiki/Medidas_de_tendencia_central
 https://www.vitutor.com/estadistica/bi/correlacion.html

15

Вам также может понравиться