Вы находитесь на странице: 1из 39

ANALISIS DE CORRELACION

LINEAL Y REGRESIN
LINEAL

ANALISIS DE CORRELACION LINEAL

OBJETIVOS

Definir los trminos variable dependiente e independiente.

Calcular, probar e interpretar la relacin entre dos variables utilizando el coeficiente


de correlacin.

ANLISIS DE CORRELACIN
Grupo de tcnicas para medir la asociacin entre dos variables.

Variable independiente:se conceptualiza como lacausao razn del


fenmeno a investigar.

Variable dependiente,es el efecto o consecuenciaque se genera en la


manipulacin de la variable independiente

En un experimento que estudia la relacin entre la exposicin a msica clsica y la capacidad


de lectura en nios, el investigador dividi a los nios en dos grupos (A y B). En el grupo A, los
nios escucharon msica de Mozart una hora al da durante un mes. En el grupo B, se pidi a
los padres que evitarn tocar msica clsica frente a los nios durante un mes. Al final del
mes, todos los nios tomaron una prueba de comprensin de lectura. Los que escucharon
msica de Mozart (grupo A), tuvieron una calificacin significativamente ms alta en el
examen. En este caso, la calificacin en el examen de comprensin de lectura es la variable
dependiente y la exposicin a la msica de Mozart es la variable independiente. Es decir, la
calificacin en la pruebadependede que el nio haya escuchado o no msica clsica. La
variable independiente, la exposicin a la msica de Mozart, esindependienteporque es algo
que puede ser manipulado o modificado por el investigador.

En un estudio con un diseo similar al ejemplo previo, los investigadores examinaron los
efectos de la nutricin en la capacidad de lectura. En el grupo A, los nios consumieron al
menos tres onzas de vegetales verde oscuro diariamente durante un mes. Los nios del grupo
B se alimentaron con su dieta acostumbrada. Al final del mes se aplic una prueba de
comprensin de la lectura a todos los nios. Aquellos que comieron vegetales verdes
diariamente no tuvieron resultados diferentes a los obtenidos por el grupo B.

COEFICIENTE DE CORRELACIN
Medida de la fuerza de la relacin lineal entre dos variables.

CARACTERSTICAS DEL COEFICIENTE DE CORRELACIN

1. El coeficiente de correlacin de la muestra se identifica con la letra minscula r.

2. Muestra la direccin y fuerza de la relacin lineal (recta) entre dos variables en


escala de intervalo o en escala de razn.

3. Vara de -1 hasta +1, inclusive.

4. Un valor cercano a 0 indica que hay poca asociacin entre las variables.

5. Un valor cercano a 1 indica una asociacin directa o positiva entre las variables.

6. Un valor cercano a -1 indica una asociacin inversa o negativa entre las variables.

EJERCICIO EN CLASE

ANLISIS DE REGRESIN
OBJETIVOS

Aplicar un anlisis de regresin para estimar la relacin lineal entre dos


variables.

Interpretar el anlisis de regresin.

ECUACIN DE REGRESIN Ecuacin que expresa la relacin lineal


entre dos variables.

PRINCIPIO DE LOS MNIMOS CUADRADOS Determina una ecuacin


de regresin al minimizar la suma de los cuadrados de las distancias
verticales entre los valores reales de Y y los valores pronosticados de Y.

Por lo tanto, si un vendedor hace 20 llamadas, debera vender 42.6316


copiadoras, nmero que se determina por

El valor b de 1.1842 significa que por cada llamada de ventas adicional, el


vendedor debera aumentar el nmero de copiadoras vendidas en
aproximadamente 1.2. En otras palabras, cinco llamadas de ventas adicionales en
un mes generarn ms o menos seis copiadoras ms vendidas, nmero
determinado por 1.1842(5) = 5.921.

El valor a de 18.9476 es el punto donde la ecuacin cruza el eje Y. Una traduccin


literal es que si no se hacen llamadas de ventas, es decir, X = 0, se vendern
18.9476 copiadoras.

Observe que X = 0 est fuera del rango de valores incluidos en la muestra y, por
lo tanto, no se debe emplear para estimar el nmero de copiadoras vendidas. Las
llamadas de ventas varan de 10 a 40, por lo que las estimaciones se deben hacer
dentro de ese rango.

Trazo de la recta de regresin

OBJETIVOS
Evaluar la significancia de la pendiente de la ecuacin
de regresin.
Evaluar una ecuacin de regresin para predecir la
variable dependiente.
Calcular e interpretar el coeficiente de determinacin.
Calcular e interpretar los intervalos de confianza y de
prediccin.

Probar la significancia de la
pendiente

Analizar la ecuacin de regresin mediante una prueba de hiptesis


para ver si la pendiente de la recta de regresin es distinta a cero, es
importante para demostrar que la pendiente de la recta de la poblacin
es distinta de cero, entonces se puede concluir que al utilizar la
ecuacin de regresin aumenta la capacidad de predecir o pronosticar la
variable dependiente basndose en la variable independiente

EVALUACIN DE LA CAPACIDAD
PREDICTORA DE UNA ECUACIN DE REGRESIN

Error estndar de estimacin . Medida de la dispersin de los valores observados respecto


de la recta de regresin para un valor dado de X.
Los resultados del anlisis de regresin de Copier Sales of America muestran una
relacin significativa entre el nmero de llamadas de ventas y el nmero de
ventas que se concret. Al sustituir el nombre de las variables en la ecuacin,
sta puede ser escrita como:

Si el error estndar de estimacin es pequeo, significa que los datos estn


relativamente cercanos a la recta de regresin, y la ecuacin de regresin sirve para
predecir con poco error. Si el error estndar de estimacin es grande, significa que
los datos estn muy dispersos respecto de la recta de regresin, y la ecuacin de
regresin no proporcionar una estimacin precisa de Y.

EL COEFICIENTE DE DETERMINACIN

Proporcin de la variacin total de la variable dependiente Y que se


explica, o contabiliza, por la variacin de la variable dependiente X.

ESTIMACIONES DE INTERVALO DE
PREDICCIN
El error estndar y el coeficiente de determinacin son dos
estadsticos que proporcionan una evaluacin general de la
capacidad de una ecuacin de regresin para predecir una variable
dependiente. Otra forma de reportar tal capacidad es especfica de
un valor declarado de la variable independiente. Por ejemplo,
podemos predecir el nmero de copiadoras vendidas (Y) en el caso
de un valor seleccionado de nmero de llamadas de ventas
realizadas (X). En realidad, es posible calcular el intervalo de
confianza del valor pronosticado de la variable dependiente para un
valor seleccionado de la variable independiente.

SUPOSICIONES DE LA REGRESIN LINEAL

1. Para cada valor de X, existen valores Y correspondientes. Estos valores Y


siguen la distribucin normal.

2. Las medias de estas distribuciones normales se encuentran en la recta de


regresin

3. Todas las desviaciones estndar de estas distribuciones normales son


iguales. La mejor estimacin de esta desviacin estndar comn es el error
estndar de la estimacin

4. Los valores Y son estadsticamente independientes. Esto significa que, al


seleccionar una muestra, una X particular no depende de ningn otro valor de
X. Esta suposicin es de particular importancia cuando los datos se recopilan
durante cierto periodo. En esas situaciones, los errores de un periodo
particular con frecuencia estn correlacionados con los de otros periodos.

si los valores siguen una distribucin normal, la media ms o menos una desviacin
estndar comprender 68% de las observaciones, la media ms o menos dos
desviaciones estndar comprender 95% de las observaciones, y la media ms o
menos tres desviaciones estndar comprender virtualmente todas las observaciones.
Existe la misma relacin entre los valores anticipados y el error estndar de
estimacin

INTERVALOS DE CONFIANZA E INTERVALOS


DE PREDICCIN
INTERVALOS DE CONFIANZA .- Se utiliza cuando la ecuacin de regresin se
emplea para predecir el valor medio de Y para una X dada. Por ejemplo, se
puede usar un intervalo de confianza para estimar el salario medio de todos
los ejecutivos en la industria minorista con base en sus aos de experiencia.
Para determinar el intervalo de confianza del valor medio de Y para una X
dada

INTERVALO DE PREDICCIN

Se utiliza cuando la ecuacin de regresin se emplea para predecir una Y


individual (n = 1) para un valor dado de X. Por ejemplo, para hacer una
estimacin del salario de ejecutivo minorista en particular con 20 aos de
experiencia. Para determinar el intervalo de prediccin de una estimacin
individual para una X dada, la frmula es:

Clculos necesarios para determinar el intervalo


de confianza y el intervalo
de prediccin

Determinar el nmero de copiadoras que se espera


que venda un representante de ventas si l o ella
hacen 25 llamadas.

Por lo tanto, el intervalo de confianza de 95% de todos los representantes


de ventas que hacen 25 llamadas es de 40.9170 a 56.1882. Para interpretar
esto, redondee los valores. Si un representante de ventas hace 25
llamadas, debera vender 48.6 copiadoras. Es probable que estas ventas
varen de 40.9 a 56.2 copiadoras

El intervalo es de 24.478 a 72.627 copiadoras. Se concluye que el


nmero de copiadoras que vender un representante que haga 25
llamadas estar aproximadamente entre 24 y 73.

Este intervalo es muy grande. Es mucho mayor que el intervalo de


confianza de todos los representantes que hagan 25 llamadas. Sin
embargo, es lgico que deba haber ms variacin en la estimacin de
ventas de un individuo que de un grupo.