Вы находитесь на странице: 1из 14

PROBABILIDAD Y ESTADISTICA

UNIDAD V

“REGRESION LINEAL”
Nombre de los integrantes:

Anaya Constantino Andree Ahitor

Coot Llanes José Yair

Llanes Ordaz Fabiola de Lourdes

Garrido Yañez Pamela del Rosario

MERIDA, YUCATAN 11 de diciembre de 2017


INDICE

INTRODUCCION

REGRESION LINEAL

REGRESION Y CORRELACION

CORRELACION

DIAGRAMA DE DISPERSION

REGRESION LINEAL SIMPLE

DETERMINACION DE LOS COEFICIENTES DE

CORRELACION Y DE DETERMINACION

DISTRIBUCION NORMAL BIDIMENCIONAL

CONCLUSION

BIBLIOGRAFIA
INTRODUCCION
Durante el curso de probabilidad y estadística se aprendieron diferentes
procesos y fenómenos de la probabilidad con el fin de poder aplicarlo a la
vida cotidiana y mejor aún en la carrera de Ing. Biomédica. Todo esto de
manera que sea posible valorar riesgos y dar mayor certidumbre al
momento de tomar decisiones o interpretar un resultado.

El propósito de este curso fue poder desarrollar el pensamiento


matemático en fenómenos aleatorios y como un medio para la compresión
y aplicación de inferencia estadística. Para que esto pueda ser
comprendido en s totalidad es importante estudiar la regresión lineal, así
como sus puntos más importantes para poder entender y aplicar
adecuadamente todos los temas antes visto durante todo el curso.
Regresión lineal
UNIDAD V
Concepto de regresión

El análisis de regresión consiste en ajustar un modelo a los datos, estimando


coeficientes a partir de las observaciones, con el fin de predecir valores de la variable de
respuesta a partir de una (regresión simple) o más variables (regresión múltiple)
predictivas o explicativas. Se usa para:

identificar a las variables predictivas relacionadas con una variable de respuesta

describir la forma de la relación entre estas variables y para derivar una función
matemática óptima que modele esta relación

Predecir la variable de respuesta a partir de la(s) explicativas o predictorias.

REGRESION LINEAL
La regresión lineal es la predicción de una variable de respuesta cuantitativa a partir de
una variable predictora cuantitativa; en otras palabras es una un modelo matemático
usado para aproximar la relación de dependencia entre una variable dependiente Y,
las variables independientes Xi y un término aleatorio ε.

Donde β0 es la intersección o termino constante, las βi (i>0) son los parámetros


respectivos a cada variable independiente, y p es el número de parámetros
independientes a tener en cuenta en la regresión. La regresión lineal puede ser
contraste con la regresión no lineal.

Tipos de regresión
 regresión lineal simple: solo se maneja una variable independiente, por lo que
solo cuenta con dos parámetros.

 regresión lineal multiple: La regresión lineal permite trabajar con una variable a
nivel de intervalo o razón. De la misma manera, es posible analizar la relación
entre dos o más variables a través de ecuaciones, lo que se denomina regresión
múltiple o regresión lineal múltiple.
 rectas de regresión: son las rectas que mejor se ajustan a la nube de puntos
(o también llamado diagrama de dispersión) generada por una distribución
binomial. Matemáticamente, son posibles dos rectas de máximo ajuste.

CORRELACIÓN
Indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos
variables estadísticas. Se considera que dos variables cuantitativas están
correlacionadas cuando los valores de una de ellas varían sistemáticamente con
respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe
correlación entre ellas si al disminuir los valores de A lo hacen también los de B y
viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación
de causalidad.

La relación entre dos variables cuantitativas queda representada mediante la línea


de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes
elementales de una línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el
sentido y la forma:

 La fuerza extrema según sea el caso, mide el grado en que la línea representa a
la nube de puntos: si la nube es estrecha y alargada, se representa por una línea
recta, lo que indica que la relación es fuerte; si la nube de puntos tiene una
tendencia elíptica o circular, la relación es débil.
 El sentido mide la variación de los valores de B con respecto a A: si al crecer los
valores de A lo hacen los de B, la relación es directa (pendiente positiva); si al
crecer los valores de A disminuyen los de B, la relación es inversa (pendiente
negativa).
 La forma establece el tipo de línea que define el mejor ajuste: la línea recta, la
curva monotónica o la curva no monotónica.

Existen diversos coeficientes que miden el grado de correlación, adaptados a la


naturaleza de los datos. El más conocido es el coeficiente de correlación de Pearson
(introducido en realidad por Francis Galton), que se obtiene dividiendo la covarianza de
dos variables entre el producto de sus desviaciones estándar. Otros coeficientes son:

Coeficiente de correlación de Spearman


Correlación canónica
Coeficiente de Correlación Intraclase
Correlación de Kendall
Correlación de Jaspen

Correlación
La correlación estadística determina la relación o dependencia que existe entre las dos
variables que intervienen en una distribución bidimensional.

Es decir, determinar si los cambios en una de las variables influyen en los cambios de la
otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay
correlación entre ellas.
Relación entre las variables

La correlación puede decir algo acerca de la relación entre las variables. Se utiliza para
entender:

*Si la relación es positiva o negativa


*La fuerza de la relación.

La correlación es una herramienta poderosa que brinda piezas vitales de información.

En el caso del ingreso familiar y el gasto familiar, es fácil ver que ambos suben o bajan
juntos en la misma dirección. Esto se denomina correlación positiva.

En caso del precio y la demanda, el cambio se produce en la dirección opuesta, de


modo que el aumento de uno está acompañado de un descenso en el otro. Esto se
conoce como correlación negativa.
Diagrama de dispersión

Los diagramas de dispersión son una forma fenomenal de expresar datos de dos
variables, y hacer predicciones basadas en los datos. Al contrario de los histogramas y
los diagramas de caja, los de dispersión muestran valores de datos individuales.

Este es el diagrama de dispersión que expresa la cantidad de dinero que se ganó Mateo
cada semana trabajando en la tienda de su padre.

Las semanas están diagramadas en el eje x, y la


cantidad de dinero que se ganó en esa semana en
el eje y. En general, la variable independiente (la
variable que no está influenciada por nada) está
en el eje x y la variable dependiente (la que es modificada por la variable independiente)
está en el eje y.

En este diagrama podemos ver que en la semana 2 Mateo se ganó alrededor de $125, y
en la semana 18 estuvo cerca de los $165. Pero más importante aún es la tendencia.
Por ejemplo, con estos datos podemos ver que Mateo gana cada vez más según pasan
las semanas. Quizá su padre le da más horas a la semana o más responsabilidades.

Línea de ajuste

Usamos la "línea de ajuste" para hacer predicciones basándonos en datos pasados. Hay
muchas y muy complicadas fórmulas para encontrar esta recta, pero por ahora solo la
dibujaremos a través de los puntos en la gráfica para que se ajuste a la tendencia que
nos marcan los datos. Cuando dibujes la recta, asegúrate de que encaje con la
mayor parte de los datos. Si hay un punto que está muy por encima o muy por
debajo con respecto al resto (los atípicos) déjalo fuera de la recta.

Regresión lineal simple


“Una técnica estadística que establece una ecuación para estimar el valor desconocido
de una variable, a partir del valor conocido de otra variable, (en vez de valores de
muchas otras variables) se denomina análisis de regresión simple.” Por lo tanto el
análisis de regresión lineal simple, es el proceso general de predecir una variable (Y) a
partir de otra (X).

El pronóstico de regresión lineal simple es un modelo óptimo para patrones de


demanda con tendencia (creciente o decreciente), es decir, patrones que presenten
una relación de linealidad entre la demanda y el tiempo.

Las relaciones entre las variables pueden ser directas o también inversas.
 Relación directa: la pendiente de esta línea es positiva, porque la variable Y
crece a medida que la variable X también lo hace.

 Relación inversa: La pendiente de esta línea es negativa, porque a medida que


aumenta el valor de la variable Y, el valor de la variable X disminuye.
Determinación de los coeficientes de Correlación y
Determinación

Coeficiente de Correlación

El coeficiente de correlación lineal es el cociente entre la covarianza y el producto de las


desviaciones típicas de ambas variables. El coeficiente de correlación lineal se expresa
mediante la letra r.
Propiedades

1. El coeficiente de correlación no varía al hacerlo la escala de medición.

2. El signo del coeficiente de correlación es el mismo que el de la covarianza.

3. El coeficiente de correlación lineal es un número real comprendido entre


−1 y 1.

−1 ≤ r ≤ 1

4. Si el coeficiente de correlación lineal toma valores cercanos a −1 la


correlación es fuerte e inversa, y será tanto más fuerte cuanto más se
aproxime r a −1.

5. Si el coeficiente de correlación lineal toma valores cercanos a 1 la


correlación es fuerte y directa, y será tanto más fuerte cuanto más se
aproxime r a 1.

6. Si el coeficiente de correlación lineal toma valores cercanos a 0, la


correlación es débil.

7. Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o


decreciente. Entre ambas variables hay dependencia funcional.

Coeficiente de determinación
En estadística, el coeficiente de determinación, denominado R² y pronunciado R
cuadrado, es un estadístico usado en el contexto de un modelo estadístico cuyo
principal propósito es predecir futuros resultados o probar una hipótesis. El coeficiente
determina la calidad del modelo para replicar los resultados, y la proporción de
variación de los resultados que puede explicarse por el modelo.

Hay varias definiciones diferentes para R² que son algunas veces equivalentes. Las más
comunes se refieren a la regresión lineal. En este caso, el R² es simplemente el
cuadrado del coeficiente de correlación de Pearson, lo cual es sólo cierto para la
regresión lineal simple.

El R² adquiere valores entre 0 y 1. Existen casos dentro de la definición computacional


de R² donde este valor puede tomar valores negativos.

Cálculo

R2 = SCReg/SCT = 1 − ( SCE/SCT );

0 ≤ R2 ≤ 1

Propiedades:

Si R2 = 0 ⇒ SCReg = 0 ⇒ El modelo no explica nada de y a partir de x.


Si R2 = 1 ⇒ SCReg = SCT ⇒ Ajuste perfecto: y depende funcionalmente de
x .
Un valor de R2 cercano a 0 ⇒ Baja capacidad explicativa de la recta.
Un valor de R2 próximo a 1 ⇒ Alta capacidad explicativa de la recta.
Distribución normal bidimensional

Son aquellas en las que cada individuo le corresponden los valores de dos variables, las
representamos por el par (Xi,Yi). Si representamos cada par de valores como las
coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o
diagrama de dispersión. Sobre la nube de puntos puede trazarse una recta que se
ajuste a ellos lo mejor posible, llamada recta de regresión.
Ejemplo:
Las notas de 12 alumnos de una clase de matemáticas y física fueron las
siguientes

Вам также может понравиться