Вы находитесь на странице: 1из 29

MODULO VII

EQUIPO Franco Reyes Gabriela Marchesini Espndola Astor Rosas Olivares Alfredo Snchez Pacheco Carmen Sols Aguirre Martha Montserrat Vargas Hernndez Irving J.

Nos

enfocamos a la funcin lineal de una sola variable de prediccin x.


la ecuacin una lnea recta para describir la relacin entre x y y, y que describimos la consistencia de la relacin por medio del coeficiente de correlacin r.

Usamos

Para

describir la relacin lineal se puede usar el modelo determinista y= + x Donde es la ordenada al origen y el valor de y cuando x=0- y es la pendiente de la recta, definida como el cambio en y para un cambio unitario en x como se muestra en la siguiente figura

Este modelo describe la relacin determinista entre la variable de inters y, denominada a veces variable de respuesta, y la variable independiente x, conocida como variable predictiva.

Pendiente =

Ordenadas al origen=a

x 1 2

Una manera simple de determinar el modelo determinista es agregar un componente de error aleatorio para explicar las desviaciones de los puntos con respecto a la recta. Una respuesta particular y se describe por medio del modelo probabilstico.

y= + x +
La primera parte de la ecuacin + x, conocida como recta de medias, describe el valor promedio de y para un valor dado en x. El componente de error permite que cada respuesta individual y se desvi de la recta de medias por una cantidad pequea.

Supongamos que los valores de satisfacen estas condiciones: Son independientes en el sentido probabilstico Tienen una media de 0 Poseen una distribucin de probabilidad normal
Este modelo se crea para una poblacin de mediciones por lo general desconocidas, pero se puede usar la informacin muestral para estimar los valores de + . Dichas estimaciones se usan para formar la recta del mejor ajuste para un conjunto de datos, denominada recta de minimos cuadrados o recta de regresin,

El procedimiento estadstico para encontrar la recta del mejor ajuste para el conjunto de datos bivariados realiza en forma matemtica. La formula para la recta del mejor ajuste es:
y = a + bx

La recta que minimiza la suma de cuadrados de las desviaciones de los valores observados de y con respect a los valores predichos es la recta de mejor ajuste. La suma de desviaciones cuadradas se llama suma de cuadrados del error (SSE) y se define como:
SSE= ( yi yi ) = (yi a bxi)

b = Sxy y Sxx

a = y - bx

donde las cantidades Sxy y Sxx se define como: Sxy = ( xi x )( yi y ) = xiyi ( xi)( n yi)

Y
Sxx= ( xi x ) = xi ( xi ) n

Encuentra la recta de prediccin de mnimos cuadrados para los datos de la calificacin del calculo de la tabla 12.1.
TABLA 12.1
ESTUDIANTE PUNTUACION DE EXAMEN CALIFICACION FINAL xi yi 1 2 3 4 5 6 7 8 9 10 TOTAL 39 43 21 64 57 47 28 75 34 52 460 65 78 52 82 92 89 73 98 56 75 760

Sxx=

xi (

xi ) = 23 334 (460) = 2474 n 10


TABLA 12.2

CALIFICACION PUNTUACION FINAL DEL EXAMEN Yi Xi 65 78 52 82 92 89 73 98 39 43 21 64 57 47 28 75

xi 1521 1849 441 4096 3249 2209 784 5625

xiyi 2535 3354 1092 5248 5244 4183 2044 7350

yi 4225 6084 2704 6724 8464 7921 5329 9604

56
75 760

34
52 460

1156
2704 23634

1904
3900 36854

3136
5625 59816

Sxy = = 1 894

xiyi (

xi) ( n

yi) = 36 854 (460)(760) 10


TABLA 12.2

CALIFICACION PUNTUACION FINAL DEL EXAMEN Yi Xi 65 78 52 82 92 89 73 98 39 43 21 64 57 47 28 75

xi 1521 1849 441 4096 3249 2209 784 5625

xiyi 2535 3354 1092 5248 5244 4183 2044 7350

yi 4225 6084 2704 6724 8464 7921 5329 9604

56
75 760

34
52 460

1156
2704 23634

1904
3900 36854

3136
5625 59816

y=

yi = 760 = 76 n 10
CALIFICACION PUNTUACION FINAL DEL EXAMEN Yi Xi 65 78 52 82 92 89 73 98 39 43 21 64 57 47 28 75

x=

xi = 460 = 46 n 10

TABLA 12.2

xi 1521 1849 441 4096 3249 2209 784 5625

xiyi 2535 3354 1092 5248 5244 4183 2044 7350

yi 4225 6084 2704 6724 8464 7921 5329 9604

56
75 760

34
52 460

1156
2704 23634

1904
3900 36854

3136
5625 59816

Entonces:

b = Sxy = 1 894 = .76556 Sxx 2 474


a = y bx = 76 (.76556)(46) = 40.78424 La recta de regresin de mnimos cuadrados es entonces: y = a + bx = 40.78424 + .76556x Y = a + b(50) = 40.78424 + (.76556)(50)= 79.06

b = Sxy = 1 894 = .76556 Sxx 2 474 a = y bx = 76 (.76556)(46) = 40.78424

TABLA 12.1 PUNTUACION CALIFICACION ESTUDIANTE DE EXAMEN FINAL xi yi 1 39 65

2
3 4 5 6 7 8 9 10 TOTAL

43
21 64 57 47 28 75 34 52 460

78
52 82 92 89 73 98 56 75 760

Es una tcnica estadstica diseada para medir si existen diferencias entre los valores medios de una variable dependiente calculados para los distintos grupos que se pueden obtener con otra variable independiente y nominal. La variable o variables independientes, reciben el nombre de Factor y deben ser variables de tipo nominal, y sus distintos valores el de tratamientos, mientras que la variable dependiente debe ser mtrica, puesto que sobre ella se debe calcular los valores medios objeto del anlisis de la varianza. El anlisis de la varianza parte de los conceptos de regresin lineal. El primer concepto fundamental es que todo valor observado puede expresarse mediante la siguiente funcin: Y = B0 + B1 * X + e Donde Y sera el valor observado (variable dependiente), y X el valor que toma la variable independiente. B0 sera una constante que en la recta de regresin equivale a la ordenada en el origen, B1 es otra constante que equivale a la pendiente de la recta, y e es una variable aleatoria que aade a la funcin cierto error que desva la puntuacin observada de la puntuacin pronosticada.

Por tanto, a la funcin de pronstico la podemos llamar "Y prima": Y' = B0 + B1 * X Podemos resumir que las puntuaciones observadas equivalen a las puntuaciones esperadas, ms el error aleatorio: Y = Y' + e (1.1) Existen tres clases conceptuales de estos modelos: El Modelo de Efectos Fsicos asume que los datos provienen de poblaciones normales las cuales podran diferir nicamente en sus medias. El Modelo de efectos aleatorios asume que los datos describen una jerarqua de diferentes poblaciones cuyas diferencias quedan restringidas por la jerarqua. Ejemplo: El experimentador ha aprendido y ha considerado en el experimento slo tres de muchos ms mtodos posibles, el mtodo de enseanza es un factor aleatorio en el experimento. El Modelo de efectos mixto describen situaciones que ste puede tomar. Ejemplo: Si el mtodo de enseanza es analizado como un factor que puede influir donde estn presentes ambos tipos de factores: fijos y aleatorios.

Con respecto a las distintas fuentes de variacin, cuando estas se dividen entre los grados de libertad apropiados, proporciona una estimacin de la variacin del experimento de las cuales se denominan Cuadros Medios y que se muestran en tablas de ANOVA:

MS = SS/gl
Al examinar los grados de libertad relacionados con cada una de estas sumas de cuadrados, se observara que los grados de libertad totales para las n mediciones son (n 1). Para evaluar la recta de regresin de la siguiente formula = a +bxi = - bx + bxi, se requiere estimar un parmetro adicional , en donde hay un grado de libertad relacionado con SSR, dejandi (n 2) grados de libertad SSE

Los procedimientos del anlisis de la varianza sirve para dividir la variacin total del experimento en porciones atribuidas a varios factores de inters para el experimentador. En el caso del anlisis de regresin, la respuesta y se relaciona con la variable independiente x. De aqu la variacion totla en la variable de la respuesta y, dada por
SStotal = Syy = (yi - y )2 = yi2 En la cual esta formula se divide en 2 partes: SSR (Suma de Cuadrados para la Regresin) SSE (Suma de Cuadrados para el Error) De modo que: Sstotal = SSR + SSE

El cuadrado medio para el error

MSE = s2 = SSE/ n - 2
Es un estimador de la varianza subyacente 2.

ANLISIS DE VARIANZA PARA LA REGRESION LINEAL


FUENTE

gl 1 n-2 n-1

SS (Sxy)2/Sxx Syy (Sxy)2/Sxx

MS MSR MSE

Regresion

Error Total

Syy

la

ecuacin de regresin que usa la informacin proporcionada por x es sustancialmente mejor que el predictor simple y no depende de x? Si la variable independiente x no es til en el modelo poblacional y= + x+, entonces el valor de y no cambia para los diferentes valores de x. La nica manera en que esto sucede para los valores de x es cuando la pendiente de la recta de medidas es igual a 0. H0 : = 0

Se

basan en la distribucin muestral de b, el estimador muestral de la pendiente . Se puede demostrar que, si son vlidos los supuestos acerca del error aleatorio , entonces el estimador b tiene una distribucin normal en el muestreo repetido con media SE= Sxx Donde es la varianza del error aleatorio . Puesto que el valor de se estima con s=MSE, puede basar las inferencias en el estadstico dado por t= b -

MSE/Sxx

En

el contexto del anlisis de la regresin lineal simple el coeficiente de correlacin mltiple establece una medida del grado de asociacin lineal entre la variable respuesta y la variable predictora, concretamente entre la variable respuesta y la recta de regresin estimada. Se define, a partir de los n pares de observaciones, mediante

Su

cuadrado, R2, denominado coeficiente de determinacin mltiple, puede interpretarse como el porcentaje de variabilidad de Y explicada o debida a la recta de regresin, en tanto que puede comprobarse que

Las

tcnicas englobadas bajo la denominacin de anlisis de la varianza o abreviadamente ANOVA (del ingls analysis of variance) han jugado un papel crucial en la metodologa estadstica moderna, desde que fueran ideadas por R.A. Fisher en 1925, y como sucede en tantas ocasiones, aunque conocidas por la gran mayora, quizs no son adecuadamente comprendidas por los no especialistas.

En

el planteamiento ms simple de anlisis de la varianza tenemos una variable numrica cuantitativa (resultado), y queremos determinar en qu medida se puede atribuir la variabilidad de sta a otra variable cualitativa nominal que vamos a denominar factor. Estamos hablando por tanto de anlisis de la varianza para un solo factor, que puede tener 2 o ms categoras o niveles.

Este factor, cuyo posible efecto sobre la variable medida queremos analizar, puede tener unos niveles fijos, por ejemplo el nivel educativo alcanzado por los sujetos que intervienen (sin estudios, estudios primarios, secundarios, formacin universitaria), y hablamos entonces de modelo de efectos fijos; o bien puede tratarse de una muestra procedente de un conjunto de niveles ms amplio, como puede ser por ejemplo el caso de un estudio en el que se seleccionan varios hospitales y se analiza las posibles diferencias entre hospitales. Entonces lo denominamos modelo de efectos aleatorios. En el anlisis de la varianza de 1 factor es mucho ms frecuente el modelo de efectos fijos.

Вам также может понравиться