Академический Документы
Профессиональный Документы
Культура Документы
LINEAL MÚLTIPLE
yˆ b0 b1 x1 b2 x2 ... bk xk
EJEMPLOS
VARIABLE DEPENDIENTE (Y) VARIABLES INDEPENDIENTES
(X1,X2,......)
Volumen de ventas, en unidades Precio unitario
Pensamiento positivo
Peso de los estudiantes Estatura
Edad
Salud mental Salud física
Nutrientes consumidos
Pensamiento positivo
Autoestima Autoconcepto
Autorespeto
Autoaceptación
Inteligencia Total Inteligencia Verbal
Inteligencia matemática
Inteligencia Lógica
Inteligencia Abstracta
Análisis de regresión múltiple
para 2 variables independientes
Para dos variables independientes, la fórmula general de la
ecuación de regresión múltiple es:
Y ' a b1 X 1 b2 X 2
X1 y X2 son las variables independientes.
a es la intercepción en Y.
b1 es el cambio neto en Y para cada cambio unitario en X1,
manteniendo X2 constante. Se denomina coeficiente de regresión
parcial, coeficiente de regresión neta o bien coeficiente de
regresión.
b2 es el cambio neto en Y para cada cambio unitario en X2,
manteniendo X1 constante. Se denomina coeficiente de regresión
parcial o bien coeficiente de regresión.
El cálculo de éstos valores es por demás laborioso a mano…
…. Por ejemplo para el caso de las dos variables
independientes, para poder resolver y obtener y en una
ecuación de regresión múltiple el cálculo se presenta
muy tediosa porque se tiene atender 3 ecuaciones que
se generan por el método de mínimo de cuadrados:
Análisis de regresión múltiple
con k variables independientes
La ecuación general de regresión múltiple con
k variables independientes es:
Y ' a b1 X 1 b2 X 2 ...bk X k
El criterio de mínimos cuadrados se usa para
el desarrollo de esta ecuación.
Como estimar b1, b2, etc. es muy tedioso,
existen muchos programas de cómputo que
pueden utilizarse para estimarlos.
Error estándar múltiple de la
estimación
El error estándar múltiple de la estimación es la
medida de la eficiencia de la ecuación de
regresión.
Está medida en las mismas unidades que la
variable dependiente.
Es difícil determinar cuál es un valor grande y cuál
es uno pequeño para el error estándar.
Error estándar múltiple de la
estimación
La fórmula es:
SY 12k (Y Y ' )
2
SSE
n (k 1) n (k 1)
Donde
Y es la observación.
Y’ es el valor estimado en la ecuación de
regresión.
n es el número de observaciones y k es el
número de variables independientes.
Regresión y correlación múltiples
(suposiciones)
Las variables independientes y dependientes tienen una
relación lineal.
La variable dependiente debe ser continua y al menos
con escala de intervalo.
La variación en (Y - Y’) o residuo debe ser la misma para
todos los valores de Y. Cuando éste es el caso, se dice
que la diferencia presenta homoscedasticidad.
Los residuos deben tener distribución normal con media
igual a 0.
Las observaciones sucesivas de la variable dependiente
no deben estar correlacionadas.
Matriz de correlación
y X
ENFOQUE MATRICIAL
Donde:
b0
y1 1x11x12 x13.......x1k b
y 1x x x .......x 1
2 21 22 23 2k
H 0 : 1 2 3 ... k 0
Ha : al menos uno de los coeficientes de regresión no es cero.
Prueba global continuación
El estadístico de prueba es la distribución F con k (número de
variables independientes) y n - (k + 1) grados de libertad,
donde n es el tamaño de la muestra.
Se calcula con: F = [(SSR) /(k)] /[(SSE) /(n-k+1)].
Tabla ANOVA
Proporciona la variación de la variable dependiente (tanto de la que está explicada
por la ecuación de regresión como de la que no lo está).
96 5.0 1.5
90 2.0 2.0
95 4.0 1.5
92 2.5 2.5
95 3.0 3.3
94 3.5 2.3
94 2.5 4.2
94 3.0 2.5
Planteando matricialmente los datos
1 5.0 1.5
96
90
1 2.0 2.0
b
0
95 1 4.0 1.5
92
y
95
X 1
1
2.5
3.0
2.5
3.3
b
1
94
94
1 3.5 2.3 b
2 3 x1
1 2.5 4.2
948 x1 1 3.0 2.5
8x3
Determinando la ecuación de regresión
El modelo es: yˆ b b x b x
0 1 1 2 2
( X X ) 1
X y
Finalmente la ecuación es:
Coeficientesa
Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95%
Límite
Modelo B Error típ. Beta t Sig. Límite inferior s uperior
1 (Cons tante) 83.230 1.574 52.882 .000 79.184 87.276
Anuncios en TV (en
2.290 .304 1.153 7.532 .001 1.509 3.072
miles de dólares )
Anuncios en periódicos
1.301 .321 .621 4.057 .010 .477 2.125
(en miles de dólares )
a. Variable dependiente: Ingresos Brutos s emanales (en miles de dólares )
S y. X X
y 2
b0 y b1 X 1 y b2 X 2 y
1 2
n3
Reemplazando los valores previamente encontrados y tomando el denominador al
valor 3 por ser el número de parámetros q intervienen en la ecuación:
S y. X1 X 2 0.64
Resumen del modelo
r = 0.959 r2 = 0.919
Interpretación Existe una relación Interpretación El 91.9% de los
directa y perfecta entre los ingresos cambios producidos en los
brutos y los gastos de publicidad en ingresos brutos es explicado
televisión y en periódicos por gastos de publicidad en
televisión y en periódicos.
MATRIZ DE CORRELACION
Correlaciones
Ingres os
Brutos Anuncios en
s emanales Anuncios en periódicos
(en miles de TV (en miles (en miles de
dólares ) de dólares ) dólares )
Correlación de Pears on Ingres os Brutos
s emanales (en 1.000 .808 -.021
miles de dólares )
Anuncios en TV (en
.808 1.000 -.556
miles de dólares )
Anuncios en periódicos
-.021 -.556 1.000
(en miles de dólares )
Sig. (unilateral) Ingres os Brutos
s emanales (en . .008 .481
miles de dólares )
Anuncios en TV (en
.008 . .076
miles de dólares )
Anuncios en periódicos
.481 .076 .
(en miles de dólares )
N Ingres os Brutos
s emanales (en 8 8 8
miles de dólares )
Anuncios en TV (en
8 8 8
miles de dólares )
Anuncios en periódicos
8 8 8
(en miles de dólares )
Ho: P= 0 (No existe correlación)
Anova H1: P ≠ 0 (La correlación es diferente de 0)
H 0 : 1 2 3 ... k 0
H1 : Por lo menos un i 0
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 23.435 2 11.718 28.378 .002 a
Res idual 2.065 5 .413
Total 25.500 7
a. Variables predictoras : (Constante), Anuncios en periódicos (en miles de dólares),
Anuncios en TV (en miles de dólares)
b. Variable dependiente: Ingresos Brutos s emanales (en miles de dólares )
Se desea analizar si
el Rendimiento Puntaje de
Puntaje de Puntaje Puntaje de
académico está Rendimiento
Autoeficacia de CI Clima Escolar
relacionado con la Académico
Autoeficacia 15 50 85 112
(creencias sobre la
17 60 75 123
capacidad de uno
mismo para lograr 18 70 98 114
objetivos), el 20 80 110 117
Coeficiente 15 90 100 185
Intelectual y el 16 100 89 145
Clima Escolar 14 110 98 123
(calidad del
13 120 79 147
ambiente en el que
se desarrollan las 8 130 90 145
actividades 10 140 87 120
académicas).
1. Hallando la ecuación yˆ b0 b1 x1 b2 x2 b3 x3
Coeficientesa
Modelo Coeficientes no estandarizados Coeficientes t Sig.
tipificados
B Error típ. Beta
(Constante) 13,000 8,318 1,563 ,169
Puntaje de Autoeficacia -,088 ,028 -,741 -3,198 ,019
1
Puntaje de CI ,119 ,076 ,348 1,573 ,167
Puntaje de Clima Escolar -,007 ,037 -,042 -,179 ,864
a. Variable dependiente: Puntaje de Rendimiento Académico
S y. X1 X 2 y 2
b0 y b1 X 1 y b2 X 2 y b3 X 3 y
n4
Interpretación:
El pronóstico obtenido de rendimiento académico puede variar en 2.38 unidades por encima o
por debajo.
3. Hallando el Coeficiente de Correlación y
de Determinación
Resumen del modelo
r = 0.841 r2 = 0.707
Interpretación Existe una relación Interpretación El 70.7% de los
directa e intensa entre el cambios producidos en los
Rendimiento Académico y las resultados obtenidos en
variables Autoeficacia, CI y Clima Rendimiento Académico es
Escolar explicado por los resultados
obtenidos en Autoeficacia, CI y
Clima Escolar.
4. Identificar la significatividad de la
relación entre las variables:
H 0 : 1 2 3 ... k 0
H1 : Por lo menos un i 0
a
ANOVA
Total 116,400 9
a. Variable dependiente: Puntaje de Rendimiento Académico
b. Variables predictoras: (Constante), Puntaje de Clima Escolar, Puntaje de CI, Puntaje de
Autoeficacia