Академический Документы
Профессиональный Документы
Культура Документы
Introduccin
El objetivo de este captulo es introducir el anlisis simultneo de dos variables y
adquirir criterios para el uso de las tcnicas de regresin y correlacin.
Hasta el captulo anterior se han introducido mtodos estadsticos que se pueden utilizar
cuando el inters es analizar el comportamiento de una sola variable, eventualmente,
bajo distintas condiciones. Por ejemplo, el rendimiento o la altura de las plantas de un
cultivo con o sin riego. Pero frecuentemente se presentan situaciones donde se observan
dos o ms variables sobre cada unidad experimental y el inters se centra en la forma en
que estas variables se relacionan.
Algunos ejemplos de relaciones funcionales que pueden ser de inters en agronoma
son: la relacin entre el rendimiento de un cultivo y la densidad de siembra, la relacin
entre la cantidad de suplemento dado y el aumento de peso que ste produce en un lote
de animales, las dosis de un insecticida y la mortalidad de los insectos tratados, etc. En
cada uno de estos casos se pueden plantear los siguientes interrogantes:
Existe alguna relacin entre las variables?
Si se conoce el comportamiento de una de ellas, se puede predecir el comportamiento
de la otra?
La estadstica aplicada ofrece dos herramientas que permiten dar respuesta a dichas
cuestiones: el Anlisis de Regresin y el Anlisis de Correlacin.
El Anlisis de Regresin estudia la relacin funcional que existe entre dos o ms
variables. Identifica el modelo o funcin que liga a las variables, estima sus parmetros
y, eventualmente, prueba hiptesis acerca de ellos. Una vez estimado el modelo es
posible predecir el valor de la variable denominada variable dependiente en funcin de
la o las otras variable/s independiente/s y dar una medida de la precisin con que esa
estimacin se ha hecho.
Dependiendo del objetivo del estudio, los valores o niveles de la/s variable/s
independiente/s pueden ser arbitrariamente modificados por el experimentador, es decir
el investigador puede fijar los niveles de la variable independiente para los cuales desea
estudiar la respuesta de la variable dependiente. El modelo hallado puede ser usado para
predecir el comportamiento de la variable dependiente para otros niveles de la variable
independiente, que pertenezcan al dominio del estudio.
El Anlisis de Correlacin lineal estudia el grado y sentido de la asociacin lineal que
hay entre un conjunto de variables y, a diferencia del anlisis de regresin, no se
identifica ni se estima explcitamente un modelo funcional para las variables, este
siempre se supone lineal. El inters principal es medir la asociacin entre dos variables
aleatorias cualesquiera, sin necesidad de distinguir variables dependientes e
independientes. Por ejemplo, puede quererse evaluar la intensidad de la asociacin entre
la cantidad de espiguillas por espiga de trigo y la longitud de las espigas. Se ha
establecido que cuanto mayor es la longitud de las espigas mayor es el nmero de
espiguillas por espiga. Obsrvese que, en el ejemplo, no se habla de relacin funcional,
ni tampoco se insina que la longitud de la espiga aumenta porque aumenta el nmero
de espiguillas o viceversa, slo se enfatiza la forma en que se comporta una variable en
relacin a la otra y el inters est centrado en medir la intensidad de esta asociacin.
En el anlisis de correlacin, ninguna de las variables puede ser fijada por el
experimentador, ya que ste podra seleccionar niveles de las variables que no son
frecuentes y esto podra conducir a una estimacin errada del grado de correlacin.
Los grficos de dispersin son tiles en la etapa exploratoria, tanto en el anlisis de
regresin como en el de correlacin. La representacin grfica de los datos es
frecuentemente el punto de partida de cualquier anlisis que involucra ms de una
variable. En los grficos de dispersin lo que se ve es una nube de puntos, donde cada
punto representa una observacin. La Figuras siguientes muestran los grficos de
dispersin usados en estudios de asociacin entre dos variables donde adems se ha
dibujado sobre la nube de puntos, la posible funcin de ajuste de esos datos, es decir, se
ha identificado el modelo funcional de la relacin.
Yij X i ij
Donde:
y / X x
Ejemplo 9.1
Suponga que se quiere estudiar la distribucin de los pesos de una poblacin de plantas
en relacin a sus alturas. Para cualquier altura elegida, por ejemplo X=50 cm., existe
una distribucin de pesos, es decir, la distribucin de los pesos de todas las plantas de la
especie que poseen esa altura. Esa distribucin, llamada distribucin condicional de Y
dada X (Y|X=50), tiene como esperanza a
y / X x
2
que tienen altura 50 cm. y una varianza Y / X x = varianza de los pesos de todas las
Y / X x1 y Y / X x2 cuando x2 x1 = 1.
Coeficientes de regresin muestral
Se llaman coeficientes de regresin muestral a las estimaciones de y , las que se
denotan como a y b respectivamente.
respecto a la recta, medidas sobre el eje de las ordenadas, sea lo ms pequea posible.
n
yi $
y yi a bxi ei2
i 1
i 1
Donde:
$
y = a + bx, es el valor predicho por el modelo lineal y ei es el residuo definido como:
e (y $
y) .
i
La condicin de primer orden de un mnimo exige que se anulen las primeras derivadas
parciales de L, con respecto a cada uno de los parmetros, es decir:
n
L
2 yi a bxi 2
a
i 1
na
b
xi
i
i 1
i 1
n
n
n
n
L
2 xi yi a bxi 2 xi yi a xi b x i2
b
i 1
i 1
i 1
i 1
y
i 1
na b xi
. (1)
i 1
i 1
i 1
i 1
xi yi a xi b xi2
(2)
i y
i
i 1
i 1 i 1
2
2
n
n
n xi x
i
i 1
i 1
n
n xi yi
a y bx
Estimaciones y predicciones
La ecuacin de regresin puede ser usada para obtener estimaciones de la esperanza de
Y o predicciones de Y para valores elegidos de X. Debe tenerse en cuenta, sin embargo,
que los valores de X propuestos deben pertenecer al dominio de las X utilizado para la
estimacin de la recta. No es conveniente usar la ecuacin de la recta para extrapolar, es
decir para estimar la esperanza de Y para valores de X fuera del rango estudiado ya que
2
Varianza del Error del Modelo:
La varianza del error del modelo refleja la variacin aleatoria o la variacin del error
experimental alrededor de la suma de regresin.
2
SCE
S y2/ x =
CME
n2
Sxx X i X
i 1
X
i 1
Syy Yi Y
i 1
2
i
Yi
n
Yi 2 i 1
n
i 1
Sxy
i 1
i 1
X i
n
X i X Yi Y X iYi i 1
n
i 1
Y
i
i 1
1 x
I $
y t
$
y 0 t 2; n 2
0 2; n 2 y 0
n
x
Sxx
Donde t
2; n 2
I $
y 0 t 2;n 2
x
1 1
2
x
Sxx
I a t
2; n 2
I b t
2
1
x
CME
n Sxx
2; n 2
CME
Sxx
Formular H 0 y H a
H 0 : 1 0
H a : 1 0
Fijar:
Estadstico de Prueba
Suma de
cuadrados
Grados de
libertad
Regresin
SCR
Error o Residual
SCE
n2
SYY
n 1
Total
Cuadrados
Medios
CMR SCR
CME
F0
F0
CMR
CME
SCR
n2
- SCR bSxy
- SCE Syy SCR
4
H 0 se rechaza si F0 Ft F 1; n 2;
5
6
Clculos
Decisin
o si p < 0,05
x 2 2; n 2
2 y x n 2
1
y x 2
x 1 2; n 2
SCR
SCE
1
Syy
Syy
n XY X Y
n X 2 X 2
2
2
n X Y
15 das de la aplicacin se realiz una evaluacin del dao, como el tamao promedio
de las manchas en hoja bandera. Los datos son los siguientes:
Dosis (x)
Dao (y)
100 125 200 250 275 300 325 350 375 400
50 48 39 35 30 25 20 12 10 5
R2
Valor
Interpretacin.
68.49
-0,1522
-0,98
0,965
Regresin
Error o Residual
Total
Suma de
cuadrados
Grados de
libertad
Cuadrados
Medios
F0
2165,81
70,59
2236,40
1
8
2165,81
270,73
7,999
n 1