Вы находитесь на странице: 1из 7

MANOVA y Anlisis Discriminante

Diseo Experimental y Anlisis de Datos

6.- MANOVA y Anlisis Discriminante


Se realiza un anlisis discriminante cuando tenemos un conjunto de
observaciones, con varias variables que las definen (igual que en componentes
principales y cluster) para dos objetivos distintos (pero nunca para formar grupos):
Comprobar que las variables utilizadadas discriminan entre grupos ya
establecidos, y distinguir cual o cuales discriminan mejor.
Predecir la pertenencia de una observacin a un grupo de los establecidos
naturales.
Si desconocemos los grupos que deben formarse, pero debemos realizar un
anlisis discriminante, debemos previamente realizar un anlisis de componentes
principales para establecer los grupos naturales.
Para comprobar que es coherente realizar con los datos un anlisis
discriminante, debemos realizar siempre un anlisis previo; MANOVA (Multivariant
ANalyse Of VAriance). Debemos suponer normalidad y homocedasticidad. Este
MANOVA es similar al anlisis ANOVA para un factor, pero con varias variables
distintas. Para i grupos definidos por j variables, siendo la media de cada variable
para cada grupo, el contraste de hiptesis que resuelve MANOVA es el siguiente:
: 11 = 21 = = ; , > 2
1 : .
Es decir;
:


1 : .
Si aceptamos la hiptesis nula, todas las variables tienen la misma media en
todos los grupos y no son capaces de discriminar entre grupos; no tiene sentido
realizar un anlisis discriminante.
Si rechazamos la hiptesis nula significa que al menos una variable puede
discriminar entre grupos, en cuyo caso s tiene sentido proceder a realizar un anlisis
discriminante.
La hiptesis nula no es sencilla y slo puede ser aproximada, excepto en unos
casos de pocas dimensiones. La mejor aproximacin de la lambda de Wilks. Otro
estadstico muy til es la Correlacin Cannica (entre variables cannicas). Ambos
varan entre 0 y 1.
El anlisis discriminante genera a su vez dos tipos de funciones; las funciones
discriminantes, que permiten contrastar si las variables permiten discriminar grupos, y
cuales son las que mejor discriminan, y las funciones de clasificacin, una para cada
grupo preexistente, que permiten clasificar a nuevos individuos.
La Lambda de Wilks es el estadstico ms til para resolver anlisis MANOVA.
Varia entre 0 y 1. Mide el poder discriminante de un conjunto de variables. Cuanto ms

35

MANOVA y Anlisis Discriminante

Diseo Experimental y Anlisis de Datos

prximo a 0, ms potente ser el anlisis discriminante, puesto que la varianza entre


grupos (between) ser muy alta, mientras que la varianza dentro de los grupos
(within) ser muy baja. La frmula de este estadstico es aproximadamente:
=

Las funciones discriminantes (FD) son combinaciones lineales de las variables


predictoras (similares a los componentes principales, pero no son la misma), donde
cada variable viene acompaada de un coeficiente o peso (b). Son funciones de la
forma (para m variables x):
= 1 . 1 + + .
El nmero de funciones discriminantes que se pueden construr corresponde al
mnimo entre el nmero de variables y el nmero de grupos que existen menos uno.
Este nmero no hace falta calcularlo; corresponde al nmero de funciones
discriminantes que construye el programa. Cuantas menos funciones se creen menor
es la potencia del anlisis.
Esta funcin informa sobre la particin de cada variable independiente en la
discriminacin a travs de sus pesos; la variable que ms discrimina es la de mayor
coeficiente (valor absoluto) en la funcin discriminante que ms discrimina, es decir,
la primera. Al igual que en los componentes principales, el programa construye las
funciones de mayor a menor cantidad de informacin (porcentaje de variabilidad
explicada por la funcin).
Cada funcin discriminante tendr su correlacin cannica, y depender de un
contraste de hiptesis de la siguiente forma:
:
1 : .
En caso de aceptacin de la hiptesis nula, la funcin discriminante en
cuestin no discrimina, y por lo tanto debe salir del anlisis. Este contraste de
hiptesis se resuelve con el estadstico chi-cuadrado.
Si rechazamos la hiptesis nula podemos trabajar con la funcin discriminante
que corresponda.
La correlacin cannica es similar a la correlacin pero adaptada para variables
cannicas. Vara entre 0 y 1. La correlacin cannica se obtiene calculando las
funciones discriminantes de cada individuo de todos los grupos, para hallar el
centroide (valor medio) de cada grupo. Cuanto ms prximo a 1, ms potente ser el
anlisis, puesto que los centroides de los distintos grupos sern muy distantes.
Las funciones de clasificacin (FC) sirven para clasificar nuevas observaciones
en uno de los grupos. Slo sern tiles si las variables discriminan, es decir, si
rechazamos las hiptesis nulas de los contrastes de las funciones discriminantes.
Existir una funcin de clasificacin para cada grupo. Se trata de combinaciones
lineales de las variables utilizadas, de la siguiente forma:

36

MANOVA y Anlisis Discriminante

Diseo Experimental y Anlisis de Datos

= + 1 . 1 + + .
Una nueva observacin (o individuo) pertenecer al grupo con mayor valor en
la funcin de clasificacin (introduciendo en dicha funcin los valores de las variables
de esta observacin).
A/ MANOVA en Statgrafic plus 5.1:
En el fichero de datos hemos creado una columna para cada variable (igual que
en componentes principales), y adems una columna de cdigo donde introducimos
los cdigos que diferencian a los grupos. Para el ejercicio DC1:

Clicamos en Men en Avanzado / Regresin Avanzada / Modelos


Lineales Generales. En la pantalla que aparece introducimos las variables en
Variables dependientes: y la columna de cdigo en Factores categricos:. No
debemos rellenar ningn otro espacio. Para el ejercicio DC1:

En la siguiente ventana que aparece, Especificaciones del Modelo GLM


clicamos simplemente aceptar sin modificar nada. Entonces aparece el anlisis de
modelos lineales generales, pero no el MANOVA. Para ver el manova no debemos ir a
opciones tabulares, sino que debemos clicar en el botn derecho en la ventana del
anlisis y seleccionar Opciones de Anlisis; en la ventana que aparece seleccionamos

37

MANOVA y Anlisis Discriminante

Diseo Experimental y Anlisis de Datos

la opcin de Inclur MANOVA. Los resultados del MANOVA aparecen entonces en la


misma ventana, al final del anlisis. Para el ejercicio DC1:

Para el examen slo utilizaremos los valores de la primera lnea, lambda de


Wilks. Nos aparece el valor de lambda de Wilks, del estadstico F (Fischer) y el p-valor
para el contraste de hiptesis del MANOVA.
En este ejercicio s tiene sentido realizar un anlisis discriminante para los
grupos estado propuestos.
B/ Anlisis Discriminante en Statgrafic plus 5.1:
Una vez realizado en anlisis MANOVA preliminar podemos proceder a realizar
el anlisis discriminante. Lo encontraremos en el Men en Avanzado / Mtodos
Multivariables / Anlisis Discriminante. Introducimos las columas de las variables
en el campo Datos: y la columna de cdigo (estado en DC1) en el campo Factor de
Clasificacin:, y clicamos aceptar.
A continuacin clicamos Opciones Tabulares para seleccionar las cuatro
primeras opciones, que son: Resumen del Anlisis, Funciones de Clasificacin
Funciones Discriminantes y Tabla de Clasificacin.
Para ver el grfico de Funciones Discriminantes (inicialmente puede no verse, si
slo existe una FD) clicar en la ventana en el botn derecho, seleccionar Opciones de
Ventana e introducir 1 en los ambos ejes.

38

MANOVA y Anlisis Discriminante

Diseo Experimental y Anlisis de Datos

El Resumen del Anlisis nos da los valores de Correlacin Cannica, chicuadrado y p-valor para el contraste de cada funcin discriminante. Nos sirve para
determinar si estas funciones sirven para discriminar, y por lo tanto, si es coherente el
anlisis. Para el ejercicio DC1 (una nica FD):

Las ventanas de Funciones de Clasificacin y Funciones Discriminantes dan


los valores de los coeficientes y las constantes de estas funciones.

FD1

39

MANOVA y Anlisis Discriminante

Diseo Experimental y Anlisis de Datos

Para las funciones discriminantes utilizaremos siempre los coeficientes


estandarizados. Son de hecho los que utiliza el StatAdvisor para construr la primera
funcin discriminante a modo de ejemplo (en este caso del ejercicio DC1 slo existe
una funcin discriminante pero puede haber ms de una).
En cuanto a las funciones de Clasificacin, obtendremos una por cada grupo
existente. Para el ejercicio DC1:

FC2

FC1

Al igual que en las funciones discriminantes, el StatAdvisor nos construye la


primera funcin de clasificacin a modo de ejemplo.
Finalmente, consultamos la Tabla de Clasificacin para ver las predicciones que
ha realizado el anlisis para observaciones no clasificadas. Escribimos los valores de las
variables de las observaciones cuyo grupo de pertenencia debe ser predicho, en las
ltimas filas del fichero, en las columnas vacas (como en regresin), dejando en
blanco la casilla de cdigo. Para el ejercicio DC1:

Sin agrupar (prediccin)

()

40

MANOVA y Anlisis Discriminante

Diseo Experimental y Anlisis de Datos

()

prediccin

En la tabla de clasificacin el programa calcula las funciones de clasificacin para todas


las observaciones (que ha utilizado para construir las mismas funciones), y las clasifica a partir
de los valores obtenidos. En algunas observaciones las funciones de clasificacin pueden
equivocarse; los datos de los errores totales (en %) cometidos aparecen en la primera tabla de
la ventana.
En la segunda tabla aparecen los grupos en los que se clasifica cada observacin a
travs de la funcin de clasificacin, y los valores obtenidos en dicha funcin (tambin aparece
la segunda opcin y el valor de la funcin para ese grupo segundo ms probable). En esta
misma tabla, al final, aparece la prediccin que realiza el programa para las observaciones no
agrupadas. En este caso (ejercicio DC1) introduce al individuo (215,07 ; 147,31) en el grupo 1 y
al individuo (248,13 ; 154,01) en el grupo 2.

41

Вам также может понравиться