Вы находитесь на странице: 1из 9

Captulo 8 Anlisis Discriminante

Tcnica de clasicacin donde el objetivo es obtener una funcin capaz de clasicar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables discriminadoras. A diferencia del A. Cluster, se deben conocer los grupos previamente y a qu grupo pertenecen ciertos individuos, de los que tambin se conoce sus valores en las variables discriminantes. EJEMPLO Se dispone de una muestra de pacientes a los que se les mide previamente un conjunto de variables. El investigador puede dividir la muestra en dos (o ms) grupos de diagnstico. Ms tarde se mide a un nuevo enfermo el mismo grupo de variables y, por los valores obtenidos, el Anlisis Discriminante permite asignar dicho paciente al grupo de mxima probabilidad, cuanticando a la vez el valor de ella. INTERS Extensin a los campos de las Ciencias de la Vida en la que la clasicacin de individuos a travs de un perl observado constituye un frecuente problema de investigacin. DEFINICIN Tcnica de Anlisis Multivariante que permite asignar o clasicar nuevos individuos dentro de grupos previamente reconocidos o denidos.
85

86

Anlisis Discriminante

PLANTEAMIENTO DEL PROBLEMA

Punto de partida: Tabla de datos de N individuos en que se han medido p variables (caso habitual), una variable cualitativa adicional (dependiente o clasicativa) con dos o ms categoras que dene, por otros medios, el grupo a que cada individuo pertenece. Dimensin de la matriz: N (p + 1) . Cada caso gura con un perl y una asignacin de grupo. Ojetivo: Obtener un modelo matemtico discriminante contra el cual sea contrastado el perl de un nuevo individuo cuyo grupo se desconoce para, en funcin de un resultado numrico, ser asignado al grupo ms probable. Nota: Cuanto mejor sea el grupo de partida ms able ser el resultado de asignaciones posteriores. Doble Finalidad:

Por una parte explicar la pertenencia de cada caso del chero de datos original a uno u otro grupo en funcin de las variables de su perl para comprobar su pertenencia o no al grupo preestablecido y cuanticar el peso de cada una de ellas en la discriminacin. Por otra parte predecir a qu grupo ms probable habr de pertenecer un nuevo individuo del que nicamente se conoce su perl de variables.

En el primer caso se explica y en el segundo se predice la variable categrica o grupo

Anlisis Discriminante

87

EJEMPLO

Dos grupos denidos. 3 variables explicativas: V 1, V 2 y V 3 10 individuos de los que se conoce su perl y su asignacin V1 15 17 32 16 30 32 33 21 20 30 V2 41 40 35 42 33 32 30 39 38 31 V3 32 56 46 50 45 33 37 35 44 45 Grupo 1 1 2 1 2 2 2 1 1 2

El valor que toma el primer individuo en la primera variable es 15, el valor que toma este individuo en la segunda variable es 41 y el valor que toma en la tercera es 32. El grupo al que pertenece este individuo es el 1. Los individuos 1, 2, 4, 8 y 9 son del grupo 1 y los individuos 3, 5, 6, 7 y 10 son del grupo 2. La pertenencia a cada grupo no viene determinada por el valor de las variables. (Nuestro objetivo es relacionar estas dos informaciones). Se conoce la pertenencia a cada grupo por otro medios. La variable que asigna los individuos a los grupos es cualitativa (se transforma en numrica para su tratamiento estadstico). El objetivo ser, dado un nuevo individuo, obtener los valores de V 1, V 2 y V 3 y utilizar esta informacin para clasicarlo en el grupo 1 2. Tambin es de nuestro inters determinar qu variables tienen ms peso a la hora de asignar el individuo al grupo ms probable al que pertenece.

88

Anlisis Discriminante

ENFOQUES DE ANLISIS

1) Basado en la obtencin de funciones discriminantes de clculo similar a las ecuaciones regresin lineal mltiple. Consiste en conseguir, a partir de las variables explicativas, unas funciones lineales de stas con capacidad para clasicar otros individuos. A cada nuevo caso se aplican dichas ecuaciones y la funcin de mayor valor dene el grupo al que pertenece. 2) Basado en tcnicas de correlacin cannica y de componentes principales (Anlisis Factorial) denominado Anlisis Discriminante Cannico.

CLASIFICACIN EN DOS GRUPOS

Estudiamos la aplicacin del Anlisis Discriminante a la clasicacin de individuos en el caso de que se puedan asignar solamente a dos grupos a partir de k variables discriminadoras. Problema resuelto por Fisher mediante su funcin discriminante:

D = u1X1 + u2 X2 + u3 X3 + . . . + uk Xk

Las puntuaciones discriminantes son los valores que se obtienen al dar valores a X1 , X2 , . . . , Xk en la ecuacin anterior. Se trata de obtener los coecientes de ponderacin uj .

Anlisis Discriminante

89

Si se considera N observaciones = La funcin discriminante Di = u1X1i + u2X2i + u3 X3i + . . . + uk Xki i = 1, . . . , N

Di es la puntuacin discriminante correspondiente a la observacin isima.

Funcin discriminate en forma matricial: D1 X11 X21 D X 2 12 X22 . = . . . . . . . . DN X1N X2N . . . Xk 1 u1 . . . Xk2 u2 . . . . . . . . . XkN uk

Expresando el modelo en funcin de las desviaciones a la media D1 d1 X11 X21 . . . Xk1 u1 D d X 2 2 12 X22 . . . Xk2 u2 = . . . . . . . . . . . . . . . X1N X2N . . . XkN uk DN dN d = Xu

Es decir:

La variabilidad de la funcin discriminante (suma de cuadrados de las desviaciones de las variables discriminantes con respecto a su media) se expresa: d0 d = u0 X 0 Xu

X 0 X es una matriz simtrica que expresa las desviaciones cuadrticas con respecto a la media de las variables (suma de cuadrados total). Se puede descomponer en suma de cuadrados entre grupos F y suma de cuadrados intragrupos V .

90

Anlisis Discriminante

X 0X = F + V

d0 d = u0 X 0 Xu = u0 (F + V )u = u0 F u + u0 V u

Los ejes discriminantes vienen dados por los vectores propios asociados a los valores propios de la matriz V 1 F ordenados de mayor a menor. Las puntuaciones discriminantes se corresponden con los valores obtenidos al proyectar cada punto del espacio k dimensional de las variables originales sobre el eje discriminante. EJEMPLO Consideremos las variables X1 y X2 que se miden en un conjunto de 13 individuos. La nube de puntos resultante es

Los centros de gravedad o centroides (vector de medias) resumen la informacin sobre los grupos.

Anlisis Discriminante

91

CENTROIDES PARA CADA GRUPO (GRUPO I Y GRUPO II) X 1I X 2I xI = . . . X kI X 1II X 2II = . . . X kII

xII

Los subndices I y II indican a qu grupo pertenece la variable. PARA CADA GRUPO SE OBTIENE DI = u1 X 1I + u2 X 2I + . . . + uk X kI DII = u1 X 1II + u2X 2II + . . . + uk X kII CRITERIO PARA CLASIFICAR A UN INDIVIDUO
F F

Si Di < C se clasica al individuo i en el grupo I . Si Di > C se clasica al individuo i en el grupo II .

C: punto de corte discriminante DI + DII 2

C=

EN GENERAL D C = u1 X1 + u2X2 + . . . + uk Xk C Se clasica dependiendo de si D C es positivo o negativo

92

Anlisis Discriminante

OBSERVACIONES

Relacin entre el anlisis de regresin y el anlisis discriminante con dos grupos: Si se realiza una recta por mnimos cuadrados, tomando como variable dependiente la variable que dene la pertenencia a uno u otro grupo y como variables explicativas a las variables clasicadoras; los coecientes que se obtienen guardan una estricta proporcionalidad con la funcin discriminante de Fisher.

Contrastes de signicacin y evaluacin de la bondad del ajuste: Responden a las cuestiones


F F F

Se cumple la hiptesis de homocedasticidad del modelo? Se cumple la hiptesis de normalidad? Dieren signicativamente las medias poblacionales de los dos grupos?

CLASIFICACIN EN MS DE DOS GRUPOS


ANLISIS DISCRIMINANTE MLTIPLE

Nmero mximo de ejes discriminantes mn (G 1, k ) (G=nmero de categoras). Se obtienen G 1 ejes discriminantes si el nmero de variables explicativas es mayor o igual que G 1 (hecho que suele ser generalmente cierto). Cada una de las funciones discriminantes Di se obtiene como funcin lineal de las k variables explicativas. Di = ui1 X1 + ui2 X2 + . . . + uik Xk i = 1, . . . , G 1

Anlisis Discriminante

93

Los G 1 ejes vienen denidos respectivamente por los vectores u1, u2 , ... , uG1. u1 = u11 u12 . . . u1k , u2 = u21 u22 . . . u2k , . . . , uG1 = uG1,1 uG1,2 . . . uG1,k

CONCLUSIN

Los ejes discriminantes son las componentes de los vectores propios normalizados asociados a los valores propios de la matriz V 1F ordenados.

CONTRASTES DE SIGNIFICACIN

Se plantean contrastes especcos para determinar si cada uno de los valores propios obtenidos contribuye a la discriminacin entre los diferentes grupos.

Bibliografa utilizada: F R. Gutirrez, A. Gonzlez, F. Torres, J.A. Gallardo (1994). Tcnicas de Anlisis de datos Multivariable. Tratamiento computacional. Universidad de Granada. F B. Visauta Vinacua (1998). Anlisis estadstico con SPSS para Windows, volumen II: Estadsitca multivariante. McGraw Hill . Temporalizacin: Dos horas

Вам также может понравиться