Вы находитесь на странице: 1из 7

Plataforma Educativa UNIDEG Materia: Anlisis multivariante Modulo: 4

Recursos de apoyo

ANALISIS DISCRIMINANTE
INTRODUCCIN:
En la investigacin de mercados abundan los ejemplos de anlisis discriminante. Esta tcnica sirve para responder preguntas como: En trminos de las caractersticas demogrficas, en qu difieren los clientes que muestran lealtad hacia una tienda de quienes no lo hacen? Existen diferencias entre usuarios frecuentes, moderados y espordicos de bebidas gaseosas, en cuanto al consumo de alimentos congelados? Qu caractersticas pictogrficas ayudan a diferenciar a los compradores de comestibles sensibles a los precios de los quienes no lo son? Los segmentos del mercado difieren en sus hbitos de exposicin a los medios de comunicacin masiva? En trminos de los estilos de vida, cules son las diferencias entre los clientes frecuentes de las cadenas de tiendas departamentales regionales, y los clientes de cadenas nacionales? Qu caractersticas distinguen a los consumidores que responden a las solicitudes enviadas por correo?

CONCEPTO:
El anlisis discriminante se utiliza para seleccionar entre diferentes grupos, mediante el anlisis de datos con una variable dependiente categrica y variables independientes medidas en escalas de intervalo. Trata de explicar la pertenencia de las observaciones a las diferentes categoras o grupos preestablecidos.

SUPUESTOS:
1. Cada uno de los grupos es una muestra de una poblacin normal de variables mltiples 2. Todas las poblaciones tienen la misma matriz de covarianza

Plataforma Educativa UNIDEG Materia: Anlisis multivariante Modulo: 4

Recursos de apoyo

OBJETIVOS DEL ANLISIS DISCRIMINANTE:


Explicar la pertenencia de individuos u objetos a grupos preestablecidos Desarrollar las funciones discriminantes. Se trata de combinaciones lineales de las variables independientes (predictoras), que discriminan mejor entre las categoras (Grupos) de la variable dependiente. Identificar diferencias significativas entre los grupos en funcin de las variables predictoras Determinar las variables independientes (predictoras) que ms contribuyen a la diferencia entre grupos. Clasificar los casos para uno de los grupos en funcin de las variables predictoras. Evaluar la exactitud de la clasificacin.

RELACIN ENTRE EL ANLISIS DISCRIMINTE CON EL ANLISIS DE DE REGRESIN Y EL ANLISIS DE VARIANZA.


En la tabla se muestra la relacin entre el anlisis discriminante, el anlisis de varianza (ANOVA) y el anlisis de regresin. Se describe esta relacin con un ejemplo donde el investigador intenta explicar la cantidad de seguros de vida comprados en trminos de la edad y los ingresos. Los tres procedimientos incluyen una sola variable dependiente o de criterio, y mltiples variables predictivas o independientes. Sin embargo, la naturaleza de esas variables es diferente. En el anlisis de varianza y el de regresin, la variable dependiente es mtrica o implica una escala de intervalo (monto de los seguros de vida comprados); en tanto que en el anlisis discriminante es categrica (cantidad de seguros de vida comprados clasificada como alta, media y baja). Las variables independientes son categricas en el caso del anlisis de varianza (edad e ingreso, clasificadas cada una como alto, medio o bajo); pero mtricas en el caso del anlisis discriminante y el de regresin (por ejemplo, edad en aos e ingreso en dinero, ambos medidos en una escala de razn). El anlisis discriminante de dos grupos, en que la variable dependiente slo tiene dos categoras, guarda una estrecha relacin con el anlisis de regresin mltiple. En este caso, la regresin mltiple, en que la variable dependiente se codifica como una variable ficticia (dummy) de 0 o 1, da como resultado coeficientes de regresin parciales que son proporcionales a los coeficientes de la funcin.

Plataforma Educativa UNIDEG Materia: Anlisis multivariante Modulo: 4

Recursos de apoyo

MODELO DE ANLISIS DISCRIMINANTE.


El modelo estadstico en que se fundamenta el anlisis discriminante comprende combinaciones lineales de la siguiente estructura: D = b0 + b1x1 + b2 x2 + b3 x3 + ..+ bkxk Siendo D = La calificacin discriminante B = Los coeficientes discriminantes X = Variables predictores o independientes. Los coeficientes, o pesos (b), se calculan de tal manera que el grupo defiera tanto como sea posible en los valores de la funcin discriminante. Esto ocurre cuando est al mximo la razn de la suma de cuadrados entre grupos y la suma de cuadrados intragrupos de las puntuaciones discriminantes. Cualquier otra combinacin lineal de los predictores dar como resultado una razn menor.

ESTADSTICOS ASOCIADOS CON EL ANLISIS DISCRIMINANTE


Los principales estadsticos relacionados con el anlisis discriminante son: Correlacin Cannica: Mide la asociacin entre la nica funcin discriminante y el conjunto de variables simuladas que definen los datos del grupo (algunos autores llaman membresa, aunque esta palabra no existe en nuestro idioma, la podemos considerar equivalente a membrete) del grupo. Mide el grado de asociacin entre los valores discriminantes y los grupos.

Plataforma Educativa UNIDEG Materia: Anlisis multivariante Modulo: 4

Recursos de apoyo

Centroide. Est formado por los valores medios de las calificaciones discriminantes para un determinado grupo. Por tanto existen tantos centroides como grupos. Las medias para un grupo en todas las funciones es el centroide del grupo. Matriz de clasificacin o matriz de confusin o prediccin. Contiene el nmero de casos que se clasifican en forma correcta y errnea. Los casos clasificados correctamente se distribuyen en la diagonal. La suma de los casos de la diagonal dividida por el total de casos es la razn de aciertos. Coeficientes de la funcin discriminante. Los no estandarizados son los multiplicadores de las variables, cuando estas se encuentran en las unidades de medicin originales. Calificaciones discriminantes. Los coeficientes no estandarizado se multiplican por los valores de las variables independientes y se suman al valor constante (b0) obtenindose el valor D (Calificacin Discriminante) Valor especfico. Es la razn de la suma de los cuadrados entre y dentro de los grupos. Los valores especficos altos indican funciones superiores. Valores F. Se determinan a partir del ANOVA unidireccional, con la variable de grupo como variable independiente categrica. Cada indicador sirve como variable dependiente mtrica del ANOVA. Medias y desviaciones estndar. Se determinan para cada indicador de cada grupo Matriz agrupada de correlaciones dentro de cada grupo. Se calcula mediante el promedio de las matrices de covarianza separadas para todos los grupos. Coeficientes estandarizados de funcin discriminante. Se utilizan com multiplicadores cuando las variables se estandarizan con media 0 y varianza 1 Correlaciones de estructura. Tambin se llaman cargas discriminantes, representan las correlaciones sencillas entre los indicadores y la funcin discriminante Matriz de correlacin total. Los casos se tratan como si fueran de una sola muestra y se determinan las correlaciones La l de Wilks. Tambin llamado estadstico U Para cada indicador es la razn de la suma de los cuadrados dentro de los grupos con la suma total de cuadrados. Su valor esta comprendido entre 0 y 1 Los valores prximos a 1 indica que las medias de un grupo no parecen ser muy diferentes si es cercano a 0 indica que las medias de los grupos parecen diferentes.

PASOS PARA RELIZAR EL ANLSIS DISCRIMINANTE.


Los pasos o fases que contiene el anlisis discriminante son: 1. 2. 3. 4. 5. Formular el problema. Estimar los coeficientes de funcin discriminante. Determinar la significacin discriminante. Interpretar los resultados. Verificar la validez del anlisis discriminante.

Plataforma Educativa UNIDEG Materia: Anlisis multivariante Modulo: 4 FORMULACIN DEL PROBLEMA.

Recursos de apoyo

Hemos de identificar a travs de los objetivos que perseguimos la variable criterio y las variables predictoras o independientes. La variable criterio debe establecerse en categoras mutuamente excluyentes y colectivamente exhaustivas. Las variables predictivas deben escogerse en funcin del criterio del investigador. La muestra se divide en dos partes, una parte de la muestra se utiliza para el clculo de la funcin discriminante (Muestra de anlisis), La otra parte que se suele denominar como proposicin o muestra de validacin y se usa para validar la funcin discriminante. Cuando la muestra es grande y se divide en dos partes iguales, lo que se hace es intercambiar el papel de las mitades hacindose lo que se denomina validacin cruzada doble. ESTIMACIN DE COEFICIENTES. La muestra de anlisis la utilizamos para determinar los coeficientes de funcin discriminante. Mtodo directo. Todos los indicadores se incluyen directamente. Es decir se incluyen todas las variables sin importar su poder de discriminacin Anlisis discriminante discreto. Las variables de prediccin entran de forma secuencial, en funcin de su capacidad para discriminar entre los grupos. El primer procedimiento es apropiado cuando, por alguna causa (modelo o experiencias) el investigador quiere que la discriminacin se base en todos los indicadores. El mtodo discreto es de utilidad cuando se quiere seleccionar un conjunto o subconjunto de indicadores para su inclusin en la funcin discriminante final. DETERMINACIN DEL GRADO DE SIGNIFICACIN. Para probar la significacin estadstica se toma como hiptesis nula (H0) En la poblacin las medias de todas las funciones discriminantes son iguales en todos los grupos. La prueba se basa en la l de Wilks La significacin se calcula con base en una transformacin de ji cuadrado Normalmente se trabaja para un contraste del nivel de significacin = 5% Rechazamos H0 cuando la significacin calculada sea menor que 0.05

Plataforma Educativa UNIDEG Materia: Anlisis multivariante Modulo: 4

Recursos de apoyo

INTERPRETACIN DE RESULTADOS. La interpretacin de los coeficientes es similar a la que se realiza en el anlisis de regresin mltiple. El valor del coeficiente de un indicador concreto depende del resto de indicadores que se incluyan en la funcin discriminante. Los signos de los coeficientes indican que valores de la variable dan como resultado valores de la funcin altos y bajos as como las correlaciones con los grupos Debido a la posible multicolinealidad en las variables predIctoras, no existe ninguna medicin objetiva de la significacin relativa de los indicadores en la discriminacin entre los grupos. Podemos tener idea de la significacin relativa al examinar los coeficientes estandarizados de la funcin discriminante En la prctica, los indicadores con coeficientes estandarizados altos contribuyen ms al poder discriminante. Tambin se analiza la significacin relativa de las variables predictoras (indicadores) analizando las correlaciones de estructura (Cargas cannicas o cargas discriminantes) Estas correlaciones simples entre el indicador y la funcin discriminante representan la varianza que la variable independiente comparte con la funcin. Tambin podemos aadir a la interpretacin de los resultados el Perfil Caracterstico, se trata de interpretar los resultados mediante la descripcin de cada grupo en trminos de las medias de los grupos para las variables de prediccin. Una comparacin entre las medias nos ayuda a comprender sus diferencias. EVALUAR VALIDEZ DE ANLISIS DISCRIMINANTE Si recordamos los datos se dividan aleatoriamente en dos submuestras. Una la denominamos muestra de anlisis y la utilizamos para estimar la funcin discriminante y la segunda que llamamos muestra de validacin se utiliza para desarrollar la matriz de clasificacin Los valores relativos discriminantes que se calculan a travs de la muestra de anlisis, se multiplican por los valores de las variables de prediccin con el objetivo de obtener las correspondientes calificaciones discriminantes (D) de la muestra de validacin. De aqu se obtiene la razn de aciertos, que es, el porcentaje de casos que se clasifican correctamente por medio del Anlisis Discriminante.

Plataforma Educativa UNIDEG Materia: Anlisis multivariante Modulo: 4

Recursos de apoyo

Es de utilidad el comparar el porcentaje de los casos que se clasificaron de forma correcta con el anlisis discriminante con el porcentaje que obtendramos por la probabilidad. Cuando las dos submuestras tienen el mismo tamao el porcentaje de clasificacin por probabilidad es 0.5, en general cuando los grupos tienen el mismo tamao el porcentaje de clasificacin por probabilidad es1 dividido por el nmero de grupos. Algunos autores citan que: La exactitud alcanzada por el AD debe ser por lo menos un 25% mayor que la alcanzada por la probabilidad. Los paquetes estadsticos utilizados habitualmente estiman una matriz de clasificacin con base en la muestra de anlisis. Dando significacin a la variacin probable de esos datos.

Extrado
Malhotra K, Naresh, Investigacin de mercados (2008), Mxico. Ed. Pearson Education 5ta. Edicin Eduardo Jimnez Marques (primera parte) (2004): Introduccin al anlisis discriminante, http://es.scribd.com/doc/61268649/Analisis-multivariable#download, consultado el 18 de octubre del 2013

Вам также может понравиться