Академический Документы
Профессиональный Документы
Культура Документы
Recursos de apoyo
ANALISIS DISCRIMINANTE
INTRODUCCIN:
En la investigacin de mercados abundan los ejemplos de anlisis discriminante. Esta tcnica sirve para responder preguntas como: En trminos de las caractersticas demogrficas, en qu difieren los clientes que muestran lealtad hacia una tienda de quienes no lo hacen? Existen diferencias entre usuarios frecuentes, moderados y espordicos de bebidas gaseosas, en cuanto al consumo de alimentos congelados? Qu caractersticas pictogrficas ayudan a diferenciar a los compradores de comestibles sensibles a los precios de los quienes no lo son? Los segmentos del mercado difieren en sus hbitos de exposicin a los medios de comunicacin masiva? En trminos de los estilos de vida, cules son las diferencias entre los clientes frecuentes de las cadenas de tiendas departamentales regionales, y los clientes de cadenas nacionales? Qu caractersticas distinguen a los consumidores que responden a las solicitudes enviadas por correo?
CONCEPTO:
El anlisis discriminante se utiliza para seleccionar entre diferentes grupos, mediante el anlisis de datos con una variable dependiente categrica y variables independientes medidas en escalas de intervalo. Trata de explicar la pertenencia de las observaciones a las diferentes categoras o grupos preestablecidos.
SUPUESTOS:
1. Cada uno de los grupos es una muestra de una poblacin normal de variables mltiples 2. Todas las poblaciones tienen la misma matriz de covarianza
Recursos de apoyo
Recursos de apoyo
Recursos de apoyo
Centroide. Est formado por los valores medios de las calificaciones discriminantes para un determinado grupo. Por tanto existen tantos centroides como grupos. Las medias para un grupo en todas las funciones es el centroide del grupo. Matriz de clasificacin o matriz de confusin o prediccin. Contiene el nmero de casos que se clasifican en forma correcta y errnea. Los casos clasificados correctamente se distribuyen en la diagonal. La suma de los casos de la diagonal dividida por el total de casos es la razn de aciertos. Coeficientes de la funcin discriminante. Los no estandarizados son los multiplicadores de las variables, cuando estas se encuentran en las unidades de medicin originales. Calificaciones discriminantes. Los coeficientes no estandarizado se multiplican por los valores de las variables independientes y se suman al valor constante (b0) obtenindose el valor D (Calificacin Discriminante) Valor especfico. Es la razn de la suma de los cuadrados entre y dentro de los grupos. Los valores especficos altos indican funciones superiores. Valores F. Se determinan a partir del ANOVA unidireccional, con la variable de grupo como variable independiente categrica. Cada indicador sirve como variable dependiente mtrica del ANOVA. Medias y desviaciones estndar. Se determinan para cada indicador de cada grupo Matriz agrupada de correlaciones dentro de cada grupo. Se calcula mediante el promedio de las matrices de covarianza separadas para todos los grupos. Coeficientes estandarizados de funcin discriminante. Se utilizan com multiplicadores cuando las variables se estandarizan con media 0 y varianza 1 Correlaciones de estructura. Tambin se llaman cargas discriminantes, representan las correlaciones sencillas entre los indicadores y la funcin discriminante Matriz de correlacin total. Los casos se tratan como si fueran de una sola muestra y se determinan las correlaciones La l de Wilks. Tambin llamado estadstico U Para cada indicador es la razn de la suma de los cuadrados dentro de los grupos con la suma total de cuadrados. Su valor esta comprendido entre 0 y 1 Los valores prximos a 1 indica que las medias de un grupo no parecen ser muy diferentes si es cercano a 0 indica que las medias de los grupos parecen diferentes.
Plataforma Educativa UNIDEG Materia: Anlisis multivariante Modulo: 4 FORMULACIN DEL PROBLEMA.
Recursos de apoyo
Hemos de identificar a travs de los objetivos que perseguimos la variable criterio y las variables predictoras o independientes. La variable criterio debe establecerse en categoras mutuamente excluyentes y colectivamente exhaustivas. Las variables predictivas deben escogerse en funcin del criterio del investigador. La muestra se divide en dos partes, una parte de la muestra se utiliza para el clculo de la funcin discriminante (Muestra de anlisis), La otra parte que se suele denominar como proposicin o muestra de validacin y se usa para validar la funcin discriminante. Cuando la muestra es grande y se divide en dos partes iguales, lo que se hace es intercambiar el papel de las mitades hacindose lo que se denomina validacin cruzada doble. ESTIMACIN DE COEFICIENTES. La muestra de anlisis la utilizamos para determinar los coeficientes de funcin discriminante. Mtodo directo. Todos los indicadores se incluyen directamente. Es decir se incluyen todas las variables sin importar su poder de discriminacin Anlisis discriminante discreto. Las variables de prediccin entran de forma secuencial, en funcin de su capacidad para discriminar entre los grupos. El primer procedimiento es apropiado cuando, por alguna causa (modelo o experiencias) el investigador quiere que la discriminacin se base en todos los indicadores. El mtodo discreto es de utilidad cuando se quiere seleccionar un conjunto o subconjunto de indicadores para su inclusin en la funcin discriminante final. DETERMINACIN DEL GRADO DE SIGNIFICACIN. Para probar la significacin estadstica se toma como hiptesis nula (H0) En la poblacin las medias de todas las funciones discriminantes son iguales en todos los grupos. La prueba se basa en la l de Wilks La significacin se calcula con base en una transformacin de ji cuadrado Normalmente se trabaja para un contraste del nivel de significacin = 5% Rechazamos H0 cuando la significacin calculada sea menor que 0.05
Recursos de apoyo
INTERPRETACIN DE RESULTADOS. La interpretacin de los coeficientes es similar a la que se realiza en el anlisis de regresin mltiple. El valor del coeficiente de un indicador concreto depende del resto de indicadores que se incluyan en la funcin discriminante. Los signos de los coeficientes indican que valores de la variable dan como resultado valores de la funcin altos y bajos as como las correlaciones con los grupos Debido a la posible multicolinealidad en las variables predIctoras, no existe ninguna medicin objetiva de la significacin relativa de los indicadores en la discriminacin entre los grupos. Podemos tener idea de la significacin relativa al examinar los coeficientes estandarizados de la funcin discriminante En la prctica, los indicadores con coeficientes estandarizados altos contribuyen ms al poder discriminante. Tambin se analiza la significacin relativa de las variables predictoras (indicadores) analizando las correlaciones de estructura (Cargas cannicas o cargas discriminantes) Estas correlaciones simples entre el indicador y la funcin discriminante representan la varianza que la variable independiente comparte con la funcin. Tambin podemos aadir a la interpretacin de los resultados el Perfil Caracterstico, se trata de interpretar los resultados mediante la descripcin de cada grupo en trminos de las medias de los grupos para las variables de prediccin. Una comparacin entre las medias nos ayuda a comprender sus diferencias. EVALUAR VALIDEZ DE ANLISIS DISCRIMINANTE Si recordamos los datos se dividan aleatoriamente en dos submuestras. Una la denominamos muestra de anlisis y la utilizamos para estimar la funcin discriminante y la segunda que llamamos muestra de validacin se utiliza para desarrollar la matriz de clasificacin Los valores relativos discriminantes que se calculan a travs de la muestra de anlisis, se multiplican por los valores de las variables de prediccin con el objetivo de obtener las correspondientes calificaciones discriminantes (D) de la muestra de validacin. De aqu se obtiene la razn de aciertos, que es, el porcentaje de casos que se clasifican correctamente por medio del Anlisis Discriminante.
Recursos de apoyo
Es de utilidad el comparar el porcentaje de los casos que se clasificaron de forma correcta con el anlisis discriminante con el porcentaje que obtendramos por la probabilidad. Cuando las dos submuestras tienen el mismo tamao el porcentaje de clasificacin por probabilidad es 0.5, en general cuando los grupos tienen el mismo tamao el porcentaje de clasificacin por probabilidad es1 dividido por el nmero de grupos. Algunos autores citan que: La exactitud alcanzada por el AD debe ser por lo menos un 25% mayor que la alcanzada por la probabilidad. Los paquetes estadsticos utilizados habitualmente estiman una matriz de clasificacin con base en la muestra de anlisis. Dando significacin a la variacin probable de esos datos.
Extrado
Malhotra K, Naresh, Investigacin de mercados (2008), Mxico. Ed. Pearson Education 5ta. Edicin Eduardo Jimnez Marques (primera parte) (2004): Introduccin al anlisis discriminante, http://es.scribd.com/doc/61268649/Analisis-multivariable#download, consultado el 18 de octubre del 2013