Вы находитесь на странице: 1из 47

INVESTIGACIN DE MERCADOS AVANZADA

ANLISIS DISCRIMINANTE Y LOGIT

Esquema del captulo


Esquema Concepto bsico Relacin con la Regresin y ANOVA Modelo de Anlisis Discriminante Estadsticos asociadas con el Anlisis Discriminante Realizacin de un Anlisis Discriminante

Formulacin Estimacin Determinacin de la Significancia Interpretacin Validacin

Esquema del captulo


Anlisis Discriminante Mltiple
Formulacin Estimacin Determinacin de la Significacin Interpretacin

Validacin

Anlisis Discriminante Paso a Paso

Esquema del captulo


El modelo Logit
Estimacin Ajuste del modelo Pruebas de significancia Interpretacin de los coeficientes

Una aplicacin ilustrativa

Resumen

Semejanzas y diferencias entre ANOVA, anlisis de regresin y anlisis discriminante

Anlisis Discriminante
El anlisis discriminante es una tcnica para analizar los

datos, cuando la variable dependiente o de criterio es categrica, y las variables predictivas o independientes son de naturaleza intervalar. Los objetivos del anlisis discriminante son los siguientes:
Desarrollar las funciones discriminantes, o combinaciones

lineales de las variables predictivas o independientes, que hagan una mejor diferenciacin entre las categoras de las variables dependientes o de criterio (grupos). Examinar si hay diferencias significativas entre los grupos, en trminos de las variables predictivas. Determinar qu variables predictivas contribuyen ms a las diferencias entre grupos. Clasificar los casos en uno de los grupos, con base en los valores de las variables predictivas. Evaluar la precisin de la clasificacin.

Anlisis Discriminante
Cuando sta tiene dos categoras, la tcnica se conoce

como anlisis discriminante de dos grupos. Cuando hay tres o ms categoras, la tcnica se conoce como anlisis discriminante mltiple. La diferencia principal es que, en el caso de dos grupos, slo puede derivarse una funcin discriminante; mientras que en el anlisis discriminante mltiple, puede calcularse ms de una funcin. En general, con G grupos y k predictores, es posible estimar el menor entre G-1 o k, funciones discriminantes. La primera funcin tiene el ratio ms algo de suma de cuadrados intergrupos y intragrupos. La segunda funcin, no correlacionada con la primera, tiene el segundo ratio ms alto y as sucesivamente. Sin embargo, no todas las funciones puede ser estadsticamente significativas.

Interpretacin geomtrica

Modelo de Anlisis Discriminante


El modelo de anlisis discriminante implica combinaciones

lineales de la siguiente forma: D = b0 + b1X1 + b2X2 + b3X3 + . . . + bkXk donde:


D = puntaje discriminante b 's = coeficiente o peso discriminante X 's = variable predictiva o independiente

Los coeficientes, o pesos (b), se calculan de manera que el

grupo difiera tanto como sea posible en los valores de la funcin discriminante Esto ocurre cuando est al mximo la razn de la suma de cuadrados entre grupos y la suma de cuadrados intragrupos de las puntuaciones discriminantes.

Estadsticos asociados con el Anlisis discriminante


Correlacin cannica: la correlacin cannica mide el

grado de asociacin entre las calificaciones discriminantes y los grupos. Es una medida de asociacin entre la nica funcin discriminante y el conjunto de variables ficticias que definen la pertenencia al grupo. Centroide: el centroide es la media de las calificaciones discriminantes de un grupo particular. Existen tantos centroides como grupos, porque hay uno para cada grupo. Los centroides del grupo son las medias de ese grupo en todas las funciones. Matriz de clasificacin: llamada a veces tambin matriz de confusin o de prediccin, contiene el nmero de casos cuya clasificacin fue correcta e incorrecta.

Estadsticos asociados con el Anlisis discriminante


Coeficientes de la funcin discriminante: los coeficientes

(no estandarizados) de la funcin discriminante son los multiplicadores de las variables, cuando stas se encuentran en las unidades de medicin originales. Calificaciones de discriminacin: los coeficientes no estandarizados se multiplican por los valores de las variables. Los productos se suman y se agregan al trmino constante para obtener las calificaciones de discriminacin. Valor propio: para cada funcin discriminante, el valor propio es la razn de la suma de cuadrados entre grupos e intragrupos. Los valores propios grandes suponen funciones superiores.

Estadsticos asociados con el Anlisis discriminante


Valores F y su significancia: se calculan en un

ANOVA de una va, donde la variable de agrupamiento funge como variable independiente categrica. A la vez, en el ANOVA cada predictivo funge como variable dependiente mtrica. Medias y desviaciones estndar de los grupos: se calculan para cada predictivo en cada grupo. Matriz de correlaciones agrupadas intragrupales: para calcular la matriz de correlaciones agrupadas intragrupales se promedian las matrices de covarianza separadas de todos los grupos.

Estadsticos asociados con el Anlisis discriminante

Coeficientes estandarizados de la funcin discriminante: los coeficientes estandarizados de la funcin discriminante son los que suelen usarse como multiplicadores cuando las variables se han estandarizado con una media de 0 y una varianza de 1. Estructura de correlaciones: conocida tambin como cargas discriminantes, la estructura de correlaciones representa las correlaciones simples entre los predictivos y la funcin discriminante. Matriz de correlacin total: si se trata a los casos como si pertenecieran a una sola muestra y se calculan las correlaciones, se obtiene una matriz de correlacin total. de Wilks: conocida tambin como estadstico U. La de Wilks de cada predictivo es la razn entre la suma de los cuadrados intragrupo y la suma total de los cuadrados. Su valor flucta entre 0 y 1. Los valores grandes de (cerca de 1) indican que parece no haber diferencia entre las medias del grupo. Los valores pequeos de (cerca de 0) indican que parece haber diferencia entre las medias del grupo.

Realizacin de un Anlisis discriminante

Formulacin del problema


Identificar los objetivos, las variables de criterio y las variables

independientes Las variables de criterio deben consistir en dos o ms categoras que sean excluyentes entre s y exhaustivas en su conjunto. La eleccin de las variables predictivas tiene que basarse en un modelo terico o en investigaciones previas; sin embargo, en el caso de la investigacin exploratoria, la seleccin debe estar guiada por la experiencia del investigador. Una parte de la muestra, llamada muestra de anlisis o de estimacin, se utiliza para calcular la funcin discriminante. La otra parte, llamada muestra de validacin o de exclusin, se reserva para la validacin de la funcin discriminante. A menudo la distribucin del nmero de casos en las muestras de anlisis y validacin sigue la distribucin de la muestra total.

Informacin sobre visitas a centros vacacionales: muestra de anlisis

Informacin sobre visitas a centros vacacionales: muestra de anlisis

Informacin sobre visitas a centros vacacionales: muestra de validacin

Clculo de los coeficientes de la funcin discriminante


El mtodo directo implica calcular la funcin

discriminante, de manera que todos los predictivos se incluyan al mismo tiempo. En el anlisis discriminante paso a paso, las variables predictivas se introducen en secuencia, con base en su habilidad para discriminar entre grupos.

Resultados del Anlisis discriminante de dos grupos

Resultados del Anlisis discriminante de dos grupos

Resultados del Anlisis discriminante de dos grupos

Resultados del Anlisis discriminante de dos grupos

Determinar la significancia de la funcin discriminante


Es posible someter a prueba estadstica la hiptesis nula

de que, en la poblacin, las medias de todas las funciones discriminantes en todos los grupos son iguales. En el SPSS esta prueba se basa en la de Wilks. Si se prueban al mismo tiempo varias funciones (como en el caso del anlisis discriminante mltiple), el estadstico de Wilks es el producto de la univariada para cada funcin. El clculo del nivel de significancia se basa en la transformacin del estadstico en una chi cuadrada. Si se rechaza la hiptesis nula, lo que indica una discriminacin significativa, puede procederse a la interpretacin de los resultados

Interpretacin de los resultados


La interpretacin de los pesos, o coeficientes discriminantes es similar a la del anlisis de regresin mltiple. Dada la multicolinealidad de las variables predictivas, no hay medidas inequvocas de la importancia relativa de los predictivos para discriminar entre los grupos. Con esta advertencia en mente, el examen de la magnitud absoluta de los coeficientes estandarizados de la funcin discriminante brinda una idea de la importancia relativa de las variables. Tambin puede obtenerse una nocin de la importancia relativa de los predictivos mediante el examen de la estructura de correlaciones, conocidas tambin como cargas cannicas o cargas discriminantes. Esas correlaciones simples entre cada predictivo y la funcin discriminante representan la varianza que el predictivo comparte con la funcin. Otro auxiliar para interpretar los resultados del anlisis discriminante es el desarrollo de un perfil caracterstico para cada grupo, donde se describe a cada grupo en trminos de sus medias en las variables predictivas.

Evaluacin de la validez del Anlisis discriminante


Muchos programas de software, como el SPSS, ofrecen una

opcin de validacin cruzada con exclusin. Los pesos discriminantes, para cuyo clculo se utiliza la muestra de anlisis, se multiplican por los valores de las variables predictivas en la muestra de validacin, para generar calificaciones discriminantes para los casos de esta muestra. Los casos se asignan luego a los grupos con base en sus calificaciones discriminantes y una regla de decisin apropiada. Entonces, para determinar la proporcin de aciertos, o porcentaje de casos correctamente clasificados, se suman los elementos de la diagonal y el resultado se divide entre el nmero total de casos. Es til comparar el porcentaje de casos clasificados correctamente por el anlisis discriminante con el porcentaje que se obtendra por azar.

Resultados del Anlisis discriminante de tres grupos

Resultados del Anlisis discriminante de tres grupos

Resultados del Anlisis discriminante de tres grupos

Resultados del Anlisis discriminante de tres grupos

Diagrama de dispersin de todos los grupos

Mapa territorial

Anlisis discriminante paso a paso


El anlisis discriminante paso a paso es similar a la

regresin mltiple paso a paso (vase el captulo 17) en la introduccin secuenciada de los predictivos, de acuerdo con su capacidad para discriminar entre los grupos. Para cada predictivo se calcula una razn F usando un anlisis univariado de la varianza, donde se trata a los grupos como la variable categrica y al predictivo como la variable de criterio. El predictivo con la razn F ms alta es el primero que se elige para ser incluido en la funcin discriminante, si cumple ciertos criterios de significancia y tolerancia. Se agrega un segundo predictivo con base en la razn F parcial o de mayor ajuste, tomando en cuenta el predictivo ya elegido.

Anlisis discriminante paso a paso


Se prueba la retencin de cada predictivo en funcin de su

asociacin con los otros predictivos seleccionados. Se contina el proceso de seleccin y retencin, hasta que en la funcin discriminante se incluyan todos los predictivos que cumplen los criterios de significancia, para la inclusin y retencin. La eleccin del procedimiento paso a paso se basa en los criterios de optimizacin adoptados. El procedimiento de Mahalanobis se basa en la maximizacin de una medida generalizada de la distancia entre los dos grupos ms cercanos. El orden en que se eligieron las variables tambin indica su importancia en la discriminacin entre los grupos.

El modelo Logit
La variable dependiente es binaria y hay

diversas variables independientes mtricas. El modelo logit binario por lo comn trata el problema de qu tan probable es que una observacin pertenezca a cada grupo. Calcula la probabilidad de que una observacin pertenezca a un grupo especfico.

Modelo logit binario


La probabilidad de xito puede modelarse

usando el modelo logit como:

o bien,

Formulacin del modelo


o bien,

donde P = probabilidad de xito Xi = variable independiente i ai = parmetro que debe calcularse

Propiedades del modelo logit


Xi puede variar - entre +, P est

restringido a quedar entre 0 y 1. Cuando Xi se aproxima a -, P se aproxima a 0 Cuando Xi se aproxima a +, P se aproxima a 1. Esto es deseable porque P es una probabilidad y debe caer entre 0 y 1.

Clculo del modelo logit binario


El procedimiento utilizado para calcular los parmetros del

modelo logit binario se conoce como mtodo de probabilidad mxima. Ajuste: R cuadrada de Cox y Snell y la R cuadrada de Nagelkerke. Ambas medidas son similares a la R2 de la regresin mltiple La R cuadrada de Cox y Snell se restringe de tal manera, que no puede ser igual a 1.0 incluso si el modelo se ajusta a los datos perfectamente. Esta limitacin es superada por la R cuadrada de Nagelkerke. Los valores pronosticados de Y luego se comparan luego con los valores reales correspondientes, para determinar el porcentaje de predicciones correctas.

Pruebas de significancia
La significancia de los coeficientes

calculados se basa en el estadstico de Wald:

donde:
ai = coeficiente logstico de la variable predictiva EEai = error estndar del coeficiente logstico

Interpretacin de los coeficientes


si Xi se incrementa en una unidad, el

logaritmo de probabilidades cambiar en ai unidades, siempre que se mantenga constante el efecto de otras variables independientes. El signo de ai determinar si la probabilidad se incrementa (si el signo es positivo) o se reduce (si el signo es negativo) en esa cantidad.

Explicacin de la lealtad a la marca

Resultados del modelo logit binario o regresin logstica

Resultados del modelo logit binario o regresin logstica

SPSS para Windows


El programa DISCRIMINANT realiza tanto el

anlisis discriminante mltiple como el de dos grupos. Para elegir este procedimiento mientras usa SPSS para Windows, haga clic en:
Analyze>Classify>Discriminant

Para correr un anlisis logit o regresin

logstica en el SPSS de Windows, haga clic en:


Analyze>Regresin>Binary Logistic

SPSS para Windows: Discriminante de dos grupos


Elija ANALIZE de la barra de men de SPSS. Haga clic en CLASSIFY y luego en DISCRIMINANT. Cambie visit al recuadro GROUPING VARIABLE. Haga clic en DEFINE RANGE. Introduzca un 1 en MINIMUM y 2 en MAXIMUM. Haga clic en CONTINUE. Cambie income, travel, vacation, fsize y age al recuadro INDEPENDENTS. Elija ENTER INDEPENDENTS TOGETHER (opcin predeterminada). Haga clic en STATISTICS. En el recuadro DESCRIPTIVES de la ventana emergente, elija MEANS y UNIVARIATE ANOVAS. En el recuadro MATRICES elija WITHIN-GROUP CORRELATIONS. Haga clic en CONTINUE. Haga clic en CLASSIFY en la ventana emergente en la opcin PRIOR PROBABILITIES, elija ALL GROUPS EQUAL (predeterminado). En el recuadro DISPLAY elija SUMMARY TABLE y LEAVE-ONE-OUT CLASSIFICATION. En el recuadro USE COVARIANCE MATRIX elija WITHIN-GROUPS. Haga clic en CONTINUE. Seleccione OK.

SPSS para Windows: Anlisis Logit


Elija ANALYZE de la barra de mens de SPSS. Haga clic en REGRESSION y enseguida en BINARY

LOGISTIC. Cambie Loyalty to the Brand [Lealtad] al recuadro DEPENDENT VARIABLE. Cambie Attitude toward the Brand [Marca] Attitude toward the Product category [Producto] y Attitude toward Shopping [Compras] al recuadro COVARIATES. Elija ENTER en la opcin METHOD (opcin predeterminada). Haga clic en OK.

Вам также может понравиться