Malhotra Mr05 PPT 18 SP

INVESTIGACIN DE MERCADOS AVANZADA
ANLISIS DISCRIMINANTE Y LOGIT
Esquema del captulo

Esquema Concepto bsico Relacin con la Regresin y ANOVA Modelo de Anlisis Discriminante Estadsticos asociadas con el Anlisis Discriminante Realizacin de un Anlisis Discriminante

Formulacin Estimacin Determinacin de la Significancia Interpretacin Validacin
Esquema del captulo

Anlisis Discriminante Mltiple
Formulacin Estimacin Determinacin de la Significacin Interpretacin
Validacin
Anlisis Discriminante Paso a Paso
Esquema del captulo

El modelo Logit
Estimacin Ajuste del modelo Pruebas de significancia Interpretacin de los coeficientes
Una aplicacin ilustrativa
Resumen
Semejanzas y diferencias entre ANOVA, anlisis de regresin y anlisis discriminante
Anlisis Discriminante
El anlisis discriminante es una tcnica para analizar los
datos, cuando la variable dependiente o de criterio es categrica, y las variables predictivas o independientes son de naturaleza intervalar. Los objetivos del anlisis discriminante son los siguientes:
Desarrollar las funciones discriminantes, o combinaciones
lineales de las variables predictivas o independientes, que hagan una mejor diferenciacin entre las categoras de las variables dependientes o de criterio (grupos). Examinar si hay diferencias significativas entre los grupos, en trminos de las variables predictivas. Determinar qu variables predictivas contribuyen ms a las diferencias entre grupos. Clasificar los casos en uno de los grupos, con base en los valores de las variables predictivas. Evaluar la precisin de la clasificacin.
Anlisis Discriminante
Cuando sta tiene dos categoras, la tcnica se conoce
como anlisis discriminante de dos grupos. Cuando hay tres o ms categoras, la tcnica se conoce como anlisis discriminante mltiple. La diferencia principal es que, en el caso de dos grupos, slo puede derivarse una funcin discriminante; mientras que en el anlisis discriminante mltiple, puede calcularse ms de una funcin. En general, con G grupos y k predictores, es posible estimar el menor entre G-1 o k, funciones discriminantes. La primera funcin tiene el ratio ms algo de suma de cuadrados intergrupos y intragrupos. La segunda funcin, no correlacionada con la primera, tiene el segundo ratio ms alto y as sucesivamente. Sin embargo, no todas las funciones puede ser estadsticamente significativas.
Interpretacin geomtrica
Modelo de Anlisis Discriminante

El modelo de anlisis discriminante implica combinaciones
lineales de la siguiente forma: D = b0 + b1X1 + b2X2 + b3X3 + . . . + bkXk donde:

D = puntaje discriminante b 's = coeficiente o peso discriminante X 's = variable predictiva o independiente
Los coeficientes, o pesos (b), se calculan de manera que el
grupo difiera tanto como sea posible en los valores de la funcin discriminante Esto ocurre cuando est al mximo la razn de la suma de cuadrados entre grupos y la suma de cuadrados intragrupos de las puntuaciones discriminantes.
Estadsticos asociados con el Anlisis discriminante

Correlacin cannica: la correlacin cannica mide el
grado de asociacin entre las calificaciones discriminantes y los grupos. Es una medida de asociacin entre la nica funcin discriminante y el conjunto de variables ficticias que definen la pertenencia al grupo. Centroide: el centroide es la media de las calificaciones discriminantes de un grupo particular. Existen tantos centroides como grupos, porque hay uno para cada grupo. Los centroides del grupo son las medias de ese grupo en todas las funciones. Matriz de clasificacin: llamada a veces tambin matriz de confusin o de prediccin, contiene el nmero de casos cuya clasificacin fue correcta e incorrecta.

Coeficientes de la funcin discriminante: los coeficientes
(no estandarizados) de la funcin discriminante son los multiplicadores de las variables, cuando stas se encuentran en las unidades de medicin originales. Calificaciones de discriminacin: los coeficientes no estandarizados se multiplican por los valores de las variables. Los productos se suman y se agregan al trmino constante para obtener las calificaciones de discriminacin. Valor propio: para cada funcin discriminante, el valor propio es la razn de la suma de cuadrados entre grupos e intragrupos. Los valores propios grandes suponen funciones superiores.

Valores F y su significancia: se calculan en un
ANOVA de una va, donde la variable de agrupamiento funge como variable independiente categrica. A la vez, en el ANOVA cada predictivo funge como variable dependiente mtrica. Medias y desviaciones estndar de los grupos: se calculan para cada predictivo en cada grupo. Matriz de correlaciones agrupadas intragrupales: para calcular la matriz de correlaciones agrupadas intragrupales se promedian las matrices de covarianza separadas de todos los grupos.
Coeficientes estandarizados de la funcin discriminante: los coeficientes estandarizados de la funcin discriminante son los que suelen usarse como multiplicadores cuando las variables se han estandarizado con una media de 0 y una varianza de 1. Estructura de correlaciones: conocida tambin como cargas discriminantes, la estructura de correlaciones representa las correlaciones simples entre los predictivos y la funcin discriminante. Matriz de correlacin total: si se trata a los casos como si pertenecieran a una sola muestra y se calculan las correlaciones, se obtiene una matriz de correlacin total. de Wilks: conocida tambin como estadstico U. La de Wilks de cada predictivo es la razn entre la suma de los cuadrados intragrupo y la suma total de los cuadrados. Su valor flucta entre 0 y 1. Los valores grandes de (cerca de 1) indican que parece no haber diferencia entre las medias del grupo. Los valores pequeos de (cerca de 0) indican que parece haber diferencia entre las medias del grupo.
Realizacin de un Anlisis discriminante
Formulacin del problema

Identificar los objetivos, las variables de criterio y las variables
independientes Las variables de criterio deben consistir en dos o ms categoras que sean excluyentes entre s y exhaustivas en su conjunto. La eleccin de las variables predictivas tiene que basarse en un modelo terico o en investigaciones previas; sin embargo, en el caso de la investigacin exploratoria, la seleccin debe estar guiada por la experiencia del investigador. Una parte de la muestra, llamada muestra de anlisis o de estimacin, se utiliza para calcular la funcin discriminante. La otra parte, llamada muestra de validacin o de exclusin, se reserva para la validacin de la funcin discriminante. A menudo la distribucin del nmero de casos en las muestras de anlisis y validacin sigue la distribucin de la muestra total.
Informacin sobre visitas a centros vacacionales: muestra de anlisis
Informacin sobre visitas a centros vacacionales: muestra de anlisis
Informacin sobre visitas a centros vacacionales: muestra de validacin
Clculo de los coeficientes de la funcin discriminante

El mtodo directo implica calcular la funcin
discriminante, de manera que todos los predictivos se incluyan al mismo tiempo. En el anlisis discriminante paso a paso, las variables predictivas se introducen en secuencia, con base en su habilidad para discriminar entre grupos.
Resultados del Anlisis discriminante de dos grupos
Determinar la significancia de la funcin discriminante

Es posible someter a prueba estadstica la hiptesis nula
de que, en la poblacin, las medias de todas las funciones discriminantes en todos los grupos son iguales. En el SPSS esta prueba se basa en la de Wilks. Si se prueban al mismo tiempo varias funciones (como en el caso del anlisis discriminante mltiple), el estadstico de Wilks es el producto de la univariada para cada funcin. El clculo del nivel de significancia se basa en la transformacin del estadstico en una chi cuadrada. Si se rechaza la hiptesis nula, lo que indica una discriminacin significativa, puede procederse a la interpretacin de los resultados
Interpretacin de los resultados

La interpretacin de los pesos, o coeficientes discriminantes es similar a la del anlisis de regresin mltiple. Dada la multicolinealidad de las variables predictivas, no hay medidas inequvocas de la importancia relativa de los predictivos para discriminar entre los grupos. Con esta advertencia en mente, el examen de la magnitud absoluta de los coeficientes estandarizados de la funcin discriminante brinda una idea de la importancia relativa de las variables. Tambin puede obtenerse una nocin de la importancia relativa de los predictivos mediante el examen de la estructura de correlaciones, conocidas tambin como cargas cannicas o cargas discriminantes. Esas correlaciones simples entre cada predictivo y la funcin discriminante representan la varianza que el predictivo comparte con la funcin. Otro auxiliar para interpretar los resultados del anlisis discriminante es el desarrollo de un perfil caracterstico para cada grupo, donde se describe a cada grupo en trminos de sus medias en las variables predictivas.
Evaluacin de la validez del Anlisis discriminante

Muchos programas de software, como el SPSS, ofrecen una
opcin de validacin cruzada con exclusin. Los pesos discriminantes, para cuyo clculo se utiliza la muestra de anlisis, se multiplican por los valores de las variables predictivas en la muestra de validacin, para generar calificaciones discriminantes para los casos de esta muestra. Los casos se asignan luego a los grupos con base en sus calificaciones discriminantes y una regla de decisin apropiada. Entonces, para determinar la proporcin de aciertos, o porcentaje de casos correctamente clasificados, se suman los elementos de la diagonal y el resultado se divide entre el nmero total de casos. Es til comparar el porcentaje de casos clasificados correctamente por el anlisis discriminante con el porcentaje que se obtendra por azar.
Resultados del Anlisis discriminante de tres grupos
Diagrama de dispersin de todos los grupos
Mapa territorial
Anlisis discriminante paso a paso

El anlisis discriminante paso a paso es similar a la
regresin mltiple paso a paso (vase el captulo 17) en la introduccin secuenciada de los predictivos, de acuerdo con su capacidad para discriminar entre los grupos. Para cada predictivo se calcula una razn F usando un anlisis univariado de la varianza, donde se trata a los grupos como la variable categrica y al predictivo como la variable de criterio. El predictivo con la razn F ms alta es el primero que se elige para ser incluido en la funcin discriminante, si cumple ciertos criterios de significancia y tolerancia. Se agrega un segundo predictivo con base en la razn F parcial o de mayor ajuste, tomando en cuenta el predictivo ya elegido.
Anlisis discriminante paso a paso

Se prueba la retencin de cada predictivo en funcin de su
asociacin con los otros predictivos seleccionados. Se contina el proceso de seleccin y retencin, hasta que en la funcin discriminante se incluyan todos los predictivos que cumplen los criterios de significancia, para la inclusin y retencin. La eleccin del procedimiento paso a paso se basa en los criterios de optimizacin adoptados. El procedimiento de Mahalanobis se basa en la maximizacin de una medida generalizada de la distancia entre los dos grupos ms cercanos. El orden en que se eligieron las variables tambin indica su importancia en la discriminacin entre los grupos.
El modelo Logit
La variable dependiente es binaria y hay
diversas variables independientes mtricas. El modelo logit binario por lo comn trata el problema de qu tan probable es que una observacin pertenezca a cada grupo. Calcula la probabilidad de que una observacin pertenezca a un grupo especfico.
Modelo logit binario

La probabilidad de xito puede modelarse
usando el modelo logit como:
o bien,
Formulacin del modelo

o bien,
donde P = probabilidad de xito Xi = variable independiente i ai = parmetro que debe calcularse
Propiedades del modelo logit

Xi puede variar - entre +, P est
restringido a quedar entre 0 y 1. Cuando Xi se aproxima a -, P se aproxima a 0 Cuando Xi se aproxima a +, P se aproxima a 1. Esto es deseable porque P es una probabilidad y debe caer entre 0 y 1.
Clculo del modelo logit binario

El procedimiento utilizado para calcular los parmetros del
modelo logit binario se conoce como mtodo de probabilidad mxima. Ajuste: R cuadrada de Cox y Snell y la R cuadrada de Nagelkerke. Ambas medidas son similares a la R2 de la regresin mltiple La R cuadrada de Cox y Snell se restringe de tal manera, que no puede ser igual a 1.0 incluso si el modelo se ajusta a los datos perfectamente. Esta limitacin es superada por la R cuadrada de Nagelkerke. Los valores pronosticados de Y luego se comparan luego con los valores reales correspondientes, para determinar el porcentaje de predicciones correctas.
Pruebas de significancia
La significancia de los coeficientes
calculados se basa en el estadstico de Wald:
donde:
ai = coeficiente logstico de la variable predictiva EEai = error estndar del coeficiente logstico
Interpretacin de los coeficientes

si Xi se incrementa en una unidad, el
logaritmo de probabilidades cambiar en ai unidades, siempre que se mantenga constante el efecto de otras variables independientes. El signo de ai determinar si la probabilidad se incrementa (si el signo es positivo) o se reduce (si el signo es negativo) en esa cantidad.
Explicacin de la lealtad a la marca
Resultados del modelo logit binario o regresin logstica
Resultados del modelo logit binario o regresin logstica
SPSS para Windows

El programa DISCRIMINANT realiza tanto el
anlisis discriminante mltiple como el de dos grupos. Para elegir este procedimiento mientras usa SPSS para Windows, haga clic en:
Analyze>Classify>Discriminant
Para correr un anlisis logit o regresin
logstica en el SPSS de Windows, haga clic en:

Analyze>Regresin>Binary Logistic
SPSS para Windows: Discriminante de dos grupos

Elija ANALIZE de la barra de men de SPSS. Haga clic en CLASSIFY y luego en DISCRIMINANT. Cambie visit al recuadro GROUPING VARIABLE. Haga clic en DEFINE RANGE. Introduzca un 1 en MINIMUM y 2 en MAXIMUM. Haga clic en CONTINUE. Cambie income, travel, vacation, fsize y age al recuadro INDEPENDENTS. Elija ENTER INDEPENDENTS TOGETHER (opcin predeterminada). Haga clic en STATISTICS. En el recuadro DESCRIPTIVES de la ventana emergente, elija MEANS y UNIVARIATE ANOVAS. En el recuadro MATRICES elija WITHIN-GROUP CORRELATIONS. Haga clic en CONTINUE. Haga clic en CLASSIFY en la ventana emergente en la opcin PRIOR PROBABILITIES, elija ALL GROUPS EQUAL (predeterminado). En el recuadro DISPLAY elija SUMMARY TABLE y LEAVE-ONE-OUT CLASSIFICATION. En el recuadro USE COVARIANCE MATRIX elija WITHIN-GROUPS. Haga clic en CONTINUE. Seleccione OK.
SPSS para Windows: Anlisis Logit

Elija ANALYZE de la barra de mens de SPSS. Haga clic en REGRESSION y enseguida en BINARY
LOGISTIC. Cambie Loyalty to the Brand [Lealtad] al recuadro DEPENDENT VARIABLE. Cambie Attitude toward the Brand [Marca] Attitude toward the Product category [Producto] y Attitude toward Shopping [Compras] al recuadro COVARIATES. Elija ENTER en la opcin METHOD (opcin predeterminada). Haga clic en OK.

Malhotra Mr05 PPT 18 SP

Загружено:

Сведения о документе

Исходное описание:

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Malhotra Mr05 PPT 18 SP

Загружено:

Авторское право:

Доступные форматы

INVESTIGACIN DE MERCADOS AVANZADA

ANLISIS DISCRIMINANTE Y LOGIT

Esquema del captulo

Formulacin Estimacin Determinacin de la Significancia Interpretacin Validacin

Esquema del captulo

Anlisis Discriminante Paso a Paso

Esquema del captulo

Una aplicacin ilustrativa

Semejanzas y diferencias entre ANOVA, anlisis de regresin y anlisis discriminante

Modelo de Anlisis Discriminante

lineales de la siguiente forma: D = b0 + b1X1 + b2X2 + b3X3 + . . . + bkXk donde:

Los coeficientes, o pesos (b), se calculan de manera que el

Estadsticos asociados con el Anlisis discriminante

Estadsticos asociados con el Anlisis discriminante

Estadsticos asociados con el Anlisis discriminante

Estadsticos asociados con el Anlisis discriminante

Realizacin de un Anlisis discriminante

Formulacin del problema

Informacin sobre visitas a centros vacacionales: muestra de anlisis

Informacin sobre visitas a centros vacacionales: muestra de anlisis

Informacin sobre visitas a centros vacacionales: muestra de validacin

Clculo de los coeficientes de la funcin discriminante

Resultados del Anlisis discriminante de dos grupos

Resultados del Anlisis discriminante de dos grupos

Resultados del Anlisis discriminante de dos grupos

Resultados del Anlisis discriminante de dos grupos

Determinar la significancia de la funcin discriminante

Interpretacin de los resultados

Evaluacin de la validez del Anlisis discriminante

Resultados del Anlisis discriminante de tres grupos

Resultados del Anlisis discriminante de tres grupos

Resultados del Anlisis discriminante de tres grupos

Resultados del Anlisis discriminante de tres grupos

Diagrama de dispersin de todos los grupos

Anlisis discriminante paso a paso

Anlisis discriminante paso a paso

Modelo logit binario

usando el modelo logit como:

Formulacin del modelo

donde P = probabilidad de xito Xi = variable independiente i ai = parmetro que debe calcularse

Propiedades del modelo logit

Clculo del modelo logit binario

calculados se basa en el estadstico de Wald:

Interpretacin de los coeficientes

Explicacin de la lealtad a la marca

Resultados del modelo logit binario o regresin logstica

Resultados del modelo logit binario o regresin logstica

SPSS para Windows

Para correr un anlisis logit o regresin

logstica en el SPSS de Windows, haga clic en:

SPSS para Windows: Discriminante de dos grupos

SPSS para Windows: Anlisis Logit

Вам также может понравиться