Академический Документы
Профессиональный Документы
Культура Документы
Esquema Concepto bsico Relacin con la Regresin y ANOVA Modelo de Anlisis Discriminante Estadsticos asociadas con el Anlisis Discriminante Realizacin de un Anlisis Discriminante
Validacin
Resumen
Anlisis Discriminante
El anlisis discriminante es una tcnica para analizar los
datos, cuando la variable dependiente o de criterio es categrica, y las variables predictivas o independientes son de naturaleza intervalar. Los objetivos del anlisis discriminante son los siguientes:
Desarrollar las funciones discriminantes, o combinaciones
lineales de las variables predictivas o independientes, que hagan una mejor diferenciacin entre las categoras de las variables dependientes o de criterio (grupos). Examinar si hay diferencias significativas entre los grupos, en trminos de las variables predictivas. Determinar qu variables predictivas contribuyen ms a las diferencias entre grupos. Clasificar los casos en uno de los grupos, con base en los valores de las variables predictivas. Evaluar la precisin de la clasificacin.
Anlisis Discriminante
Cuando sta tiene dos categoras, la tcnica se conoce
como anlisis discriminante de dos grupos. Cuando hay tres o ms categoras, la tcnica se conoce como anlisis discriminante mltiple. La diferencia principal es que, en el caso de dos grupos, slo puede derivarse una funcin discriminante; mientras que en el anlisis discriminante mltiple, puede calcularse ms de una funcin. En general, con G grupos y k predictores, es posible estimar el menor entre G-1 o k, funciones discriminantes. La primera funcin tiene el ratio ms algo de suma de cuadrados intergrupos y intragrupos. La segunda funcin, no correlacionada con la primera, tiene el segundo ratio ms alto y as sucesivamente. Sin embargo, no todas las funciones puede ser estadsticamente significativas.
Interpretacin geomtrica
grupo difiera tanto como sea posible en los valores de la funcin discriminante Esto ocurre cuando est al mximo la razn de la suma de cuadrados entre grupos y la suma de cuadrados intragrupos de las puntuaciones discriminantes.
grado de asociacin entre las calificaciones discriminantes y los grupos. Es una medida de asociacin entre la nica funcin discriminante y el conjunto de variables ficticias que definen la pertenencia al grupo. Centroide: el centroide es la media de las calificaciones discriminantes de un grupo particular. Existen tantos centroides como grupos, porque hay uno para cada grupo. Los centroides del grupo son las medias de ese grupo en todas las funciones. Matriz de clasificacin: llamada a veces tambin matriz de confusin o de prediccin, contiene el nmero de casos cuya clasificacin fue correcta e incorrecta.
(no estandarizados) de la funcin discriminante son los multiplicadores de las variables, cuando stas se encuentran en las unidades de medicin originales. Calificaciones de discriminacin: los coeficientes no estandarizados se multiplican por los valores de las variables. Los productos se suman y se agregan al trmino constante para obtener las calificaciones de discriminacin. Valor propio: para cada funcin discriminante, el valor propio es la razn de la suma de cuadrados entre grupos e intragrupos. Los valores propios grandes suponen funciones superiores.
ANOVA de una va, donde la variable de agrupamiento funge como variable independiente categrica. A la vez, en el ANOVA cada predictivo funge como variable dependiente mtrica. Medias y desviaciones estndar de los grupos: se calculan para cada predictivo en cada grupo. Matriz de correlaciones agrupadas intragrupales: para calcular la matriz de correlaciones agrupadas intragrupales se promedian las matrices de covarianza separadas de todos los grupos.
Coeficientes estandarizados de la funcin discriminante: los coeficientes estandarizados de la funcin discriminante son los que suelen usarse como multiplicadores cuando las variables se han estandarizado con una media de 0 y una varianza de 1. Estructura de correlaciones: conocida tambin como cargas discriminantes, la estructura de correlaciones representa las correlaciones simples entre los predictivos y la funcin discriminante. Matriz de correlacin total: si se trata a los casos como si pertenecieran a una sola muestra y se calculan las correlaciones, se obtiene una matriz de correlacin total. de Wilks: conocida tambin como estadstico U. La de Wilks de cada predictivo es la razn entre la suma de los cuadrados intragrupo y la suma total de los cuadrados. Su valor flucta entre 0 y 1. Los valores grandes de (cerca de 1) indican que parece no haber diferencia entre las medias del grupo. Los valores pequeos de (cerca de 0) indican que parece haber diferencia entre las medias del grupo.
independientes Las variables de criterio deben consistir en dos o ms categoras que sean excluyentes entre s y exhaustivas en su conjunto. La eleccin de las variables predictivas tiene que basarse en un modelo terico o en investigaciones previas; sin embargo, en el caso de la investigacin exploratoria, la seleccin debe estar guiada por la experiencia del investigador. Una parte de la muestra, llamada muestra de anlisis o de estimacin, se utiliza para calcular la funcin discriminante. La otra parte, llamada muestra de validacin o de exclusin, se reserva para la validacin de la funcin discriminante. A menudo la distribucin del nmero de casos en las muestras de anlisis y validacin sigue la distribucin de la muestra total.
discriminante, de manera que todos los predictivos se incluyan al mismo tiempo. En el anlisis discriminante paso a paso, las variables predictivas se introducen en secuencia, con base en su habilidad para discriminar entre grupos.
de que, en la poblacin, las medias de todas las funciones discriminantes en todos los grupos son iguales. En el SPSS esta prueba se basa en la de Wilks. Si se prueban al mismo tiempo varias funciones (como en el caso del anlisis discriminante mltiple), el estadstico de Wilks es el producto de la univariada para cada funcin. El clculo del nivel de significancia se basa en la transformacin del estadstico en una chi cuadrada. Si se rechaza la hiptesis nula, lo que indica una discriminacin significativa, puede procederse a la interpretacin de los resultados
La interpretacin de los pesos, o coeficientes discriminantes es similar a la del anlisis de regresin mltiple. Dada la multicolinealidad de las variables predictivas, no hay medidas inequvocas de la importancia relativa de los predictivos para discriminar entre los grupos. Con esta advertencia en mente, el examen de la magnitud absoluta de los coeficientes estandarizados de la funcin discriminante brinda una idea de la importancia relativa de las variables. Tambin puede obtenerse una nocin de la importancia relativa de los predictivos mediante el examen de la estructura de correlaciones, conocidas tambin como cargas cannicas o cargas discriminantes. Esas correlaciones simples entre cada predictivo y la funcin discriminante representan la varianza que el predictivo comparte con la funcin. Otro auxiliar para interpretar los resultados del anlisis discriminante es el desarrollo de un perfil caracterstico para cada grupo, donde se describe a cada grupo en trminos de sus medias en las variables predictivas.
opcin de validacin cruzada con exclusin. Los pesos discriminantes, para cuyo clculo se utiliza la muestra de anlisis, se multiplican por los valores de las variables predictivas en la muestra de validacin, para generar calificaciones discriminantes para los casos de esta muestra. Los casos se asignan luego a los grupos con base en sus calificaciones discriminantes y una regla de decisin apropiada. Entonces, para determinar la proporcin de aciertos, o porcentaje de casos correctamente clasificados, se suman los elementos de la diagonal y el resultado se divide entre el nmero total de casos. Es til comparar el porcentaje de casos clasificados correctamente por el anlisis discriminante con el porcentaje que se obtendra por azar.
Mapa territorial
regresin mltiple paso a paso (vase el captulo 17) en la introduccin secuenciada de los predictivos, de acuerdo con su capacidad para discriminar entre los grupos. Para cada predictivo se calcula una razn F usando un anlisis univariado de la varianza, donde se trata a los grupos como la variable categrica y al predictivo como la variable de criterio. El predictivo con la razn F ms alta es el primero que se elige para ser incluido en la funcin discriminante, si cumple ciertos criterios de significancia y tolerancia. Se agrega un segundo predictivo con base en la razn F parcial o de mayor ajuste, tomando en cuenta el predictivo ya elegido.
asociacin con los otros predictivos seleccionados. Se contina el proceso de seleccin y retencin, hasta que en la funcin discriminante se incluyan todos los predictivos que cumplen los criterios de significancia, para la inclusin y retencin. La eleccin del procedimiento paso a paso se basa en los criterios de optimizacin adoptados. El procedimiento de Mahalanobis se basa en la maximizacin de una medida generalizada de la distancia entre los dos grupos ms cercanos. El orden en que se eligieron las variables tambin indica su importancia en la discriminacin entre los grupos.
El modelo Logit
La variable dependiente es binaria y hay
diversas variables independientes mtricas. El modelo logit binario por lo comn trata el problema de qu tan probable es que una observacin pertenezca a cada grupo. Calcula la probabilidad de que una observacin pertenezca a un grupo especfico.
o bien,
restringido a quedar entre 0 y 1. Cuando Xi se aproxima a -, P se aproxima a 0 Cuando Xi se aproxima a +, P se aproxima a 1. Esto es deseable porque P es una probabilidad y debe caer entre 0 y 1.
modelo logit binario se conoce como mtodo de probabilidad mxima. Ajuste: R cuadrada de Cox y Snell y la R cuadrada de Nagelkerke. Ambas medidas son similares a la R2 de la regresin mltiple La R cuadrada de Cox y Snell se restringe de tal manera, que no puede ser igual a 1.0 incluso si el modelo se ajusta a los datos perfectamente. Esta limitacin es superada por la R cuadrada de Nagelkerke. Los valores pronosticados de Y luego se comparan luego con los valores reales correspondientes, para determinar el porcentaje de predicciones correctas.
Pruebas de significancia
La significancia de los coeficientes
donde:
ai = coeficiente logstico de la variable predictiva EEai = error estndar del coeficiente logstico
logaritmo de probabilidades cambiar en ai unidades, siempre que se mantenga constante el efecto de otras variables independientes. El signo de ai determinar si la probabilidad se incrementa (si el signo es positivo) o se reduce (si el signo es negativo) en esa cantidad.
anlisis discriminante mltiple como el de dos grupos. Para elegir este procedimiento mientras usa SPSS para Windows, haga clic en:
Analyze>Classify>Discriminant
Elija ANALIZE de la barra de men de SPSS. Haga clic en CLASSIFY y luego en DISCRIMINANT. Cambie visit al recuadro GROUPING VARIABLE. Haga clic en DEFINE RANGE. Introduzca un 1 en MINIMUM y 2 en MAXIMUM. Haga clic en CONTINUE. Cambie income, travel, vacation, fsize y age al recuadro INDEPENDENTS. Elija ENTER INDEPENDENTS TOGETHER (opcin predeterminada). Haga clic en STATISTICS. En el recuadro DESCRIPTIVES de la ventana emergente, elija MEANS y UNIVARIATE ANOVAS. En el recuadro MATRICES elija WITHIN-GROUP CORRELATIONS. Haga clic en CONTINUE. Haga clic en CLASSIFY en la ventana emergente en la opcin PRIOR PROBABILITIES, elija ALL GROUPS EQUAL (predeterminado). En el recuadro DISPLAY elija SUMMARY TABLE y LEAVE-ONE-OUT CLASSIFICATION. En el recuadro USE COVARIANCE MATRIX elija WITHIN-GROUPS. Haga clic en CONTINUE. Seleccione OK.
LOGISTIC. Cambie Loyalty to the Brand [Lealtad] al recuadro DEPENDENT VARIABLE. Cambie Attitude toward the Brand [Marca] Attitude toward the Product category [Producto] y Attitude toward Shopping [Compras] al recuadro COVARIATES. Elija ENTER en la opcin METHOD (opcin predeterminada). Haga clic en OK.