Вы находитесь на странице: 1из 12

ANÁLISIS DE CONGLOMERADOS

PRESENTADO POR:

DAIVELIS VILLAMIZAR

ANNY CALLE

LEODÉGAR ROYS

SANTIAGO GÓMEZ

UNIVERSIDAD SERGIO ARBOLEDA

ESCUELA INTERNACIONAL DE ADMINISTRACIÓN Y MARKETING

ÁREA: ANÁLISIS MULTIVARIADO

SANTA MARTA, MAGDALENA

2019
ANÁLISIS DE CONGLOMERADOS

Respecto al análisis de conglomerados, llamado también análisis de clasificación o

taxonomía numérica, se puede afirmar que es una técnica usada para clasificar objetos o casos

en grupos relativamente homogéneos llamados conglomerados. Los objetos de cada

conglomerado tienden a ser similares entre sí y diferentes de los objetos de otros

conglomerados.

Tanto el análisis de conglomerados como el análisis discriminante se interesan en la

clasificación. Sin embargo, el análisis discriminante requiere de un conocimiento previo del

conglomerado o la pertenencia al grupo de cada objeto o caso incluido, para desarrollar la

regla de clasificación.

En contraste, en el análisis de conglomerados no existe información a priori sobre la

pertenencia al grupo o conglomerado de ninguno de los objetos. Los grupos o conglomerados

son sugeridos por los datos, no se definen a priori.

El análisis de conglomerados se ha usado en marketing con diversos propósitos, entre los que

se encuentran:

Segmentación del mercado: por ejemplo, puede agruparse a los consumidores según los

beneficios que buscan en la compra de un producto. Cada conglomerado estaría formado por

consumidores que son relativamente homogéneos en términos de los beneficios que buscan.

Este procedimiento se conoce como segmentación por beneficios.

ESTADÍSTICOS ASOCIADOS CON EL ANÁLISIS DE CONGLOMERADO

Antes de revisar los estadísticos asociados con el análisis de conglomerados, debería

mencionarse que la mayoría de los procedimientos de conglomeración son relativamente


sencillos, que no se sustentan en un razonamiento estadístico amplio. Más bien, en su mayoría

son heurísticos que se basan en algoritmos. Por lo tanto, existe un notable contraste entre el

análisis de conglomerados y el análisis de varianza, la regresión, el análisis discriminante y

el análisis factorial, los cuales se fundamentan en un razonamiento estadístico amplio.

Aunque muchos de los procedimientos de conglomeración tienen propiedades estadísticas

importantes, debe reconocerse su sencillez fundamental.

Los siguientes estadísticos y conceptos se asocian con el análisis de conglomerados:

 Calendario de aglomeración: Este programa brinda información sobre objetos o

casos que se combinan en cada etapa del proceso de conglomeración jerárquica.

 Centroide del conglomerado: Es la media de los valores de las variables de todos

los objetos o casos de un conglomerado particular.

 Centros del conglomerado: Son el punto de partida en la conglomeración no

jerárquica. Los conglomerados se construyen en torno a estos centros o semillas.

 Pertenencia al conglomerado: Indica el conglomerado al que corresponde cada

objeto o caso.

 Dendrograma: Conocido como gráfica de árbol, es un medio gráfico para presentar

los resultados de la conglomeración. Donde, las líneas verticales representan

conglomerados que están unidos. Asimismo, La posición de la línea en la escala

indica las distancias en las que se unen los conglomerados. Por lo tanto, el

dendrograma se lee de izquierda a derecha.

 Distancias entre los centros de los conglomerados: Estas distancias indican qué tan

separados están los pares individuales de conglomerados. Por consiguiente, los que

están muy separados son distintos y, por lo tanto, son deseables.


 Diagrama de carámbanos: Es una representación gráfica de los resultados de la

conglomeración, recibe ese nombre porque parece una fila de carámbanos que

cuelgan del tejado de una casa. En donde las columnas corresponden a los objetos

que se conglomeran; y las filas, al número de conglomerados. Es importante decir

que un diagrama de carámbanos se lee de abajo hacia arriba.

 Matriz de coeficientes de semejanza y distancia: Es una matriz de triángulo inferior

que contiene distancias entre pares de objetos o casos.

REALIZACIÓN DE UN ANÁLISIS DE CONGLOMERADOS

PLANTEAMIENTO DEL PROBLEMA

Quizá la parte más importante del planteamiento del problema de conglomeración sea la

elección de las variables en se basará el agrupamiento. Aun cuando la inclusión de una o dos

variables irrelevantes distorsionaría una solución de agrupamiento, que de otra manera podría

ser útil. En esencia, el conjunto de las variables elegidas debe describir la semejanza entre

los objetos en términos relevantes para el problema de investigación de mercados. Las

variables tienen que elegirse con base en la investigación previa, la teoría o la consideración
de la hipótesis evaluada. En la investigación exploratoria, el investigador debe valerse de su

juicio e intuición.

Para ilustrar, consideramos el agrupamiento de los consumidores con base en sus actitudes

hacia ir de compras. A partir de la investigación previa, se identificaron seis variables de

actitud. Se pidió a los consumidores que expresaran su grado de acuerdo con los siguientes

enunciados en una escala de 7 puntos (1 = desacuerdo, 7 = de acuerdo):

V1: ir de compras es divertido

V2: ir de compras es malo para su presupuesto

V3: cuando voy de compras aprovecho para comer fuera

V4: cuando voy de compras busco las mejores ofertas

V5: no me interesa ir de compras

V6: puede ahorrar mucho dinero si compara precios

ELECCIÓN DE UNA MEDIDA DE DISTANCIA O SEMEJANZA

Dado que el objetivo de la conglomeración es agrupar objetos similares, se necesita alguna

medida para evaluar qué tan semejantes o diferentes son dichos objetos. En consecuencia, el

enfoque más común consiste en medir la semejanza en términos de la distancia entre pares

de objetos. En donde, los objetos separados por una distancia menor son más similares entre

sí, que aquellos que tienen distancias mayores. Hay diversas formas de calcular la distancia

entre dos objetos, sin embargo, la medida de semejanza de uso más común es la distancia

euclidiana o su cuadrado: raíz cuadrada de la suma de diferencias elevadas al cuadrado en

los valores de cada variable.


Es importante decir, que si las variables se miden en unidades muy diferentes, la solución de

la conglomeración estará influida por las unidades de medición.

SELECCIÓN DE UN PROCEDIMIENTO DE CONGLOMERACIÓN

Estos pueden ser jerárquicos, no jerárquicos u otros. Los procedimientos jerárquicos pueden

ser por aglomeración o por división. Por un lado, la conglomeración por aglomeración

comienza con cada objeto en un conglomerado separado. Los conglomerados se forman al

agrupar objetos en conglomerados cada vez más grandes; este procedimiento continúa hasta

que todos los objetos son miembros de un solo conglomerado. Por su parte, la

conglomeración por división comienza con todos los objetos agrupados en un solo

conglomerado. Los conglomerados se dividen hasta que cada objeto queda en un

conglomerado separado. Las técnicas por aglomeración son comunes en la investigación de

mercados; incluyen los procedimientos de enlace, los procedimientos de varianza o sumas de

errores elevadas al cuadrado, y los procedimientos centroides.

A partir de lo anterior, los procedimientos de enlace incluyen enlace único, enlace completo

y enlace promedio. Por un lado, la técnica de enlace único se basa en la distancia mínima o

la regla del vecino más cercano. Los primeros dos objetos agrupados son los que tienen la

menor distancia entre sí. Se identifica la siguiente distancia más corta y el tercer objeto se

agrupa con los dos primeros, o se crea un nuevo conglomerado de dos objetos. En cada etapa,

la distancia entre dos conglomerados es la distancia entre sus dos puntos más cercanos.
En cualquier etapa se fusionan dos conglomerados a través del enlace único más cercano

entre ellos. Este proceso continúa hasta que todos los objetos estén en un solo conglomerado.

El procedimiento de enlace único no funciona bien cuando los conglomerados están mal

definidos. El procedimiento de enlace completo es similar al enlace único, a excepción de

que se basa en la distancia máxima o en la regla del vecino más lejano. En el enlace completo,

la distancia entre dos conglomerados se calcula como la distancia entre sus dos puntos más

lejanos.

El procedimiento de enlace promedio funciona de manera similar. Sin embargo, en éste la

distancia entre dos conglomerados se define como

el promedio de las distancias entre todos los pares

de objetos, donde un miembro del par pertenece a

cada uno de los conglomerados


Los procedimientos de varianza

intentan formar conglomerados

para minimizar la varianza interna.

Un procedimiento de varianza

usado con frecuencia es la técnica

de Ward, que calcula las medias de

todas las variables de cada

conglomerado. Luego, calcula para

cada objeto el cuadrado de la distancia euclidiana de las medias del conglomerado (véase la

fi gura 20.6). Se suman estas distancias para todos los objetos. En cada etapa, se combinan

los dos conglomerados con el menor incremento en la suma de cuadrados global de las

distancias dentro del conglomerado. En los procedimientos de centroides, la distancia entre

dos conglomerados es la distancia entre sus centroides (las medias de todas las variables)

Cada vez que se agrupan los objetos, se calcula un nuevo centroide. De los procedimientos

jerárquicos, los de enlace promedio y la técnica de Ward han demostrado un mejor

desempeño que los demás procedimientos. El segundo tipo de procedimientos de

conglomeración, los de conglomeración no jerárquica, se conocen también como

conglomeración de k-medias e incluyen el umbral secuencial, el umbral paralelo y la división

óptima. En el procedimiento de umbral secuencial, se elige un centro del conglomerado y se

agrupan todos los objetos que están dentro de un valor de umbral especificado de antemano.

Luego se elige un nuevo centro de conglomerado o semilla, y se repite el proceso con los

puntos que no están en el conglomerado. Una vez que un objeto se agrupa con una semilla,

ya no se considera para agruparlo con semillas subsiguientes.


procedimiento de división óptima difiere de los dos procedimientos de umbral en que los

objetos pueden reasignarse después a conglomerados para optimizar el criterio general, como

la distancia promedio dentro de un conglomerado para un número de conglomerados

específico. Dos grandes desventajas de los procedimientos no jerárquicos son la necesidad

de especificar de antemano el número de conglomerados y la arbitrariedad en la selección de

los centros de los conglomerados. Además, los resultados de la conglomeración pueden

depender de la forma en que se eligen los centros.

DECISIÓN SOBRE EL NÚMERO DE CONGLOMERADOS

Un tema importante en el análisis de conglomerados es decidir su número. Aunque no hay

reglas exactas ni rápidas, existen algunos lineamientos:

1. Las consideraciones teóricas, conceptuales o prácticas pueden sugerir un cierto

número de conglomerados. Por ejemplo, si el propósito del agrupamiento es

identificar los segmentos del mercado, tal vez la gerencia desee un número de

conglomerados específico.

2. En los procedimientos de conglomeración jerárquica, pueden usarse como criterios

las distancias en las que se combinan los conglomerados. Esta información puede

obtenerse del calendario de aglomeración o del dendrograma.

3. En los procedimientos de conglomeración no jerárquica, la proporción entre la

varianza total intragrupo y la varianza entre grupos puede graficarse contra el número

de conglomerados. El punto donde se presenta un ángulo o una curva aguda indica

un número adecuado de conglomerados. Por lo regular no vale la pena incrementar

el número de conglomerados más allá de dicho punto.


4. Los tamaños relativos de los conglomerados deberían ser significativos, al hacer un

simple conteo de las frecuencias de pertenencia al conglomerado, vemos que la

solución de tres conglomerados da como resultado conglomerados con ocho, seis y

seis elementos. No obstante, si vamos a la solución de cuatro conglomerados, los

tamaños de los conglomerados son ocho, seis, cinco y uno. No tiene sentido formar

un conglomerado con un solo caso, así

INTERPRETACIÓN Y DESCRIPCIÓN DE LOS CONGLOMERADOS

Interpretar y describir los conglomerados implica examinar sus centroides, los cuales

representan los valores promedio de los objetos contenidos en el conglomerado en cada una

de las variables. Los centroides nos permiten describir cada conglomerado al asignarle un

nombre o etiqueta. Si el calendario de conglomeración no imprime esta información, puede

obtenerse mediante el análisis discriminante.

EVALUACIÓN DE LA CONFIABILIDAD Y LA VALIDEZ

Dados los diversos juicios que conlleva el análisis de conglomerados, no debería aceptarse

una solución de agrupamiento sin una evaluación acerca de su confiabilidad y validez. Los

procedimientos formales para evaluar la confiabilidad y validez de las soluciones de

agrupamiento son complejos y no del todo justificables. Por lo que las omitimos aquí. Sin

embargo, los siguientes procedimientos ofrecen una verificación adecuada de la calidad de

los resultados de la conglomeración.

1. Realice el análisis de conglomerados con los mismos datos, pero con diferentes

medidas de distancia. Compare los resultados entre las medidas para determinar la

estabilidad de las soluciones.


2. Utilice diferentes procedimientos de conglomeración y compare los resultados.

3. Divida al azar los datos en mitades. En cada mitad realice la conglomeración de

manera separada. Compare los centroides de los conglomerados de las dos

submuestras.

4. Suprima variables al azar. Realice la conglomeración en el conjunto reducido de

variables. Compare los resultados con los obtenidos al formar los conglomerados a

partir del conjunto de variables completo.

5. En la conglomeración no jerárquica, tal vez la solución dependa del orden de los casos

en el conjunto de datos. Haga varias corridas con los casos ordenados de diferente

manera, hasta que la solución se estabilice. La conglomeración no jerárquica se ilustra

con más detalle en un estudio sobre las diferencias en las estrategias de marketing

entre empresas estadounidenses, japonesas y británicas.


BIBLIOGRAFÍA

Malhotra, N. (2008). INVESTIGACIÓN DE MERCADOS. México: PEARSON


EDUCACIÓN.

Вам также может понравиться