Академический Документы
Профессиональный Документы
Культура Документы
MBA
Universidad ICESI, Febrero 5 de 2016
Carlos Ignacio Patio F.
Control de Lectura
Defina, en sus propias palabras,
el trmino segmentacin
Qu es una medida de
similitud?
Segmentacin Estratgica
Empleada de manera usual para segmentar clientes,
Segmentacin Natural
Surge a partir del anlisis de mltiples dimensiones de
manera simultnea
Separacin natural entre grupos de unidades de anlisis
Clustering: Permite agrupar clientes (o cualquier otra unidad
Variables
Similaridad
Mtodo
Nmero de
k
Perfilar y
evaluar
Refinar?
productos?) encuestas
Variables
Psicogrficas
Demogrficas
Geogrficas
Comportamiento (transaccionales)
Competitivas (SoW)
Valor (Lifetime Value, etc)
Medidas de Similaridad
Similaridad
Hamming
Atributo 2
Euclideana
B:
(2,3)
C:
(5,3)
Manhattan
Similaridad Coseno
A:
(1,1)
Atributo 1
Distancia Euclideana
Si los valores son reales, se
=|| x i - x j ||
Ak
( v ik v jk )2
Ejemplo
Ejemplo 1 (MPG dataset, 3 real-valued input attributes)
Car 1: weight = 2500, displacement = 250, horsepower = 100
Car 2: weight = 3000, displacement = 150, horsepower = 150
Car 3: weight = 3050, displacement = 250, horsepower = 100
Distancia Hamming
Si los valores son discretos, se emplea la
Distancia Hamming:
D(xi, xj) = # de atributos para los cuales x i y xj
son diferentes
Distancia Manhattan
City Block: esta medida mide la
Mtodos
Jerrquico
No
Jerrquico
observaciones)
Produce una solucin con n-1 segmentos, al combinar
Ejemplo
14 registros
2 atributos reales
Distancia: Euclidean
Ejemplo
(1 fusin)
Ejemplo
(2 fusiones)
Ejemplo
(6 fusiones)
Ejemplo
(7 fusiones)
Ejemplo
(8 fusiones)
Ejemplo
(9 fusiones)
Ejemplo
(9 fusiones)
Ejemplo
(10 fusiones)
Ejemplo
(11 fusiones)
Ejemplo
(12 fusiones)
Ejemplo
Fin!
Mtodo K-Medias
Especificar nmero k de segmentos (usuario)
Seleccin aleatoria de k centros (unidades analticas)
El resto de las observaciones se asignan al centro ms cercano
Clculo de nuevos centros (promedios para cada variable en cada cluster)
Reasignar instancias de acuerdo a la distancia frente a los nuevos centros
ITERAR y PARAR cuando no ocurran reasignaciones
K-means
1. Seleccione k
K-means
1. Seleccione k
2. Seleccione centros
de manera aleatoria
K-means
1. Seleccione k
2. Seleccione centros
de manera aleatoria
3. Cada instancia
busca su centro
ms cercano
K-means
1. Seleccione k
2. Seleccione centros
de manera aleatoria
3. Cada instancia
busca su centro
ms cercano
4. Cada centro es
recalculado
teniendo en las
instancias en el
segmento
K-means
1. Seleccione k
2. Seleccione centros
de manera aleatoria
3. Cada instancia
busca su centro
ms cercano
4. Cada centro es
recalculado
teniendo
las
Repetir
3 y 4en
hasta
instancias
en el
que
haya
segmento
convergencia
Nmero de Segmentos, k
La parte ms difcil
Subjetividad es importante
Tradeof entre significado gerencial y costo de
implementacin
Alternativas formales
Interpretacin de Resultados
Perfilamiento
Fue correcto el nmero de clusters?
Es necesario incluir variables adicionales?
Es necesario probar un mtodo diferente?
Ejemplo: