Академический Документы
Профессиональный Документы
Культура Документы
LEARNING
Transformando procesos de negocio automticos en
procesos inteligentes
TUTOR:
Mg. Nstor H. Mazza
DARWIN EN LA ERA DE MACHINE
LEARNING
Transformando procesos de negocio automticos en
procesos inteligentes
Autor
Field Project
Justamente, en una era industrial, esta es la forma en la que las empresas han sabido generar
Eficiencia Rigidez
estrategia de la compaa es lo que genera la ventaja competitiva. Esto puede sonar similar
al concepto concebido por IBM Research en la dcada de los 901 aunque tomado desde la
1Harvard Business School Press (1999), Adaptive Enterprise: Creating and Leading Sense-and-Respond
Organizations
iv
En esta nueva era, la estrategia no es algo que se tiene guardado en un cajn y que
se la revisa cada 5 aos sino que es una actividad que debe ejercitarse todos los das
potenciada por tecnologas como el cloud, mobile, social data, Internet of Things (IoT) y
contexto correcto para generar procesos sistemticos ad-hoc en una forma efectiva y semi-
ventaja de las capacidades de Machine Learning, Big Data y el Cloud para potenciar sus
capacidades de upselling2 y cross-selling3 que se vieron limitadas por la automatizacin de
permitirn a la empresa no solo recuperar lo que perdi, sino que tambin predecir lo que
2 Upselling: Segn Harding, Ford (2002). Cross-Selling Success, en marketing, se trata de una estrategia de
ventas donde el vendedor induce al comprador a adquirir productos ms caros, ms grandes o agregarle
complementos al mismo con el objetivo de realizar una venta con mayor ganancia.
3 Cross-selling: Segn Harding, Ford (2002). Cross-Selling Success, en marketing, se trata de una estrategia
de ventas donde se induce al cliente a comprar productos o servicios adicionales a los que iba a comprar
con el objetivo de realizar una venta mayor o para proteger la relacin con el cliente al ofrecer un mayor
valor final al combinar los productos/servicios.
v
Tabla de contenidos
INTRODUCCIN .................................................................................................1
Aspectos ..................................................................................................................3
Iniciativa ..................................................................................................................7
Clasificacin de los clientes ............................................................................8
Prediccin del carrito de compras ...................................................................9
Recomendaciones ...........................................................................................9
Anlisis de clientes en riesgo ........................................................................11
vi
Riesgos de implementacin ...................................................................................18
Drivers de la solucin...........................................................................................22
Diseo ....................................................................................................................31
Implementacin ....................................................................................................34
Preparacin de los data sets a utilizar en los modelos analticos ..................35
Preparacin del sitio web para retroalimentar los modelos analticos ..........37
Clasificacin de los clientes ..........................................................................38
Diseo del modelo ...............................................................................38
Training data set ...................................................................................39
Comportamiento ..................................................................................39
Prediccin del carrito de compras .................................................................40
Diseo del modelo: ..............................................................................40
Training data set:..................................................................................40
Comportamiento: .................................................................................40
Productos que se compran en conjunto (Frecuently both together) ..............41
Diseo del modelo: ..............................................................................42
Trainning data set:................................................................................42
Comportamiento: .................................................................................42
Recomendaciones especficas para un producto ...........................................43
Diseo del modelo: ..............................................................................43
Trainnning data set:..............................................................................43
Comportamiento: .................................................................................43
Recomendaciones especficas para el carrito de compras ............................44
vii
Diseo del modelo: ..............................................................................44
Trainning data set:................................................................................45
Comportamiento: .................................................................................45
Anlisis de clientes en riego .........................................................................45
Diseo del modelo: ..............................................................................45
Trainning data set:................................................................................46
Comportamiento: .................................................................................46
Integracin con Microsoft Dynamics AX .....................................................47
Adaptacin y rediseo del sitio web de compras en lnea ............................48
CONCLUSIONES................................................................................................54
BIBLIOGRAFA .......................................................................................................55
APENDICE 1 ........................................................................................................57
APENDICE 2 ........................................................................................................60
viii
Pgina intencionalmente en blanco
ix
INTRODUCCIN
entre otros.
sus servicios - siendo estos considerados de alta calidad, aunque a precio conveniente para
Nuestra empresa ofrece un catlogo de 4500 productos disponibles con todo lo que
necesitan sus clientes para poder mantener su negocio, desde productos congelados,
simples, de bajo precio, con bajo margen al mismo tipo de clientes a los que nuestra
empresa vende.
bajos o bajo margen. Es por esto que la empresa ha desarrollado e implementado tecnologa
Dado que los clientes de este rubro tienen un patrn de recambio relativamente alto
y sumado a que el costo por parte del cliente de cambiar de un proveedor a otro es
VENTAS
en lnea respectivamente. Las rdenes se reciben durante todo el da hasta las 21:00 hs y
TRANSPORTE
La empresa posee su propia red de distribucin y transporte que llega hasta todos
2
DISTRIBUCIN DE PRODUCTOS EN LOS DEPSITOS
necesarios para completar los pedidos estn disponibles. La empresa posee una amplia
productos deben estar disponibles en el depsito correcto para poder confeccionar los
CARGA DE PEDIDOS
Los vehculos de distribucin son cargados con los pedidos correspondientes a ser
la ruta asignada para cada unidad. Los mismos son cargados a partir de las 5:00 am. de
cada da.
ENTREGA DE PEDIDOS
Los vehculos de distribucin entregan los pedidos que fueron ingresados al sistema
pedidos podra parecer un poco anticuada o ineficiente desde algn punto de vista. Sin
embargo, para nuestra empresa existen grandes beneficios y una gran familiarizacin con
3
el cliente al hacerlo de esta forma. Nuestra empresa ha sabido tomar ventaja del intangible
realidades y deseos. Prestar atencin a las pequeas cosas, que al final del proceso no
que se ajustaban a las necesidades de los clientes u obtener informacin relevante sobre el
servicio o los productos que al fin y al cabo beneficiara a ambos el cliente y la empresa.
Los agentes de ventas han sido entrenados especficamente para guiar la compra de
ventas. El sistema de asignacin de agentes de ventas cuando un cliente llama, por ejemplo,
est configurado de tal forma para que siempre sean atendidos por el mismo grupo de
cliente ms estrecho.
ofrece servicios en lnea para que sus clientes puedan gestionar sus cuentas y generar los
directamente desde el sitio web. Est poltica de innovacin ha tenido tal aceptacin que
Sin embargo, esto gener una pregunta fundamental para el modelo de negocio de
la compaa: Cmo mantener los beneficios del toque personal que generaba el servicio
herramientas tecnolgicas?
4
En definitiva, el problema que se comenz a evidenciar es que la capacidad de
ms grandes o agregarle complementos al mismo con el objetivo de realizar una venta con
mayor ganancia. En lo que respecta a cross-selling, tambin lo define como una estrategia
de ventas pero donde se induce al cliente a comprar productos o servicios adicionales a los
que iba a comprar con el objetivo de realizar una venta mayor o para proteger la relacin
experiencia, impulsar zonas no tan populares del catlogo y aumentar las ventas.
Con esto, las capacidades de la empresa para conocer a sus clientes y ofrecer
de pedidos del 60% en este canal, la empresa estara perdiendo una de las ventajas
competitivas que ha sabido cultivar durante tiempo y que le ha dado ventaja sobre sus
competidores.
5
CROSS-SELLING Y UPSELLING
recomendaciones son exhibidas para todos los clientes de todos los segmentos. Algunas
en cuenta que, por ejemplo, un cliente que compro 100 bolsas de harina probablemente no
compra ms harina en lo que resta del mes (porque no la necesitar) a pesar de ser el
elemento ms comprado.
CLASIFICACIN DE CLIENTE
para la compaa, por lo cual todas las promociones y ofertas son igualmente accesibles
para cualquiera de los clientes. Los clientes son clasificados actualmente segn el tipo de
quienes luego le ofrecen a los clientes promociones de forma directa o instruyen al sistema
de CRM para que ofrezca promociones especificas la prxima vez que el cliente inicie
sesin en alguno de los canales (Contact Center o a travs del sitio web). Esta estrategia no
solo es lenta sino que adems riesgosa. Si el personal de ventas no analiz el reporte
6
todos los clientes por igual tienen la contra parte de que son ofrecidas utilizando la premisa
one-size-fit-all.
La empresa monitorea las ventas las 2 primeras semanas de cada mes con el fin de
materializado, los agentes de ventas realizan llamadas a los mismos para ofrecerles alguna
Iniciativa
transacciones que sus clientes han realizado y realizan todos los das, pero la misma nunca
Esta informacin podra ser analizada con tcnicas de Data Mining para mejorar el
7
F IGURA 1: M EJORA DE LA SATISFAC CIN DE CLIENTES Y AUMENTO DE LAS VENTAS A TRAVS DE
LAS INICIATIVAS PROP UESTAS
minera de datos. Esta clasificacin ayudar al sitio web y a los operadores del Contact
Center en algunos procesos de decisiones como por ejemplo, que promocin ofrecer al
8
PREDICCIN DEL CARRITO DE COMPRAS
del mismo segmento, en el momento en que el usuario inicia sesin en sitio web, el sistema
que comprar cada uno de los das. Claramente, esto tambin mejorar la eficiencia del
que se persigue es que el cliente pase tanto tiempo como pueda en el sitio, recorrindolo,
objetivo es completamente diferente: que las rdenes sean completadas con el menor
esfuerzo posible. No queremos que el cliente tenga que esforzarse para encontrar los
pedido. El principal reto para lograr esto es claramente la gran variedad de clientes,
tamao de clientes y lgica que usan para comprar. Por ejemplo, un determinado restaurant
podra comprar vegetales todos los das, harinas 2 veces a la semana y aceite una vez al
mes. Para que est funcionalidad sea exitosa, la prediccin debe ser relevante en cada da,
cada semana.
RECOMENDACIONES
asegurarse de que el cliente no est olvidando comprar algo que la mayora de las personas
secciones del catlogo de productos que no son tan populares y que el cliente quizs no es
consciente de que existen. No solo mejora la capacidad de upselling sino que adems le
permite al canal web proveer una experiencia de compra guiada, concepto que la compaa
este caso puede ser que estn tratando de reemplazar el producto que el cliente est viendo.
Por ejemplo, es posible que el cliente este buscando comprar harina y el sistema le
recomiende comprar otra marca. En otros casos, es posible que lo est complementando.
Por ejemplo, si el cliente compra aceite, el sistema puede inferir que sera interesante tener
algo que frer con ese aceite, y recomendar papas fritas congeladas.
comportamiento que tienen los clientes en este momento especifico del proceso de compra.
Mensualmente se analizan la informacin sobre las compras que han realizado los
clientes en el mes para predecir cules de ellos probablemente estn optando por cambiar
barato que reclutar uno nuevo. Esta informacin tiene dos destinos principales: acciones
activas y acciones pasivas4. Las acciones activas son aquellas que se disparan cuando se
telefnicamente, por correo electrnico, etc. Las acciones pasivas son aquellas donde el
sistema no puede intervenir al usuario, pero puede tomar alguna accin como por ejemplo
ofrecer un descuento del 5% la prxima vez que el usuario ingresa al sistema, o comenzar
para que estos puedan evaluarlos y tomar acciones proactivas u ofrecerles alternativas con
el objetivo de retener tales clientes. El departamento de Marketing posee fondos que son
4 Acciones pasivas: Son aquellas acciones que no crean directamente algn objeto/elemento que impacta al
usuario (enviar un correo electrnico, llamar al usuario por telfono, et). Se caracterizan por la adaptacin
del sistema en lugar de tomar una accin correctiva; con la premisa de que si se tomar una accin activa,
esta podra ser errnea.
Yamaguchi University (2011), Neural Information Processing, Pginas 76-85
11
Indicadores de rendimiento (KPI)
indicadores de rendimiento (KPI), los cuales estn relacionados cada uno con las iniciativas
indicadores muestran la mejora con respecto al valor actual (salvo cuando se indique lo
contrario).
Financiera
Definiciones:
12
la cantidad de predicciones realizadas ya que algunas predicciones podran
Clientes
Definiciones:
del carrito de compras, medido desde el momento en que inicia sesin hasta
13
dividida la cantidad de productos total del carrito (productos distintos,
desestimando cantidades).
clientes a los cuales les ofrecemos promociones realmente sean aquellos que
5 En minera de datos, Lift se refiere a una medida del rendimiento de un determinado modelo predictivo
como una mejora a si se escogiera un modelo basado en eleccin aleatoria. Wikipedia:
https://en.wikipedia.org/wiki/Lift_(data_mining)
14
Construccin del caso de negocio
comportamiento del usuario basado en un conjunto de factores que saldrn a la luz de las
COSTOS
Adaptacin del sitio web de la empresa para hacer uso de tales modelos
clasificacin de clientes.
Contact Center.
BENEFICIOS
Aumento del monto del carrito de compras: Segn los objetivos que se
una facturacin anual que ronda los 180 millones de dlares, incluso el 2%
Vale la pena marcar que prevemos que a medida que la prediccin del
Amazon, por ejemplo, en promedio posee un CTR que vara del 5% al 15%
clientes que los pueden comprar. Se estima que un 0.5% del total del carrito
mayor.
exhibir de 2 formas:
de retencin.
Ntese que una premisa aqu es que el valor del presupuesto de marketing
Destinaremos este 15% del tiempo a que los agentes capten nuevos
clientes.
17
esperamos que esto incentive a nuevos clientes a preferir nuestra
compaa.
Riesgos de implementacin
comportamiento exhibido en datos es sensible a que tan bien hayamos generado nuestros
modelos predictivos, los algoritmos que utilizamos dentro de ellos y los datos con los
sobre aquellos clientes que operan en este canal. Estos agentes conocen a
18
nuestros modelos analticos son correctas o no, y en caso de ser incorrectas,
para una implementacin de este tipo son elevados. En caso de realizar la inversin
necesaria y dar con una implementacin fallida representara prdidas significativas para
la compaa.
Claro est que esta decisin de implementar una estrategia basada en nube pblica
integridad y seguridad. Si bien esto es un riego real, se tratan de riesgos inherentes a las
soluciones de nube que la empresa deber de aceptar si desea entrar en este tipo de modelo
9 Time-To-Marlet: En ingls, se trata del tiempo que toma llevar a un producto desde la concepcin de la
idea hasta su disponibilidad para la venta o consumo.
Wikipedia: http://en.wikipedia.org/wiki/Time_to_market
19
Privacidad:
o Sin publicidad: No se analicen los datos para ofrecer publicidad
Transparencia:
o Ubicacin de los datos: Un claro mapa de donde la informacin es
almacenada y como se transmite.
Cumplimiento:
o Seguridad: ISO 27001
20
DRIVERS DE LA ARQUITECTURA
Contexto tecnolgico
precios competitivos es fundamental para evitar que los clientes vayan a la competencia.
relevantes para sus clientes junto a una alta eficiencia en el back-end que le permite
Para administrar sus 8 depsitos y los 4500 productos que mantienen en cartera la
compaa utiliza Microsoft Dynamics ERP, mientras que para gestionar sus 45,000 clientes
Dynamics AX para registrar las interacciones con los clientes y generar los pedidos de
compra. Los agentes del Contact Center estn entrenados para proveer una experiencia de
compra asistida y guiada que mejora la satisfaccin del cliente y contribuye en el proceso
de up-selling.
Por su parte, el portal en lnea les da la capacidad a los clientes de realizar sus
21
desde Microsoft Dynamics AX. A su vez, cada orden de compra realizada en el canal web
genera una solicitud de compra en Microsoft Dynamics para que sea procesada por el
depsito de la compaa.
La empresa analiza sus ventas utilizando las herramientas de anlisis de SQL Server
Analysis Services. Estos reportes son revisados por el personal de ventas quienes luego le
ofrecen a los clientes promociones de forma directa o instruyen al sistema de CRM para
que ofrezca promociones especificas la prxima vez que el cliente inicie sesin en alguno
Drivers de la solucin
cumplir con una serie de requisitos mandatorios para asegurar la correcta implementacin
e integracin con los sistemas existentes, con las personas que lo operaran, con los
codificados por los desarrolladores dentro de las mismas aplicaciones que los utilizaban.
Esto requiere la modificacin de todas las aplicaciones en caso de tener que evolucionar el
algoritmo utilizado, modificar las variables usadas, el modelo de datos, etc., incrementando
que se pueden lograr con estos sistemas son muy limitadas dada la complejidad para
22
implementar algoritmos estadsticos en lenguajes de programacin que no estn pensados
que gobernaran los resultados arrojados por el sistema de toma de decisiones. Estos
LEARNING
Machine Learning es un concepto que est enmarcado dentro del ms amplio
(conocido como training data set) para luego utilizar tal conocimiento (generalmente
creando un Modelo de datos) para ejecutar las mismas acciones observadas de una
manera ms eficiente (en algn aspecto). Las tecnologas de Big Data junto con la
relaciones entre los datos que no estn visibles a simple vista para luego hacer predicciones.
ANLISIS PRESCRIPTIVO
La mayora de los datos denominados Big Data resultan difciles de procesar o
consumir para cualquier persona, ofreciendo casi ningn valor por si solos. Sin embargo,
23
la informacin que se deriva de esos datos al aplicar tcnicas o herramientas de anlisis
apropiadas, si lo es.
El anlisis ms simple que podemos hacer sobre los datos es lo que se conoce como
datos son en su mayora contadores. Se estima de hecho que el 80% de los anlisis que
las empresas hacen sobre los datos es de este tipo. Edwards Deming, llama a los problemas
El anlisis predictivo es el siguiente paso que podemos tomar para reducir los datos.
Utiliza un conjunto de tcnicas estadsticas, modelos de datos y minera de datos para
estudiar tanto datos actuales como histricos permitiendo realizar predicciones sobre el
futuro.
Vale la pena aclarar que el propsito del anlisis predictivo no es predecir lo que
va a suceder en el futuro, sino predecir lo que es ms probable que sucede de acuerdo a los
datos que se tienen. Todos los anlisis predictivos derivan de modelos probabilsticos por
naturaleza.
En estos estudios, normalmente se analizan datos que se tienen para predecir datos
que no se tienen. Edwards Deming llama a los problemas que son resueltos con este tipo
este ltimo concepto un poco ms lejos al recomendar al menos una accin para tomar
junto con los posibles resultados que se podran obtener si se tomara esa accin.
modelo predictivo junto con 2 componentes adicionales: Datos que permitan inferir
retroalimentacin que registre los resultados obtenidos por las acciones que se tomaron.
Segn Gartner11, existen 3 atributos claves necesarios para una implementar exitosa
de anlisis prescriptivo:
lo cual es importante que la solucin posea un grado de facilidad suficiente para que
analistas de negocio puedan construir los modelos de datos y los modelos prescriptivos
para poder adaptar, parametrizar o modificar los resultados de forma simple. Los costos
asociados para crear un grupo de recursos humanos de este tipo son prohibitivos para la
11 InformationWeek (2013), Prescriptive Analytics And Big Data: Next Big Thing?,
http://www.informationweek.com/big-data/big-data-analytics/prescriptive-analytics-and-big-data-next-big-
thing/d/d-id/1109537
25
SOLUCIN COMO SERVICIO EN LA NUBE
La empresa actualmente no posee los recursos de infraestructura necesarios que se
requieren para implementar una solucin del tipo de Machine Learning y los costos
asociados a realizar una implementacin de este estilo son elevados. En tal caso, el riesgo
asociado a una inversin de tal tipo ser difcil de afrontar en caso de una implementacin
costosa y fallida que no cumpli con las expectativas. Si bien el anlisis de tal
implementacin esta fuera del alcance de este documento, ser mandatorio que la solucin
propuesta pueda ser consumida como un servicio en la nube pblica que la empresa pueda
NEGOCIOS INTELIGENTES
cuestin, pero lo que buscamos es embeber inteligencia dentro de los mismos utilizando
12 Knime: https://www.knime.org/knime
26
mejorar los tiempos que lleva tomar los pedidos en este canal y adicionalmente potenciar
no solo de tomar datos provenientes de Microsoft Dynamics AX para modelar los datos
sino que adems proveer APIs que puedan ser consumidas por Dynamics en el momento
de forma rpida y que puede significar un gran riesgo para el negocio, as como un gran
para el 2020 y aquellas empresas que comiencen a realizar test de viabilidad sobre estas
neurobusiness, NLQA, Big Data, Cloud Computing y anlisis predictivo en este momento,
significativo en las economas de todas las industrias no solo en los prximos aos sino
dcadas. Las grandes compaas que mantienen grandes cantidades de informacin estarn
herramientas disponibles para realizarlo de una forma escalable. Aunque tecnologas como
Deep Learning an estn en etapas tempranas segn Gartner, es claro que el valor de
Uno de las principales restricciones para implementar este tipo de soluciones yace
15 Forbes (2014), Deep learning and machine intelligence will eat the world
28
de datos, junto con su asociada dificultad de atraer suficientes desarrolladores para que
inviertan tiempo en aprender estas nuevas herramientas. Hoy en da no existe una API
estandarizada que los desarrolladores puedan aprender, por lo cual muchas compaa de
tecnologa estn actualmente peleando por la atencin de los desarrolladores para que
source, como Apache Hadoop, no se trata de sistemas basados en APIs listas para consumir.
Esto hace que se requiera un esfuerzo de desarrollo ms elevado. Como alternativa a esta
problemtica, soluciones como MapR16 aparecen como alternativas para el desarrollo de
TECNOLOGA
Tecnologas disponibles
la correcta tecnologa que nos provea las funcionalidades necesarias bajo un modelo de
costos soportable por la empresa mientras que nos permita mantenernos relevantes en los
prximos aos.
16 MapR: https://www.mapr.com/
17 Gartner (2015), Magic Quadrant for Business Intelligence and Analytics Platforms
29
(como ser estadstica, minera de datos descriptiva y predictiva, simulacin y optimizacin)
pueden alcanzar.
SAS. En el apndice 2 se incluye una breve descripcin de cada uno de estos proveedores
30
Evaluaremos a los proveedores basndonos en los requerimientos que se
proveedor dado que la empresa ya intent en el pasado utilizar dicha tecnologa, obteniendo
resultados negativos.
Diseo
Learning (Azure ML de ahora en adelante) dado que es el proveedor que mejor se encuadra
you-use.
datos elevados)
31
o Azure ML expone APIs web en formato REST donde es posible
integracin.
sistemas on-premise.
Disponibilidad del vendor para incorporar Data Scientists para elegir los
directa.
33
En el Apndice 2 se encuentra un detalle de los dems proveedores evaluados. Si
de desplegarlas.
IBM: Si bien provee una solucin con una gran fortaleza, IBM requiere de
operar la plataforma.
Implementacin
consumirlos
34
3. Construccin del servicio Clasificacin de clientes
compras
Learning. A la informacin que est lista para ser consumida por nuestros modelos en
Dado que los datos sern consumidos por Windows Azure, crearemos una base de
datos especfica de SQL Azure en Windows Azure donde realizaremos las tareas de
competencia.
Cloud
Data Sets
Clientes que
Transacciones
abandonaron la empresa
(diarias)
(mensual)
Red corporativa
Clientes que
abandonaron la
Pedidos en linea empresa
Agente de Marketing
Dynamics AX
F IGURA 4: P ROCESO DE CARGA DE M ODELO DE DATOS EN A ZURE ML. E N ESTA FIGURA , EN ROJO ,
RED CORPORATIVA DE L A EMPRESA , EN AZUL , ELEMENTOS HOSPEDADO S EN W INDOWS A ZURE
36
La informacin sobre que clientes han abandonado la empresa para irse a la
competencia deber ser actualizada por el personal de marketing puesto que no queremos
ingresar al sistema informacin de clientes que han abandonado la empresa porque han
cerrado su negocio. Tampoco queremos que el sistema infiera cuando un cliente abandon
la empresa, sino que la misma ser quien se asegurar cual fue el motivo por el cual el
dejado de realizar ordenes en los ltimos meses, se contacta con el mismo para investigar
cantidad de tiempo que pasa el usuario en cada pgina, tiempo total de la compra y cantidad
poder detectar cuando una prediccin sobre un producto fue correcta y cuando no. Esto nos
que implica que no incorporaremos un data set para entrenar el modelo sino que el mismo
se ir generando a medida que se utilice. Para poder explotar todas estas caractersticas
del carrito
37
Sugerencias de FBT que son cliqueadas por el usuario
el usuario
Clic FBT
Bares, Restaurantes, Hoteles, etc. La empresa sabe que son mercados lo suficientemente
para analizarlos por separado. La compaa tambin sabe que lo que aplica para un
Dadas las necesidades de la empresa para clasificar a sus clientes, este modelo ser
a cada una de ellas dependiendo de la relevancia que exhiban en los datos (Cuales de ellas
Productos individuales (productos nicos que han sido comprados en una sola
unidad)
La informacin de estas variables para los ltimos 3 aos es introducida dentro del
clasificacin de cada uno de los clientes basndose en los patrones ocultos de cada
segmento de clientes.
Comportamiento
las siguientes categoras: Platinum, Diamond, Gold, Silver, Bronze y Cliente perdido. Note
aqu una diferencia sustancial con la prediccin de un cliente que se perder en el mes
39
siguiente, la cual es cubierta ms adelante y su objetivo es predecir que cliente ser
mostrar los productos que el cliente que acaba de iniciar sesin en el sistema
lo realiz, en que cantidades y con qu frecuencia. Los nuevos datos sobre historial de
Comportamiento:
cliente, y hasta los prximos 30 das, cualquier producto que el cliente compre y que
prediccin. Note que esto no significa que el cliente no encontrar el producto para
compras no solo estar afectado por lo inferido de aplicar minera de datos sino que tambin
Afectados por reglas especficas: La compaa sabe que los clientes compran
detectar este patrn y respetarlo: Por ejemplo: Los clientes compran primero
Coca-Cola, a menos que su probabilidad sea tan baja que rompa este vnculo
que el cliente tenga que recorrer el catalogo para comprar Coca-Cola Light solo
producto que otros cliente han comprado y que quizs nuestro cliente no est considerando.
41
Diseo del modelo:
Existen muchos modelos que ofrecen soluciones a este problema. Utilizaremos uno
de los algoritmos ms utilizados20, Frecuence Pattern Mining y el cual est disponible como
una solucin empaquetada en Azure ML Apps. Este algoritmo tiene la caracterstica de ser
complejos que pueden hacer sugerencias ms precisas, la ventaja del elegido es que lo
compaa.
Comportamiento:
suficientemente alta, el sistema podra sugerir productos que no tengan ninguna relacin.
Queremos evitar confundir al cliente distinguiendo las compras que son intencionales de
las que son casuales. Si el modelo no puede ofrecer una prediccin lo suficientemente
20Pater, M (2007), The Benefits of Using Prefix Tree Data Structure in Multi-Level Frequent Pattern
Mining, ISBN: 978-1-4244-1608-0
42
RECOMENDACIONES ESPECFICAS PARA UN PRODUCTO
productos que el cliente puede estar necesitando y que son especficas para este producto.
Latent Factor21. Es uno de los algoritmos ms potentes que se basa en caracterizar al cliente
y al producto en una cantidad de factores o atributos que son inferidos del conjunto de
datos y que gobiernan el comportamiento del cliente. Esto implica que el modelo no
Otra ventaja de este modelo es que requiere ajustes para la industria que son
Esta solucin est disponible como una solucin empaquetada en Azure ML Apps.
Los productos nuevos (cold items) sern modelados utilizando las caractersticas
Comportamiento:
no encontrara de otra manera (es decir, que no es ofrecido por alguno de los restantes
sistemas de recomendaciones).
21 Ver apndice 1
43
marcas de papas fritas a las cuales frer, queremos que ofrezca 1, y luego, por ejemplo, alas
de pollo que es probable que tambin las pueda usar para frer.
Latent Factor, al igual que en el modelo anterior, pero en este caso las predicciones estarn
ajustadas por el contenido que tiene el carrito de compras del cliente en ese momento. Este
entrenarse con los diferentes tipos de carritos de compras que se pueden dar. Esto ser
22Koenigstein, N & Paquet, U & Nice, N & Schleyen, N, The Xbox Recommender System, Tel Aviv
University, www.eng.tau.ac.il/~noamk/papers/KNPS12.pdf
44
Trainning data set:
Comportamiento:
Objetivo: Generar una lista de los clientes con una alta probabilidad de abandonar
Antes de generar el modelo analtico, se debe definir que significa que un cliente
este en riesgo para poder identificarlos y poder aprender los patrones de tales clientes.
La empresa sabe dada su experiencia que los clientes que compran de forma regular en el
sitio lo hacen mensualmente, varias veces en el mes y comprando varios productos en cada
una de sus compras. En la mayora de los casos, si un cliente no compra en un mes dado es
muy poco probable que vuelva a comprar en el mes siguiente. Esta ser nuestra definicin
de cliente en riesgo.
El algoritmo utilizado ser del tipo Classification que ser entrenado con un
competencia y cules no. El algoritmo descubrir los patrones que diferencian a un grupo
45
Esta implementacin est disponible como una solucin empaquetada en Azure ML
Apps. La tecnologa que est detrs es boosted decision trees23, tecnologa que es utilizada
por el motor de bsquedas Bing y cuyos resultados son ampliamente mejores que lo de
algoritmos ms complejos.
clientes en los ltimos 3 aos. La compaa marcar manualmente aquellos clientes que
cada cliente, predeciremos que clientes se irn a la competencia en el prximo mes. Los
Comportamiento:
prximo mes, utilizando la informacin de los ltimos 3 meses de las transacciones de cada
marketing considere.
23 Microsoft Research, Uncertainty in Artificial Intelligence Boosted Decision Trees for Deep Learning,
http://event.cwi.nl/uai2010/papers/UAI2010_0282.pdf
46
INTEGRACIN CON MICROSOFT DYNAMICS AX
Como se mencion anteriormente, ser importante que esta misma tecnologa est
disponible para los agentes en de Contact Center a la hora de atender pedidos de forma
telefnica. Dado que, desde su concepcin, todos los modelos predictivos se generaron
directamente.
endpoints expuestos en Azure ML. La siguiente figura muestra que servicios estarn
F IGURA 4: S ERVICIOS INTEGRADOS DENTRO DE D YNAMICS AX. E N ROJO , PROCESOS QUE SUCEDE N
DE FORMA AUTOMTICA ; EN VERDE , PROCESOS EN LOS QUE SE REQUIERE LA INTE RACCIN DEL
ASISTENTE DE VENTAS CON EL CLIENTE .
47
ADAPTACIN Y REDISEO DEL SITIO WEB DE COMPRAS EN LNEA
Redisearemos el sitio para que sea capaz de consumir las predicciones que
realizamos desde Azure ML. Los siguientes servicios sern consumidos desde el sitio:
PARMETROS
48
Costos de Microsoft Azure Machine Learning:
Caracterstica Precio24
Seat de Azure ML /mes $9.9900
Precio por hora de computo $2.0000
Precio por milisegundo de computo $0.0000005556
Precio cada 1000 predicciones $0.5000
Precio de uso de ML Studio / hr. $1.0000
SQL Server database / Mes / 1 GB $1.5100
Egreso de datos / Mes / 100 GB $8.2700
Cargos totales por 1000 predicciones de 1 milisegundo $0.5006
Cargos totales por 1000 predicciones de 50 milisegundos $0.5278
Cargos totales por 1000 predicciones de 500 milisegundos $0.7778
Cargos totales por 1000 predicciones de 1 segundo $1.0556
Nota: Para mantener el clculo simple y dado que los costos asociados a egreso
de datos son despreciables y que Azure no cobra por el trfico de ingreso de datos
ni interno dentro la nube, no estamos contemplando en la estructura de costos
gastos relacionados con transferencia de datos.
50
Categorias Flujo ao 1 Flujo ao 2 Flujo ao 3
Adpatacin de sistemas existentes ($ 70,000.0)
Adaptacin de Dynamix AX ($ 20,000.0)
Adaptacin del sitio web ($ 50,000.0)
Capacitacin del personal ($ 50,000.0)
Capacitaciones de Microsoft ($ 50,000.0)
Contruccin de modelos predictivos ($ 252,811.4) ($ 1,812.0) ($ 1,812.0)
Creacin de los modelos predictivos ($ 200,999.4)
Consultora de ML ($ 200,000.0)
Herramienta de modelado de datos ($ 999.4)
Saneamiento de informacin y agregacin ($ 51,812.0) ($ 1,812.0) ($ 1,812.0)
Importacin de datos ($ 50,000.0)
SQL Azure Database ($ 1,812.0) ($ 1,812.0) ($ 1,812.0)
Mantenimiento de modelos predictivos ($ 50,839.4) ($ 50,839.4) ($ 50,839.4)
Consultora de ML ($ 50,000.0) ($ 50,000.0) ($ 50,000.0)
Herramienta de modelado de datos ($ 839.4) ($ 839.4) ($ 839.4)
Hora de Azure ML Studio ($ 240.0) ($ 240.0) ($ 240.0)
Seats de Azure ML Studio ($ 599.4) ($ 599.4) ($ 599.4)
Utilizacin de los sistemas de prediccin ($ 17,455.0) ($ 17,455.0) ($ 17,455.0)
Costo de transacciones de recomendaciones ($ 17,455.0) ($ 17,455.0) ($ 17,455.0)
Predicciones de carrito de compras ($ 10,766.7) ($ 10,766.7) ($ 10,766.7)
Predicciones de FBT ($ 855.0) ($ 855.0) ($ 855.0)
Predicciones de productos para checkout ($ 793.3) ($ 793.3) ($ 793.3)
Predicciones especificas de productos ($ 5,040.0) ($ 5,040.0) ($ 5,040.0)
Grand Total ($ 441,105.8) ($ 70,106.4) ($ 70,106.4)
51
Rendimiento financiero de la solucin
(*)
este caso.
los clientes que utilizan el canal web y la va telefnica, constando en total de 3 rondas de
implementacin.
52
53
CONCLUSIONES
negocio presentan grandes oportunidades para la empresa con una inversin controlada y
continua, es posible dar con un modelo de datos predictivo con un alto grado de efectividad.
Learning es una tecnologa que integrada de la forma correcta permite prestar atencin a
las pequeas cosas, que al final del proceso no son tan pequeas de forma escalable,
54
BIBLIOGRAFA
Harvard Business School Press (1999), Adaptive Enterprise: Creating and Leading
Sense-and-Respond Organizations
Information Week (2014), Prescriptive Analytics and Big Data is the next big thing?,
http://www.informationweek.com/big-data/big-data-analytics/prescriptive-analytics-and-
big-data-next-big-thing/d/d-id/1109537
Information Week (2015), Gartner Advanced Analytics Quadrant 2015: Gainers, Losers,
http://www.informationweek.com/big-data/big-data-analytics/gartner-advanced-
analytics-quadrant-2015-gainers-losers/d/d-id/1319192
Forbes (2014), Deep learning and machine intelligence will eat the world
Koenigstein, N & Paquet, U & Nice, N & Schleyen, N, The Xbox Recommender System,
Tel Aviv University
www.eng.tau.ac.il/~noamk/papers/KNPS12.pdf
Yahoo Research & AT&T Labs (2009), Matrix factorization techniques for recommender
systems
Pater, M (2007), The Benefits of Using Prefix Tree Data Structure in Multi-Level
Frequent Pattern Mining, ISBN: 978-1-4244-1608-0
Beel, J, Stefan, G (September 2013), Sponsored vs. Organic: Recommendations and the
Impact of Labeling
56
APENDICE 1
han convertido en un rea de aplicacin bastante contundente en los ltimos tiempos. Estos
son utilizados tanto por investigadores como por empresas en una gran cantidad de
de datos de entrada, Training Data Set, realiza un modelado de los datos utilizando
encapsula el conocimiento o inteligencia que se obtuvo de los datos. El modelo puede ser
utilizado luego sobre un nuevo conjunto de datos, test data, y generar resultados para esos
la aplicacin en cuestin).
dos estrategias. La estrategia de Content Filtering, la cual crea perfiles para cada usuario o
sistema de alquiler de pelculas podra incluir atributos relacionados con el gnero, los
actores que participan, la popularidad que alcanz, etc. Los perfiles de los usuarios en tal
sistema podran permitir asociar entonces usuarios con determinadas pelculas (productos).
Este tipo de estrategias podran requerir combinar informacin externa al sistema que
57
anteriores que hizo el usuario sin requerir la creacin de perfiles de forma explcita. Esta
Filtering analiza la relacin que existe entre los usuarios y las interdependencias con los
conjuntos de datos cuyos parmetros son elusivos o difciles de perfilar utilizando Content
Filtering.
Mientras que generalmente ejecuta de forma ms precisa que las tcnicas de
momento.
Las dos principales formas de aplicar Collaborative Filtering son a travs de los
Neighborhood estn centrados en computar las relaciones que existen entre los productos
o, alternativamente, entre los usuarios. Esta tcnica evala las preferencias de los usuarios
mismo usuario. Los productos vecinos se definen como aquellos productos que tienden a
explicar la clasificacin que logran los productos al caracterizar tanto a los productos como
a los usuarios en, digamos de unos 20 a 100 atributos que son inferidos de los patrones de
25 Concepto ideado por Doug Terry para el sistema Tapestry Information System, Xerox PARC
58
clasificacin. En esencia, estos atributos constituyen un sinnimo computarizado para lo
26 Matrix factorization techniques for recommender systems, Yahoo Research, AT&T Labs, August 2009
59
APENDICE 2
RAPIDMINER
RapidMiner ofrece una plataforma disponible tanto como servicio en la nube as
comercial tiene la capacidad de conectarse con data sets de mayor tamao y de mayor
valor a negocios puede ser difcil de alcanzar debido a que los entrenamientos disponibles
de esta plataforma no son de calidad y existe una falta de documentacin del producto.
ALTERYX
Alteryx provee una plataforma para la integracin de datos y el anlisis avanzado
escalamiento que se alcanzan gracias a Apache Spark. Sin embargo, debido a su falta de
Tableau o Qlik para poder hacer uso de la totalidad de sus capacidades, siendo este uno de
MICROSOFT
Microsoft ofrece una solucin de BI y anlisis de datos competitiva y en expansin.
Esta solucin est basada en las capacidades de Office 2013, capacidades de administracin
Azure.
herramientas para los usuarios de negocios junto con una plataforma empresarial acorde.
consultas en un lenguaje comn y self-service ETL que pueden ser aplicadas tanto a datos
internos como externos. Los productos Insight HD y Azure Machine Learning ofrecen
que actualmente pueden ofrecen una gran variedad de funcionalidades, muchos clientes
reportan que el principal obstculo que visualizan para implementar estas soluciones tiene
que ver con la falta o debilidad de ciertas funcionalidades. Mobile, visualizacin interactiva
61
y administracin de la metadata son las principales falencias que se reportan. En particular,
Microsoft est por detrs de la mayora de los dems vendors de BI en lo que respecta a
IBM
IBM ofrece un abanico completo de capacidades de anlisis de datos que incluyen
avanzadas complementados con un completo conjunto de servicios que estn listos para
ser implementados por los clientes en sus soluciones sea cual sea el dominio, industria o
ubicacin geogrfica.
que los clientes han reportado. Otra evidencia de las capacidades empresariales de IBM es
respuesta de IBM a este inconveniente dado que le permite diferenciarse por s mismo
integrando estas capacidades con su plataforma IBM Cognos y combinar sus fortalezas
descubrimiento de datos ms amigables para los usuarios. Los clientes identifican varias
62
SAS
Con un porfolio de ms de 40.000 clientes y un slido ecosistema de Partners, SAS
ha sido la opcin ms comn entre las organizaciones que buscan anlisis avanzado de
datos. SAS tiene fortalezas principalmente en los sectores de banca, seguros, servicios y
agencias gubernamentales.
atributos, junto su escalabilidad y confiabilidad. Sin embargo, SAS es una plataforma que
dispone de un conjunto de productos con capacidades similares que muchas veces son
bloqueantes ms fuertes que las empresas encuentran en los productos de SAS y por el
KNIME
Knime ofrece una plataforma gratuita, de cdigo abierto y basada en su aplicacin
amplia rama de verticales, aunque siendo fuerte en el sector de salud, gobierno, educacin,
calidad junto con una pobre documentacin hace difcil su implementacin en muchos
64