Вы находитесь на странице: 1из 73

DARWIN EN LA ERA DE MACHINE

LEARNING
Transformando procesos de negocio automticos en
procesos inteligentes

TUTOR:
Mg. Nstor H. Mazza
DARWIN EN LA ERA DE MACHINE
LEARNING
Transformando procesos de negocio automticos en
procesos inteligentes

Autor

Ing. SANTIAGO, Facundo

Field Project

Maestra en Administracin de Negocios con Orientacin en Direccin


de Sistemas de Informacin

Universidad del Salvador State University of New York


Ao 2015
Pgina intencionalmente en blanco
Abstract

Darwin en la era de Machine Learning


Transformando procesos de negocio automticos en procesos inteligentes

Ing. SANTIAGO, Facundo

Universidad del Salvador, Ao 2015

Hoy en da las empresas tienen sistemas basados en transacciones que estn

diseminados a lo largo y a lo ancho del negocio, pero concebidos en la era industrial, es

decir, construidos para automatizar transacciones de una forma repetible y rgida.

Justamente, en una era industrial, esta es la forma en la que las empresas han sabido generar

ventaja competitiva: generando eficiencia.

Eficiencia Rigidez

En la nueva economa de la informacin prevalece exactamente lo opuesto.


Flexibilidad, adaptabilidad, la habilidad de adaptarse en tiempo real e introducir la

informacin en un ciclo sinrgicos de sense-and-response para continuamente adaptar la

estrategia de la compaa es lo que genera la ventaja competitiva. Esto puede sonar similar

al concepto concebido por IBM Research en la dcada de los 901 aunque tomado desde la

perspectiva del management empresarial. Aqu, se tomar como un modelo de negocios.

1Harvard Business School Press (1999), Adaptive Enterprise: Creating and Leading Sense-and-Respond
Organizations
iv
En esta nueva era, la estrategia no es algo que se tiene guardado en un cajn y que

se la revisa cada 5 aos sino que es una actividad que debe ejercitarse todos los das

potenciada por tecnologas como el cloud, mobile, social data, Internet of Things (IoT) y

Big Data que al final se traducen en la informacin correcta, en el momento justo, en el

contexto correcto para generar procesos sistemticos ad-hoc en una forma efectiva y semi-

automatizada (estos procesos no son automticos).

En este documento se presenta un caso de negocio donde una compaa tomar

ventaja de las capacidades de Machine Learning, Big Data y el Cloud para potenciar sus
capacidades de upselling2 y cross-selling3 que se vieron limitadas por la automatizacin de

determinados procesos de venta. Eliminaremos la rigidez de la automatizacin de tales

procesos para convertirlos en procesos sistemticos de toma de decisiones ad-hoc que le

permitirn a la empresa no solo recuperar lo que perdi, sino que tambin predecir lo que

sus clientes harn y actuar en consecuencia.

2 Upselling: Segn Harding, Ford (2002). Cross-Selling Success, en marketing, se trata de una estrategia de
ventas donde el vendedor induce al comprador a adquirir productos ms caros, ms grandes o agregarle
complementos al mismo con el objetivo de realizar una venta con mayor ganancia.
3 Cross-selling: Segn Harding, Ford (2002). Cross-Selling Success, en marketing, se trata de una estrategia
de ventas donde se induce al cliente a comprar productos o servicios adicionales a los que iba a comprar
con el objetivo de realizar una venta mayor o para proteger la relacin con el cliente al ofrecer un mayor
valor final al combinar los productos/servicios.
v
Tabla de contenidos

INTRODUCCIN .................................................................................................1

Acerca del negocio..................................................................................................1

Principales procesos de negocio ............................................................................2


VENTAS ...........................................................................................................2
TRANSPORTE ..................................................................................................2
DISTRIBUCIN DE PRODUCTOS EN LOS DEPSITOS .......................................3
CARGA DE PEDIDOS ........................................................................................3
ENTREGA DE PEDIDOS ....................................................................................3

CONSTRUCCIN DEL CASO DE NEGOCIO ................................................3

Aspectos ..................................................................................................................3

Identificacin del proceso de negocio......................................................................5


Cross-selling y Upselling ................................................................................6
Clasificacin de cliente ...................................................................................6
Retencin de los clientes .................................................................................7

Iniciativa ..................................................................................................................7
Clasificacin de los clientes ............................................................................8
Prediccin del carrito de compras ...................................................................9
Recomendaciones ...........................................................................................9
Anlisis de clientes en riesgo ........................................................................11

Indicadores de rendimiento (KPI) ..........................................................................12

Construccin del caso de negocio ..........................................................................15


Costos............................................................................................................15
Beneficios .....................................................................................................15

vi
Riesgos de implementacin ...................................................................................18

DRIVERS DE LA ARQUITECTURA ...........................................................................21

Contexto tecnolgico ............................................................................................21

Drivers de la solucin...........................................................................................22

Estado actual de las tecnologas de Machine Learning ....................................27

TECNOLOGA ................................................. ERROR! BOOKMARK NOT DEFINED.

Tecnologas disponibles .......................................................................................29

Diseo ....................................................................................................................31

Implementacin ....................................................................................................34
Preparacin de los data sets a utilizar en los modelos analticos ..................35
Preparacin del sitio web para retroalimentar los modelos analticos ..........37
Clasificacin de los clientes ..........................................................................38
Diseo del modelo ...............................................................................38
Training data set ...................................................................................39
Comportamiento ..................................................................................39
Prediccin del carrito de compras .................................................................40
Diseo del modelo: ..............................................................................40
Training data set:..................................................................................40
Comportamiento: .................................................................................40
Productos que se compran en conjunto (Frecuently both together) ..............41
Diseo del modelo: ..............................................................................42
Trainning data set:................................................................................42
Comportamiento: .................................................................................42
Recomendaciones especficas para un producto ...........................................43
Diseo del modelo: ..............................................................................43
Trainnning data set:..............................................................................43
Comportamiento: .................................................................................43
Recomendaciones especficas para el carrito de compras ............................44
vii
Diseo del modelo: ..............................................................................44
Trainning data set:................................................................................45
Comportamiento: .................................................................................45
Anlisis de clientes en riego .........................................................................45
Diseo del modelo: ..............................................................................45
Trainning data set:................................................................................46
Comportamiento: .................................................................................46
Integracin con Microsoft Dynamics AX .....................................................47
Adaptacin y rediseo del sitio web de compras en lnea ............................48

Estimacin de costos y beneficios .........................................................................48


Parmetros.....................................................................................................48
Estructura de costos y beneficios ..................................................................50

CRONOGRAMA PROPUESTO DE IMPLEMENTACIN ..........................52

CONCLUSIONES................................................................................................54

BIBLIOGRAFA .......................................................................................................55

APENDICE 1 ........................................................................................................57

Sobre los sistemas de recomendaciones .............................................................57

APENDICE 2 ........................................................................................................60

Tecnologas disponibles para implementacin de Machine Learning ............60

viii
Pgina intencionalmente en blanco

ix
INTRODUCCIN

Acerca del negocio

Nuestra empresa es una de las compaas lderes en la entrega y distribucin de una

amplia gama de productos alimenticios en el pas para restaurantes, industrias, cafeteras,

establecimientos educativos, centros de nutricin, empresas de catering, hoteles y bares,

entre otros.

Con una historia de 25 aos en la industria y 8 depsitos propios, la empresa ofrece

sus servicios - siendo estos considerados de alta calidad, aunque a precio conveniente para

el cliente - para alrededor de 45,000 establecimientos, procesando 1 milln de pedidos al

ao. La compaa incluso ha sido premiada en varias ocasiones con reconocimientos y

premios por innovacin tecnolgica y desarrollo del negocio.

Nuestra empresa ofrece un catlogo de 4500 productos disponibles con todo lo que

necesitan sus clientes para poder mantener su negocio, desde productos congelados,

enlatados, frescos, no perecederos e incluso productos para su correcta manipulacin como

productos de limpieza, o papeles.

El servicio de entrega y distribucin de productos alimenticios es un rubro muy


competitivo con relativamente bajas barreras para ingresar al mercado. Muchas de las

empresas de la competencia distribuyen (y en algunos casos manufacturan) productos

simples, de bajo precio, con bajo margen al mismo tipo de clientes a los que nuestra

empresa vende.

Sin embargo, nuestra empresa sabe que el servicio de distribucin de productos no

puede ser rentable solamente diferencindose de la competencia con polticas de precios

bajos o bajo margen. Es por esto que la empresa ha desarrollado e implementado tecnologa

de punta en una industria que paradjicamente es considerada una de las ms conservadoras


1
a la adopcin de nuevas tecnologas, ofreciendo as un servicio altamente diferenciado del

resto junto con un control de costos minucioso.

Dado que los clientes de este rubro tienen un patrn de recambio relativamente alto

y sumado a que el costo por parte del cliente de cambiar de un proveedor a otro es

prcticamente nulo, la empresa constantemente est introduciendo nuevos servicios o

reinventando los existentes para ofrecer un propuesta ms eficiente y reducir costos de

operacin con el objetivo incansable de reclutar y retener clientes.

Principales procesos de negocio

Para comprender de mejor manera el negocio de nuestra empresa, a continuacin,

se muestran los principales procesos de negocio que se han definido:

VENTAS

La empresa tiene dos canales de ventas, basados en su Contact Center y su portal

en lnea respectivamente. Las rdenes se reciben durante todo el da hasta las 21:00 hs y

son entregadas el da siguiente.

TRANSPORTE

La empresa posee su propia red de distribucin y transporte que llega hasta todos

sus clientes. La organizacin de los horarios de entrega, rutas de distribucin y asignacin

de conductores y personal de descarga para cada unidad de distribucin es realizada por la

empresa a travs de su personal de logstica.

2
DISTRIBUCIN DE PRODUCTOS EN LOS DEPSITOS

Con 8 depsitos y 4500 productos es importante asegurar que los productos

necesarios para completar los pedidos estn disponibles. La empresa posee una amplia

variedad de productos con distintos requerimientos de almacenamiento como ser productos

frescos que requieren refrigeracin, cocidos, perecederos, no perecederos, etc. Estos

productos deben estar disponibles en el depsito correcto para poder confeccionar los

pedidos y posteriormente entregarlos.

CARGA DE PEDIDOS

Los vehculos de distribucin son cargados con los pedidos correspondientes a ser

entregados en cada depsito dependiendo de la ubicacin de los clientes involucrados en

la ruta asignada para cada unidad. Los mismos son cargados a partir de las 5:00 am. de

cada da.

ENTREGA DE PEDIDOS

Los vehculos de distribucin entregan los pedidos que fueron ingresados al sistema

el da anterior durante todo la jornada.

CONSTRUCCIN DEL CASO DE NEGOCIO


Aspectos

Originalmente, la empresa tomaba la totalidad de sus pedidos a travs de su propio

Contact Center, es decir, telefnicamente. Esta forma de llevar adelante la recoleccin de

pedidos podra parecer un poco anticuada o ineficiente desde algn punto de vista. Sin

embargo, para nuestra empresa existen grandes beneficios y una gran familiarizacin con

3
el cliente al hacerlo de esta forma. Nuestra empresa ha sabido tomar ventaja del intangible

pero personalizado modo de entendimiento de las personas en otras palabras, el elemento

humano en las interacciones del da a da. Se trata de la habilidad de conocer al cliente a

un nivel ms ntimo, aprendiendo entonces sus gustos, preferencias, necesidades,

realidades y deseos. Prestar atencin a las pequeas cosas, que al final del proceso no

son tan pequeas.

Esta capacidad de entendimiento es lo que le permita a la empresa ofrecer ofertas

que se ajustaban a las necesidades de los clientes u obtener informacin relevante sobre el
servicio o los productos que al fin y al cabo beneficiara a ambos el cliente y la empresa.

Los agentes de ventas han sido entrenados especficamente para guiar la compra de

los clientes, conocer sus necesidades, detectar oportunidades y potenciar la capacidad de

ventas. El sistema de asignacin de agentes de ventas cuando un cliente llama, por ejemplo,

est configurado de tal forma para que siempre sean atendidos por el mismo grupo de

agentes, permitiendo as un nivel de conocimiento e interiorizacin con el negocio del

cliente ms estrecho.

Con el objetivo de mantener la calidad y la innovacin en los servicios, la compaa

ofrece servicios en lnea para que sus clientes puedan gestionar sus cuentas y generar los

pedidos de forma electrnica, incluso posibilitando la compra con tarjetas de crdito

directamente desde el sitio web. Est poltica de innovacin ha tenido tal aceptacin que

actualmente el 60% de los pedidos son procesados de forma electrnica.

Sin embargo, esto gener una pregunta fundamental para el modelo de negocio de

la compaa: Cmo mantener los beneficios del toque personal que generaba el servicio

telefnico mientras que la empresa se mueve y expande a nuevos canales apoyados en

herramientas tecnolgicas?

4
En definitiva, el problema que se comenz a evidenciar es que la capacidad de

realizar Upselling y Cross-selling en el canal en lnea era relativamente nula; capacidades

importantes en el modelo de negocios de nuestra empresa.

Harding, Ford (2002), en Cross-Selling Success, define upselling como una

estrategia de ventas donde el vendedor induce al comprador a adquirir productos ms caros,

ms grandes o agregarle complementos al mismo con el objetivo de realizar una venta con

mayor ganancia. En lo que respecta a cross-selling, tambin lo define como una estrategia

de ventas pero donde se induce al cliente a comprar productos o servicios adicionales a los
que iba a comprar con el objetivo de realizar una venta mayor o para proteger la relacin

con el cliente al ofrecer un mayor valor final al combinar los productos/servicios.

Estas estrategias en conjunto, le permitan a la empresa guiar la compra, mejor la

experiencia, impulsar zonas no tan populares del catlogo y aumentar las ventas.

Con esto, las capacidades de la empresa para conocer a sus clientes y ofrecer

promociones que se ajusten especficamente a ellos tambin se deterior. Con un volumen

de pedidos del 60% en este canal, la empresa estara perdiendo una de las ventajas

competitivas que ha sabido cultivar durante tiempo y que le ha dado ventaja sobre sus

competidores.

Identificacin del proceso de negocio

En la problemtica anteriormente descripta intervienen un conjunto de procesos de

negocio que contribuyen a la situacin. Los mismos se enuncian a continuacin:

5
CROSS-SELLING Y UPSELLING

Las capacidades de Upselling y Cross-selling de la compaa descansan en la

atencin personalizada y el entrenamiento que recibe el personal del Contact Center.

En el canal web, el sitio es capaz de ofrecer recomendaciones de productos que son

programadas especficamente en el mismo y son de naturaleza estticas. Las mismas

recomendaciones son exhibidas para todos los clientes de todos los segmentos. Algunas

recomendaciones estn basadas en la frecuencia de compra de los productos, pero no tiene

en cuenta que, por ejemplo, un cliente que compro 100 bolsas de harina probablemente no

compra ms harina en lo que resta del mes (porque no la necesitar) a pesar de ser el

elemento ms comprado.

CLASIFICACIN DE CLIENTE

La empresa no realiza una segmentacin de clientes basada en el valor que aportan

para la compaa, por lo cual todas las promociones y ofertas son igualmente accesibles

para cualquiera de los clientes. Los clientes son clasificados actualmente segn el tipo de

negocio: Cafs, Bares, Restaurantes, Hoteles, etc.

Actualmente, la empresa analiza sus ventas utilizando las herramientas de anlisis


de SQL Server Analysis Services. Estos reportes son revisados por el personal de ventas

quienes luego le ofrecen a los clientes promociones de forma directa o instruyen al sistema

de CRM para que ofrezca promociones especificas la prxima vez que el cliente inicie

sesin en alguno de los canales (Contact Center o a travs del sitio web). Esta estrategia no

solo es lenta sino que adems riesgosa. Si el personal de ventas no analiz el reporte

correctamente esto significar que el presupuesto de promociones ser gastado en clientes

que no lo requeran reduciendo su eficiencia. Aquellas promociones que se aplican a

6
todos los clientes por igual tienen la contra parte de que son ofrecidas utilizando la premisa

one-size-fit-all.

RETENCIN DE LOS CLIENTES

La empresa monitorea las ventas las 2 primeras semanas de cada mes con el fin de

detectar si el cliente ha alcanzado o no las compras que se esperaban. En caso de no haberse

materializado, los agentes de ventas realizan llamadas a los mismos para ofrecerles alguna

promocin acorde o para confirmar si han cambiado a la competencia.

Iniciativa

La empresa posee una gran cantidad de informacin almacenada sobre las

transacciones que sus clientes han realizado y realizan todos los das, pero la misma nunca

ha sido explotada. Disponemos de aos de informacin de nuestros clientes que estn a la

espera de ser analizados.

Esta informacin podra ser analizada con tcnicas de Data Mining para mejorar el

servicio que se le ofrece al cliente en 4 aspectos claves: Clasificacin de los clientes,


Analizar clientes en riego de cambiar a un proveedor de la competencia, ofrecer

recomendaciones, predecir el carrito de compras.

7
F IGURA 1: M EJORA DE LA SATISFAC CIN DE CLIENTES Y AUMENTO DE LAS VENTAS A TRAVS DE
LAS INICIATIVAS PROP UESTAS

CLASIFICACIN DE LOS CLIENTES

Los clientes son clasificados en diferentes segmentos basndose en un modelo de

minera de datos. Esta clasificacin ayudar al sitio web y a los operadores del Contact

Center en algunos procesos de decisiones como por ejemplo, que promocin ofrecer al

cliente actual basndose en su perfil.

8
PREDICCIN DEL CARRITO DE COMPRAS

Basndose en el historial de compra del cliente, de otros clientes y de otros clientes

del mismo segmento, en el momento en que el usuario inicia sesin en sitio web, el sistema

predecir lo que el cliente comprar hoy y mostrar los productos involucrados

ordenndolos por probabilidad, relevancia y reglas de segmentacin. Se espera que esta

funcionalidad provea un cambio radical en la forma de hacer pedidos ofrecindole al cliente

que comprar cada uno de los das. Claramente, esto tambin mejorar la eficiencia del

cliente para realizar su pedido.

Es importante marcar que este no es un tpico escenario de B2C, donde el objetivo

que se persigue es que el cliente pase tanto tiempo como pueda en el sitio, recorrindolo,

verificando otros productos, disfrutando de la experiencia, etc. En un escenario B2B, el

objetivo es completamente diferente: que las rdenes sean completadas con el menor

esfuerzo posible. No queremos que el cliente tenga que esforzarse para encontrar los

productos que necesita.

Entonces, el principal objetivo es predecir lo que el cliente va a comprar en cada

pedido. El principal reto para lograr esto es claramente la gran variedad de clientes,

tamao de clientes y lgica que usan para comprar. Por ejemplo, un determinado restaurant

podra comprar vegetales todos los das, harinas 2 veces a la semana y aceite una vez al

mes. Para que est funcionalidad sea exitosa, la prediccin debe ser relevante en cada da,

cada semana.

RECOMENDACIONES

Tres tipos de recomendaciones son ofrecidas en tiempo real.

Productos que son adquiridos generalmente en conjunto (Frecuently bought


together - FBT): Analizando las transacciones de aos de compras de clientes, recomendar
9
agregar otro producto que normalmente se compra junto al anterior inmediatamente

despus de que el cliente agrega un producto al carrito de compras. Cuando un cliente

agrega un producto al carrito, el servicio analizar las millones de combinaciones posibles

y ofrecer la ms relevante. El beneficio ms importante de esta funcionalidad es

asegurarse de que el cliente no est olvidando comprar algo que la mayora de las personas

compra cuando adquiere el producto en cuestin.

Sugerencias de otros productos que comprar: Cuando un cliente ingresa en la

descripcin de un producto en particular, el servicio recomendar otros productos que


comprar basndose no solo en lo que otros clientes compran sino que tambin basndose

en que haya diversidad e innovacin en las recomendaciones. Esto ayuda a promocionar

secciones del catlogo de productos que no son tan populares y que el cliente quizs no es

consciente de que existen. No solo mejora la capacidad de upselling sino que adems le

permite al canal web proveer una experiencia de compra guiada, concepto que la compaa

utilizaba de forma muy efectiva en el canal telefnico.

La naturaleza de estas recomendaciones es distinta a las anteriores (FBT) ya que en

este caso puede ser que estn tratando de reemplazar el producto que el cliente est viendo.

Por ejemplo, es posible que el cliente este buscando comprar harina y el sistema le

recomiende comprar otra marca. En otros casos, es posible que lo est complementando.

Por ejemplo, si el cliente compra aceite, el sistema puede inferir que sera interesante tener

algo que frer con ese aceite, y recomendar papas fritas congeladas.

Sugerencias al momento de checkout: Se proveen recomendaciones de productos

a agregar al carrito basndose en la totalidad de productos que ya se encuentran all y el

comportamiento que tienen los clientes en este momento especifico del proceso de compra.

A diferencia de las recomendaciones anteriores, estas tienen en cuenta la totalidad del

carrito de compras. La esencia en este punto no es predecir lo que el cliente viene a


10
comprar sino ofrecer productos que la empresa puede llegar a querer impulsar o que el

cliente puede llegar a olvidar.

ANLISIS DE CLIENTES EN RIESGO

Mensualmente se analizan la informacin sobre las compras que han realizado los

clientes en el mes para predecir cules de ellos probablemente estn optando por cambiar

de proveedor. La compaa sabe que si supiera qu clientes estn en riesgo de irse a la

competencia, prevenir que esos clientes realmente lo hagan es significativamente ms

barato que reclutar uno nuevo. Esta informacin tiene dos destinos principales: acciones

activas y acciones pasivas4. Las acciones activas son aquellas que se disparan cuando se

detecta que un cliente est por cambiar de proveedor y se lo intercepta ya sea

telefnicamente, por correo electrnico, etc. Las acciones pasivas son aquellas donde el

sistema no puede intervenir al usuario, pero puede tomar alguna accin como por ejemplo

ofrecer un descuento del 5% la prxima vez que el usuario ingresa al sistema, o comenzar

a promocionar productos mas baratos.

En este sentido, el sistema alimentar el proceso de clasificacin de clientes donde

algunas promociones u ofertas pueden ser sugeridas a clientes clasificados como

Riesgosos. Adicionalmente, se proveer esta informacin al departamento de marketing

para que estos puedan evaluarlos y tomar acciones proactivas u ofrecerles alternativas con

el objetivo de retener tales clientes. El departamento de Marketing posee fondos que son

destinados especficamente a estas acciones.

4 Acciones pasivas: Son aquellas acciones que no crean directamente algn objeto/elemento que impacta al
usuario (enviar un correo electrnico, llamar al usuario por telfono, et). Se caracterizan por la adaptacin
del sistema en lugar de tomar una accin correctiva; con la premisa de que si se tomar una accin activa,
esta podra ser errnea.
Yamaguchi University (2011), Neural Information Processing, Pginas 76-85
11
Indicadores de rendimiento (KPI)

Mediremos el rendimiento de esta implementacin a travs de los siguientes

indicadores de rendimiento (KPI), los cuales estn relacionados cada uno con las iniciativas

planteadas en la seccin anterior y a los objetivos estratgicos de la compaa. Todos los

indicadores muestran la mejora con respecto al valor actual (salvo cuando se indique lo

contrario).

Financiera

Objetivo estratgico Iniciativa KPI Target

Aumentar la Productos comprados Clic rate de la prediccin 30%


capacidad de frecuentemente (*)
cross-selling,
Recomendaciones % de productos agregados
upselling 3%
especficas de producto por recomendaciones en
el carrito
Recomendaciones
especficas de carrito

Guiar la compra Recomendaciones Clic rate de la prediccin 30%


especficas de producto

(*) Valor absoluto

Definiciones:

Clic rate de la prediccin: Nmero de recomendaciones aceptadas por el

usuario dividido cantidad de recomendaciones totales exhibidas al usuario.

(note que la cantidad de recomendaciones recibidas pueden ser menor que

12
la cantidad de predicciones realizadas ya que algunas predicciones podran

optar por no recomendar un producto)

% de productos agregados por recomendaciones en el carrito: Valor

moneda de los productos que fueron recomendados por alguno de los

sistemas de recomendaciones y que el usuario agreg al carrito de compras

dividido el valor moneda total de la compra realizada.

Clientes

Objetivo estratgico Iniciativa KPI Target

Mejorar la Prediccin del carrito de Tiempo promedio de -20%


satisfaccin del compras creacin de pedido
cliente
% del carrito predicho. 30%

Retener a los Clasificacin de los clientes Clientes que abandonan la -50%


clientes empresa (mensual)
Prediccin de clientes que
abandonaran la empresa Lift sobre la estrategia 3
anterior (*)

(*) Valor absoluto

Definiciones:

Tiempo promedio de creacin de pedido: Tiempo promedio de creacin

del carrito de compras, medido desde el momento en que inicia sesin hasta

que procede a realizar el checkout.

% del carrito predicho: Cantidad de productos que fueron recomendados

como prediccin del carrito de compras y que finalmente el usuario agreg

13
dividida la cantidad de productos total del carrito (productos distintos,

desestimando cantidades).

Clientes que abandonan la empresa (mensual): No incluye clientes que

hayan cerrado su negocio. Es importante marcar que este indicador no est

directamente relacionado con la implementacin propuesta puesto que el

hecho de que un cliente que evala irse a la competencia lo haga o no

depende de la efectividad del departamento de marketing. Este indicador se

exhibe porque es el objetivo final que debemos impactar, a pesar de que el


sistema solo predecir quien es probable que se vaya o no.

Lift5 sobre la estrategia anterior: Mide la eficacia del presupuesto de

marketing. El departamento de marketing tiene una cantidad determinada

de dinero disponible para ofrecer promociones mensualmente. Este

presupuesto no alcanza para impactar a todos los clientes que

potencialmente exhiben patrones de compra que evidenciando que se iran

a la competencia el mes siguiente. Consecuentemente, es importante que los

clientes a los cuales les ofrecemos promociones realmente sean aquellos que

si no lo hiciramos, se iran a la competencia. Este indicador medir la

efectividad de cada dlar en el presupuesto de marketing. Un valor 3, por

ejemplo, significa que cada dlar invertido es 3 veces ms efectivo que si

no se utilizara el modelo predictivo en cuestin.

5 En minera de datos, Lift se refiere a una medida del rendimiento de un determinado modelo predictivo
como una mejora a si se escogiera un modelo basado en eleccin aleatoria. Wikipedia:
https://en.wikipedia.org/wiki/Lift_(data_mining)
14
Construccin del caso de negocio

La implementacin de la anteriormente mencionada iniciativa requerir de una

plataforma de anlisis de datos con la capacidad de realizar predicciones sobre el

comportamiento del usuario basado en un conjunto de factores que saldrn a la luz de las

transacciones que realizan.

COSTOS

Los costos principales de esta implementacin son enunciados a continuacin. En


la seccin Tecnologa, Implementacin obtendr un detalle de cmo se calculan los costos

que se agregan en esta seccin:

Construccin de modelos predictivos de datos que permitan realizar las

recomendaciones y predicciones anteriormente mencionadas utilizando la

informacin que posee la empresa sobre sus clientes.

Adaptacin del sitio web de la empresa para hacer uso de tales modelos

predictivos para realizar las recomendaciones pertinentes de productos y

clasificacin de clientes.

Adaptacin de Dynamix AX para que tome ventaja de las mismas

capacidades que se estn posibilitando en el sitio web para los agentes de

Contact Center.

BENEFICIOS

Las beneficios derivados de esta implementacin se enuncian a continuacin junto

con una descripcin de cmo se alcanzan los valores finales.

Aumento del monto del carrito de compras: Segn los objetivos que se

describieron en la seccin Indicadores de rendimiento, se espera un

aumento de entre el 2% y el 3% del valor total de carrito de compras. Esta


15
cifra podra parecer pequea en un principio, pero para una empresa con

una facturacin anual que ronda los 180 millones de dlares, incluso el 2%

es un valor ms que aceptable.

Vale la pena marcar que prevemos que a medida que la prediccin del

carrito de compras sea ms efectiva con el tiempo, la efectividad de los

restantes sistemas de recomendaciones (FBT por ejemplo) tienda a bajar.

Sin embargo, en su conjunto, todos nuestros sistemas de recomendaciones

mantendrn un 30% de efectividad (CTR6) constante. Note que un clic rate


del 30%, como se muestra en el cuadro de KPI, es un valor enorme para un

negocio de B2C, pero aceptable para uno de B2B.

Amazon, por ejemplo, en promedio posee un CTR que vara del 5% al 15%

dependiendo del tipo de recomendacin y segmento7. Sitios de B2C

similares poseen CTR que rondan el 10%.8

Aumento del margen de los productos: Nuestra estrategia de cross-selling

privilegiar productos cuyo margen de ganancia es mayor para aquellos

clientes que los pueden comprar. Se estima que un 0.5% del total del carrito

de compras en promedio tendr productos con un margen de ganancia

mayor.

Retencin de clientes: Una de las iniciativas pretende predecir aquellos

clientes que abandonaran la empresa el prximo mes e impedirlo. Segn

nuestro cuadro de KPIs, esperamos un lift de 3 para el presupuesto de

6 Click-through rate, https://en.wikipedia.org/wiki/Click-through_rate


7 "Evaluating recommender systems from the user's perspective: survey of the state of the art". User
Modeling and User-Adapted Interaction (2012)
8 Beel, J, Stefan, G (September 2013), Sponsored vs. Organic: Recommendations and the Impact of
Labeling
16
Marketing. Esto significa que aumentamos la efectividad 3 veces por cada

dlar que se invierte. Las ganancias asociadas a esta mejora la podemos

exhibir de 2 formas:

o Posibilidad de reduccin del presupuesto de marketing manteniendo

el mismo nivel de retencin de clientes actual.

o Mantener el presupuesto de marketing actual y aumentar un 300%

la efectividad en la retencin de clientes a travs de nuestra poltica

de retencin.
Ntese que una premisa aqu es que el valor del presupuesto de marketing

no es lo suficientemente grande como para prevenir que todos los clientes

cambien de proveedor, por lo tanto preferimos brindarles promociones

solamente a aquellos clientes que tienen alta probabilidad de cambiar a la

competencia si no les ofreciramos una promocin. En este caso de negocio

y dada la experiencia de la compaa, preferimos mantener el valor asignado

al presupuesto pero aumentar su efectividad.

Nuevos clientes captados: Los mrgenes de ganancia asociados a nuevos

clientes captados estn basados en dos factores:

o Aumento de la productividad de los agentes de marketing al no tener

que analizar y segmentar a los clientes manualmente. Actualmente,

un 15% del tiempo de los agentes est destinado a esta actividad.

Destinaremos este 15% del tiempo a que los agentes capten nuevos

clientes.

o Dada la mejora en la experiencia de usuario que se percibe por

nuestra funcionalidad de prediccin del carrito de compras,

17
esperamos que esto incentive a nuevos clientes a preferir nuestra

compaa.

Esperamos que esta iniciativa nos permita aumentar nuestra cartera de

clientes en un 1% interanual, sumado a la cantidad de clientes que prefieren

nuestra empresa normalmente.

Riesgos de implementacin

La introduccin de sistematizacin de procesos que toman decisiones a partir del

comportamiento exhibido en datos es sensible a que tan bien hayamos generado nuestros

modelos predictivos, los algoritmos que utilizamos dentro de ellos y los datos con los

cuales entrenamos los modelos y predecimos los resultados.

Dado que estos procedimientos estn embebidos en nuestros procesos de negocio,

afectarn directamente la performance de la empresa. Es importante marcar que estamos

considerando implementar la iniciativa en una estrategia omni-channel, lo que implica que

todos los canales de venta se vern afectados, aumentando el impacto.


Mitigaremos este enorme riesgo utilizando la siguiente estrategia:

Seleccin de un grupo alfa de clientes que sern expuestos a este nuevo

canal de ventas online.

Nuestros operadores de Contact Center podrn brindar retroalimentacin

sobre aquellos clientes que operan en este canal. Estos agentes conocen a

los clientes y pueden validar si las predicciones que estn realizando

18
nuestros modelos analticos son correctas o no, y en caso de ser incorrectas,

corregirlas en el momento mientras se realiza la compra.

A su vez, sabemos que los requerimientos de infraestructura tecnolgica necesarios

para una implementacin de este tipo son elevados. En caso de realizar la inversin

necesaria y dar con una implementacin fallida representara prdidas significativas para

la compaa.

Para soportar este riesgo, se privilegiar una implementacin basada en la nube


pblica, donde podremos pagar por el servicio a medida que se utiliza. Adems de proveer

un time-to-market9 mayor, evitar la necesidad de invertir en una infraestructura para

anlisis de datos en el data center de la empresa.

Claro est que esta decisin de implementar una estrategia basada en nube pblica

introduce nuevos riesgos en la ecuacin relacionados con la privacidad de los datos,

integridad y seguridad. Si bien esto es un riego real, se tratan de riesgos inherentes a las

soluciones de nube que la empresa deber de aceptar si desea entrar en este tipo de modelo

de cmputo. Cuando una compaa selecciona un proveedor de nube para administrar su

infraestructura, aplicaciones y datos, este proveedor se convierte en un socio en el que la

empresa confa para alcanzar y mantener los requerimientos de integridad, seguridad,

cumplimiento y otras certificaciones que puedan aplicar. En nuestro caso, nos

aseguraremos de que el proveedor seleccionado cumpla con los siguientes requisitos:

9 Time-To-Marlet: En ingls, se trata del tiempo que toma llevar a un producto desde la concepcin de la
idea hasta su disponibilidad para la venta o consumo.
Wikipedia: http://en.wikipedia.org/wiki/Time_to_market
19
Privacidad:
o Sin publicidad: No se analicen los datos para ofrecer publicidad

basada en los datos del cliente, no se escaneen ni se haga minera de

datos sobre la informacin de los clientes.

o Portabilidad: La informacin que se almacena en el servicio le

pertenece al cliente y puede exportarla cuando lo desee.

Transparencia:
o Ubicacin de los datos: Un claro mapa de donde la informacin es
almacenada y como se transmite.

o Acceso a los datos: La informacin de los clientes es accedida

solamente para propsitos de resolucin de problemas o prevencin

de software malicioso por el proveedor.

o Notificaciones: El proveedor notificar cualquier modificacin en

la ubicacin de los datos y forma de manipulacin.

Cumplimiento:
o Seguridad: ISO 27001

o Acuerdos de procesamiento de informacin: Que aseguran

privacidad, seguridad y manipulacin de los datos de forma correcta

en cada locacin donde se encuentran los datos.

20
DRIVERS DE LA ARQUITECTURA

Contexto tecnolgico

La empresa ha tratado de mantenerse siempre a la vanguardia en lo que respecta a

innovacin tecnolgica con el objetivo de poder mejorar la eficiencia de sus procesos de

back-end. Debido a la alta competitividad de la industria en donde opera, mantener los

precios competitivos es fundamental para evitar que los clientes vayan a la competencia.

Nuestra empresa ha generado una situacin de diferenciacin al ofrecer servicios ms

relevantes para sus clientes junto a una alta eficiencia en el back-end que le permite

mantener bajos costos operativos.

Para administrar sus 8 depsitos y los 4500 productos que mantienen en cartera la

compaa utiliza Microsoft Dynamics ERP, mientras que para gestionar sus 45,000 clientes

utiliza Microsoft Dynamics CRM.

Actualmente, la empresa ha logrado refinar sus operaciones utilizando Microsoft

Dynamics AX para orquestar y potenciar la totalidad de las operaciones, incluyendo

recursos humanos, proveedores, ventas, manejo de inventarios, logstica y transporte y

manejo de pedidos y relacin con clientes.

Como ya se mencion, la empresa tiene dos canales de ventas, basados en su


Contact Center y su portal en lnea. Los agentes del Contact Center utilizan Microsoft

Dynamics AX para registrar las interacciones con los clientes y generar los pedidos de

compra. Los agentes del Contact Center estn entrenados para proveer una experiencia de

compra asistida y guiada que mejora la satisfaccin del cliente y contribuye en el proceso

de up-selling.

Por su parte, el portal en lnea les da la capacidad a los clientes de realizar sus

pedidos en cualquier momento y en cualquier lugar. El catlogo de productos es alimentado

21
desde Microsoft Dynamics AX. A su vez, cada orden de compra realizada en el canal web

genera una solicitud de compra en Microsoft Dynamics para que sea procesada por el

depsito de la compaa.

La empresa analiza sus ventas utilizando las herramientas de anlisis de SQL Server

Analysis Services. Estos reportes son revisados por el personal de ventas quienes luego le

ofrecen a los clientes promociones de forma directa o instruyen al sistema de CRM para

que ofrezca promociones especificas la prxima vez que el cliente inicie sesin en alguno

de los canales (Contact Center o a travs del sitio web).

Drivers de la solucin

En el contexto tecnolgico presentado anteriormente, la solucin propuesta deber

cumplir con una serie de requisitos mandatorios para asegurar la correcta implementacin

e integracin con los sistemas existentes, con las personas que lo operaran, con los

estndares de la industria y con los estndares de la compaa.

SISTEMA DE TOMA DE DECISIONES BASADO EN REGLAS


Anteriormente, los sistemas de toma de decisiones o recomendaciones estaban

codificados por los desarrolladores dentro de las mismas aplicaciones que los utilizaban.

Esto requiere la modificacin de todas las aplicaciones en caso de tener que evolucionar el

algoritmo utilizado, modificar las variables usadas, el modelo de datos, etc., incrementando

los costos de mantenimiento y dificultando la flexibilidad. Adicionalmente, las capacidades

que se pueden lograr con estos sistemas son muy limitadas dada la complejidad para

22
implementar algoritmos estadsticos en lenguajes de programacin que no estn pensados

para tal fin.

Los sistemas de tomas de decisiones basados en reglas permiten disear y modelar

el comportamiento del algoritmo utilizando un conjunto de reglas de forma centralizada

que gobernaran los resultados arrojados por el sistema de toma de decisiones. Estos

sistemas son ms flexibles, intuitivos y no requieren de desarrolladores para realizar

modificaciones a los mismos. En algunos casos, incluso no es necesario un profesional

estadstico para operarlos.

POTENCIAR LAS DECISIONES CON PREDICCIONES PROVENIENTES DE MACHINE

LEARNING
Machine Learning es un concepto que est enmarcado dentro del ms amplio

concepto de Inteligencia Artificial. Esta tcnica observa continuamente una serie de

acciones ejecutadas durante un periodo de tiempo determinado en un conjunto de datos

(conocido como training data set) para luego utilizar tal conocimiento (generalmente

creando un Modelo de datos) para ejecutar las mismas acciones observadas de una

manera ms eficiente (en algn aspecto). Las tecnologas de Big Data junto con la

capacidad de procesar grandes volmenes de datos potencian y aceleran el beneficio que

se puede percibir de esta tcnica.

Los algoritmos de Machine Learning son capaces de descubrir patrones ocultos y

relaciones entre los datos que no estn visibles a simple vista para luego hacer predicciones.

ANLISIS PRESCRIPTIVO
La mayora de los datos denominados Big Data resultan difciles de procesar o

consumir para cualquier persona, ofreciendo casi ningn valor por si solos. Sin embargo,
23
la informacin que se deriva de esos datos al aplicar tcnicas o herramientas de anlisis

apropiadas, si lo es.

El anlisis ms simple que podemos hacer sobre los datos es lo que se conoce como

Anlisis Descriptivo, cuyo propsito es resumir lo que sucede/sucedi de acuerdo a los

datos son en su mayora contadores. Se estima de hecho que el 80% de los anlisis que

las empresas hacen sobre los datos es de este tipo. Edwards Deming, llama a los problemas

que son resueltos con este tipo de anlisis, problemas enumerativos10.

El anlisis predictivo es el siguiente paso que podemos tomar para reducir los datos.
Utiliza un conjunto de tcnicas estadsticas, modelos de datos y minera de datos para

estudiar tanto datos actuales como histricos permitiendo realizar predicciones sobre el

futuro.

Vale la pena aclarar que el propsito del anlisis predictivo no es predecir lo que

va a suceder en el futuro, sino predecir lo que es ms probable que sucede de acuerdo a los

datos que se tienen. Todos los anlisis predictivos derivan de modelos probabilsticos por

naturaleza.

En estos estudios, normalmente se analizan datos que se tienen para predecir datos

que no se tienen. Edwards Deming llama a los problemas que son resueltos con este tipo

de anlisis como Problemas Analticos2.

El anlisis prescriptivo, un tipo de anlisis que ha emergido recientemente, lleva

este ltimo concepto un poco ms lejos al recomendar al menos una accin para tomar

junto con los posibles resultados que se podran obtener si se tomara esa accin.

El anlisis prescriptivo no predice un posible futuro, sino que predice mltiples

posibles futuros basndose en acciones. De hecho, en la clasificacin de Edwards Deming,

10 Some Theory of Sampling (1950), W. Edwards Deming.


24
los anlisis prescriptivos forman parte de los problemas analticos. Se requiere de un

modelo predictivo junto con 2 componentes adicionales: Datos que permitan inferir

acciones (normalmente se la refiere como actionable-data) y un sistema de

retroalimentacin que registre los resultados obtenidos por las acciones que se tomaron.

Segn Gartner11, existen 3 atributos claves necesarios para una implementar exitosa

de anlisis prescriptivo:

Precisin: Crear un sistema de mediciones y clasificacin ms preciso


Transparencia: Hacer que los anlisis sean parte del modelo de negocio

Decisivo: El objetivo debe prometer soportar la toma de decisiones

FACILIDAD DE USO Y FLEXIBILIDAD


La compaa no posee especialistas en estadstica ni en modelos estadsticos, por

lo cual es importante que la solucin posea un grado de facilidad suficiente para que

analistas de negocio puedan construir los modelos de datos y los modelos prescriptivos

necesarios. En su defecto, se podr recurrir a especialistas para confeccionar los modelos

iniciales o entrenar a los analistas de negocio y que la herramienta provea la flexibilidad

para poder adaptar, parametrizar o modificar los resultados de forma simple. Los costos

asociados para crear un grupo de recursos humanos de este tipo son prohibitivos para la

empresa en estos momentos.

11 InformationWeek (2013), Prescriptive Analytics And Big Data: Next Big Thing?,
http://www.informationweek.com/big-data/big-data-analytics/prescriptive-analytics-and-big-data-next-big-
thing/d/d-id/1109537
25
SOLUCIN COMO SERVICIO EN LA NUBE
La empresa actualmente no posee los recursos de infraestructura necesarios que se

requieren para implementar una solucin del tipo de Machine Learning y los costos

asociados a realizar una implementacin de este estilo son elevados. En tal caso, el riesgo

asociado a una inversin de tal tipo ser difcil de afrontar en caso de una implementacin

no exitosa. La empresa ya tiene experiencia en la implementacin de soluciones de este

tipo cuando intent desplegar la plataforma Knime12, resultando en una implementacin

costosa y fallida que no cumpli con las expectativas. Si bien el anlisis de tal
implementacin esta fuera del alcance de este documento, ser mandatorio que la solucin

propuesta pueda ser consumida como un servicio en la nube pblica que la empresa pueda

costear mientras lo utiliza (conocido como pay-as-you-use).

TRANSFORMAR PROCESOS DE NEGOCIO QUE SON AUTOMTICOS EN PROCESOS DE

NEGOCIOS INTELIGENTES

La compaa ya posee los elementos necesarios para automatizar los procesos en

cuestin, pero lo que buscamos es embeber inteligencia dentro de los mismos utilizando

algoritmos de Machine Learning calificados como de gran efectividad.

INTEGRACIN CON DYNAMICS AX


Los agentes del Call-center deberan de poder tomar ventaja de esta tecnologa de

Machine Learning e integrarla dentro de sus procesos de ventas telefnicos de forma de

12 Knime: https://www.knime.org/knime
26
mejorar los tiempos que lleva tomar los pedidos en este canal y adicionalmente potenciar

la capacidad de upselling y cross-selling de los mismos. La implementacin debe ser capaz

no solo de tomar datos provenientes de Microsoft Dynamics AX para modelar los datos

sino que adems proveer APIs que puedan ser consumidas por Dynamics en el momento

en que los agentes estn tomando pedidos.

Estado actual de las tecnologas de Machine Learning

Machine Learning es un conjunto de tecnologas que est comenzando a emerger

de forma rpida y que puede significar un gran riesgo para el negocio, as como un gran

benefici si se tiene xito. Segn Gartner13, su mercado ser extremadamente dinmico

para el 2020 y aquellas empresas que comiencen a realizar test de viabilidad sobre estas

tecnologas podrn alcanzar los beneficios que promete.

El principal beneficio de utilizar Machine Learning junto con profesionales de la

informacin es que la empresa tiene acceso a lo mejor de 2 mundos: productividad y

velocidad derivado de Machine Learning, y la capacidad de percibir y asimilar al cliente,

as como manejar la incertidumbre, derivados de las personas. Un claro ejemplo de esto


es IBM Watson quien es utilizado por mdicos para proveer respuestas a preguntas

utilizando lenguaje natural (NLQA Natural language question answering).

Gartner recomienda14 que las empresas comiencen a adoptar anlisis prescriptivo,

neurobusiness, NLQA, Big Data, Cloud Computing y anlisis predictivo en este momento,

donde estn lejos de ser fcilmente adoptadas por la competencia.

13Gartner (2014), Hype Cycle for Smart Machines


14Gartner (2015), Gartner Says Business Intelligence and Analytics Need to Scale Up to Support Explosive
Growth in Data Sources, http://www.gartner.com/newsroom/id/231391
27
F IGURA 2: G ARTNER ' S 2014 H YPE C YCLE FOR E MERGING T ECHNOLOGIES M APS -
WWW . GARTNER . COM / NEWSROOM / ID /2819918

Segn Forbes15, en general, Machine Learning tendr un impacto ms que

significativo en las economas de todas las industrias no solo en los prximos aos sino

dcadas. Las grandes compaas que mantienen grandes cantidades de informacin estarn

particularmente motivadas a extraer valor de esta informacin ahora que existen

herramientas disponibles para realizarlo de una forma escalable. Aunque tecnologas como

Deep Learning an estn en etapas tempranas segn Gartner, es claro que el valor de

mercado de Machine Learning est creciendo rpidamente.

Uno de las principales restricciones para implementar este tipo de soluciones yace

en la escasa disponibilidad de Data Scientists que puedan manipular y generar modelos

15 Forbes (2014), Deep learning and machine intelligence will eat the world
28
de datos, junto con su asociada dificultad de atraer suficientes desarrolladores para que

inviertan tiempo en aprender estas nuevas herramientas. Hoy en da no existe una API

estandarizada que los desarrolladores puedan aprender, por lo cual muchas compaa de

tecnologa estn actualmente peleando por la atencin de los desarrolladores para que

inviertan su tiempo en aprender la tecnologa que proponen.

Si bien muchas de estas compaas ofrecen implementaciones de software open-

source, como Apache Hadoop, no se trata de sistemas basados en APIs listas para consumir.

Esto hace que se requiera un esfuerzo de desarrollo ms elevado. Como alternativa a esta
problemtica, soluciones como MapR16 aparecen como alternativas para el desarrollo de

soluciones basadas en Hadoop por ejemplo.

TECNOLOGA

Tecnologas disponibles

Ser decisivo para el xito de la propuesta anteriormente planteada la seleccin de

la correcta tecnologa que nos provea las funcionalidades necesarias bajo un modelo de
costos soportable por la empresa mientras que nos permita mantenernos relevantes en los

prximos aos.

Para la seleccin inicial, evaluaremos los proveedores que se encuentran ubicados

en el cuadrante de lderes y visionarios segn Gartner en su reporte Magic Quadrant for

Advanced Analytics Platforms17. En este reporte, Gartner define a Advance Analytics

como el anlisis de cualquier tipo de datos utilizando sofisticados mtodos cuantitativos

16 MapR: https://www.mapr.com/
17 Gartner (2015), Magic Quadrant for Business Intelligence and Analytics Platforms
29
(como ser estadstica, minera de datos descriptiva y predictiva, simulacin y optimizacin)

para producir el conocimiento/entendimiento que los reportes de Business Intelligence no

pueden alcanzar.

F IGURA 3: M AGIC Q UADRANT FOR A DVANCED A NALYTICS P LATFORMS , G ARTNER , 2015

Los proveedores que evaluaremos sern RapidMiner, Alteryx, Microsoft, IBM y

SAS. En el apndice 2 se incluye una breve descripcin de cada uno de estos proveedores

en cuanto a sus ofertas, fortalezas y debilidades.

30
Evaluaremos a los proveedores basndonos en los requerimientos que se

mencionaron anteriormente en la seccin Drivers de la solucin en conjunto con el

Contexto tecnolgico de la empresa.

Es importante marcar que Knime no ser tomado en consideracin como posible

proveedor dado que la empresa ya intent en el pasado utilizar dicha tecnologa, obteniendo

resultados negativos.

Diseo

Dentro de las alternativas disponibles se elegir a Microsoft Azure Machine

Learning (Azure ML de ahora en adelante) dado que es el proveedor que mejor se encuadra

dentro de los requerimientos para la solucin que se necesitan y el contexto tecnolgico de

la compaa. La decisin est basada en los siguientes aspectos:

Implementacin como un servicio en la nube utilizando el modelo pay-as-

you-use.

o Azure ML posee un modelo de pago basado en nmero de

predicciones realizadas, horas de computo requeridas para computar

las predicciones y horas de tiempo utilizadas para generar los


modelos de datos.

o No ser necesario pagar por el trfico de datos que viaja desde el

Data Center de la compaa a Azure dado que solo se cobra el trfico

saliente. (Dato no menor dado que pensamos analizar volmenes de

datos elevados)

Disponibilidad de APIs web RESTful para obtener las recomendaciones

31
o Azure ML expone APIs web en formato REST donde es posible

ejecutar las predicciones y luego informar al modelo del resultado

de la prediccin (por ejemplo, si el usuario efectivamente compr o

no lo que le recomendamos). La disponibilidad de APIs de este tipo

reducir significativamente los costos asociados a la adaptacin del

sitio web de compras en lnea.

Disponibilidad de soluciones empaquetadas listas para usar para solucionar

aquellos escenarios que son comunes.


o Azure ML posee un Marketplace donde es posible encontrar

soluciones listas para usar, conocidas como Azure ML Apps. FBT,

Recomendaciones especficas para productos, recomendaciones

especficas para checkout y predicciones de clientes en riesgo

utilizarn estas soluciones empaquetadas.

Disponibilidad de entrenar modelos On-the-fly

o Sabemos que ser difcil modelar los datos de alguno de los

escenarios que contemplamos. Una funcionalidad conocida como

train on-the-fly, entrenamiento mientras se usa, permite entrenar

modelos a medida que se utilizan y as ir mejorando su ejecucin

con el tiempo. Esta es una caracterstica nica actualmente

disponible en Azure ML.

Disponibilidad de un lenguaje de programacin estndar

o Azure ML soporta el lenguaje R y Python. Ambos lenguajes

ampliamente adoptados en la industria. En nuestro caso, optaremos

por implementar el lenguaje R dada su relevancia no solo en la

industria, sino que tambin en el plano acadmico.


32
Facilidad de integracin con Microsoft Dynamics AX y soporte para tal

integracin.

o Dado que Dynamics y Azure son productos del mismo proveedor,

Microsoft, obtendremos una posicin favorable a la hora de

implementar la integracin de la solucin en la nube con nuestros

sistemas on-premise.

Disponibilidad del vendor para incorporar Data Scientists para elegir los

modelos analticos ms convenientes o desarrollar los modelos para los


escenarios que lo requieran.

o La compaa actualmente posee un contrato Premier con Microsoft,

el cual le permite el acceso a un conjunto de servicios y asistencia

diferenciada. Dentro de este marco, la empresa dispone de

capacitaciones sobre la tecnologa, acceso a Microsoft Consulting

Services para la implementacin de los escenarios planteados junto

con la posibilidad de escalar cualquier inconveniente que encuentre

a las personas que directamente trabajan con los productos para

obtener lineamientos de cmo solucionarlo.

Disponibilidad del vendor para entrenar al personal de la compaa en

Machine Learning y como operarlo.

o Al igual que en el punto anterior, el contrato que dispone la

compaa le permite acceder a este tipo de entrenamientos de forma

directa.

33
En el Apndice 2 se encuentra un detalle de los dems proveedores evaluados. Si

bien se realiz un anlisis profundo de cada proveedor, los principales bloqueantes/desafos

para la implementacin de otras soluciones fueron los siguientes:

RapidMinder: Si bien ofrece la mayora de las capacidades necesarias, el

producto no se alinea exactamente con el vertical de la empresa.

RapidMinder tiene grandes fortalezas que se rescatan en otros mbitos,

como ser el acadmico.

Alteryx: En el caso de este producto, es necesario contar con una


implementacin de Tableau o Qlik para explotar todas sus capacidades. La

compaa no posee ninguna de estas tecnologas actualmente ni tiene planes

de desplegarlas.

IBM: Si bien provee una solucin con una gran fortaleza, IBM requiere de

un esfuerzo de instalacin importante en donde, adicionalmente, los costos

son elevados para la compaa.

SAS: La compaa ve a SAS como una opcin a evaluar, sin embargo, el

prifncipal inhibidor aqu es la alta curva de aprendizaje que se requiere para

operar la plataforma.

Implementacin

Propondremos entonces implementar la solucin en cuestin utilizando Azure

Machine Learning. La implementacin constar de las siguientes etapas:

1. Preparacin de los Data Sets a utilizar en los modelos analticos

2. Preparacin del sitio web para retroalimentar los modelos analticos y

consumirlos
34
3. Construccin del servicio Clasificacin de clientes

4. Construccin del servicio Prediccin del carrito de compras

5. Construccin del servicio Productos que se compran en conjunto (FBT)

6. Construccin del servicio Recomendaciones especficas para un producto

7. Construccin del servicio Recomendaciones especficas para el carrito de

compras

8. Construccin del servicio Anlisis de clientes en riesgo

9. Adaptacin de Microsoft Dynamics AX


10. Adaptacin y rediseo del sitio web de compras en lnea.

Nota: En el apndice 1 se incorpora un resumen sobre la tecnologa que est


detrs de los sistemas de recomendaciones y los tipos que existen. Se recomienda
su lectura antes de leer las secciones que detallan la implementacin de los
modelos analticos.

PREPARACIN DE LOS DATA SETS A UTILIZAR EN LOS MODELOS ANALTICOS

Para la implementacin de la solucin propuesta ser necesario contar con la

informacin transaccional en un formato simple y rpido de consumir por Azure Machine

Learning. A la informacin que est lista para ser consumida por nuestros modelos en

Azure ML la denominaremos de ahora en adelante Data sets, diferencindose as de

cualquier otro repositorio de informacin.

Dado que los datos sern consumidos por Windows Azure, crearemos una base de

datos especfica de SQL Azure en Windows Azure donde realizaremos las tareas de

saneamiento y transformacin de la informacin para los diferentes modelos que

utilizaremos, siendo estos:

Transacciones de los clientes de los ltimos 3 aos


35
Informacin de clientes que han abandonado la empresa para irse a la

competencia.

La informacin fluir diaria y mensualmente segn corresponda desde el Data

Center de la compaa y ser importada a travs de Jobs de importacin de datos dentro de

SQL Azure. La siguiente figura esquematiza este diseo.

Cloud

Data Sets

Sitio pblico Azure ML


SQL Azure

Clientes que
Transacciones
abandonaron la empresa
(diarias)
(mensual)

Red corporativa
Clientes que
abandonaron la
Pedidos en linea empresa
Agente de Marketing
Dynamics AX

Call Center Agent

F IGURA 4: P ROCESO DE CARGA DE M ODELO DE DATOS EN A ZURE ML. E N ESTA FIGURA , EN ROJO ,
RED CORPORATIVA DE L A EMPRESA , EN AZUL , ELEMENTOS HOSPEDADO S EN W INDOWS A ZURE

36
La informacin sobre que clientes han abandonado la empresa para irse a la

competencia deber ser actualizada por el personal de marketing puesto que no queremos

ingresar al sistema informacin de clientes que han abandonado la empresa porque han

cerrado su negocio. Tampoco queremos que el sistema infiera cuando un cliente abandon

la empresa, sino que la misma ser quien se asegurar cual fue el motivo por el cual el

cliente ha dejado de comprar. Cuando un agente de marketing detecta que un cliente ha

dejado de realizar ordenes en los ltimos meses, se contacta con el mismo para investigar

que sucedi y actualizar el motivo de forma acorde.

PREPARACIN DEL SITIO WEB PARA RETROALIMENTAR LOS MODELOS ANALTICOS

Actualmente, el sitio web de la compaa implementa Google Analytics para

detectar y medir el comportamiento de los usuarios durante la compra. Mediciones como

cantidad de tiempo que pasa el usuario en cada pgina, tiempo total de la compra y cantidad

de clics que realizan son analizadas.

Sin embargo, nuestros modelos analticos requieren de una retroalimentacin para

poder detectar cuando una prediccin sobre un producto fue correcta y cuando no. Esto nos

permitir mejorar la relevancia de los sistemas de recomendacin a medida que se

comienzan a utilizar. Adicionalmente, algunos modelos sern entrenados On the fly, lo

que implica que no incorporaremos un data set para entrenar el modelo sino que el mismo

se ir generando a medida que se utilice. Para poder explotar todas estas caractersticas

deberemos adaptar el sitio web para poder enviar estas seales.

Las seales que implementaremos sern las siguientes:

Productos que son agregados al carrito de compra provenientes de la prediccin

del carrito

37
Sugerencias de FBT que son cliqueadas por el usuario

Recomendaciones especficas de productos que son cliqueadas por el usuario

Recomendaciones especficas al momento de checkout que son cliqueadas por

el usuario

Clic FBT

Clic recomendacin de carrito

Clic recomendacin de producto


Sitio pblico Azure ML
Clic prediccin del carrito

F IGURA 5: R ETROALIMENTACIN DE LOS SISTEMAS DE RECOMENDACIONES

CLASIFICACIN DE LOS CLIENTES

La compaa clasifica actualmente a los clientes segn el tipo de negocio: Cafs,

Bares, Restaurantes, Hoteles, etc. La empresa sabe que son mercados lo suficientemente

distintos en lo que respecta a productos que compran, patrones o comportamientos como

para analizarlos por separado. La compaa tambin sabe que lo que aplica para un

segmento en esta clasificacin no es extrapolable a otras.

Diseo del modelo

Dadas las necesidades de la empresa para clasificar a sus clientes, este modelo ser

generado utilizando Azure ML Studio y programado en R18.

18 The R Project for Statistical Computing, https://www.r-project.org/


38
Training data set

Basado en la experiencia de la empresa, las siguientes variables han sido

identificadas como principales en la clasificacin de clientes. El modelo le asignar un peso

a cada una de ellas dependiendo de la relevancia que exhiban en los datos (Cuales de ellas

explican mejor el comportamiento del cliente)

Si el cliente ha realizado compras o no en el mes anterior

Frecuencia de compra por mes

Productos individuales (productos nicos que han sido comprados en una sola

unidad)

Cantidad total de productos en el carrito (independientemente de su tipo)

Tamao del carrito (nmero de elementos en el carrito)

Margen bruto mensual, (Gross Margin)

Total de gastos del cliente mensual

Las variables anteriormente mencionadas sern extradas de Dynamics AX para

cada uno de los clientes.

La informacin de estas variables para los ltimos 3 aos es introducida dentro del

modelo de Azure ML para entrenarlo. Se espera que el modelo pueda predecir la

clasificacin de cada uno de los clientes basndose en los patrones ocultos de cada

segmento de clientes.

Comportamiento

Agregando la clasificacin detectada basado en el modelo anterior, se obtendrn

las siguientes categoras: Platinum, Diamond, Gold, Silver, Bronze y Cliente perdido. Note

aqu una diferencia sustancial con la prediccin de un cliente que se perder en el mes

39
siguiente, la cual es cubierta ms adelante y su objetivo es predecir que cliente ser

clasificado como Cliente Perdido en el prximo mes.

PREDICCIN DEL CARRITO DE COMPRAS

Objetivo: Predecir el carrito de compras antes de que el cliente comience a

comprar, mejorando la experiencia de usuario de forma radical. En este sentido, el servicio

mostrar los productos que el cliente que acaba de iniciar sesin en el sistema

probablemente compre hoy.

Diseo del modelo:

Dado la importancia y capacidades nicas que se pretenden de este servicio, este

modelo ser generado utilizando Azure ML Studio y programado en R19.

Training data set:

Utilizando 3 meses de historial de compras de cada cliente, generaremos un modelo

de datos aplicando minera de datos analizando: aquello que el cliente compr, en qu da

lo realiz, en que cantidades y con qu frecuencia. Los nuevos datos sobre historial de

compra ingresaran al modelo de forma diaria.

Comportamiento:

Desde el momento en que el sistema comienza a predecir el carrito de compras del

cliente, y hasta los prximos 30 das, cualquier producto que el cliente compre y que

alcance la cantidad y frecuencia de compra para este cliente ser eliminado de la

prediccin. Note que esto no significa que el cliente no encontrar el producto para

comprarlo, sino que no aparecer en la pgina de inicio.

19 The R Project for Statistical Computing, https://www.r-project.org/


40
El ranking que obtengan los productos dentro de la prediccin del carrito de

compras no solo estar afectado por lo inferido de aplicar minera de datos sino que tambin

afectados por las categoras a las que pertenecen y reglas especficas:

Afectados por reglas especficas: La compaa sabe que los clientes compran

determinadas categoras de productos en determinado orden. El modelo deber

detectar este patrn y respetarlo: Por ejemplo: Los clientes compran primero

productos bsicos y luego bebidas.

Afectados por categoras: Algunos productos tienden a comprarse en grupos,


a pesar de que la probabilidad de que sean comprada sea menor que la de otro

producto. La prediccin debe respetar este agrupamiento que realizan los

clientes al momento de comprar. Por ejemplo, el producto Coca-Cola Light

recibir un ranking tal que se muestre inmediatamente despus del producto

Coca-Cola, a menos que su probabilidad sea tan baja que rompa este vnculo

entre los dos productos. Este comportamiento es deseado porque no queremos

que el cliente tenga que recorrer el catalogo para comprar Coca-Cola Light solo

porque existe menos probabilidad de que lo haga.

PRODUCTOS QUE SE COMPRAN EN CONJUNTO (FRECUENTLY BOTH TOGETHER)

Objetivo: Aumentar lo que el cliente tena pensado comprar al sugerirle un

producto que otros cliente han comprado y que quizs nuestro cliente no est considerando.

La sugerencia aparecer en el momento que el cliente agregue un producto al carrito

de compras y ser exhibido inmediatamente a un costado del producto agregado.

41
Diseo del modelo:

Existen muchos modelos que ofrecen soluciones a este problema. Utilizaremos uno

de los algoritmos ms utilizados20, Frecuence Pattern Mining y el cual est disponible como

una solucin empaquetada en Azure ML Apps. Este algoritmo tiene la caracterstica de ser

eficaz y a su vez generar el modelo predictivo en tiempos prcticos para la cantidad de

datos que suministraremos. Con un catlogo de productos de 3000 elementos, la cantidad

de combinaciones posibles asciende a 27 billones. (Multiplicado por la cantidad

transacciones en los aos que queremos analizar). Si bien existen algoritmos ms

complejos que pueden hacer sugerencias ms precisas, la ventaja del elegido es que lo

puede realizar en tiempos prcticos.

Trainning data set:

Utilizaremos 3 aos de informacin de compras de todos los clientes de la

compaa.

Comportamiento:

El modelo predictivo deber sugerir solo 1 producto a comprar. Sin embargo, no

todos los productos generaran una sugerencia. Si la probabilidad de la sugerencia no es lo

suficientemente alta, el sistema podra sugerir productos que no tengan ninguna relacin.

Queremos evitar confundir al cliente distinguiendo las compras que son intencionales de

las que son casuales. Si el modelo no puede ofrecer una prediccin lo suficientemente

certera, entonces preferimos que no la haga.

20Pater, M (2007), The Benefits of Using Prefix Tree Data Structure in Multi-Level Frequent Pattern
Mining, ISBN: 978-1-4244-1608-0
42
RECOMENDACIONES ESPECFICAS PARA UN PRODUCTO

Objetivo: Mostrar en la pgina de detalle del producto recomendaciones de

productos que el cliente puede estar necesitando y que son especficas para este producto.

Diseo del modelo:

Aplicaremos un anlisis del tipo Collaborative Filterring usando un modelo de

Latent Factor21. Es uno de los algoritmos ms potentes que se basa en caracterizar al cliente

y al producto en una cantidad de factores o atributos que son inferidos del conjunto de

datos y que gobiernan el comportamiento del cliente. Esto implica que el modelo no

necesariamente busca patrones en los elementos que recomienda.

Otra ventaja de este modelo es que requiere ajustes para la industria que son

mnimos ya que se comporta de forma mayoritariamente agnstica al vertical a aplicar.

Esta solucin est disponible como una solucin empaquetada en Azure ML Apps.

Los productos nuevos (cold items) sern modelados utilizando las caractersticas

de los productos (atributos) para complementar la solucin de Collaborative Filtering.

Trainnning data set:

Utilizaremos 3 aos de informacin de compras de clientes.

Comportamiento:

El algoritmo ofrecer recomendaciones de productos que inferimos que el cliente

no encontrara de otra manera (es decir, que no es ofrecido por alguno de los restantes

sistemas de recomendaciones).

La diversidad de recomendaciones es importante para la compaa. El modelo

ofrecer una variedad de recomendaciones basadas en diferentes atributos. Por ejemplo, en

el caso del aceite anteriormente enunciado, no queremos que el sistema recomiende 5

21 Ver apndice 1
43
marcas de papas fritas a las cuales frer, queremos que ofrezca 1, y luego, por ejemplo, alas

de pollo que es probable que tambin las pueda usar para frer.

RECOMENDACIONES ESPECFICAS PARA EL CARRITO DE COMPRAS

Objetivo: Generar una lista de recomendaciones que se exhiben al cliente justo en

el momento antes de que el cliente confirme y enve el pedido.

Diseo del modelo:

Aplicaremos un anlisis del tipo Collaborative Filterring usando un modelo de

Latent Factor, al igual que en el modelo anterior, pero en este caso las predicciones estarn

ajustadas por el contenido que tiene el carrito de compras del cliente en ese momento. Este

modelo est disponible como una solucin empaquetada en Azure ML Apps.

Sin embargo, al tener que ajustar las recomendaciones basados en el carrito de

compras del cliente al momento de confirmar la compra, el modelo debe de poder

entrenarse con los diferentes tipos de carritos de compras que se pueden dar. Esto ser

difcil de conseguir o generar dada que la cantidad de posibles combinaciones de carritos

que se pueden dar es extremadamente elevada.

Utilizaremos la caracterstica de Train on the fly, la cual permite entrenar el modelo


a medida que se comienza a utilizar. Esto solucionar el problema de tener que identificar

los tipos de carritos de compra de antemano. Esta caracterstica es nica en Azure ML y

utiliza la tecnologa de Xbox recomendation system22, uno de los sistemas de

recomendaciones ms avanzados en el mundo.

22Koenigstein, N & Paquet, U & Nice, N & Schleyen, N, The Xbox Recommender System, Tel Aviv
University, www.eng.tau.ac.il/~noamk/papers/KNPS12.pdf
44
Trainning data set:

No ser necesario un training data set dato que utilizaremos la caracterstica de

Train on the fly

Comportamiento:

El modelo recomendar productos que el cliente podra llegar a comprar en esta

etapa especifica. Se recomendarn 5 productos como mximo.

ANLISIS DE CLIENTES EN RIEGO

Objetivo: Generar una lista de los clientes con una alta probabilidad de abandonar

la empresa el mes siguiente.

Diseo del modelo:

Antes de generar el modelo analtico, se debe definir que significa que un cliente

este en riesgo para poder identificarlos y poder aprender los patrones de tales clientes.

La empresa sabe dada su experiencia que los clientes que compran de forma regular en el

sitio lo hacen mensualmente, varias veces en el mes y comprando varios productos en cada

una de sus compras. En la mayora de los casos, si un cliente no compra en un mes dado es

muy poco probable que vuelva a comprar en el mes siguiente. Esta ser nuestra definicin

de cliente en riesgo.

El algoritmo utilizado ser del tipo Classification que ser entrenado con un

conjunto de datos en los cuales marcaremos cuales clientes realmente se fueron a la

competencia y cules no. El algoritmo descubrir los patrones que diferencian a un grupo

de clientes de los restantes.

45
Esta implementacin est disponible como una solucin empaquetada en Azure ML

Apps. La tecnologa que est detrs es boosted decision trees23, tecnologa que es utilizada

por el motor de bsquedas Bing y cuyos resultados son ampliamente mejores que lo de

algoritmos ms complejos.

Trainning data set:

El modelo se entrenar utilizando informacin histrica de las transacciones de los

clientes en los ltimos 3 aos. La compaa marcar manualmente aquellos clientes que

realmente se fueron a la competencia y cules no.

Luego, utilizando la informacin de los ltimos 3 meses de las transacciones de

cada cliente, predeciremos que clientes se irn a la competencia en el prximo mes. Los

datos deben ingresar al modelo mensualmente.

Comportamiento:

El modelo generar una lista de los clientes que se irn a la competencia en el

prximo mes, utilizando la informacin de los ltimos 3 meses de las transacciones de cada

uno de ellos. Dos acciones sern ejecutadas con tal lista:

Acciones pasivas: El sistema asignar promociones especiales para el cliente

la prxima vez que inicie sesin en el portal. La promocin asignada depender


del segmento en al que se asign al cliente.

Acciones activas: El personal de marketing recibir el informe de los clientes

que se irn a la competencia junto con la probabilidad asociada con ello. De

esta forma, se podrn tomar decisiones ms especficas que el personal de

marketing considere.

23 Microsoft Research, Uncertainty in Artificial Intelligence Boosted Decision Trees for Deep Learning,
http://event.cwi.nl/uai2010/papers/UAI2010_0282.pdf
46
INTEGRACIN CON MICROSOFT DYNAMICS AX

Como se mencion anteriormente, ser importante que esta misma tecnologa est

disponible para los agentes en de Contact Center a la hora de atender pedidos de forma

telefnica. Dado que, desde su concepcin, todos los modelos predictivos se generaron

como servicios, los mismos sern invocados desde Dynamics AX y consumidos

directamente.

Para esto se conectar la API de recomendaciones de Dynamics AX con los

endpoints expuestos en Azure ML. La siguiente figura muestra que servicios estarn

integrados en Dynamics AX y en qu orden sern procesados.

F IGURA 4: S ERVICIOS INTEGRADOS DENTRO DE D YNAMICS AX. E N ROJO , PROCESOS QUE SUCEDE N
DE FORMA AUTOMTICA ; EN VERDE , PROCESOS EN LOS QUE SE REQUIERE LA INTE RACCIN DEL
ASISTENTE DE VENTAS CON EL CLIENTE .

47
ADAPTACIN Y REDISEO DEL SITIO WEB DE COMPRAS EN LNEA

Redisearemos el sitio para que sea capaz de consumir las predicciones que

realizamos desde Azure ML. Los siguientes servicios sern consumidos desde el sitio:

Prediccin del carrito de compras

Productos que se compran en conjunto

Recomendaciones especficas para un producto

Recomendaciones especficas para el carrito de compras

Estimacin de costos y beneficios

PARMETROS

A continuacin se muestran los principales parmetros que se tienen en cuenta para

el clculo de costos de la solucin y los beneficios.

48
Costos de Microsoft Azure Machine Learning:

Caracterstica Precio24
Seat de Azure ML /mes $9.9900
Precio por hora de computo $2.0000
Precio por milisegundo de computo $0.0000005556
Precio cada 1000 predicciones $0.5000
Precio de uso de ML Studio / hr. $1.0000
SQL Server database / Mes / 1 GB $1.5100
Egreso de datos / Mes / 100 GB $8.2700
Cargos totales por 1000 predicciones de 1 milisegundo $0.5006
Cargos totales por 1000 predicciones de 50 milisegundos $0.5278
Cargos totales por 1000 predicciones de 500 milisegundos $0.7778
Cargos totales por 1000 predicciones de 1 segundo $1.0556

C UADRO 1: C OSTOS DE M ICROSOFT M ACHINE L EARNING (A ZURE ML)

Nota: Para mantener el clculo simple y dado que los costos asociados a egreso
de datos son despreciables y que Azure no cobra por el trfico de ingreso de datos
ni interno dentro la nube, no estamos contemplando en la estructura de costos
gastos relacionados con transferencia de datos.

Estimaciones de consumo de la solucin:

Parmetros de consumo de la solucin Valores (mensuales)


Usuarios para modelado de datos 5
Data sets (GB) 100
Cantidad total de predicciones / mes 1,610,001
Predicciones de carrito de compras 850,000
Predicciones de FBT (*) 135000
Predicciones especificas de productos (*) 540000
Predicciones de productos para checkout (**) 85,000
Predicciones de clientes que abandonarn la
empresa 1
C UADRO 2: E STIMACIONES DE CONSU MO DE LA SOLUCIN

24 Costos expresados en Dlares Estadounidenses (USD) segn Abril 2015, publicados en


http://azure.microsoft.com/en-us/pricing/details/machine-learning/
49
(*) Es importante marcar que, con el objetivo de mantener los costos controlados,
las predicciones de FBT y especficas de producto sern almacenadas en cache de
forma diaria. Esto reducir la cantidad de predicciones sin impactar la eficacia.
(**) 85000 pedidos mensualmente procesados

Estimaciones de beneficios de la solucin segn KPI:

Parmetros para el clculo de beneficios Valores


Facturacin total anual $ 185.000.000,00
Cantidad de clientes 45000
Estimacin de aumento de ventas 3%
Estimacin de Lift de efectividad en retencin de clientes 3
Estimacin de aumento de ganancias por rentabilidad 2,25%
Estimacin de captacin de nuevos clientes 1%

C UADRO 3: E STIMACIONES DE BENEFICIOS DE LA SOLUCIN SEGN KPI ESPERADOS

ESTRUCTURA DE COSTOS Y BENEFICIOS

Utilizando los parmetros enunciados anteriormente, se procede con el clculo de

costos y beneficios para la solucin propuesta:

50
Categorias Flujo ao 1 Flujo ao 2 Flujo ao 3
Adpatacin de sistemas existentes ($ 70,000.0)
Adaptacin de Dynamix AX ($ 20,000.0)
Adaptacin del sitio web ($ 50,000.0)
Capacitacin del personal ($ 50,000.0)
Capacitaciones de Microsoft ($ 50,000.0)
Contruccin de modelos predictivos ($ 252,811.4) ($ 1,812.0) ($ 1,812.0)
Creacin de los modelos predictivos ($ 200,999.4)
Consultora de ML ($ 200,000.0)
Herramienta de modelado de datos ($ 999.4)
Saneamiento de informacin y agregacin ($ 51,812.0) ($ 1,812.0) ($ 1,812.0)
Importacin de datos ($ 50,000.0)
SQL Azure Database ($ 1,812.0) ($ 1,812.0) ($ 1,812.0)
Mantenimiento de modelos predictivos ($ 50,839.4) ($ 50,839.4) ($ 50,839.4)
Consultora de ML ($ 50,000.0) ($ 50,000.0) ($ 50,000.0)
Herramienta de modelado de datos ($ 839.4) ($ 839.4) ($ 839.4)
Hora de Azure ML Studio ($ 240.0) ($ 240.0) ($ 240.0)
Seats de Azure ML Studio ($ 599.4) ($ 599.4) ($ 599.4)
Utilizacin de los sistemas de prediccin ($ 17,455.0) ($ 17,455.0) ($ 17,455.0)
Costo de transacciones de recomendaciones ($ 17,455.0) ($ 17,455.0) ($ 17,455.0)
Predicciones de carrito de compras ($ 10,766.7) ($ 10,766.7) ($ 10,766.7)
Predicciones de FBT ($ 855.0) ($ 855.0) ($ 855.0)
Predicciones de productos para checkout ($ 793.3) ($ 793.3) ($ 793.3)
Predicciones especificas de productos ($ 5,040.0) ($ 5,040.0) ($ 5,040.0)
Grand Total ($ 441,105.8) ($ 70,106.4) ($ 70,106.4)

C UADRO 4: E STRUCTURA DE COSTOS DE IMPLEMENTACIN DE LA SOLUCIN

Categorias Flujo ao 1 Flujo ao 2 Flujo ao 3


Retencin de clientes $ 493.333,3 $ 493.333,3 $ 493.333,3
Nueva capacidad de retencin de clientes $ 493.333,3 $ 493.333,3 $ 493.333,3
Satisfaccin de clientes $ 1.850.000,0 $ 1.850.000,0 $ 1.850.000,0
Nuevos clientes captados $ 1.850.000,0 $ 1.850.000,0 $ 1.850.000,0
Upselling y cross-selling $ 1.248.750,0 $ 1.248.750,0 $ 1.248.750,0
Aumento del margen de ganancia de productos $ 416.250,0 $ 416.250,0 $ 416.250,0
Aumento del monto del carrito de compras $ 832.500,0 $ 832.500,0 $ 832.500,0
Grand Total $ 3.592.083,3 $ 3.592.083,3 $ 3.592.083,3

C UADRO 5: E STRUCTURA DE BENEFIC IOS DE LA SOLUCIN

51
Rendimiento financiero de la solucin

(*)

C UADRO 6: RENDIMIENTO FINANCIERO DE LA SOLUCIN


(*) VAN CONSIDERANDO UNA TAZA DE DESCUENTO DEL 9%

Es importante notar que elevado valor de la tasa de retorno de la inversin (ROI)

en el cuadro anterior se debe a la decisin de implementar la propuesta utilizando una


solucin de nube pblica bajo el modelo pay-as-you-use. Este comportamiento de la tasa

de retorno es intrnseco a implementaciones con un nivel de inversin muy bajo, como es

este caso.

CRONOGRAMA PROPUESTO DE IMPLEMENTACIN

A continuacin, se muestra el cronograma propuesto para la implementacin de la

solucin anteriormente descripta.

Segn la planificacin, el proyecto tendr un tiempo estimado de implementacin

de 6 meses, aunque la misma se realizar de forma incremental hasta impactar al 100% de

los clientes que utilizan el canal web y la va telefnica, constando en total de 3 rondas de

implementacin.

52
53
CONCLUSIONES

Las capacidades que ofrece Machine Learning al integrarlas en los procesos de

negocio presentan grandes oportunidades para la empresa con una inversin controlada y

de bajo riesgo. Con el monitoreo correcto del desempeo de la solucin y la mejora

continua, es posible dar con un modelo de datos predictivo con un alto grado de efectividad.

Nuestra compaa necesita recuperar el toque personal que ha sabido cultivar

durante mucho tiempo. Se trata de la habilidad de conocer al cliente a un nivel ms ntimo,

aprendiendo entonces sus gustos, preferencias, necesidades, realidades y deseos. Machine

Learning es una tecnologa que integrada de la forma correcta permite prestar atencin a

las pequeas cosas, que al final del proceso no son tan pequeas de forma escalable,

en todos los canales y sobre todo, adaptable en tiempo real.

54
BIBLIOGRAFA

W. Edwards Deming (1950), Some Theory of Sampling

Harvard Business School Press (1999), Adaptive Enterprise: Creating and Leading
Sense-and-Respond Organizations

Information Week (2014), Prescriptive Analytics and Big Data is the next big thing?,
http://www.informationweek.com/big-data/big-data-analytics/prescriptive-analytics-and-
big-data-next-big-thing/d/d-id/1109537

Information Week (2015), Gartner Advanced Analytics Quadrant 2015: Gainers, Losers,
http://www.informationweek.com/big-data/big-data-analytics/gartner-advanced-
analytics-quadrant-2015-gainers-losers/d/d-id/1319192

Gartner (2014), Hype Cycle for Smart Machines

Gartner (2015), Magic Quadrant for Advanced Analytics Platforms

Forbes (2014), Deep learning and machine intelligence will eat the world

Barnes, F, Azure Machine Learning, Microsoft Press

Koenigstein, N & Paquet, U & Nice, N & Schleyen, N, The Xbox Recommender System,
Tel Aviv University
www.eng.tau.ac.il/~noamk/papers/KNPS12.pdf

Microsoft Research, Uncertainty in Artificial Intelligence: Boosted Decision Trees for


Deep Learning,
http://event.cwi.nl/uai2010/papers/UAI2010_0282.pdf

Yahoo Research & AT&T Labs (2009), Matrix factorization techniques for recommender
systems

Wikipedia, Lift (Data Mining),


https://en.wikipedia.org/wiki/Lift_(data_mining)

Crawley, J (2013), The R Book, Willey

Pater, M (2007), The Benefits of Using Prefix Tree Data Structure in Multi-Level
Frequent Pattern Mining, ISBN: 978-1-4244-1608-0

Harding, Ford (2002). Cross-Selling Success


55
Yamaguchi University (2011), Neural Information Processing

User Modeling and User-Adapted Interaction (2012), Evaluating recommender systems


from the user's perspective: survey of the state of the art

Beel, J, Stefan, G (September 2013), Sponsored vs. Organic: Recommendations and the
Impact of Labeling

56
APENDICE 1

Sobre los sistemas de recomendaciones

Los sistemas de recomendaciones, y en general el campo de Machine Learning, se

han convertido en un rea de aplicacin bastante contundente en los ltimos tiempos. Estos

son utilizados tanto por investigadores como por empresas en una gran cantidad de

verticales y aplicaciones para descubrir patrones o predecir resultados.

A alto nivel, un sistema de recomendacin es un algoritmo que toma un conjunto

de datos de entrada, Training Data Set, realiza un modelado de los datos utilizando

metodologas especficas de probabilidad y estadstica y genera como salida un modelo que

encapsula el conocimiento o inteligencia que se obtuvo de los datos. El modelo puede ser

utilizado luego sobre un nuevo conjunto de datos, test data, y generar resultados para esos

nuevos datos, normalmente denominados predicciones o clasificaciones (dependiendo de

la aplicacin en cuestin).

A grandes rasgos, los sistemas de recomendaciones pueden estar basados en una de

dos estrategias. La estrategia de Content Filtering, la cual crea perfiles para cada usuario o

producto para caracterizar su naturaleza. Por ejemplo, un perfil de una pelcula en un

sistema de alquiler de pelculas podra incluir atributos relacionados con el gnero, los

actores que participan, la popularidad que alcanz, etc. Los perfiles de los usuarios en tal

sistema podran permitir asociar entonces usuarios con determinadas pelculas (productos).

Este tipo de estrategias podran requerir combinar informacin externa al sistema que

podra no estar disponible o ser difcil de conseguir.

Una estrategia alternativa a Content Filtering se apoya solamente en el

comportamiento del usuario en el pasado por ejemplo, transacciones o calificaciones

57
anteriores que hizo el usuario sin requerir la creacin de perfiles de forma explcita. Esta

estrategia se la conoce como Collaborative Filtering, un trmino ideado por los

desarrolladores de Tapestry25, el primer sistema de recomendaciones. Collaborative

Filtering analiza la relacin que existe entre los usuarios y las interdependencias con los

productos para identificar nuevas tuplas usuario-producto. La principal caracterstica de

esta estrategia es que no es especifica de un vertical de negocio, y a pesar de ello resolver

conjuntos de datos cuyos parmetros son elusivos o difciles de perfilar utilizando Content

Filtering.
Mientras que generalmente ejecuta de forma ms precisa que las tcnicas de

Content Filtering, Collaborative Filtering sufre del problema que normalmente se lo

denomina como arranque en fro, haciendo alusin a la incapacidad de estas tcnicas de

resolver situaciones donde interactan usuarios o productos desconocidos hasta el

momento.

Las dos principales formas de aplicar Collaborative Filtering son a travs de los

mtodos conocidos como Neighborhood y Latent Factor model. Los mtodos de

Neighborhood estn centrados en computar las relaciones que existen entre los productos

o, alternativamente, entre los usuarios. Esta tcnica evala las preferencias de los usuarios

para un producto en particular a partir de la evaluacin de otros productos vecinos del

mismo usuario. Los productos vecinos se definen como aquellos productos que tienden a

obtener calificaciones similares cuando son clasificados por el mismo usuario.

El modelo de Latent Factor es una tcnica alternativa a la anterior que trata de

explicar la clasificacin que logran los productos al caracterizar tanto a los productos como

a los usuarios en, digamos de unos 20 a 100 atributos que son inferidos de los patrones de

25 Concepto ideado por Doug Terry para el sistema Tapestry Information System, Xerox PARC
58
clasificacin. En esencia, estos atributos constituyen un sinnimo computarizado para lo

que normalmente solemos llamar gneros musicales, si se permite la extrapolacin. 26

26 Matrix factorization techniques for recommender systems, Yahoo Research, AT&T Labs, August 2009
59
APENDICE 2

Tecnologas disponibles para implementacin de Machine Learning 27, 28

RAPIDMINER
RapidMiner ofrece una plataforma disponible tanto como servicio en la nube as

como tambin como una plataforma cliente/servidor de cdigo abierto. La versin

comercial tiene la capacidad de conectarse con data sets de mayor tamao y de mayor

variedad. Se trata de una plataforma fcilmente extensible a travs de lenguajes de

programacin, libreras de terceros, plataformas de BI y aplicaciones web.

La mayora de los usuarios de esta plataforma la escogen por su facilidad de uso,

implementacin y esquema de licenciamiento. Su extensibilidad y profundas capacidades

analticas son otros puntos fuertes de este proveedor.

Sin embargo, a pesar de tener un gran nmero de usuarios, RapidMiner es

principalmente utilizado en el mbito cientfico-acadmico. Su capacidad para entregar

valor a negocios puede ser difcil de alcanzar debido a que los entrenamientos disponibles

de esta plataforma no son de calidad y existe una falta de documentacin del producto.

ALTERYX
Alteryx provee una plataforma para la integracin de datos y el anlisis avanzado

de los mismos prometiendo fusionar tanto repositorios internos, de terceros como

informacin almacenada en la nube para luego analizarlos utilizando herramientas

predictivas. Esto se puede alcanzar sin ningn tipo de programacin, siendo

particularmente fuerte en industrias de comunicaciones.

27 Fuente: Gartner (2015), Magic Quadrant for Advanced Analytics Platforms


28 Informacin segn Febrero 2015
60
Los usuarios de Alteryx destacan la facilidad de adopcin y corta curva de

aprendizaje al disponer de una moderna interfaz de usuario. Entre otras fortalezas se

encuentran el soporte del lenguaje de programacin R junto con sus capacidades de

escalamiento que se alcanzan gracias a Apache Spark. Sin embargo, debido a su falta de

soporte nativo para la visualizacin de datos, Alteryx requiere la implementacin de

Tableau o Qlik para poder hacer uso de la totalidad de sus capacidades, siendo este uno de

los puntos ms criticados por sus usuarios.

MICROSOFT
Microsoft ofrece una solucin de BI y anlisis de datos competitiva y en expansin.

Esta solucin est basada en las capacidades de Office 2013, capacidades de administracin

de datos de SQL Server, la colaboracin que viene de la mano de la plataforma SharePoint

y un conjunto de servicios de anlisis de datos disponibles en su nube pblica Windows

Azure.

Microsoft ha logrado realizar gran progreso en sus capacidades para entregar

herramientas para los usuarios de negocios junto con una plataforma empresarial acorde.

Las capacidades de descubrimiento de datos estn siendo mejoradas agresivamente a travs

de su oferta de Power BI la cual agrega referenciamiento geoespacial 3D, generacin de

consultas en un lenguaje comn y self-service ETL que pueden ser aplicadas tanto a datos

internos como externos. Los productos Insight HD y Azure Machine Learning ofrecen

capacidades nicas de anlisis de datos avanzadas disponibles a consumir como servicios.

A pesar de que la funcionalidad de los productos de Microsoft ha ido mejorando y

que actualmente pueden ofrecen una gran variedad de funcionalidades, muchos clientes

reportan que el principal obstculo que visualizan para implementar estas soluciones tiene

que ver con la falta o debilidad de ciertas funcionalidades. Mobile, visualizacin interactiva
61
y administracin de la metadata son las principales falencias que se reportan. En particular,

Microsoft est por detrs de la mayora de los dems vendors de BI en lo que respecta a

capacidades de BI para mviles.

IBM
IBM ofrece un abanico completo de capacidades de anlisis de datos que incluyen

BI empresarial, administracin de la performance y capacidades de anlisis de datos

avanzadas complementados con un completo conjunto de servicios que estn listos para
ser implementados por los clientes en sus soluciones sea cual sea el dominio, industria o

ubicacin geogrfica.

La plataforma Cognos BI maneja algunos de las instalaciones de BI ms grandes

que los clientes han reportado. Otra evidencia de las capacidades empresariales de IBM es

que clientes la clasifican dentro de las 3 ms relevantes empresas en trminos de tamao

de las implementaciones y permanencia-homogeneidad dentro de las organizaciones. Dos

de las caractersticas mejor consideradas de IBM son administracin de metadata e

infraestructura y administracin de la plataforma.

La carencia de ventajas fciles de reconocer sobre sus competidores podra llegar a

comprometer el futuro de IBM en el plano de anlisis de datos. Watson Analytics es la

respuesta de IBM a este inconveniente dado que le permite diferenciarse por s mismo

integrando estas capacidades con su plataforma IBM Cognos y combinar sus fortalezas

empresariales con algunas caractersticas ms innovadoras y capacidades de

descubrimiento de datos ms amigables para los usuarios. Los clientes identifican varias

limitaciones que impiden la implementacin de la solucin de IBM, la ms importante, los

costos del software, reportado por el 40% de los clientes.

62
SAS
Con un porfolio de ms de 40.000 clientes y un slido ecosistema de Partners, SAS

ha sido la opcin ms comn entre las organizaciones que buscan anlisis avanzado de

datos. SAS tiene fortalezas principalmente en los sectores de banca, seguros, servicios y

agencias gubernamentales.

El producto de SAS es uno de los ms extensos en la industria, principalmente

potenciado por el amplio rango de tcnicas de anlisis de datos que se encuentran


implementadas en el lenguaje de cdigo abierto R.

Los usuarios identifican a la performance de la plataforma como uno de sus mejores

atributos, junto su escalabilidad y confiabilidad. Sin embargo, SAS es una plataforma que

dispone de un conjunto de productos con capacidades similares que muchas veces son

complejos de integrar. Adicionalmente, la elevada curva de aprendizaje de los productos

de SAS es una de las crticas ms fuertes a este proveedor.

Finalmente, una compleja y costosa estructura de licenciamiento es otro de los

bloqueantes ms fuertes que las empresas encuentran en los productos de SAS y por el

cual, en muchas ocasiones, deciden evaluar productos similares de la competencia.

KNIME
Knime ofrece una plataforma gratuita, de cdigo abierto y basada en su aplicacin

de escritorio para el anlisis avanzado de datos. Adicionalmente, tambin ofrece una

versin comercial basada en una arquitectura cliente-servidor o tambin disponible en la

nube que adicionalmente incluye funcionalidades empresariales. Knime compite en una

amplia rama de verticales, aunque siendo fuerte en el sector de salud, gobierno, educacin,

banca y sector comercial.


63
La principal ventaja que encuentran los usuarios de este proveedor es la apertura de

la plataforma para/con otras tecnologas, permitindoles utilizar a la misma como un

framework de anlisis de datos. La plataforma es capaz de entregar gran valor al negocio.

A pesar de tener un alto nmero de usuarios, la plataforma carece de visibilidad

fuera de la comunidad de minera de datos. Adicionalmente, la falta de capacitaciones de

calidad junto con una pobre documentacin hace difcil su implementacin en muchos

casos. Finalmente, uno de los puntos ms negativos de la plataforma es su interfaz de

usuarios, la cual requiriere de una mejora ciertamente segn sus usuarios.

64

Вам также может понравиться