Вы находитесь на странице: 1из 14

FACULTAD DE INGENIERA

ESCUELA ACADMICO PROFESIONAL


DE INGENIERA DE SISTEMAS

EXPERIENCIA CURRICULAR DE
FILOSOFA

TTULO

APLICACIN DE TCNICAS DE DATA MINING EN EMPRESAS COMERCIALES


EN SJL

AUTORA
Vela Oxoln, Isamar April

ASESOR
Manuel Inga

LIMA PER
2017
INDICE

INTRODUCCIN ............................................................................................................................ 4

ARGUMENTACIN ........................................................................................................................ 6

1. DATA MINING ................................................................................................................... 6

2. TECNICAS DE DATA MINING ............................................................................................. 7

2.1. TCNICAS PREDICTIVAS ............................................................................................ 8

2.1.1. SERIES TEMPORALES......................................................................................... 9

2.1.2. RBOLES DE DECISIONES .................................................................................. 9

2.1.3. PREVISIN LOCAL ........................................................................................... 10

2.2. TCNICAS DESCRIPTIVAS ........................................................................................ 10

2.2.1. CLUSTERNING (SEGMENTACIN) ................................................................... 11

2.2.2. REGLAS DE ASOCIACIN ................................................................................. 11

3. APLICACIN DE LAS TECNICAS DE DATA MINING EN EMPRESAS COMERCIALES......... 12

CONCLUSIONES ........................................................................................................................... 14

BIBLIOGRAFA ............................................................................................................................. 15

3
INTRODUCCIN

Una de las fuentes de informacin ms importantes de toda empresa es la que est almacenada
en la base de datos. Las empresas en la actualidad almacenan una gran cantidad de informacin,
que con la automatizacin se ha vuelto ms efectivo de recoger y rpido de almacenar. Estos
nos permiten conocer el pasado y con ello predecir el futuro. Las tcnicas del Data minning
aportan al anlisis de los datos almacenados, con el objetivo de tomar decisiones; las cuales son
aprovechadas, entre una de ellas, por las empresas comerciales.

Con el fin de mantener a los clientes interesados y satisfechos con los servicios prestados por las
empresas comerciales, que es un sector de alta competitividad, el uso correcto de tcnicas de
Data Minning aporta mejor calidad y soporte a las decisiones que se desea tomar. Puesto que,
el uso de estas facilita el acceso a toda la informacin necesaria y existente en la base de datos,
con la cual el anlisis ser ms efectivo.

Sin embargo, la minera de datos cuenta con diversas tcnicas tanto para el descubrimiento de
informacin en la base datos como para el apoyo en el anlisis y toma de decisiones. Entonces,
cul es la tcnica de data minning indicada que debe usar una empresa comercial para poder
aprovechar la informacin que tiene de sus clientes con la intencin de mantenerlos satisfechos
con su servicio y que se mantengan fieles a la empresa?

El objetivo general del presente ensayo es:

Identificar la tcnica de data minning indicada que debe usar una empresa comercial
para poder aprovechar la informacin que tiene de sus clientes con la intencin de mantenerlos
satisfechos con su servicio y que se mantengan fieles a la empresa.

As como tambin los siguientes objetivos especficos:

Definir las diferentes tcnicas de data mining existentes y relacionarlo con su aplicacin
en empresas comerciales.
Justificar la tcnica de data minning que se considere ms indicada para su uso en una
empresa comercial.
El sector comercial es de alta competitividad, el uso de tcnicas de minera de datos es de gran
utilidad para lograr muchos de sus objetivos porque establece tendencias. Este ensayo tiene la
finalidad de identificar la tcnica ms apropiadas para las empresas comerciales, comparando
cada una de ellas. Esto mejorara la relacin que existe entre la empresa y sus clientes, de tal
forma que se preste un mejor servicio; as como tambin sera beneficio para la empresa, ya que
aumentaran las ventas e ingresos econmicos.

Para el desarrollo del presente ensayo tendr como primer tema a desarrollar: la definicin de
Data Mining, como segundo tema: tcnicas de Data Mining y como ltimo tema: la aplicacin
de tcnicas de Data Mining en las empresas comerciales; con el fin de manifestar en las
conclusiones la respuesta a la pregunta definida.

5
ARGUMENTACIN

1. DATA MINING

En la actualidad, con la globalizacin y todos los avances tecnolgicos que ayudan a reducir la
mano de obra, las empresas almacenan mayor cantidad de informacin en los diferentes
sistemas de informacin que utilizan. Esta informacin es valiosa para la toma de decisiones. Es
por ello que se requiere obtener lo mejor de toda la informacin almacenada mediante procesos
como el Data Mining.

Segn Prez y Santn en su libro Minera de datos: tcnicas y herramientas (2007), definen
Data Mining como un proceso de descubrimiento de nuevas y significativas relaciones,
patrones y tendencias al examinar grandes cantidades de datos (p. 1).

Es decir, todos los datos que ingresan a una organizacin van a ser almacenadas, procesadas y
analizadas con el fin de dar informacin relevante y til. Esto gracias al uso herramientas de Data
Mining que ayuden a encontrar patrones o comportamientos de datos, as como tendencias.

As tambin, Molina y Garca en su libro Tcnicas de Anlisis de Datos (2006), lo define como:

Minera de Datos es un trmino genrico que engloba resultados de investigacin, tcnicas y


herramientas usadas para extraer informacin til de grandes bases de datos. Si bien Minera de Datos
es una parte del proceso completo de KDD, en buena parte de la literatura los trminos Minera de Datos
es usado comnmente por los estadsticos, analistas de datos, y por la comunidad de administradores
de sistemas informticos como todo el proceso del descubrimiento, mientras que el trmino KDD es
utilizado ms por los especialistas en Inteligencia Artificial (p. 5-6).

Es importante saber que el Data Minig tambin est considerado dentro de un proceso global
que es el descubrimiento de conocimiento en bases de datos denominado KDD. Dentro de ello,
es definido como la aplicacin de algoritmos para el descubrimiento y para el anlisis de los
datos, para as obtener informacin numrica sobre estos datos.

Sin embargo, las definiciones dadas anteriormente tienen un punto de vista ms acadmico o
terico; pero tambin podemos contar con un punto de vista empresarial. Para ello, Vallejos en
su trabajo de adscripcin Minera de datos (2006), lo define como: La integracin de un
conjunto de reas que tienen como propsito la identificacin de un conocimiento obtenido a
partir de las bases de datos que aporten un sesgo hacia la toma de decisin (p.11).

6
Esto hace referencia al entorno comercial. El data mining lo que hace es utilizar distintas reas
para sacar ventaja de ellas. reas tales como la estadstica, la computacin grfica, la inteligencia
artificial, las bases de datos y principalmente el procesamiento masivo. Estas reas apoyan a
obtener importante informacin de los datos almacenados para que aporten sustancialmente
en las decisiones a tomar.

Definitivamente el uso de Data Mining en las empresas es ideal para la toma de decisiones por
el descubrimiento y por el anlisis que realiza con los datos que se almacenan. Este proceso es
importante sobre todo para aquellas empresas que obtienen grandes cantidades de datos a
diario, como las empresas comerciales. Ms an si se trata de las empresas comerciales ubicadas
en el distrito ms grande y poblado de Lima Metropolitana.

2. TECNICAS DE DATA MINING

La Data Minig tiene como uno de sus objetivos descubrir tendencias y patrones para su anlisis.
Para ello se hace uso de las tcnicas, las cuales son exactamente intentan obtener las tendencias
y patrones a partir de los datos almacenados en las bases de datos. Estas tcnicas son tiles y
objetivas para el uso y entendimiento de los usuarios, en los diferentes mbitos y problemas
que se tenga.

Para tener claro la definicin de Tcnicas de Data Mining, se hace referencia a los autores Molina
y Garca que en su libro Tcnicas de Anlisis de Datos (2006), lo definen de la siguiente manera:

Una tcnica constituye el enfoque conceptual para extraer la informacin de los datos, y, en general
es implementada por varios algoritmos. Cada algoritmo representa, en la prctica, la manera de
desarrollar una determinada tcnica paso a paso, de forma que es preciso un entendimiento de alto
nivel de los algoritmos para saber cul es la tcnica ms apropiada para cada problema. Asimismo
es preciso entender los parmetros y las caractersticas de los algoritmos para preparar los datos a
analizar (p. 97).

Las tcnicas son implementadas por diferentes algoritmos, para realizar un enfoque conceptual
de como extraer de los datos la informacin necesaria. Para obtener la tcnica ms apropiada
para cada respectivo problema a solucionar, es necesario que se entienda estos algoritmos, ya
que estos representan la forma en la que se desarrolla la tcnica elegida.

Dado a que el distrito de San Juan de Lurigancho es un distrito en el cual se encuentran diversos
tipos de empresas comerciales, ya sea grandes, medianas o pequeas; tendramos muchas
tcnicas adecuadas para su uso. Es por ello que en el presente ensayo solo hare referencia a las

7
grandes empresas comerciales, ms especficamente a los supermercados ms conocidos y
concurridos del distrito. Aquellas empresas en las cuales se necesita una tcnica ideal para
analizar grandes cantidades de datos almacenados diariamente.

A su vez, Vallejos en su Trabajo de Adscripcin titulado Minera de datos manifiesta lo


siguiente acerca de las Tcnicas de Data Minig:

Las tcnicas de Data Mining pueden redituar los beneficios de automatizacin en las plataformas
de hardware y software existentes y puede ser implementada en sistemas nuevos a medida que
las plataformas existentes se actualicen y nuevos productos sean desarrollados. Cuando las
herramientas de Data Mining son implementadas en sistemas de procesamiento paralelo de alta
performance, pueden analizar bases de datos masivas en minutos. Procesamiento ms rpido
significa que los usuarios pueden automticamente experimentar con ms modelos para entender
datos complejos. Alta velocidad hace que sea prctico para los usuarios analizar inmensas
cantidades de datos. Grandes bases de datos, a su vez, producen mejores predicciones (p. 16).

Uno de las ventajas importantes que trae consigo el uso de las tcnicas de Data Mining es que
aumenta la productividad de las empresas por la automatizacin de los datos. As mismo
optimiza el uso del hardware y software ya existente en las empresas. Y a su vez pueden seguir
siendo utilizadas conforme se actualicen y se creen nuevas tcnicas.

Como se defini, Data Ming es un proceso que es parte del descubrimiento de conocimiento de
base de datos. Dentro de ello, para su uso las tcnicas se clasifican en dos: las tcnicas
predictivas y las tcnicas descriptivas.

2.1. TCNICAS PREDICTIVAS

En primer lugar, Data Mining puede utilizar las tcnicas predictivas para el descubrimiento de
datos. Prez y Santn en su libro Minera de datos: tcnicas y herramientas (2007), describe a
estas tcnicas como:

Las tcnicas predictivas especifican el modelo para los datos en base a un conocimiento previo. El modelo
supuesto para los datos debe contrastarse despus del proceso de minera de datos antes de aceptarlo
como vlido. Formalmente, la aplicacin de todo modelo debe superar las fases de identificacin objetiva
(a partir de los datos se aplican reglas que permitan identificar el mejor modelo posible que ajuste los
datos), estimacin (proceso de clculo de los parmetros del modelo elegido para los datos en la fase de
identificacin), diagnosis (proceso de contraste de la validez del modelo estimado) y prediccin (proceso
de utilizacin del modelo identificado, estimado y validado para predecir valores futuros de las variables
dependientes). En algunos casos, el modelo se obtiene como mezcla del conocimiento obtenido antes y
despus del Data Mining y tambin debe contrastarse antes de aceptarse como vlido.

8
Las tcnicas predictivas nos permiten hacer estimaciones futuras, teniendo un
conocimiento previo de los datos. Sin embargo, para aceptar estos supuestas, primero
deben ser corroborados mediante el proceso de minera de datos. Es decir, se debe
identificar el modelo que se ajuste a los datos, se debe hacer clculos de los paramentos,
se debe validar lo estimado y se debe utilizar el modelo identificado para verificarlo.

Segn Vallejos en su trabajo de adscripcin Minera de datos (2006), las tcnicas


predictivas se clasifican en las siguientes:

2.1.1. SERIES TEMPORALES

Como primera tcnica predictiva tenemos a las series temporales, que son definidos
como:

A partir de la serie de comportamiento histrica, permite modelizar las componentes bsicas


de la serie, tendencia, ciclo y estacionalidad y as poder hacer predicciones para el futuro,
tales como cifra de ventas, previsin de consumo de un producto o servicio, etc. (p. 485).

Est tcnica permite determinar componentes bsico, tendencias, entre otros


elementos que permiten realizar predicciones que se desean a partir del
comportamiento histrico.

Para el caso especfico de empresas comerciales, para las grandes empresas como los
supermercados, el uso de esta tcnica sera indicado. Ya que los clientes acuden
constantemente a los establecimientos y estos cuentan con un comportamiento
histrico sobre sus compras, con lo cual se determinan tendencias y esta sera una gran
oportunidad para mantener satisfechos a los clientes afiliados.

2.1.2. RBOLES DE DECISIONES

Como segunda tcnica predictiva tenemos a los arboles de decisiones, que son definidos
como: Permiten obtener de forma visual las reglas de decisin bajo las cuales operan
los consumidores, a partir de datos histricos almacenados. Su principal ventaja es la
facilidad de interpretacin (p.485).

Esta tcnica tiene como principal ventaja la facilidad con la que se puede interpretar, ya
que se obtiene de una forma visual las razones por los cuales los consumidores toman
decisiones.

9
Para el sector comercial, esta tcnica sera de gran utilidad para mantener a los clientes
fidelizados, ya que precisamente est enfocado en cmo operan los consumidores en el
mercado. Con lo cual se puede predecir de qu forma mantener satisfechos a los clientes
en un futuro prximo.

2.1.3. PREVISIN LOCAL

Como ltima tcnica predictiva tenemos a la previsin local, que es definida como:

La idea de base es que individuos parecidos tendrn comportamientos similares respecto de


una cierta variable de respuesta. La tcnica consiste en situar los individuos en un espacio
eucldeo y hacer predicciones de su comportamiento a partir del comportamiento observado
en sus vecinos (p. 485)

Esta tcnica consiste en hacer predicciones del comportamiento de los individuos a


partir del comportamiento observado en sus vecinos, en un espacio geogrfico
previamente establecido. Se desea obtener comportamientos similares entre individuos
en una misma zona geogrfica.

Esta tcnica tambin puede ser considerada adecuada para el problema de este ensayo.
Ms an si se desea saber con exactitud el comportamiento de los consumidores
ubicados en el distrito de San Juan de Lurigancho, ya que esta tcnica en especfico se
usa para estudiarlo por sectores geogrficos. De esta forma se mantendra satisfecho a
la mayor cantidad de clientes en la zona requerida.

2.2. TCNICAS DESCRIPTIVAS

En segundo lugar, Data Mining puede utilizar las tcnicas descriptivas para el descubrimiento de
datos. Prez en su libro Minera de datos: tcnicas y herramientas (2007), describe a estas
tcnicas como: las tcnicas descriptivas no se asigna ningn papel predeterminado a las
variables. No se supone la existencia de variables dependientes ni independientes y tampoco se
supone la existencia de un modelo previo para los datos.

Segn Molina y Garca (2006) en su libro Tcnicas de Anlisis de Datos, las tcnicas
predictivas se clasifican en las siguientes:

10
2.2.1. CLUSTERNING (SEGMENTACIN)

Como primera tcnica descriptiva tenemos a la tcnica de clusterning, que es definida


como:

Tambin llamada agrupamiento, permite la identificacin de tipologas o grupos donde los


elementos guardan gran similitud entre s y muchas diferencias con los de otros grupos. As
se puede segmentar el colectivo de clientes, el conjunto de valores e ndices financieros, el
espectro de observaciones astronmicas, el conjunto de zonas forestales, el conjunto de
empleados y de sucursales u oficinas, etc. La segmentacin est teniendo mucho inters
desde hace ya tiempo dadas las importantes ventajas que aporta al permitir el tratamiento
de grandes colectivos de forma pseudoparticularizada, en el ms idneo punto de equilibrio
entre el tratamiento individualizado y aquel totalmente masificado (p. 98).

Esta tcnica permite determinar grupos donde los elementos tienen muchas similitudes
y los grupos entre ellos varias diferencias. De esta forma se pueden segmentar a grupos
de clientes. La ventaja es que permite tener un punto de equilibrio entre el tratamiento
individualizado y el masificado, porque a pesar de que se trata de grupos estos tienen
caractersticas muy similares, de modo que se les atienden de forma casi individual.

Esta tcnica sera muy adecuada para empresas comerciales muy grandes, como los
supermercados, aquellas que cuentan con gran cantidad de informacin y de clientes.
De esta forma clientes pueden sentir que estn siendo tratados de forma individual y
que se sientan satisfechos con el servicio. Y por parte de la empresa sera satisfactorio,
ya que la atencin en es por grupos. Refirindonos a este distrito en especfico la
cantidad de clientes que se desea mantener bien atendido es realmente grande.

2.2.2. REGLAS DE ASOCIACIN

Y como segunda tcnica descriptiva tenemos a las reglas de asociacin, que son
definidos como:

Este tipo de tcnicas se emplea para establecer las posibles relaciones o correlaciones entre
distintas acciones o sucesos aparentemente independientes; pudiendo reconocer como la
ocurrencia de un suceso o accin puede inducir o generar la aparicin de otros [AIS93b]. Son
utilizadas cuando el objetivo es realizar anlisis exploratorios, buscando relaciones dentro
del conjunto de datos []. Debido a sus caractersticas, estas tcnicas tienen una gran
aplicacin prctica en muchos campos como, por ejemplo, el comercial ya que son
especialmente interesantes a la hora de comprender los hbitos de compra de los clientes y

11
constituyen un pilar bsico en la concepcin de las ofertas y ventas cruzada, as como del
"merchandising" (p. 107).

Con esta tcnica se puede determinar las relaciones que suceden entre distintas
acciones, las cuales son aparentemente independientes; determinando en realidad que
la ocurrencia de algunos hechos genera la aparicin de otros y que existe una relacin
entre ellas.

Y sera realmente adecuado para los supermercados, ya que con esta tcnica se puede
estableces los hbitos de compra que tiene los clientes, el cual es bsico para poder
realizar ofertas, que son de total agrado para los consumidores, para atraerlos y para
que se mantengan satisfechos con el servicio que se les da.

3. APLICACIN DE LAS TECNICAS DE DATA MINING EN EMPRESAS COMERCIALES

La minera de datos ha sido utilizada desde hace tiempo y este ha ido integrndose con ms
tecnologas, con lo cual ha ido mejorando. Uno de los puntos importantes en el cual el Data
Mining aporta es en la toma de decisiones y esa es la importancia de la aplicacin de la tcnica
adecuada para cada una de las empresas.

Molina y Garca (2006) en su mencionado libro Tcnicas de anlisis de datos, presentan los
siguientes beneficios que trae consigo el uso de las tcnicas de Data Mining en empresas
comerciales, los cuales son de gran importancia para los supermercados:

Identificar patrones de compra de los clientes: Determinar cmo compran, a partir de sus
principales caractersticas, conocer el grado de inters sobre tipos de productos, si
compran determinados productos en determinados momentos.
Segmentacin de clientes: Consiste en la agrupacin de los clientes con caractersticas
similares, por ejemplo demogrficas. Es una importante herramienta en la estrategia de
marketing que permite realizar ofertas acordes a diferentes tipos de comportamiento de
los consumidores.
Predecir respuestas a campaas de mailing: Estas campaas son caras y pueden llegar a
ser molestas para los clientes a los que no le interesan el tipo de producto promocionado
por lo que es importante limitarlas a los individuos con una alta probabilidad de
interesarse por el producto. Est por ello muy relacionada con la segmentacin de
clientes.
Anlisis de cestas de la compra [market-basket analysis]: Consiste en descubrir relaciones
entre productos, esto es, determinar qu productos suelen comprarse junto con otros,
con el fin de distribuirlos adecuadamente (p. 10).

12
Identificar patrones de compras de los clientes, segmentar a los clientes, predecir campaas y
tener un anlisis de cestas de compra son exactamente los beneficios que los supermercados
necesitan para poder mantenerse en el mercado teniendo las ganancias que esperan.

De la misma manera, Vallejos en su trabajo de adscripcin Minera de datos (2006) presenta


el siguiente anlisis realizado en supermercados con el uso de las tcnicas de Data Mining:

Hbitos de compra en supermercados. Un estudio muy citado detect que los viernes haba una
cantidad inusualmente elevada de clientes que adquiran a la vez paales y cerveza. Se detect que
se deba a que dicho da solan acudir al supermercado padres jvenes cuya perspectiva para el fin
de semana consista en quedarse en casa cuidando de su hijo y viendo la televisin con una cerveza
en la mano. El supermercado pudo incrementar sus ventas de cerveza colocndolas prximas a los
paales para fomentar las ventas compulsivas (p. 20).

Con el reporte mencionado sobre los hbitos de compra en los supermercados, se determina lo
importante que es la aplicacin de las tcnicas en las empresas comerciales con grandes
cantidades de datos almacenados. Los beneficios son tanto para la empresa como para el
consumidor.

Pero dado a que el presente ensayo tiene como objetivo el beneficio desde el punto de vista de
las empresas, de los supermercados con exactitud; la aplicacin de la tcnica adecuada se vera
reflejada en las ventas y las ganancias, centrndose en el punto de mantener a los clientes fieles
a la empresa. Demostrado est que su aplicacin es primordial para el xito de la empresa.

13
CONCLUSIONES

Como conclusiones de este presente ensayo, presento los siguientes:

1. El uso de la tcnica Clusterning es la ms adecuada para una empresa comercial con la cual
se podr aprovechar la informacin que tiene de sus clientes con la intencin de
mantenerlos satisfechos con su servicio y que se mantengan fieles a la empresa.
2. Entre las tcnicas de Data Mining con las cuales se tendra mayor ventaja en una empresa
comercial tenemos en tcnicas predictivas: series temporales, arboles de decisiones y
previsin local; y en tcnicas descriptivas: clusterning y reglas de asociacin. Con estas
tcnicas se puede establecer tendencias y patrones con los cuales los supermercados
pueden tomar decisiones como ofertas y descuentos.
3. El uso de la tcnica descriptiva de Data Mining Clusterning resulta ser la ms adecuada para
una empresa comercial, para un supermercado en el distrito de San Juan de Lurigancho,
porque permite realizar un tratamiento individualizado a pesar de que son tratados en
grupos con caractersticas similares. Adems porque su uso es posible en grandes
cantidades de informacin, lo cual ocurre a diario en los supermercados de este distrito.

14
BIBLIOGRAFA

ALUJA, Toms. La minera de datos, entre la estadstica y la inteligencia artificial. Qestii [en
lnea]. 2001, vol. 25, n. 3 [fecha de consulta: 07 de Junio de 2017].

Disponible en: https://www.idescat.cat/sort/questiio/questiiopdf/25.3.4.Aluja.pdf

ISSN: 02108054

MOLINA, Jos y GARCA, Jess. Tcnicas de Anlisis de Datos [en lnea] Madrid: Universidad
Carlos III, 2006 [fecha de consulta: 06 de Junio de 2017].

Disponible en:

https://senaintro.blackboard.com/bbcswebdav/institution/semillas/621121_1_VIRTUAL/Conte
nido/Documentos/Otros%20documentos/Material_apoyo_Gu%C3%ADa%206/TECNICA%20DE
%20ANALISIS%20DE%20DATOS.pdf

PREZ, Cesar y SANTN, Daniel. Minera de datos: tcnicas y herramientas [en lnea]. Espaa:
International Thomson Ediciones Paraninfo, 2008 [fecha de consulta: 06 de Junio de 2017].

Disponible en:

https://books.google.com.pe/books?id=wz-
D_8uPFCEC&printsec=frontcover&hl=es&source=gbs_ge_summary_r&cad=0#v=onepage&q&f
=false

ISBN: 9788497324922

VALLEJOS, Sofa. Minera de Datos. Trabajo de Adscripcin (Licenciatura de Ingeniera de


Sistemas). Argentina: Universidad Nacional de Noroeste, Facultad de Ciencias Exactas, 2006. 38
p.

15

Вам также может понравиться