Вы находитесь на странице: 1из 6

Aplicando la

Ciencia de
Datos en una
organización

1 ABRIL

LIBRERÍA IZTACCIHUATL
Creado por: Andres Escobar Echeverri
Santiago de Chile

1
Tabla de contenido

INTRODUCCION ....................................................................................................... 3
OBJETIVO ................................................................................................................ 4
LENGUAJE RECOMENDADO. ..................................................................................... 5
PREDICCIONES. ........................................................................................................ 5
TIPO DE BASE DE DATOS .......................................................................................... 6
SERVIDOR EN LA NUBE PARA ALMACENAR LOS DATOS ............................................. 6
CONCLUSIONES ........................................................................................................ 6

2
INTRODUCCION
En la etapa de un proyecto de ciencia de datos, que tiene que ver con el análisis y la
modelación de datos es indispensable pensar en herramientas tecnológicas para que
nos faciliten estas tareas, pues no estamos hablando de 100 datos sino de millones de
datos representados en sin número de formas. Por esta razón vamos a analizar cual es
la mejor herramienta para el análisis de los datos otorgados por la librería Iztaccihuatl,
y poder hacer tres predicciones para la librería con su respectivo análisis, forma de
presentar las bases de datos, y cual seria la nube mas adecuada para su alojamiento.

La librería Iztaccihuatl de la ciudad de Nuevo León en México, con el fin de mejorar sus
indicadores de desempeños (KPI’s), ha decidido desarrollar un proyecto basado en
ciencia de datos para desarrollar estrategias que le permitan la toma de decisiones. Por
lo tanto, para la realización de este trabajo, se analizará la información de los
archivos de la carpeta “datasets_books”, los cuales se clasifican en:

• El archivo “books” contiene los datos generales de cada libro existente en la


librería y además menciona el promedio de clasificación de cada libro de acuerdo
con las votaciones y compras del cliente.
• El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo
con una clasificación general.
• El archivo “raitings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
• El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer.

3
OBJETIVO
Identificar las herramientas necesarias para el análisis; estructuras de datos y servicios
de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la
toma de decisiones para La librería Iztaccihuatl.

4
LENGUAJE RECOMENDADO.
Dadas las características de librería Iztaccihuatl, vamos a trabajar con un el lenguaje R,
ya que es fácil de manejar, de código abierto lo cual no genera costos para la
organización, R es un sistema para análisis estadísticos y gráficos, lo que se convierte
en el mejor aliado para trabajar con las bases de datos suministrados por la librería y al
utilizar también RStudio lo podemos integrar con otras herramientas tales como git,
github, y Python.

PREDICCIONES.
Del archivo “to_read” que contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer.

# 𝒗𝒆𝒄𝒆𝒔 𝒓𝒆𝒄𝒐𝒎. 𝒍𝒊𝒃.


𝑰𝒏𝒄𝒓𝒆 𝒅𝒆 𝒍𝒊𝒃𝒓𝒐𝒔 𝒓𝒆𝒄𝒐𝒎𝒆𝒏𝒅𝒂𝒅𝒐𝒔 =
# 𝒗𝒆𝒄𝒆𝒔 𝒓𝒆𝒄𝒐𝒎𝒆𝒏𝒅.

Con esta tasa de incremento por periodo podemos analizar cuales son los libros con
mayor numero de recomendaciones y como se comporta a lo largo de un periodo y con
esta información podemos proyectar cuales van a ser los libros más vendidos.

Del archivo “top_books” que contiene el top 20 de los libros más vendidos de acuerdo
con una clasificación general

𝒗𝒆𝒏𝒕𝒂𝒔 𝒕𝒐𝒕𝒂𝒍𝒆𝒔 𝒑𝒆𝒓𝒊𝒐𝒅𝒐 𝒂𝒄𝒕𝒖𝒂𝒍


𝑻𝒂𝒔𝒂 𝒅𝒆 𝒄𝒓𝒆𝒄𝒊𝒎𝒊𝒆𝒏𝒕𝒐 =
𝒗𝒆𝒏𝒕𝒂𝒔 𝒕𝒐𝒕𝒂𝒍𝒆𝒔 𝒑𝒆𝒓𝒊𝒐𝒅𝒐 𝒂𝒏𝒕𝒆𝒓𝒊𝒐𝒓

Con esta tasa de crecimiento podemos proyectar cuales van a ser los libros mas
vendidos y podemos hacer una proyección de ingresos y gastos.

Al unir las bases de datos “books”, “top_books”y “ratings”, podeos hacer un análisis
mas completo de como se esta comportando la librería, y hacer proyecciones, ya que
podemos comparar el porcentaje de aumento de las recomendaciones con el
porcentaje de venta de los libros y a partir de esta información se puede hacer una
proyección de ventas, y al tener los precios promedio de los libros podemos hacer una
proyección de ganancia de la librería.

5
TIPO DE BASE DE DATOS
Dado que las bases de datos otorgados por la librería están estructuradas, se hace mas
fácil que el almacenamiento de la nueva base de datos generada por el análisis y las
proyecciones se puede generar bases de datos estructuradas, ya que podemos
identificar el libro, su precio, su puntuación, cantidad de veces vendida, su crecimiento
de venta, las veces que fue recomendado.

SERVIDOR EN LA NUBE PARA


ALMACENAR LOS DATOS
Se recomienda utilizar Hadoop, usando la versión de Microsoft Excel 2013, ya que
también nos permite hacer un análisis de los dados en Excel y nos permite manejar gran
volumen de datos.

CONCLUSIONES
• Al utilizar un lenguaje para el análisis de las bases de datos tal como R, que es
fácil de manejar nos permite hacer análisis estadísticos y garantizar una buena
proyección para tomar decisiones.
• Determinar el objetivo y que queremos analizar con los datos que tenemos es
muy importante para poder hacer predicciones que nos ayuden a tomar buenas
decisiones.
• Estructurar una buena predicción nos ayuda a potenciar el negocio, y a tomar las
decisiones y entender que se quiere y como se va a hacer.
• Al escoger como queremos representar la base de datos nos ayuda a identificar
cual es el almacenamiento mas apropiado, ya que muchos trabajan en base a
esto.
• El almacenamiento en la nube de las bases de dato se debe escoger en base a la
cantidad de datos que queremos analizar, su complejidad, las herramientas que
vamos a utilizar y la cantidad de dinero que estemos dispuestos a pagar por esta.

Вам также может понравиться