Вы находитесь на странице: 1из 5

Introducción a SQL Server para Ciencia de Datos

Tarea #2
Fecha de Entrega: Diciembre 03, 2018 (Semana 05)
Para esta tarea no habrá prórroga porque se estaría resolviendo en la primera hora de la clase.

El siguiente es un caso de negocio, es un esfuerzo individual y se deberá adjuntar las sentencias


utilizadas que permitieron llegar a cada respuesta, esto con capturas de pantalla donde se pueda
ver el SELECT utilizado cuando se requiera y los resultados obtenidos. En algunas respuestas se
requiere de su conocimiento crítico, es realmente extenso y se abarca situaciones de investigación,
incertidumbre, ética, razonamiento lógico y comprensión de datos.

Con el fin de corregir una diferencia en las versiones del motor de base de datos al cargar archivos,
antes de iniciar esta tarea se deberá ejecutar la siguiente instrucción. Si al ejecutarlo le indica “(0
rows affected)” significa que sus datos estaban correctos:
update PE_Personas
set PER_SEGUNDO_nombre = null
where PER_SEGUNDO_nombre = ' '

- Casos a Resolver -
La empresa InnovaFintech S.A. brinda servicios a entidades financieras, se especializa en administrar
el centro de llamadas de las entidades que adquieran sus servicios, cuenta con experiencia de más
de 16 años con un record de satisfacción altamente valorado. Una entidad financiera le contrató los
servicios de gestión de cobro administrativo y judicial de su cartera de clientes de crédito
cumpliéndose en este fin de mes, seis meses de la firma del contrato. Esta entidad ha presentado
una inconformidad, indicando que InnovaFintech S.A. no está cumpliendo los acuerdos del contrato
de servicios y que la gestión para recuperación de cuentas morosas es deficiente, dado que la
estimación inicial de recuperación con la gestión debería superar el 91% y no ha logrado superar el
66% en los 6 meses transcurridos, por lo que la entidad está por prescindir del contrato y solicitar
un proceso legal para realizar la recuperación de su dinero.

La entidad financiera indica que, si existe al menos el 80% de cumplimiento en la gestión de llamadas
para los seis meses, puede dar por aceptado el contrato y comprender que la situación actual del
país no ha permitido realizar la recuperación esperada y provisionar más dinero en el Banco Central
de Costa Rica para poder soportar una crisis.

La entidad financiera le entrego a InnovaFintech, S.A. un archivo en un DVD protegido, no


modificable, con una etiqueta que indica “Cantidad de registros de clientes para gestión: 27,396” y
se mantiene custodiado en la caja de seguridad.

La empresa InnovaFintech S.A. cuenta con altos estándares de calidad, por lo que le es muy difícil
comprender la situación actual y decide realizar una investigación de los datos de contacto de
clientes suministrados por la entidad para realizar la gestión. De una lista de 9 analistas de datos
usted ha sido seleccionada(o) para realiza un análisis de los datos existentes y se le convoca a una
reunión donde están presentes los encargados del Departamento Comercial y Departamento Legal
Introducción a SQL Server para Ciencia de Datos

y se le explica lo crítico de tener un resultado de la más alta calidad y precisión para evitar que la
empresa deba llegar a enfrentar un proceso legal, se le explica a fondo la situación y se le pide
realizar un informe ejecutivo contestando a las siguientes requerimientos de datos. Usted deberá
comparar los resultados de sus consultas con los que se le indique en el contrato y deberá asumir
que el contrato podría tener errores, por lo que debe documentar su investigación para cada
respuesta con una sentencia select y una captura de pantalla con el resultado:

InnovaFintech, S.A. le entrega a usted un archivo de nombre InnovaFintechGestion.csv con los


siguientes datos:

Nombre Campo Descripción


cte_cedula Cédula de Cliente
cte_telefono Teléfono de Cliente
cte_gestion_mes Número del Mes de Gestión
cte_gestion_realizada Gestión Realizada (S = sí se realizó gestión, N = no se realizó gestión)

a. El archivo entregado por la entidad financiera deberá cargarlo en la base de datos de análisis
llamada SQLCienciaDatos con el nombre de tabla CL_ClientesGestion y contar la cantidad de
registros cargados en la tabla.

Total de registros cargados en la tabla XXXXXXXXXX

b. Para tener un resultado preliminar, usted agrupa los datos por mes de gestión y completa la
columna de la tabla “Total de Gestiones para cada mes. Luego filtra los registros para los que sí
se realizó la gestión de cobro, completa la tabla y calcula los totales y porcentajes.

Total de Gestiones Cantidad de Gestiones Porcentaje


Mes
por Mes realizadas Cumplido.
1 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX
2 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX
3 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX
4 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX
5 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX
6 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX
Totales XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX

c. El promedio general de la línea de totales indica que la empresa no tuvo una falta pues la
cantidad de gestiones es de un 81.87%, superior al 80% indicado como aceptable, pero al ver el
resultado de la consulta con más de 128mil registros, usted recuerda que la entidad financiera
entrego el archivo con 27,396 clientes, lo que lo hace dudar del primer resultado. Al consultar a
la Gerencia Comercial, se le indica que por cada cliente puede existir hasta seis veces en la
misma tabla, un registro por cada gestión de cada mes y se le facilita una nueva instrucción de
SELECT que no ha utilizado antes para poder contarlos sin duplicados. Este select realiza primero
Introducción a SQL Server para Ciencia de Datos

un DISTNCT de las cédulas para tener los clientes únicos “distinct(cte_cedula)” y colocándolo
dentro del COUNT se obtiene la cuenta de los clientes únicos “count(distinct(cte_cedula))”:

select count(distinct(cte_cedula))
from CL_ClientesGestion

Al ejecutar este select, determina que el resultado no coincide con los indicados en el DVD y
completa la siguiente tabla con los totales y el porcentaje de datos existentes (cantidad contada
entre cantidad reportada en la etiqueta del DVD). Con esto, usted encuentra la primera
inconsistencia y como sabe que un primer indicio no es una respuesta confiable, determina
profundizar más en la situación.

Total de registros en la etiqueta del DVD XXXXXXXXXX


Total de registros de clientes únicos en la tabla XXXXXXXXXX
Porcentaje de registros existentes XXXXXXXXXX

d. Para comprender más los datos, usted realiza las siguientes consultas, basándose en las tablas
de clientes y de identificaciones, todos los listados deben esta ordenados por cédula y mes de
gestión:

1. Listado de gestiones de cobro realizadas a clientes que existen como personas. Con esto
obtiene todas las gestiones que fueron realizadas a cada cliente (inner join).

2. Listado de gestiones de cobro realizadas a clientes que existen como personas, más los
clientes a los que no se les ha realizado una gestión. Con esto puede determinar cuáles
clientes se han contactado y cuáles no (left join). Observación: que un cliente no tenga
asociado un código de persona, podría ser una identificación internacional o un error
de datos.

3. Listado de personas que existen como clientes, más las personas que no son clientes.
Con esto puede determinar personas que se pueden contactar para ofrecerles servicios
y que formen parte de la cartera de clientes (right join).

4. Listado total de gestiones de clientes que no tienen una persona asignada. Con este
listado puede ver solamente los clientes que no cuentan con información de personas
y que podría representar errores en los datos, dado que cada cliente debería tener una
persona asignada (left join con valores nulos de personas).

5. Listado total de personas que no tienen cliente asignado (right join con valores nulos de
clientes). Con este listado puede ver específicamente las personas que no son clientes
y aprovechar la información para ofrecerle s servicios.

6. Listado de todas las personas y clientes en un solo reporte además de las relaciones
entre ellos. Con este listado tiene toda la información completa, tanto de todos los
clientes como de todas las personas y las relaciones que haya entre ellos (full outer join).
Introducción a SQL Server para Ciencia de Datos

7. Listado de todas las personas y clientes en un solo reporte sin las relaciones entre ellos.
Con este listado tiene toda la información completa, tanto de todos los clientes como
de todas las personas sin las relaciones que haya entre ellos y se puede utilizar para
determinar inconsistencias (full outer join).

e. Finalizados los listados que le han consumido una cantidad importante de tiempo, usted
continúa investigando. Ya tuvo oportunidad de contar las cantidades de registros y detectar las
primeras inconsistencias, comprendió que un primer dato no es la respuesta y que ante
cualquier duda debe consultar para tener claridad de su ecosistema de datos, también tuvo la
oportunidad de familiarizarse con los datos visualmente al realizar siete reportes diferentes. En
este momento, usted decide tomarse unos minutos para repasar los resultados obtenidos, pero
el Gerente Comercial lo llama a su oficina y le facilitar nueva información: “Se acordó entre
ambas partes que solo se realizan llamadas a clientes que estén relacionados con una persona,
de lo contrario no sabemos a quién estaríamos llamando”. Esto podría disminuir la cantidad de
clientes que utilizó para sus resultados anteriores y deberá calcular nuevamente los resultados
de la pregunta A y B, pero relacionando las tablas de Gestión de Clientes, Identificación de
personas y personas (inner join).

Total de Gestiones Cantidad de Gestiones Porcentaje


Mes
por Mes realizadas Cumplido.
1 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX
2 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX
3 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX
4 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX
5 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX
6 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX
Totales XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX

f. Con los datos actuales usted ya puede presentar el informe que libera a la empresa
InnovaFintech, S.A. de un proceso legal y entrega los resultados. El Gerente Comercial observa
un comportamiento anormal en los totales de los meses 5 y 6. Están por debajo del 80% y
aunque se cumplió con el cliente, se considera una exposición al riesgo el que no se haya
cumplido la meta en cada mes, por lo que llama al encargado de la gestión telefónica y le pide
explicaciones. El encargado, después de varios minutos indica lo siguiente:

“Hace dos meses tuvimos recorte de personal, y se finalizó el contrato laboral de un compañero
del centro de llamadas. Las llamadas a los clientes se realizan segmentando el total de clientes
por la primera letra de su primer apellido y se entrega a cada colaborador un segmento. Esta
persona que ya no está en la empresa, se encargaba de llamar lo clientes con la letra C en su
apellido y no se reasignó su control de llamadas, por lo que a estos clientes no se les realizó una
gestión de cobro”.

El Gerente Comercial le solicita a usted un listado de estos clientes para realiza un plan de acción
y posiblemente indemnizar a la entidad financiera por un error en el procedimiento, por lo que
realiza un listado de clientes relacionados con las personas y que inicien con la letra “C” en el
Introducción a SQL Server para Ciencia de Datos

primer apellido, para los dos últimos meses, donde la gestión de cobro esté indicada con “N”.
EL Gerente Comercial le facilita un SELECT que fue utilizado anteriormente para un caso similar
y usted debe ajustarlo para que cumpla sobre los dos últimos meses (mes 5 y mes 6) y para la
letra “C”:

select distinct cte_cedula, cte_telefono


from CL_ClientesGestion cg inner join PE_PersonasIdentificacion pid
on cg.cte_cedula = pid.PID_DOCUMENTO
inner join PE_Personas per
on pid.pid_per_id = per.per_id
where per.PER_PRIMER_APELLIDO like 'N%'
and cte_gestion_mes in (1,2, 3)
and cte_gestion_realizada = 'N'

OPCIONAL: En caso de perder puntos en alguna de las respuestas, se le suma un 10% a esta
tarea hasta llegar a un máximo de 100%

Usted está en la puerta del Departamento Comercial y Departamento Legal, listo para entregar su
informe, pero su capacidad de análisis lo detiene con una interrogante ¿Todos los clientes cuentan
con un número de teléfono? Por lo que usted decide realiza una consulta más para determinar si
cada cliente relacionado con personas cuenta con un número de teléfono.

Вам также может понравиться