Академический Документы
Профессиональный Документы
Культура Документы
Objetivo: La presente busca dar respuesta a las dudas planteadas acerca de datos atípicos
presentes en la base de datos para un mejor análisis.
La base de datos que se analizara presenta un estudio financiero de cuentas contables de una
empresa de manufactura, la misma cuanta con las siguientes variables:
Ahora bien para dar respuesta a esta pregunta como bien nos indica se realizó un boxplot de
la variable subcuenta y se obtuvo la siguiente gráfica:
En el mismo se puede apreciar los boxplot de cada observación correspondiente a la variable
subcuenta, y basándonos en el promedio que está representado por la línea en negrita dentro
de la caja, podemos inferir que la observación “MATERIALES VARIOS DE MANTENIMIENTO” es
la que presenta mayor gasto, cabe recalcar que este análisis es general sin tomar en cuenta
alguna área específica. Para poder observar mejor a continuación se presenta dicho bloxplot.
Como se evidencia esta observación tiene datos atípicos los cuales deberán ser reemplazados
por el promedio, en posteriores preguntas se resolverán dichas problemáticas.
2) Dentro del histórico por años de los "balances”, cómo ha evolucionado la cuenta
remuneraciones? , realizar el mismo análisis por meses.
Para solventar esta inquietud se realizaron boxplots con las especificaciones indicadas, es decir
categorizando únicamente los balances de la variable categoría y del mismo modo
considerando solo la observación remuneraciones para la variable cuenta.
En ficha grafica se pude observar igual que la anterior que presenta datos atípicos que
salen de los límites superiores para los meses de abril y diciembre. Dichos datos deberán
ser depurados para tener un análisis estadístico más completo.
Existen datos atípicos? Si es así el caso realice un reemplazo del valor atípico por el
por=promedio. Realice un boxplot untes y después del reemplazo. Detallar la Cuenta con
la que se está trabajando.
Pues bien claramente podemos saber que si existen datos atípicos ya que como hemos
visto antes han existido datos que se encuentran fuera de los limites. Realizando un
análisis de cada observación de la variable subcuenta se obtuvieron los siguientes
resultados.