Академический Документы
Профессиональный Документы
Культура Документы
ISSN 2518-4725.
Resumen
Abstract
El análisis exploratorio de datos es una de las etapas
más importantes de un proyecto de mejora bajo el
Exploratory Data Analysis (EDA) is one of he most
modelo DMAIC (Define, Measure, Analyze &
important stages in a continuous improvement
Control) de la metodología Six Sigma.
project using the DMAIC (Define, Measure, Analyse,
Improve, Control) models for Six Sigma
En este artículo se presenta una breve reseña del
methodology.
análisis exploratorio de datos (AED) como una
poderosa herramienta para identificar y solucionar
This article presents a brief review of EDA as a
problemas de calidad en los procesos de cualquier
powerful tool to pinpoint and solve quality issues in
tipo.
any type of process.
Se utilizó para tal efecto un software estadístico de
For this purpose, an open source statistical tool was
código abierto que es uno de los más utilizados a
used, which is one of the most used statistical
nivel mundial, R y su interfase RStudio para
software worldwide, R and the RStudio IDE in
realizar un análisis exploratorio de un problema
order to analyze a fictitious problem. Based on the
ficticio. En base a los resultados obtenidos se pudo
results of the analysis, it was possible to identify
identificar el problema subyacente y proponer
the underlying problem and to propose some
algunas soluciones al mismo.
solutions.
Palabras clave
Keywords
Análisis Estadístico, Calidad, Procesos, Mejora
Statistical Analysis, Quality, Process, Continuous
Continua, Six Sigma, Software Estadístico.
Improvement, Six Sigma, Statistical Software.
Revista de la Escuela de Estudios de Postgrado, Vol. 8 No. 1, año 2017.
ISSN 2518-4725.
En este caso, por tratarse de un ejemplo ficticio, Aquí puede observarse en un solo vistazo claramente
solamente se incluyó un factor posible, la máquina la diferencia entre lo que está produciendo la
llenadora. Los factores generalmente son utilizados máquina 1 y lo que produce la máquina 2. Aunque
para segmentar o estratificar los datos, de manera que la máquina 1 tiene una mejor tendencia central, ya
puedan analizarse por separado para identificar las que su mediana se encuentra justo en el valor de la
diferencias que existen en la variable respuesta según especificación (350 ml), su dispersión es casi 4
el nivel del factor. En este caso se procede a calcular veces la de la máquina 2, cuya tendencia central
nuevamente las estadísticas descriptivas pero está por debajo de lo requerido pero cuya dispersión
segmentadas por máquina: es bastante menor.
Tabla II. Es claro que ambas máquinas tienen problemas que
Estadísticas Descriptivas por máquina. inciden negativamente en la calidad del producto
que está llegando al cliente y de ahí surgen los
Medida Maq 1 Maq 2
Media
reclamos que la empresa ha estado recibiendo. Se
353.36 340.92
Mediana 350 340 debe recordar una máxima atribuida al Dr. Edwards
Desv. Est. 17.52 4.83 Deming: “La variabilidad es el enemigo de la
Rango 69 22 calidad” lo cual aplica muy bien en este caso. Los
clientes perciben un problema de calidad al
Fuente: elaboración propia observar que muchas veces el producto contiene
Aquí ya se puede observar una diferencia significativa menos de lo que ellos esperan. En realidad algunas
entre los resultados producidos por cada una de las veces el producto contiene más de lo requerido,
máquinas. Se pueden obtener conclusiones pero eso generalmente no es percibido por el cliente
interesantes de los resultados numéricos, pero vale sino solamente los casos en los cuales el contenido
la pena tener una visualización de los mismos es menor. Esto genera una percepción de que se
utilizando un boxplot. está entregando menos producto que lo que el
cliente está pagando por lo que existe una sensación
de engaño.
Los problemas de ambas máquinas en realidad son
diferentes. El caso de la máquina 1 se puede ver
que su localización (tendencia central) está bien
pero su dispersión es muy grande, lo cual puede ser
atribuido a un problema mecánico, un desajuste,
desgaste de piezas u otras causas. La acción a toma
en este caso es una revisión profunda de la máquina
para identificar esa causa y corregirla.
Síntesis conclusiva
En este trabajo se pudo ejemplificar cómo un sencillo
análisis exploratorio de datos puede ayudar a obtener
información muy valiosa de posibles causas raíz de
problemas. La visualización de datos utilizando
gráficos sencillos es de suma utilidad para llegar a
conclusiones importantes para la solución de
problemas.
Existen herramientas de software disponibles en
forma gratuita que permiten el análisis de datos y su
representación gráfica y que están al alcance de
cualquier persona u organización.
Referencias bibliográficas