Вы находитесь на странице: 1из 36

Equipo: * Juan Pablo Lara * Rodolfo de la Garza

Septiembre 2013

Tema #1

Mtodos Estadsticos Aplicados


MEDIDAS DESCRIPTIVAS HERRAMIENTAS PRINCIPALES

Estadstica:
Su objetivo es apoyar (o fundamentar) la toma de decisiones o satisfacer ciertas necesidades de informacin sobre una poblacin o proceso.
En esta presentacin se expondrn los siguientes temas: * Medidas descriptivas
Las medidas descriptivas son valores numricos calculados a partir de la muestra y que no resume la informacin contenida en ella.

* Herramientas Principales
Histograma y Diagrama de Tallo y Hoja.Representaciones grficas de la distribucin de un conjunto de datos o una variable.

Medidas Descriptivas

Media o Promedio Tendencia Central Mediana Moda

Medidas Descriptivas
Dispersin

Rango Desviacin Estndar

Varianza

Medidas de Tendencia Central


Media o Promedio

La media o promedio es igual a la suma de las observaciones dividida entre la cantidad de observaciones . Es la medida ms comn de la tendencia central.
Tcnicas para el calculo del promedio: Datos Individuales Datos Agrupados

- Datos Individuales
Tcnica utilizada cuando los datos no estn organizados en una tabla.

Donde Xi son los valores de Presin Mxima n es la cantidad de valores de muestra

- Datos agrupados
Tcnica utilizada cuando los datos estn organizados y agrupados en una tabla con limites definidos.

- Datos agrupados
Caso 1.- Cuando el agrupamiento se realiza por clase y se observa ms de un valor por clase.

- Datos agrupados
Caso 2.- Cuando el valor Xi observado tiene su propia frecuencia fi.

Mediana La mediana es igual al valor que divide una serie de observaciones ordenadas de tal manera que la cantidad de elementos arriba de ella es igual a la cantidad de elementos por debajo. Tcnicas para el calculo de la Mediana: Datos Individuales Datos Agrupados

- Datos Individuales
Para calcular la mediana, lo primero que se debe de hacer es ordenar los nmeros de la serie.

Cuando la cantidad de nmeros en la serie es impar, la mediana es el punto medio de los valores.

Cuando la cantidad de nmeros en la serie es par, la mediana es el promedio de los dos nmeros de la mitad.

El promedio de los dos valores centrales es la mediana

- Datos agrupados
Cuando los datos estn agrupados en una distribucin de frecuencia, la mediana se obtiene determinando la clase o grupo que contenga el nmero de la mitad. Una vez definido la clase o grupo, se procede a interpolar para obtener su valor.

- Calculo mediana para datos agrupados

Moda La moda (Mo) de un conjunto de nmeros es el valor que se presenta con la mxima frecuencia. Si una serie de nmeros tiene solo una moda, se dice que unimodal, bimodal si tiene dos modas, y multimodal si tiene ms de dos modas. Cuando se agrupan los datos en una distribucin de frecuencias, el punto medio de la celda que tiene la frecuencia mayor es la moda, porque ese punto representa el punto ms alto (la mayor frecuencia) del histograma.

Relaciones entre las medidas de tendencia central

El promedio es la medida de tendencia central ms utilizada cuando la distribucin es simtrica, o no es marcadamente asimtrica o cuando se va a calcular ms estadsticos, como medidas de dispersin, grficos de control, etc., con base en el promedio. La mediana es una medida efectiva de la tendencia central cuando la distribucin es asimtrica positiva o negativa. Se utiliza cuando se desea tener un punto medio exacto de una distribucin.
La moda se utiliza cuando se desea tener una medida rpida y aproximada de la tendencia central.

Medidas de Dispersin
Las medidas de dispersin describen la forma en que los datos se extienden o dispersan a cada lado del valor central. Rango
El Rango de una serie de nmeros es la diferencia entre los valores u observaciones de mayor y menor.

Desviacin Estndar La desviacin estndar es un valor numrico cuyas unidades son las de los valores observados; mide la tendencia de los datos a la dispersin. Una desviacin estndar grande indica una mayor variabilidad de los datos que una pequea. Tcnicas para el calculo de la Desviacin Estndar: Datos Individuales Datos Agrupados

Desviacin Estndar - Datos Individuales

- Datos Agrupados
Cuando los datos se agrupan en distribucin de frecuencias se puede utilizar la siguiente tcnica.

Desviacin Estndar
La desviacin estndar es una referencia que mide la dispersin en los datos. Cuando menor sea la desviacin estndar, la calidad ser mejor, porque la distribucin estar ms compacta en torno al valor central.

Relaciones entre las medidas de dispersin


El rango es una medida muy comn de la dispersin: Se usa en una de las principales graficas de control. Las principales ventajas del Rango son que proporciona el conocimiento de la extensin total de los datos, y su simplicidad. La desviacin estndar se usa cuando se desea una medida ms precisa.

A medida que la desviacin estndar muestral se vuelve ms pequea, la calidad mejora.

En la siguiente figura se muestran dos distribuciones con el mismo promedio, y el mismo rango, sin embargo, la distribucin inferior es mucho mejor.

La desviacin estndar muestral es mucho menor en esta distribucin, lo que indica que los datos son ms compactos en torno al promedio.

Herramientas principales
Histograma y tabla de frecuencias El histograma y la tabla de frecuencias permiten visualizar la tendencia central y la dispersin de un conjunto de datos, y muestran la forma en que los datos se distribuyen dentro de su rango de variacin. El histograma es una representacin grfica, en forma de barras de la distribucin de un conjunto de datos o una variable, donde los datos se clasifican por su magnitud en cierto nmero de grupos o clases, y cada clase es representada por una barra, cuya longitud es proporcional a la frecuencia de los valores representados. Comnmente el histograma se obtiene a partir de la tabla de frecuencias.

La tabla de frecuencias es una representacin en forma de tabla de la distribucin de unos datos, a los que se clasifica por su magnitud en cierto nmero de clases. Para obtener la tabla de frecuencia: Recolectar datos y formar una hoja de conteos Determinar el Rango

1. 2.

3.

Determinar el intervalo de clase

La clase se calcula:

4. Determinar los puntos medio de la clase

5. Determinar los limites de la clase

6. Identificar la frecuencia de la clase

7. Por ltimo se construye el histograma utilizando la tabla de frecuencias

La siguiente figura presenta las caractersticas de las distribuciones por frecuencia

La siguiente figura presenta las diferencias con respecto a la localizacin, extensin y forma de la coleccin de datos

Interpretacin de Histogramas
Cuando un histograma se construye de manera correcta, es resultado de un numero suficiente de datos (de preferencia mas de 100), y estos son representativos del estado del proceso durante el periodo de inters; entonces, se recomienda considerar los siguientes puntos en la interpretacin del histograma.
1. Observar la tendencia central de los datos. Localizar en el eje horizontal o escala de medicin las barras con mayores frecuencias. Estudiar el centrado del proceso. Para ello, es necesario apoyarse en el punto anterior y observar la posicin central del cuerpo del histograma con respecto a la calidad optima y a las especificaciones.

2.

3.

Examinar la variabilidad del proceso. Consiste en comparar la amplitud de las especificaciones con el ancho del histograma. Para considerar que la dispersin no es demasiada, el ancho del histograma debe caber de forma holgada en las especificaciones. Analizar la forma del histograma. Al observar un histograma considerar que la forma de distribucin de campana es la que mas se da en salidas de proceso, ver figuras a, b, c y e, y tiene caractersticas similares a la distribucin normal

4.

Distribucin normal

Distribucin sesgada.
Forma de la distribucin de unos datos en la que sea aprecian claramente dos o ms modas (picos). Por lo general, cada moda refleja una condicin o realidad diferente. Ver figura e) Posibles causas: - Desgastes o desajustes - Procedimientos viciados en la forma de obtener las mediciones o un desempeo especial del proceso - Existen caractersticas de calidad que, por su naturaleza, tienen sesgo, como son tiempos de vida y resistencias a la fatiga. Una forma de decidir si una distribucin sesgada indica una situacin especial a corregir, consiste en comparar esta con la distribucin de la misma caracterstica o de variables similares para datos obtenidos en otro periodo de tiempo. La recomendacin general es que ante la sospecha de que hay algo especial atrs de una distribucin con sesgo se debe investigar si efectivamente es as.

Distribucin multimodal.
Forma de la distribucin de unos datos en la que sea aprecian claramente dos o ms modas (picos). Por lo general, cada moda refleja una condicin o realidad diferente. Ver figura e) Este tipo de distribuciones con dos o mas modas reflejan la presencia de dos o mas realidades o condiciones diferentes. Algunas situaciones que originan una distribucin multimodal son: - Diferencias importantes de lote a lote en la materia prima que utiliza el proceso, debido a que proceden de diferentes proveedores o al exceso de variacin de un mismo proveedor. - Cuando en el proceso intervienen varios operadores, con criterios o mtodos de trabajo diferentes. - Las mediciones de la variable de salida que estn representadas en el histograma fueron realizadas por personas o instrumentos diferentes; por lo tanto, se utilizaron distintos criterios o instrumentos mal calibrados. - El proceso, cuando genero los resultados de la distribucin multimodal, fue operando en condiciones diferentes (una condicin para cada moda). - En general, una distribucin multimodal se debe a la presencia de fuentes de variacin bien definidas que deben ser identificadas y corregidas, a fin de mejorar la capacidad del proceso correspondiente. - Una forma de identificarlas es analizar por separado los datos en funcin de diferentes lotes de materia prima, operadores, instrumentos de medicin, turnos o das de produccin, etc., para as comparar los resultados y ver si hay diferencias significativas.

Distribucin muy plana.


En figura g se aprecia un histograma que muestra una distribucin muy chata o plana y que esta lejos de tener forma de campana. Las situaciones que pueden causar esto son las mismas que las de la distribucin multimodal, pero con la particularidad de que las diferencias son menos fuertes; sin embargo, afectan de manera seria la capacidad de un proceso. Por lo tanto, tambin deben ser identificadas y corregidas mediante la estrategia recomendada antes.

Distribucin con acantilados.


En figura h) se observa un acantilado derecho, que es una corte muy brusco en la cada de la distribucin. suspensin o

Algunas de las posibles causas que motivan la presencia de un acantilado son: - Un lote de artculos previamente inspeccionados al 100% donde se excluyo a los artculos que no cumplen con alguna medida mnima o que exceden una medida mxima - Problemas con el equipo de medicin, errores en la medicin o inspeccin (cuando el inspector esta predispuesto a no rechazar un articulo y observa que este casi cumpla con los requisitos, registra la medida mnima aceptable). En general, un acantilado es anormal y, por lo tanto, se debe buscar la causa del mismo.

5.

Datos raros o atpicos. Una pequea cantidad de mediciones muy extremas o atpicas son identificadas con facilidad mediante un histograma, debido a que aparecen una o mas barras pequeas bastante separadas o aisladas del resto. Un dato raro refleja una situacin especial que se debe investigar, y entre las posibles causas estn las siguientes: El dato es incorrecto, ya sea por error de medicin, de registro o de dedo cuando fue introducido a la computadora. La medicin fue realizada sobre un articulo o individuo que no forma parte del proceso o poblacin a la que pertenece el resto. Si han sido descartadas las dos situaciones anteriores, entonces la medicin se debe a un evento raro o especial. Es decir, cuando se hizo la medicin, en el proceso estaba ocurriendo una situacin especial o fuera de lo comn.

6.

Estratificar. En ocasiones, en el histograma no se observa ninguna forma particular pero existe mucha variacin y, en consecuencia, la capacidad del proceso es baja. Cuando los datos proceden de distintas maquinas, proveedores, lotes, turnos u operadores, puede encontrarse informacin valiosa si se hace un histograma por cada fuente (estratificar), con lo que se podr determinar cual es la maquina o el proveedor mas problemtico.

Limitaciones del histograma


Aunque el histograma es una herramienta fundamental para analizar el desempeo de un proceso, tiene algunas limitaciones: 1. No considera el tiempo en el que se obtuvieron los datos; por lo tanto, con el histograma es difcil detectar tendencias que ocurren a travs del tiempo. Por tal razn, no ayuda a estudiar la estabilidad del proceso en el tiempo, lo cual se analiza por medio de cartas de control. 2. No es la tcnica ms apropiada para comparar de manera prctica varios procesos o grupos de datos; en esos casos, el diagrama de caja o la grfica de medias son ms apropiados. 3. La cantidad de clases o barras influye en la forma del histograma, por lo que una buena prctica es que a partir de la cantidad de clases que de manera inicial sugiere un software, se analice el histograma con un numero de clases ligeramente menor y un poco ms de clases, a fin de verificar si se observa algo diferente.

Diagramas de tallo y hoja


El diagrama "tallo y hojas" permite obtener simultneamente una distribucin de frecuencias de la variable y su representacin grfica. Esta representacin de los datos es semejante a la de un histograma pero adems de ser fciles de elaborar, presentan ms informacin que estos.

1. Organizar de manera ascendente las mediciones. 2. Definir el tallo eliminando el ultimo digito 3. En el lado derecho se coloca el ultimo digito (hoja) que corresponde a cada valor de tallo y que representa la frecuencia 4. Se construye la grafica utilizando los valores de tallo y hoja

Вам также может понравиться