Вы находитесь на странице: 1из 41

CAPULO 1.

- INTRODUCCIN A LA PROBABILIDAD Cada vez que realizamos un clculo matemtico para resolver un problema fsico, estamos aplicando un modelo matemtico a un fenmeno de la realidad. Este fenmeno puede ser, por ejemplo, la cada de un objeto desde cierta altura, y en este caso utilizamos un modelo que es la Ley de Gravedad. Qu es un modelo?. Al enfrentar un problema de fsica, qumica, ingeniera, etc., estamos analizando e investigando una parte o aspecto de la realidad material que nos rodea. Para resolver el problema, necesitamos modelar esa realidad, es decir, construir una representacin en la mente de cmo ocurren los hechos, junto con ecuaciones matemticas que permitan calcular los efectos de los mismos. En ningn caso se debe confundir modelo con realidad. Un modelo es slo una representacin de la realidad, utilizado para estudiar y analizar dicha realidad. Hay modelos matemticos que nos permiten obtener un resultado numrico preciso, por ejemplo, que la velocidad de un automvil es de 175,5 Km/Hora. O que la corriente elctrica que circula por un cable es de 5,7 Amperios. Este tipo de modelos matemticos se denominan Determinsticos. Existen tambin fenmenos que necesitan otro tipo de modelos matemticos, denominados no determinsticos, probabilsticos o estocsticos. Por ejemplo, supongamos que se ha previsto la realizacin de unas pruebas balsticas para las que se necesita saber la cantidad de lluvia que va a caer en un prximo periodo de tiempo, antes de decidir la forma de llevar a cabo los ensayos. El Tcnico responsable podr informarse en el servicio meteorolgico en relacin con la presin baromtrica, la temperatura, velocidad del viento y otros datos meteorolgicos, sin embargo, no hay una ecuacin que con todos esos datos le permita calcular de forma precisa los milmetros de lluvia que van a caer durante el periodo de tiempo que le interesa. De la misma forma, ningn operador puede calcular cuanto va a subir la Bolsa, ni siquiera si va a subir o bajar, an cuando tenga a su alcance todas las variables econmicas disponibles. Este tipo de fenmenos no admiten un modelo determinstico, sino un modelo probabilstico, que como resultado nos dice la probabilidad de que llueva una cierta cantidad, o la probabilidad de que la Bolsa suba un cierto porcentaje. El resultado no es un valor determinado, sino la probabilidad de un valor. Veamos algunos ejemplos de fenmenos para los cuales es apropiado utilizar un modelo probabilstico:

Experimento 1: Se lanza un dado y se anota el nmero que aparece en la cara superior. Experimento 2: Se arroja una moneda cuatro veces y se anota la sucesin de caras y cruces obtenidas.

Experimento 3: Se fabrican artculos en una lnea de produccin y se cuenta el nmero de artculos defectuosos producidos en 24 horas. En todos estos casos, el resultado del experimento no se puede predecir con absoluta certeza. Hay varios resultados posibles cada vez que se realiza la experiencia. Para cada experimento del tipo que estamos considerando, se define el Espacio Muestral como el conjunto de todos los resultados posibles que pueden producirse al realizar el experimento. Los espacios muestrales respectivos son : S1 = {1,2,3,4,5,6} S2 = {cccc, xccc, cxcc, ccxc, cccx, xxcc, xcxc, xccx, cxcx, ccxx, xxxc, xxcx, cxxx, xcxx, xxxx} S3 = {1,2,3,, N} ; N mximo de artculos producidos en 24 horas. Un Suceso, respecto a un espacio muestral S asociado con determinado experimento, es un subconjunto de resultados del espacio muestral. El conjunto vaco, el formado por un solo elemento y el formado por todos los elementos del espacio muestral son tambin sucesos. Vemos entonces que, dado un experimento aleatorio cualquiera, hay un espacio muestral asociado cuyos elementos son todos los resultados que se pueden obtener de la experiencia. Un subgrupo o subconjunto de resultados es un suceso. Ahora, cmo podemos saber si la posibilidad de que ocurra un suceso es grande o pequea? Por ejemplo, si arrojamos un dado, cmo podemos calcular la probabilidad de que salga un 2 ?. Para esto necesitamos un nmero asociado con cada suceso, al cual se lo denomina probabilidad del suceso. Entonces, la probabilidad P de un suceso es un nmero entre 0 y 1, que nos dice en que medida es posible que ocurra el suceso. Si la probabilidad es 1 significa que el suceso ocurrir con toda certeza. Si la probabilidad es 0,5 significa que un suceso puede ocurrir o puede no ocurrir con la misma probabilidad. Probabilidad 0 quiere decir que el suceso es imposible que ocurra. Cmo podemos calcular la Probabilidad de un suceso?

La respuesta a esta pregunta no siempre es sencilla y depende del experimento y de su espacio muestral asociado. Hay casos simples en los que el clculo es relativamente sencillo. En primer trmino, supondremos que se trata de un experimento cuyo espacio muestral es finito y tiene un nmero pequeo de resultados posibles. En segundo trmino, supondremos que todos los resultados que integran el espacio muestral (sucesos elementales) tienen la misma probabilidad de ocurrir. Con estas dos hiptesis, la frmula para calcular la probabilidad es muy sencilla. Supongamos que se trata de un experimento cualquiera cuyo espacio muestral S tiene N elementos (N resultados posibles). Deseamos calcular la probabilidad de un suceso H (Un subconjunto H del espacio muestral S) que tiene m elementos. De acuerdo a lo dicho previamente, el nmero N tiene que ser pequeo y la probabilidad de cada suceso elemental tiene que ser la misma. Entonces la probabilidad P de que ocurra el suceso H es: P = m/N Veamos algunos ejemplos. Supongamos que se arroja un dado sobre una mesa y apostamos a que salga un nmero igual o menor que 4. Sabemos que son igualmente posibles los nmeros: {1, 2, 3, 4, 5 y 6} (Espacio muestral con 6 elementos). Pero los nmeros favorables a nuestra apuesta son: {1, 2, 3 y 4} (Suceso con 4 elementos). Entonces, la probabilidad de que ganemos es P = 4/6 = 0,666 Es decir que tenemos a nuestro favor una probabilidad de 0,666.. (o sea aproximadamente del 67 %). Si apostamos a un slo nmero (sacar un As), la probabilidad de ganar sera P = 1/6 = 0,1666 Repitiendo, la probabilidad es un nmero entre 0 y 1, que nos dice en que medida es posible que ocurra un suceso.

CAPITULO 2.- CONCEPTOS ESTADSTICOS FUNDAMENTALES Poblacin estadstica.

Hasta ahora hemos visto el caso de fenmenos o experimentos cuyo espacio muestral asociado tiene un nmero pequeo de elementos. Ello nos ha servido para introducir la nocin de probabilidad, Pero en muchos casos es necesario trabajar con experiencias o procesos que generan un nmero muy grande de datos o resultados numricos, es decir, espacios muestrales con un nmero infinito o muy grande de elementos.Cuando tenemos un conjunto muy grande de datos numricos para analizar decimos que tenemos un Universo o Poblacin de observaciones. Cada dato numrico es un elemento de la poblacin o universo. Una Muestra es un subconjunto pequeo de observaciones extradas de un universo o poblacin. La Estadstica trabaja con poblaciones de datos y con muestras extradas de las mismas. Los conceptos de poblacin y muestra a veces resultan ambiguos en su aplicacin prctica. Por ejemplo, supongamos que en una ciudad de 5000 habitantes se realiza un censo mdico en el cual se mide el peso, la altura y se relevan otros datos de todos los habitantes de la ciudad. Alguien podra referirse al universo o poblacin censada teniendo in mente el conjunto de los habitantes de la ciudad. Pero cuando hablamos en trminos estadsticos, nos referimos a poblaciones o universos de datos. Por ejemplo, el conjunto de todas las mediciones de altura (De los habitantes de la ciudad) es un conjunto de datos y por lo tanto constituye un universo o poblacin de datos desde el punto de vista estadstico. Otro universo o poblacin de datos son los pesos medidos (De los habitantes de la ciudad). Pero la poblacin de habitantes, es decir, las personas que habitan la ciudad no son la poblacin a la que nos estamos refiriendo desde el punto de vista estadstico.

Supongamos que en una empresa se fabrica un lote de 10 toneladas de un producto qumico, y un tcnico debe controlar la calidad del mismo. El tcnico toma una pequea porcin, por ejemplo, 100 gramos y dir que tom una muestra del producto para analizar en el laboratorio. Hasta el momento, la muestra no fue analizada y por lo tanto no tenemos ningn dato numrico. Cuando el laboratorio efecta algn ensayo en la muestra y obtiene un resultado numrico, dicho dato podra ser analizado desde el punto de vista estadstico. Vamos a suponer hipotticamente que el tcnico contina sacando otras muestras del producto, hasta agotar el lote y cada una es ensayada en el laboratorio, que nos da los resultados. Como tenamos 10 toneladas de producto y las muestras son aproximadamente de 100 gramos, el tcnico seguramente extraer alrededor de 100000 muestras y el laboratorio nos entregar alrededor de 100000 resultados. Este conjunto de datos numricos es nuestro universo o poblacin de datos. Si tomamos al azar 10 de esos resultados, podemos decir que tenemos una muestra de 10 elementos de ese universo o poblacin. No debemos confundir esta muestra (Desde el punto de vista estadstico) con la muestra de material que extrajo el tcnico para ser analizada en el laboratorio. Ahora bien, nuestro universo o poblacin de datos a veces no existe en la realidad, sino que es un concepto o abstraccin que utilizamos para referirnos al universo o poblacin que hipotticamente podra existir. Veamos el ejemplo anterior. Supongamos que el tcnico toma solamente 5 muestras y las enva para analizar al laboratorio. El laboratorio nos enviar slo 5 resultados, y nosotros diremos que tenemos una muestra de datos extrada del universo o poblacin de datos total. Y estamos pensando en el universo o poblacin que tendramos si se hubieran extrado y analizado las 100000 muestras de material. Muchas veces resulta difcil imaginarse cual es el universo del cual extrajimos los datos. Supongamos que tenemos una mquina que produce piezas de plstico en serie y un tcnico toma 5 piezas sucesivas y les mide la altura con un calibre. Tenemos, entonces, 5 resultados, es decir una muestra de 5 elementos. Cul es el universo al cual pertenece esa muestra de datos?. Debemos imaginar lo siguiente: Si la mquina continuara trabajando en las mismas condiciones (Es decir, a la misma velocidad, con las mismas materias

primas, a la misma temperatura, manejada por el mismo operario, etc.) ...y a cada pieza que produce se le mide la altura tendramos un conjunto muy grande de resultados numricos. Ese conjunto muy grande de resultados numricos que no existe, pero que podra obtenerse en esas condiciones es el universo o poblacin del cual extrajimos la muestra de 5 observaciones.

Veamos otro ejemplo. Supongamos que el sindicato de la industria textil desea saber cual es el sueldo medio de un operario en esa industria. Entonces, encarga una encuesta a una empresa especializada, que entrevista a 20 operarios de la industria textil y averigua sus salarios. Estos datos son una muestra de 20 observaciones del universo o poblacin formado por los salarios de todos los operarios de la industria textil del pas. Aunque el encuestador no disponga de esos datos, sabemos que existen miles de operarios que ganan un salario determinado y por lo tanto podemos hablar de un universo o poblacin cuyos elementos son los salarios de los operarios de la industria textil en el pas. Adems, esa poblacin de datos es seguramente diferente de la poblacin de salarios de los operarios de la industria textil inglesa o brasilea (Usando una misma moneda de referencia). Qu representa una Poblacin de datos? El anlisis estadstico de una poblacin o universo de datos tiene como objetivo final descubrir las caractersticas y propiedades de aquello que gener los datos. Por ejemplo, se tiene una poblacin de escolares (Poblacin fsica, poblacin humana) y se les mide la altura. El conjunto de datos de altura constituye una poblacin o universo estadstico. El anlisis de estos datos de altura (Universo estadstico) sirve para caracterizar y estudiar a la poblacin de estudiantes (Que no es una Poblacin estadstica). Supongamos que un instituto dedicado a estudios econmicos ha realizado una encuesta de ingresos en el pas. El universo de datos generados por la encuesta sirve a los fines de caracterizar a la poblacin fsica, a la poblacin real del pas, desde un punto de vista econmico. Un ingeniero controla un proceso industrial, que genera a diario muchos lotes de

un producto (Poblacin de lotes). Para cada lote se mide una caracterstica de calidad, obtenindose una gran cantidad de resultados numricos (Poblacin de datos). El ingeniero realiza esta tarea porque a travs de los datos numricos obtenidos se puede evaluar el comportamiento del proceso, que es lo que realmente le interesa.

Es importante destacar que detrs de un universo o poblacin de datos se encuentra una poblacin fsica subyacente, formada por elementos de la realidad que nos rodea, de la cual, a travs de algn tipo de medicin, se obtuvieron los datos numricos. Es esa poblacin fsica subyacente (Elementos de la realidad, seres humanos, lotes de material, etc.) la que deseamos estudiar y caracterizar por medio del anlisis estadstico de los datos obtenidos. La poblacin estadstica est representando, entonces, una poblacin fsica o natural formada por elementos de la realidad, con respecto a una caracterstica o propiedad de esa poblacin fsica. Es muy importante, al utilizar mtodos estadsticos, no confundir la poblacin fsica, formada por elementos de la realidad que estamos estudiando, con la poblacin o universo de datos generados a partir de la primera. De aqu en adelante, cuando utilicemos los trminos poblacin o universo sin otro adjetivo nos estaremos refiriendo a poblacin o universo de datos numricos (Tambin

llamados observaciones, mediciones o valores). La Distribucin de Frecuencias

CAPTULO 3.- METRICA EN EL ESPACIO ESTADISTICO Medidas de tendencia central Una caracterstica importante de cualquier poblacin es su posicin, es decir, donde est situada con respecto al eje de abscisas (Eje horizontal). En nuestro caso, es importante saber si los datos se agrupan alrededor de 60 Kg. o de 90 Kg. o alrededor de 12 Kg. Una manera de obtener un dato numrico que nos d idea de la posicin de nuestra poblacin es calcular el Promedio o Media de todas las observaciones:

Este importante parmetro nos permite efectuar comparaciones entre distintas poblaciones. Por ejemplo, si tuviramos una poblacin formada por mediciones del peso de mujeres de 30 aos, otra de peso de varones de 40 aos y una tercera de peso de nios de 8 aos, es indudable que los promedios van a ser diferentes. El promedio, entonces, nos est diciendo que las tres poblaciones son diferentes y tambin en que medida difieren. Ahora, si tuviramos una poblacin de varones con peso promedio 70 Kg. y otra poblacin de varones con el mismo promedio, se puede afirmar que ambas poblaciones son equivalentes? Para responder esta pregunta necesitamos tener medidas de la dispersin de la poblacin de datos. Medidas de Dispersin La otra caracterstica muy importante de una poblacin es el grado de dispersin de las observaciones. No es lo mismo si en nuestra poblacin encontramos que todos los valores estn entre 75 y 90 Kg. que si estn entre 60 y 105 Kg., aunque el promedio sea el mismo. Es necesario agregar alguna idea de la dispersin de los valores. Una manera es a travs del Rango de las observaciones, es decir, el valor Mximo y el valor Mnimo de los datos de la poblacin. Entonces, una descripcin mas realista acerca de los seres humanos sera decir que pesan en promedio 70 Kg. y que el rango es de 40 a 120 Kg. (Estos valores son supuestos). Una manera ms precisa de dar idea de la dispersin de valores de una poblacin es a travs de la Varianza o su raz cuadrada, que es la Desviacin Standard.

Vamos a calcular la varianza y la desviacin standard de un nmero pequeo de datos (Una muestra) para ilustrar el clculo. Supongamos que se midi la altura de 10 personas adultas y de sexo femenino, y se obtuvieron los valores siguientes (en cm) 165 ; 163 ; 171 ; 156 ; 162 ; 159 ; 162 ; 168 : 159 ; 167 El promedio de estas observaciones es: = 163, 2 cm Si a cada una de las observaciones le restamos el promedio, obtenemos los Residuos:

Los residuos tambin nos dan una idea de la dispersin de las observaciones individuales alrededor del promedio. Si el valor absoluto (El valor numrico sin el signo) de los residuos es grande, es porque los valores estn muy dispersos. Si el valor absoluto de los residuos es pequeo, significa que las observaciones individuales estn muy cerca del promedio, y por lo tanto, hay poca dispersin. Pero nosotros necesitamos un slo nmero que nos provea informacin acerca de la dispersin de los valores. Si sumamos los residuos, como algunos son positivos y otros negativos, se cancelaran entre s, con lo cual perdemos la informacin acerca de la dispersin. Entonces, los elevamos al cuadrado:

Si ahora sumamos los residuos elevados al cuadrado, tenemos un nmero donde se condensa toda la informacin de la dispersin de la poblacin:

Este nmero, la suma de cuadrados, es dependiente del nmero de datos N, y por lo tanto no nos sirve para comparar poblaciones con distinto nmero de observaciones. Pero si dividimos la suma de cuadrados por N, tenemos un nmero que es independiente del nmero de observaciones, que se denomina Varianza:

En nuestro caso: Las frmulas anteriores son las que se aplican al clculo de la varianza y desviacin standard de una poblacin de datos. Mas adelante veremos que las frmulas a aplicar en el caso de una muestra son ligeramente diferentes. La varianza es un nmero que nos permite comparar poblaciones. Cuando la dispersin de las observaciones es grande (Datos que se alejan mucho por encima y por debajo del promedio), el valor de los residuos (distancia entre cada dato y el promedio) ser grande. Entonces aumenta la suma de cuadrados de los residuos y por lo tanto la varianza. Tambin se utiliza la raz cuadrada de la varianza:

Por lo tanto:

La desviacin standard o desviacin tpica tiene las mismas unidades que la variable con la que estamos trabajando, en nuestro caso el centmetro. Tanto la varianza como la desviacin standard nos permiten comparar el grado de dispersin de distintas poblaciones. Media y Varianza de una Muestra CAPTULO 4.- FUNCIONES DE DISTRIBUCIN DE PROBABILIDADES Hemos visto como se construye un grfico de frecuencias con datos extrados de una poblacin. A medida que aumentamos la cantidad de observaciones que tomamos de la poblacin, podemos construir nuestro grfico con un nmero mayor de intervalos, aunque de menor amplitud (El rango total cubierto por la poblacin es el mismo).

Si continuamos este proceso, con intervalos cada vez mas estrechos y numerosos, los altibajos en el grfico de la distribucin de frecuencias tienden a desaparecer. En el lmite, el ancho del intervalo tiende a cero y la poblacin puede representarse por una distribucin de probabilidad continua. Cuando, para representar esta distribucin de probabilidad continua se utiliza una funcin matemtica, esta se denomina Funcin de Densidad de Probabilidad. La forma de la curva en el grfico de la funcin de distribucin es caracterstica de la poblacin de observaciones asociada con la misma, y depende de variables internas del proceso que gener los datos de la poblacin.Existen distintas funciones de distribucin tericas, cada una de las cuales est basada en un modelo de comportamiento del proceso que gener el universo de observaciones. La aplicacin de una de estas distribuciones tericas a una poblacin particular est justificada si las hiptesis (suposiciones) del modelo de comportamiento del proceso que gener la poblacin se cumplen. Dicho de otro modo, si conocemos el proceso, es decir, el conjunto de fenmenos que dieron lugar a nuestra poblacin de mediciones u observaciones, y adems estamos seguros de que el mismo se ajusta a un modelo de comportamiento determinado, entonces podemos decir que la distribucin de probabilidades de nuestra poblacin es la que corresponde al modelo. En la prctica, se sabe que ciertos procesos y fenmenos generan resultados numricos cuya distribucin de probabilidades se puede ajustar a determinados modelos tericos. Por ejemplo, el nmero de partculas alfa emitidas por un material radiactivo sigue una distribucin de Poisson. Existen muchas otras distribuciones tericas, como la Binomial, la Exponencial, la de Weisbull, etc. Cada una de ellas tiene su propio campo de aplicacin, que se sostiene en un determinado comportamiento de los fenmenos, y al aplicarla se est haciendo en forma implcita la suposicin de que se cumplen las suposiciones del modelo subyacente. La Distribucin Normal

Una distribucin muy importante es la Distribucin Normal o de Gauss. La ecuacin matemtica de la funcin de Gauss es la siguiente:

La distribucin normal es una curva con forma de campana, con eje de simetra en el punto correspondiente al promedio del universo . La distancia entre el eje de simetra de la campana y el punto de inflexin de la curva es igual a , la desviacin standard de la poblacin. El rea total debajo de la curva es igual a 1. El rea debajo de la curva comprendida entre y + es aproximadamente igual a 0,68 del rea total; entre 2 y + 2 es aproximadamente igual a 0,95 del rea total: Es importante ver que los nicos parmetros necesarios para dibujar el grfico de la distribucin normal son y (Media y desviacin standard de la poblacin). Con estos dos parmetros sabemos donde situar la campana de Gauss (En el punto correspondiente a la media) y cual es su ancho (Determinado por la desviacin standard). Cuando nos encontramos con una poblacin de observaciones, si podemos afirmar que la distribucin correspondiente es normal, slo hace falta estimar la media y la desviacin standard para tener toda la informacin necesaria acerca de dicha poblacin. La Distribucin Normal Standard Podemos escribir la frmula de la distribucin normal de la siguiente manera:

con Esta es la frmula de la Distribucin Normal Standard o Tipificada. Como podemos observar, en ella hay un slo parmetro, Z, que incluye al promedio y la desviacin standard de la poblacin. Esta funcin est tabulada. Al calcular Z, lo que estamos haciendo, en realidad, es un cambio de variable por el cual movemos la campana de Gauss centrndola en el 0 del eje X, y modificamos el ancho para que la desviacin standard sea 1.

De esta manera tenemos tabulada una funcin de Gauss que no depende de cual sea el promedio y la desviacin standard de nuestra poblacin real. El cambio de variable hace que se conserve la forma de la funcin y que sirva para cualquier poblacin, siempre y cuando esa poblacin tenga una distribucin normal. Cuando queremos calcular las probabilidades para una poblacin real, calculamos Z y entramos en la tabla de la funcin normal estandard.

La Distribucin T de Student En la generalidad de los casos, no disponemos de la desviacin standard de la poblacin, sino de una estimacin calculada a partir de una muestra extrada de la misma y por lo tanto no podemos calcular Z. En estos casos calculamos el estadstico T:

con

donde S es la desviacin standard muestral, calculada con n-1 grados de libertad. Ntese que utilizamos S, la Desviacin Standard de una Muestra, en lugar de , la Desviacin Standard de la Poblacin. El estadstico T tiene una distribucin que se denomina distribucin T de Student, que est tabulada para 1, 2, 3, ... etc. grados de libertad de la muestra con la cual se calcul la desviacin standard. La distribucin T tiene en cuenta la incertidumbre en la estimacin de la desviacin standard de la poblacin, porque en realidad la tabla de T contiene las distribuciones de probabilidades para distintos grados de libertad.

La distribucin T es mas ancha que la distribucin normal tipificada Para un nmero de grados de libertad pequeo. Cuando los grados de libertad tienden a infinito, la distribucin T tiende a coincidir con la distribucin normal standard. Es decir, en la medida que aumentemos el nmero de observaciones de la muestra, la desviacin standard calculada estar mas prxima a la desviacin standard de la poblacin y entonces la distribucin T correspondiente se acerca a la distribucin normal standard. El uso de la distribucin T presupone que la poblacin con que estamos trabajando tiene una distribucin normal. Distribucin de Promedios Muestrales Para comprender que significa distribucin de promedios muestrales, vamos a suponer que realizamos un experimento con bombos como los usados en la lotera. Colocamos un nmero muy grande de bolas blancas en un bombo blanco, en cada una de las cuales figura un dato X. Este bombo representa la poblacin de observaciones X, y tiene media m y varianza s2. Supongamos que a continuacin hacemos los siguiente: 1) Tomamos una muestra de n=10 bolas blancas. 2) Calculamos la media y la anotamos en una bola azul. 3) Colocamos la bola azul en un segundo bombo de color azul. 4) Devolvemos las bolas blancas a su bombo y le damos vueltas. 5)Repetimos toda la operacin muchas veces hasta que el bombo azul est lleno de bolas azules. Entonces, los nmeros del bombo azul forman una poblacin de promedios muestrales. Esta es una poblacin derivada de la anterior, y tiene la misma media o promedio que la distribucin original, pero su varianza es un ensimo de la varianza de la distribucin original:

En el caso del bombo azul, si denominamos tenemos:

a la varianza y

a la media,

La distribucin de medias muestrales est situada en el mismo lugar (alrededor de la misma media) que la distribucin original, pero es mucho mas estrecha, porque su varianza es la dcima parte de la varianza original. La distribucin original de observaciones representada por el bombo blanco se denomina comnmente distribucin madre o base. Al construir la poblacin de promedios muestrales, realizbamos extracciones de 10 bolas blancas despus de dar vueltas al bombo. Es decir, que estbamos realizando un muestreo aleatorio de la poblacin madre, porque cada una de las bolas blancas tena la misma posibilidad de ser elegida para integrar la muestra. Aunque la poblacin original no sea de distribucin normal, si el muestreo es aleatorio, la poblacin de promedios muestrales se aproximar a la normalidad, es decir, ser casi de distribucin normal. Este efecto se debe a un teorema de estadstica matemtica denominado Teorema Central del Lmite. En resumen, si se cumple la hiptesis de muestreo aleatorio, tenemos:

En general, en los problemas que se presentan habitualmente, existe una poblacin de observaciones cualesquiera, de la cual tomamos una muestra aleatoria, por medio de la cual intentamos conocer todo lo que sea posible acerca de la poblacin de la cual fue extrada. El promedio de la muestra de n elementos pertenece a la distribucin de promedios muestrales de la poblacin original. Es decir, que el promedio de la muestra que obtuvimos es uno de los muchos promedios muestrales que se distribuyen alrededor de m con desviacin standard. Por lo tanto, si la muestra es mas grande (n mayor), estaremos en una distribucin de promedios con desviacin standard mas pequea, por lo cual, el promedio de la muestra estar mas cerca del promedio del universo. Es por esto que es razonable pensar que el promedio de la muestra es una estimacin del promedio del universo.

Distribucin binomial Una persona arroja un dado apostando con otra a que saca un as (un 1). La

probabilidad de sacar el as es igual a:

Es decir que la probabilidad que tiene de acertar es 17 % aproximadamente. Ahora, supongamos que la persona arroja 5 dados iguales a la vez. Cul es la probabilidad de que saque 0, 1, 2, 3... unos?. Cuando realizamos una experiencia individual donde el resultado debe ser slo uno de dos posibles: acierto/fallo, cara/cruz, etc. decimos que es un ensayo de Bernouilli. Es tan probable sacar 1 2 ases como sacar 5 ases?. A priori parecera que no. En nuestro caso, cada vez que arrojamos un dado podemos definir nuestro experimento registrando slo dos resultados posibles: Cada acto individual de arrojar un dado es independiente de los otros y las probabilidades de obtener un as o de no obtener ninguno, son, respectivamente : Por lo que, cuando arrojamos 5 dados, la probabilidad de obtener 5 ases es:

Y la probabilidad de no obtener ningn As en los 5 dados arrojados es:

Nos falta calcular las probabilidades intermedias, es decir la probabilidad de obtener 1, 2, 3...ases. Es posible calcular todas estas probabilidades con una frmula binomial. Cul es la probabilidad de sacar un As al arrojar cinco dados? Por ejemplo, una forma es que salga un As en el primer dado. La probabilidad de sacar 1 As en el primer dado y no sacar As en los otros cuatro es:

Pero hay 5 formas diferentes de obtener 1 As en cinco dados arrojados: que se obtenga en el 1 de los dado, o en el 2 o en el 3 o en el 4 o en el 5. Por lo tanto, la probabilidad de sacar 1 As al arrojar 5 dados es:

Cmo podemos generalizar el clculo de las distintas formas de obtener 1 As, 2 Ases, etc. en cinco dados arrojados? La respuesta la dan los nmeros combinatorios:

; donde : m! = 1*2*3**m y n! = 1*2*3**n son el factorial de m y de n respectivamente. La expresin representa el nmero de combinaciones de m elementos tomados de n en n (agrupados de n en n). Por ejemplo, si tenemos las 5 letras A, B, C, D y E, y queremos saber cuantas son todas las combinaciones posibles agrupndolas de a tres en cualquier orden: ABC, ADC,...etc., tenemos :

Y las distintas combinaciones son : ABC, ABD, ABE, ACD, ACE, ADE, BCD, BCE, BDE, CDE Supongamos que se realizan n ensayos de Bernoulli, con probabilidad p de tener un acierto, (1-p) de tener un fallo. Entonces, la probabilidad de obtener y aciertos en n ensayos de Bernouilli es:

Esta probabilidad es un trmino del binomio siguiente:

, donde p+q = 1

Los trminos de la suma son las probabilidades P(y), que determinan la distribucin de probabilidades de la variable aleatoria y, la cual es una variable discreta (toma los valores 0, 1, 2, ...etc.). Aplicando la frmula al caso de 5 dados:

Las probabilidades de no sacar ningn As o de sacar uno, dos, tres, cuatro o cinco, son :

Cules son los parmetros estadsticos de la variable aleatoria Y ? La media es: standard resulta: En la experiencia de arrojar 5 dados: Cmo interpretamos este resultado? Si bien el promedio resulta un valor fraccionario, nos est diciendo que al arrojar los cinco dados estaremos ms cerca de sacar 1 As que de sacar 2 o ms ases. De una manera ms rigurosa, ese valor nos dice que si se repitiera la experiencia muchas veces, el promedio del nmero de ases que se obtendra en todos los experimentos sera igual a 0.83 La varianza de Y resulta ser y la desviacin standard: ; la varianza es: , y, finalmente, la desviacin

Volvamos, ahora a nuestro jugador. Supongamos que arroja 5 dados y apuesta a que va a sacar 3 o ms ases, cul es la probabilidad que tiene de ganar? Esta probabilidad es la suma de los trminos del binomio para 3, 4 y 5 aciertos (ases), es decir:

Lo que significa una probabilidad de ganar de aproximadamente el 3,5 %.

CAPTULO 5.- TEST DE HIPTESIS El contraste de hiptesis o test de hiptesis es una herramienta ampliamente utilizada para comparar mediciones y tomar decisiones basadas en una probabilidad. Los pasos a seguir para aplicar esta metodologa son:

Plantear unas hiptesis. Escoger un estadstico concreto. Conocer la distribucin del estadstico.

Y, a partir de ah, decidir si, con los datos que poseemos de la muestra, tenemos caracterizada a la poblacin. Herramientas para contrastar hiptesis Los dos tipos de distribuciones ms importantes, aunque no nicos, para el contraste de hiptesis, son las distribuciones Normal y T-Student, que hemos visto en el captulo anterior. El contraste de hiptesis es un conjunto de reglas que nos permiten decidir cul de entre dos hiptesis debe ser aceptada como cierta en base a los resultados obtenidos en una observacin muestral. Se conocen como hiptesis nula (Ho) e hiptesis alternativa (Ha). La hiptesis nula puede mantenerse mientras los datos no indiquen su falsedad; la hiptesis nula nunca se puede afirmar , solo podremos aceptarla o rechazarla. Por

lo tanto trataremos de decidir si la informacin muestral que poseemos est en consonancia con Ho, o bien nos permite rechazar esa creencia con lo que aceptaremos Ha. Podemos distinguir entre dos tipos de hiptesis:

Paramtricas que se refieren a conjeturas sobre el parmetro de una distribucin. No paramtricas que responden a afirmaciones acerca de la naturaleza de la distribucin. Regin crtica. Tipos de errores

En la prctica el Contraste de Hiptesis consiste en estudiar si un estadstico que es funcin de las observaciones de la muestra est dentro de una regin llamada de aceptacin, o se encuentra en la regin de rechazo o regin crtica, de tal forma que si el estadstico se encuentra en la regin de aceptacin se aceptar la hiptesis nula y si cae en la regin de rechazo se rechazar dicha hiptesis. El estadstico muestral es un fenmeno aleatorio, por lo que pudiera pasar que aunque la Ho fuera cierta, el estadstico se encontrara en la regin de rechazo, en esta situacin estaramos cometiendo un Error de Tipo I ( ). Otra posible situacin sera encontrar el estadstico en la regin de aceptacin siendo la Ho falsa, con lo que cometeramos un Error Tipo II ( ). La forma de minimizar este problema es empleando muestras de tamao grande. Generalmente se procede fijando una probabilidad de error . Al valor se le denomina nivel de significacin y habitualmente es del 5%. Aunque existen diversos tipos de contrastes de hiptesis, nicamente explicaremos y pondremos ejemplo de dos de ellos, que son el contraste de medias y el contraste de diferencias de medias. Contraste de medias Con la notacin que habitualmente se utiliza en el contraste de hiptesis tendremos que es la media de la poblacin, la desviacin tpica de la poblacin, s la desviacin tpica de la muestra, n es el tamao de muestra, X la media de la muestra, y Z o t es el estadstico. Con relacin al contraste de medias, suelen emplearse dos tipos de pruebas, los tests unilaterales o los tests bilaterales, que tienen, respectivamente, las siguientes estructuras.

Ejemplo 1. Un laboratorio farmacutico afirma que el antiinflamatorio fabricado por ellos elimina la inflamacin en 14 minutos en los casos corrientes. Con el objeto de comprobar estadsticamente esta afirmacin, eligimos al azar 18 pacientes con inflamaciones varias y tomamos como variable de respuesta el tiempo transcurrido entre la administracin del antiinflamatorio y el momento en que desaparece la inflamacin. Adems, nos dicen que la variable tiempo transcurrido entre la administracin del antiinflamatorio y el momento en que desaparece la inflamacin sigue una distribucin normal de media 14 y desviacin 7. El tiempo medio de respuesta de la muestra fue de 19 minutos. Se pide comprobar la afirmacin del laboratorio a un nivel de significacin de 0.05. Solucin. Primero consideremos los datos que tenemos. X = 19, = 14, = 7, n = 18 Planteemos ahora las hiptesis de este test. Queremos contrastar la hiptesis nula a partir de la afirmacin de la empresa que dice que la inflamacin desaparece en 14 minutos; as pues, tendremos: Hiptesis nula Ho : = 14 La hiptesis alternativa ser el caso desfavorable, en esta ocasin para la empresa, y puede escribirse: Hiptesis alternativa Ha : > 14 Procederemos aceptando de entrada la hiptesis nula (m = 14), calculando el estadstico y observando si se sita en la regin crtica. Si as sucediera, rechazaramos la creencia inicial de aceptacin de la hiptesis nula. Sustituyendo los parmetros de la poblacin y de la muestra en el estadstico tenemos :

Con lo que podemos observar que el estadstico se sita en la regin crtica y ,por lo tanto no sigue el criterio de aceptacin de la hiptesis nula. De ese modo, rechazaramos la hiptesis Ho de que = 14 y concluimos que a un nivel 0.05 el tiempo medio de eliminar la inflamacin por este antiinflamatorio es superior a 14 minutos.

CAPTULO 6.- MANUAL DE CONTROL ESTADSTICO DE PROCESOS Introduccin Un sistema de control del proceso puede definirse como un sistema de realimentacin de la informacin en el que hay 4 elementos fundamentales: Proceso Por proceso entendemos la combinacin global de personas, equipo, materiales utilizados, mtodos y medio ambiente, que colaboran en la produccin. El comportamiento real del proceso -la calidad de la produccin y su eficacia productivadependen de la forma en que se dise y construy, y de la forma en que es administrado. El sistema de control del proceso slo es til si contribuye a mejorar dicho comportamiento. Informacin Sobre el Comportamiento El proceso de produccin incluye no solo los productos producidos, sino tambin los estados intermedios que definen el estado operativo del proceso tales como temperaturas, duracin de los ciclos, etc. Si esta informacin se recopila e interpreta correctamente, podr indicar si son necesarias medidas para corregir el proceso o la produccin que se acaba de obtener. No obstante, si no se toman las medidas adecuadas y oportunas, todo el trabajo de recogida de informacin ser un trabajo perdido. Actuacin Sobre el Proceso Las actuaciones sobre el proceso estn orientadas al futuro, ya que se toman en caso necesario para impedir que ste se deteriore. Estas medidas pueden consistir en la modificacin de las operaciones (por ejemplo, instrucciones de operarios, cambios en los materiales de entrada, etc) o en los elementos bsicos del proceso mismo (por ejemplo, el equipo -que puede necesitar mantenimiento, o el diseo del proceso en su conjunto- que puede ser sensible a los cambios de

temperatura o de humedad del taller). Debe llevarse un control sobre el efecto de estas medidas, realizndose ulteriores anlisis y tomando las medidas que se estimen necesarias. Actuacin sobre la Produccin

Las actuaciones sobre la produccin estn orientadas al pasado, porque la misma implica la deteccin de productos ya producidos que no se ajustan a las especificaciones. Si los productos fabricados no satisfacen las especificaciones, ser necesario clasificarlos y retirar o reprocesar aquellos no conformes con las especificaciones. Este procedimiento deber continuar hasta haberse tomado las medidas correctoras necesarias sobre el proceso y haberse verificado las mismas, o hasta que se modifiquen las especificaciones del producto. Es obvio que la inspeccin seguida por la actuacin nicamente sobre la produccin es un pobre sustituto de un rendimiento eficaz del proceso desde el comienzo. El Control del Proceso centra la atencin en la recogida y anlisis de informacin sobre el proceso, a fin de que puedan tomarse medidas para perfeccionar el mismo. Hay dos formas diferentes de diseo y anlisis de sistemas de control que utilizan herramientas estadsticas :

Control Estadstico de Proceso (CEP) del que trata este manual.

Control adaptativo, que utiliza lazos de retroalimentacin para predecir futuros valores de las variables de proceso. Este control dice cuando hay que corregir para mantener a las variables con oscilaciones mnimas alrededor de los valores objetivos y est basado en el Anlisis de series Temporales (Box-Jenkins).

Este tipo de control puede implementarse mediante sistemas de control automtico digital (caso ms habitual) o mediante grficos de control. En o sucesivo nos referiremos nicamente al Control Estadstico del Proceso.

Control Estadstico de Procesos (C.E.P) El CEP es una herramienta estadstica que se utiliza en el puesto de trabajo para conseguir el producto adecuado y a la primera. Los grficos de control constituyen el procedimiento bsico del C.E.P. Con dicho procedimiento se pretende cubrir 3 objetivos - Seguimiento y vigilancia del proceso - Reduccin de la variacin - Menos costo por unidad En cualquier proceso productivo, por muy bien que se disee y por muy cuidadosamente que se controle, siempre existir una cierta variabilidad inherente, natural, que no se puede evitar. Esta variabilidad natural, este ruido de fondo, es el efecto acumulado de muchas pequeas causas de carcter, esencialmente, incontrolable. Cuando el ruido de fondo sea relativamente pequeo consideraremos aceptable el nivel de funcionamiento del proceso y diremos que la variabilidad natural es originada por un sistema estable de causas de azar. Un proceso sobre el que solo actan causas de azar se dice que est bajo control estadstico. Por el contrario, existen otras causas de variabilidad que pueden estar, ocasionalmente, presentes y que actuarn sobre el proceso. Estas causas se derivan, fundamentalmente, de tres fuentes:
Ajuste inadecuado de las mquinas Errores de las personas que manejan las mquinas Materia prima defectuosa.

La variabilidad producida por estas causas suele ser grande en comparacin con el ruido de fondo y habitualmente sita al proceso en un nivel inaceptable de

funcionamiento. Denominaremos a estas causas causas asignables y diremos que un proceso funcionando bajo causas asignables est fuera de control. Un objetivo fundamental del C.E.P. es detectar rpidamente la presencia de causas asignables para emprender acciones correctoras que eviten la fabricacin de productos defectuosos. Alcanzar un estado de control estadstico de proceso puede requerir un gran esfuerzo pero es slo el primer paso. Una vez alcanzado, podremos utilizar la informacin de dicho control como base para estudiar el efecto de cambios planificados en el proceso de produccin con el objetivo de mejorar la calidad del mismo. La Operacin Evolutiva es un tipo de Diseo de Experimentos en lnea (aplicado al proceso productivo) que sirve como herramienta para acercarnos a las condiciones ptimas de funcionamiento del proceso. Grficos CEP. Generalidades Los grficos de control o cartas de control son una importante herramienta utilizada en control de calidad de procesos. Bsicamente, una Carta de Control es un grfico en el cual se representan los valores de algn tipo de medicin realizada durante el funcionamiento de un proceso continuo, y que sirve para controlar dicho proceso. Vamos a tratar de entenderlo con un ejemplo. Supongamos que tenemos una mquina de inyeccin que produce piezas de plstico, por ejemplo de PVC. Una caracterstica de calidad importante es el peso de la pieza de plstico, porque indica la cantidad de PVC que la mquina inyect en la matriz. Si la cantidad de PVC es poca la pieza de plstico ser deficiente; si la cantidad es excesiva, la produccin se encarece porque se consume ms materia prima.

En el lugar de salida de las piezas, hay un operario que cada 30 minutos toma una, la pesa en una balanza y registra la observacin. Supongamos que estos datos se registran en un grfico de lneas en funcin del tiempo:

Observamos una lnea quebrada irregular, que nos muestra las fluctuaciones del peso de las piezas a lo largo del tiempo. Esta es la fluctuacin esperable y natural del proceso. Los valores se mueven alrededor de un valor central (El promedio de los datos), la mayor parte del tiempo cerca del mismo. Pero en algn momento puede ocurrir que aparezca uno o ms valores demasiado alejados del promedio. Cmo podemos distinguir si esto se produce por la fluctuacin natural del proceso o porque el mismo ya no est funcionando bien? El control estadstico de procesos provee la respuesta a la anterior pregunta y a continuacin veremos como lo hace. Todo proceso de fabricacin funciona bajo ciertas condiciones o variables que son establecidas por las personas que lo manejan para lograr una produccin satisfactoria.

Cada uno de estos factores est sujeto a variaciones que realizan aportes ms o menos significativos a la fluctuacin de las caractersticas del producto, durante el proceso de fabricacin. Los responsables del funcionamiento del proceso de fabricacin fijan los valores de algunas de estas variables, que se denominan variables controlables. Por ejemplo, en el caso de la inyectora se fija la

temperatura de fusin del plstico, la velocidad de trabajo, la presin del pistn, la materia prima que se utiliza (Proveedor del plstico), etc.

CAPTULO 7.- GRAFICOS DE CONTROL POR VARIABLES Introduccin. Grficos basado en un estudio inicial Muchas caractersticas de calidad pueden expresarse en trminos de medida numrica. Por ejemplo, el dimetro de una pieza puede medirse con un micrmetro y expresarse en milmetros. Una caracterstica cualitativa que sea medible tal como un volumen, un peso, o cualquier dimensin, en general, es una variable. Cuando nos referimos a una variable, es una prctica normal el controlar tanto el valor medio como la dispersin. El control del valor medio se realiza, habitualmente, con el grfico de control para medias, o grfico . El control de la dispersin puede efectuarse bien con el grfico de control de la desviacin tpica (grfico S) o con el grfico de control de rangos (grfico R). El uso del grfico R est ms extendido que el del grfico S. Debemos sealar que es necesario mantener el control sobre ambos: Media y dispersin del proceso. La figura 2 representa la situacin de un proceso. En a) tanto la media como la desviacin tpica estn bajo control a sus valores nominales ( o, o) y en consecuencia la mayor parte de la produccin del proceso cae dentro de los lmites de especificacin. En la figura b) la media se ha trasladado 1 > o dando como resultado una cierta fraccin de la produccin fuera de especificacin. En la figura c) la desviacin tpica ha cambiado 1 > o lo que origina tambin que un parte de la produccin est fuera de norma.

Los grficos X-R se utilizan cuando la caracterstica de calidad que se desea controlar es una variable continua. A.- Grfico de la media Supongamos que una variable est normalmente distribuida con media y desviacin tpica y que ambas son conocidas. Si X1, X2, ... son mediciones de una muestra de tamao n, la media muestral, dada por :

est normalmente distribuida con media y desviacin tpica . Adems, la probabilidad de que cualquier media muestral caiga en el intervalo

es 1 - , siendo el error tipo I o Nivel de significacin (probabilidad de decir que el proceso se ha descorregido cuando en realidad el proceso sigue la distribucin N( , )),

Por consiguiente, si y son conocidos la expresin anterior puede utilizarse para determinar los lmites de control de la media muestral. Habitualmente usaremos los lmites 3 reemplazando Z /2 por 3. Si la media muestral cae fuera de estos lmites, esto indicar que la media del proceso no permanece en . Hemos supuesto que la distribucin original era normal. Si no lo fuera, los anteriores resultados seran tambin aproximadamente vlidos por aplicacin del teorema central del lmite. En la prctica no conocemos ni , por consiguiente, debemos estimarlas a partir de muestras previas obtenidas del proceso cuando se cree que ste est bajo control. Esta estimacin debe basase como mnimo en 20 o 25 muestras. Supongamos que disponemos de (m) muestras, cada una de ellas con (n) observaciones. Tpicamente, n ser pequeo 4 5. En esa situacin, el mejor estimador de la media del proceso ser

se utilizar como valor de la lnea central del grfico. Para construir los lmites de control, necesitamos un estimador de la desviacin tpica s. Podemos estimar s a partir de los rangos o de las desviaciones tpicas de las (m) muestras. De momento, haremos la estimacin a partir de los rangos. Si X1, X2,..., Xn, son mediciones de una muestra de tamao n, el rango de la muestra es R =Xmax - Xmin. La variable aleatoria W = R/s sigue una distribucin conocida denominada distribucin del rango relativo. Los parmetros de esta distribucin son funcin del tamao de muestra (n). La media de W es (d2) y la desviacin tpica (d3). En consecuencia, un estimador de s es R/d2. Los valores de d2 estn tabulados (Tablas II y III). Si

la mejor estima de s ser Cuando el tamao de la muestra es pequeo: n = 4 5 el mtodo de estimar a partir del rango da casi tan buen resultado como estimarla a partir de la varianza muestral. Sin embargo, para valores de n, digamos no mayores de 10, pierde rpidamente eficiencia ya que ignora toda la informacin comprendida entre Xmax y Xmin. Si usamos como estimador de m y como estimador de s entonces los lmites de control del grfico de medias quedaran:

Za/2 lo obtendramos de las tablas de Distribucin Normal (Tabla I), una vez elegido a (error tipo I). Normalmente Za/2 = 3 (a = 0,0027), en este caso la cantidad tabulada y el calculo de los lmites de control da: esta

Normalmente Za/2 = 3 (a = 0,0027), en este caso la cantidad tabulada y el calculo de los lmites de control da:

esta

Grficos basado en un estudio inicial. Grfico del recorrido Grficos basados en valores standar Grficos de control para valores individuales Lneas generales para el diseo del grafico Eficacia de los grficos ,R ,R

Grficos de control de sumas acumuladas (CUSUM) Otros grficos de control.- Grfico de control de media mvil Tablas para la elaboracin de grficos de control

CAPTULO 8.- CAPACIDAD DEL PROCESO Introduccin Un proceso de fabricacin es un conjunto de equipos, materiales, personas y mtodos de trabajo que genera un producto fabricado.

Para analizar el comportamiento del proceso, se toman muestras de producto fabricado y se realizan ensayos para determinar el valor de una caracterstica de calidad seleccionada previamente. Desde el punto de vista del control estadstico, es conveniente incluir la etapa de muestreo y ensayo dentro del proceso mismo. Conceptualmente debemos considerar que cualquier variacin en las condiciones de un proceso (Modificacin en el equipo, cambio de materias primas, etc.) da lugar a otro proceso, diferente del anterior. El primer paso para aplicar una tcnica estadstica es definir la caracterstica de calidad que se va a medir en el producto fabricado. Desde el punto de vista estadstico, esta caracterstica de calidad constituye una variable aleatoria, porque an despus de realizar una serie de mediciones, el valor que se obtendra en la siguiente medicin no puede predecirse por clculo. El conjunto de todos los resultados de mediciones que pueden obtenerse es nuestro universo o poblacin. Cualquier subconjunto de mediciones extrado del universo constituye una muestra. Con respecto al concepto de universo o poblacin, cuando se aplica a resultados de mediciones en un proceso, es necesario puntualizar lo siguiente: La poblacin o universo de resultados es el conjunto de datos que se obtuvieron hasta ese momento mas aquellos que se obtendran si el proceso continuara funcionando siempre bajo las mismas condiciones. Esto se conoce como Universo Hipottico de mediciones de la caracterstica de calidad. Antes de aplicar cualquier tcnica estadstica, es necesario establecer algunas

hiptesis bajo las cuales se va a desarrollar el anlisis. En primer lugar, vamos a suponer que la caracterstica de calidad (Variable aleatoria) es continua y de distribucin normal. En segundo lugar, consideraremos que el proceso est bajo control estadstico, es decir que la variabilidad se debe solamente a un sistema constante de causas aleatorias (No intervienen causas asignables). Al realizar una sucesin de mediciones de la caracterstica de calidad sobre muestras del producto fabricado, encontramos que los valores fluctan alrededor de un valor central. Esto es lo que llamamos la fluctuacin natural y esperable del proceso. Esta variacin de la caracterstica de calidad medida se debe a un conjunto muy grande de causas que afectan el proceso, cuyo efecto individual es pequeo y que actan en forma aleatoria (Sistema constante de causas aleatorias). La fluctuacin natural del proceso es inherente al mismo y no puede eliminarse, slo puede reducirse realizando modificaciones al proceso mismo, lo cual significa, como ya hemos dicho, trabajar con otro proceso. La fluctuacin natural de un proceso puede cuantificarse a travs de la desviacin standard del mismo, con la cual podemos calcular Lmites de Tolerancia Natural del proceso. Se debe insistir en que estos lmites no pueden fijarse voluntariamente, dependen del proceso y de las variables no controlables del mismo. Generalmente se toma un rango para la fluctuacin natural de 6 sigmas. Los Lmites de Especificacin de un producto son fijados voluntariamente por el cliente, por el fabricante o por alguna norma. Estos lmites constituyen un requisito a cumplir por el producto y no deben confundirse en ningn caso con los Lmites de Control o con los Lmites de Tolerancia Natural del proceso. La Capacidad de un proceso es la aptitud para generar un producto que cumpla con determinadas especificaciones. En el mejor de los casos, es conveniente que los Lmites de Tolerancia Natural del proceso se encuentren dentro de los Lmites de Especificacin del producto. De esta manera nos aseguramos que toda la produccin cumplir con las especificaciones. Para analizar la capacidad del proceso se puede utilizar un histograma de frecuencias. Si se dispusiera de todos los datos del universo para la caracterstica de calidad medida y se hiciera un histograma este permitira tener una idea exacta de la fluctuacin natural del proceso. Como esto es imposible, es necesario tomar un cierto nmero de mediciones (Mnimo 100-200) y efectuar con ellas un histograma de frecuencias.

Este es el histograma de una muestra y por lo tanto es slo una estimacin del verdadero histograma del universo. Si representamos en las abscisas los Lmites de Especificacin del producto, podemos ver grficamente si el proceso tiene aptitud (Capacidad) para fabricar dicho producto.

Anlisis de la capacidad del proceso

CAPTULO 9.- GRAFICOS DE CONTROL POR ATRIBUTOS Introduccin

Algunas caractersticas de calidad no pueden ser representadas convenientemente por medio de variables cuantitativas. En estos casos, las unidades de producto se clasifican en conformes o en no conformes segn la caracterstica o caractersticas cualitativas sean o no conformes con las especificaciones. Las caractersticas de calidad de este tipo se denominan atributos. Los datos de tipo atributo tienen solamente dos valores: Conforme / no conforme, pasa/no pasa, funciona / no funciona, presente / ausente. Tambin se consideran atributos aquellas caractersticas cuantitativas que se registran en trminos de sino como por ejemplo, el dimetro de un eje cuya conformidad solo la medimos en trminos de aceptable/no aceptable, las imperfecciones de pintura en una puerta de un automvil, las burbujas en la laca de un detonador, la presencia/ausencia de un percutor, etc. Vamos a analizar cuatro tipos de grficos de control por atributos: Grfico p para porcentajes defectuosos Grfico np para el nmero de unidades defectuosas Grfico c para el nmero de defectos Grfico u para el nmero de defectos por unidad inspeccionada Grfico p para porcentajes defectuosos La fraccin no conforme de un colectivo se define como el cociente entre el nmero de unidades defectuosas y el nmero total de unidades en dicho colectivo. Cada unidad de producto puede ser examinada por el inspector respecto de una o varias caractersticas cualitativas. Si la unidad inspeccionada no es conforme respecto a la especificacin en una o ms caractersticas, se clasifica como no conforme. Habitualmente, la fraccin no conforme se expresa en forma decimal aunque puede tambin indicarse en tanto por ciento. La distribucin binomial es la base estadstica del grfico de control por atributos. Supondremos que el proceso est operando de forma estable y que la posibilidad de que una unidad de producto sea defectuosa es constante y de valor p. Tambin, supondremos que las unidades producidas sucesivamente son independientes. Entonces, si tomamos una muestra de n unidades, y llamamos x al nmero de unidades no conformes, la probabilidad de que x tome los valores 0, 1, 2.... n vendr determinada por la distribucin binomial con parmetros n, p:

El valor medio y la varianza de esta distribucin son :

La fraccin muestral no conforme se define como el cociente entre el nmero de unidades no conformes en la muestra x y el tamao de la misma p = x/n. El valor medio y la varianza de p sern respectivamente :

como consecuencia de la relacin p = x/n Operativa del grfico de control p La base estadstica para definir los lmites de control es comn con los restantes grficos de Shewhart: Si W es un estadstico que describe una determinada caracterstica de calidad siendo w y w2 su media y su varianza, los lmites de control se definen como :

K es la distancia de los lmites de control a la lnea central expresada como un mltiplo de sw. Habitualmente escogeremos K = 3. Supongamos que conocemos o se especifica la fraccin p no conforme de un proceso de produccin. Entonces los limites de control resultan:

La operativa consiste en tomar sucesivas muestras de n unidades, contar dentro de cada muestra el nmero de unidades no conformes y calcular = D/n llevando este valor al grfico. En tanto permanezca dentro de los lmites de control y la secuencia de puntos no seale ninguna pauta distinta a la que puede surgir por mero azar, diremos que el proceso est bajo control al nivel p de fraccin no conforme. Si por el contrario, observamos algn punto fuera de control o un patrn inusual diremos que la fraccin defectuosa ha cambiado a un nivel diferente y que el proceso est fuera de control. Cuando se desconoce p, debe estimarse a partir de los datos. El procedimiento a seguir es seleccionar m muestras preliminares, cada una de tamao n. Como norma general, m estar comprendido entre 20 y 25. Si Di es el nmero de unidades defectuosas en la muestra i, calcularemos la fraccin defectuosa en la muestra como ; i = 1, 2... .n y la media de estas fracciones, , estimar la media p del proceso siendo los lmites de control:

Frecuentemente se utiliza solo el lmite superior. Estos lmites de control se consideran como limites de prueba y sirven para determinar si el proceso estaba bajo control cuando las m muestras iniciales fueron seleccionadas. Si todos los puntos caen dentro de los lmites de control y no se observa ninguna pauta anormal dictaminaremos que el proceso estaba bajo control a la toma de las m muestras y los lmites de prueba sern validos para controlar la produccin actual y la futura. Los lmites de control para la produccin actual deben basarse en datos obtenidos de una situacin estable. Por ello, cuando alguno de los puntos iniciales est fuera de control se hace necesario revisar los lmites de control. Esto se realiza examinando cada punto fuera de control y buscando las causas asignables. Si se localiza la causa asignable se descarta el punto correspondiente y se vuelven a calcular los lmites de control con los puntos restantes. Puede darse el caso que alguno de estos restantes puntos se encuentre ahora fuera de control respecto de los nuevos lmites ya que estos sern, normalmente, ms estrechos que los iniciales. Entonces, deben repetirse los pasos dados anteriormente hasta que todos los puntos se encuentren dentro de control con lo que ya podremos adoptar los lmites hasta entonces provisionales como lmites definitivos. Si el grfico de control se basa en un valor estandar conocido (un objetivo) para la fraccin no conforme p, entonces el clculo de lmites de prueba es, generalmente, innecesario aunque deben tomarse ciertas precauciones en el sentido de comprobar si el proceso est bajo control a un valor de p diferente dei indicado en el objetivo. Por ejemplo, supongamos que la Direccin seala como valor objetivo p = 0,01 pero que el proceso se encuentra realmente bajo control a p = 0,05. Utilizando el grfico correspondiente a p = 0,01 encontraremos muchos puntos fuera de control sin que aparezca causa asignable. No obstante, suele ser til esta opcin para mejorar el nivel de calidad llevando el proceso al nivel adecuado, sobre todo en procesos donde la fraccin no conforme puede ser controlada mediante un proceso sencillo de ajuste. Diseo del grfico p El grfico p tiene tres parmetros a especificar: Tamao y frecuencia del desmuestre y distancia entre lmites de control. Es frecuente calcular el grfico de control a partir de la inspeccin realizada a lo largo de un periodo de tiempo determinado. Un da, un turno, etc. En este caso, la frecuencia y el tamao de la muestra estn relacionados. Generalmente, se selecciona inicialmente la frecuencia del desmuestre apropiada para la produccin

a inspeccionar y de ah resulta el tamao de la muestra, Los subgrupos racionales pueden jugar tambin un papel importante en determinar la frecuencia del desmuestre. Por ejemplo, si hay tres turnos y sospechamos que entre turnos puede variar el nivel de calidad utilizaremos cada turno como un subgrupo sin mezclarlos para obtener una fraccin diaria no conforme. Si p es pequeo n deber ser suficientemente grande para encontrar, al menos una unidad defectuosa en la muestra. Se ha sugerido que el tamao de muestra debe ser lo bastante grande para tener una probabilidad de aprox. 50% de detectar un cambio de una determinada magnitud. Por ejemplo, supongamos que p = 0,01 y que queremos que la probabilidad de detectar un cambio a p = 0,05 sea del 50%. Suponiendo que aproximamos la distribucin binomial respecto de la normal, escogeremos de tal forma que el lmite de Control Superior coincide con la fraccin no conforme en la situacin de fuera de control. Si 6 es la magnitud del cambio del proceso, entonces n debe satisfacer

En nuestro ejemplo, p = 0,01, = 0,05-0,01 = 0,04 y con K=3

n = 56

Los lmites 3 son los que se usan con ms frecuencia aunque pueden adaptarse otros ms sensibles a costa de exponerse a situaciones ms frecuentes de falsa alarma. A veces, suelen usarse limites ms estrechos (por ejemplo 2 ) dentro de una situacin de urgencia para mejorar la calidad de un proceso. Estos lmites deben utilizarse con precaucin porque las falsas alarmas destruyen la confianza de los operadores en los grficos de control. Hay que tener en cuenta que los lmites de control estudiados se basan en la distribucin binomial que considera constante la proporcin defectuosa p y que los valores sucesivos son independientes. En procesos en los que las unidades no conformes estn agrupadas o en los que la probabilidad de producir una unidad defectuosa depende de que la anterior unidad producida haya sido no defectuosa, no son aplicables este tipo de grficos. Deben examinarse con cuidado aquellos puntos situados por debajo del lmite de control inferior. Estos puntos no suelen ser lo que aparentemente indican: Una mejora en la calidad del proceso por disminucin de a sino que suelen originarse por errores en la inspeccin o por causa de aparatos de medida mal calibrados. Tambin puede deberse a que los operadores hayan registrado datos ficticios para cubrir su responsabilidad.

Grfico np para unidades defectuosas

10.- LINEAS GENERALES PARA IMPLANTAR GRAFICOS DE CONTROL Ventajas de los grficos de control Existen importantes razones para implantar los grficos de control. Destacamos las siguientes: a) Los grficos de control son una tcnica de eficacia probada para mejorar la productividad. La adecuada implantacin de un programa de C.E.P. reduce la repeticin de las operaciones no conformes y los rechazos por desechos que son uno de los principales enemigos de la productividad. De esta reduccin se deriva una disminucin en los costes y un incremento de produccin de producto correcto b) Los grficos de control son eficaces en la prevencin de defectos. El objetivo bsico del grfico de control es detectar cualquier cambio en el proceso o en el producto. Siempre es ms barato hacer las cosas bien de entrada que escoger las unidades buenas dentro de un lote de malas y buenas. Si no se posee un control eficaz, se estar pagando por fabricar produccin no conforme. c) Los grficos de control previenen de ajustes innecesarios del proceso. El grfico de control distingue entre el ruido de fondo y una variacin anormal. Si el operador ajusta el proceso basndose en comprobaciones peridicas no relacionadas con la implantacin sistemtica de los grficos de control, a menudo reaccionar frente al ruido de fondo y realizar ajustes innecesarios. d) El grfico de control proporciona informacin sobre la capacidad del Proceso. El grfico suministra informacin sobre los parmetros bsicos del proceso y sobre su estabilidad a lo largo del tiempo. La tecnologa moderna, utilizando ordenadores, hacen sencilla la implantacin de los grficos de control, en cualquier tipo de proceso. Como resumen de lo visto en los captulos anterores, vamos a tratar sobre los siguientes puntos : A) Determinacin de la caracterstica a controlar y desde donde se va a controlar B) Seleccin del grfico adecuado A) Seleccin de la caracterstica a controlar y donde controlarla

a) En el comienzo de la implantacin se aplican los grficos a aquellas caractersticas del proceso o del producto que se consideran importantes. Los grficos nos dirn si son realmente necesarias. b) Eliminar grficos que se encuentren innecesarios. c) Disponer de una informacin actualizada sobre el nmero y tipos de grficos de control existentes en el proceso. Cuando comienza la implantacin, el nmero de grficos suele crecer de forma continuada, despus decrece. Cuando el proceso se estabiliza, el nmero de variables seguidas por grficos, suele mantenerse constante aunque stas no son necesariamente las mismas. d) Segn se va sabiendo ms sobre el proceso, el nmero de grficos por atributos disminuye y el nmero de grficos por variables aumenta. e) Al comienzo, suelen utilizarse bastantes grficos por atributos para el producto final o intermedio. Despus estos grficos tienden a ser sustituidos por grficos por variables para caractersticas de las primeras fases del proceso. f) Los grficos de control son procedimientos a implantar en la lnea tan cerca del puesto de trabajo como sea posible, as, la informacin llegar con rapidez. Adems, las personas responsables de produccin tendrn la responsabilidad directa de recoger datos, realizar los grficos e interpretar resultados. Los operadores e ingenieros que trabajan en el proceso disponen del conocimiento del mismo necesario para corregir fallos y utilizar el grfico como una herramienta para mejorar la calidad. Los ordenadores facilitan enormemente la rapidez de clculos y presentacin de grficos por lo que no pueden faltar en ningn procedimiento moderno de control estadstico del proceso. B) Seleccin del grfico adecuado Grficos , R (o , S); Solo para variables cuantitativas. Los grficos por variables se utilizan en los casos siguientes: a) Comienza un nuevo proceso, o un nuevo producto va a fabricarse en un proceso existente. b) El proceso tiene continuos problemas o es incapaz de cumplir las tolerancias especificadas.

c) La verificacin de la calidad producida requiere ensayos destructivos o costosos procedimientos de ensayo. d) Se desea reducir la inspeccin por desmuestre y otras verificaciones sobre el producto al mnimo e) Se han utilizado, sin resultado, grficos de control por atributos. f) Procesos con especificaciones muy estrechas. g) Situaciones en las que el operador debe decidir si ajusta o no el proceso. h) Cuando ha de demostrarse ante el cliente de forma continuada, la estabilidad y la capacidad del proceso. Grficos CUSUM Se puede utilizar en todos los casos sealados para el grfico , R, pero donde realmente muestra ms ventajas es: a) Cuando los procesos vayan descorrigindose lentamente (por ejemplo procesos qumicos) b) Cuando sea necesario descubrir rpidamente pequeos desajustes. c) Situaciones en las que es posible disponer un microordenador en la lnea Grficos por atributos Se recomienda utilizar los grficos por atributos en los siguientes casos: a) Los operadores controlan las causas asignables y es preciso reducir el porcentaje de fallos. b) El proceso es una operacin de montaje compleja y la calidad del producto se mide en trminos de conforme/no conforme. c) Es necesario el control del proceso pero no pueden obtenerse datos cuantitativos.

d) Para facilitar a la direccin una visin con un resumen informativo sobre la eficacia del proceso. Grficos de control para valores individuales Se puede usar conjuntamente con los grficos de rango mvil en los siguientes casos: a) Procesos en los que no puede obtenerse ms que una medida por muestra o donde las medidas repetidas solo difieren debido a errores analticos. Esto suele suceder en los procesos qumicos. b) Procesos donde la tecnologa existente cuantifica cada unidad producida. En estos casos, tambin pueden considerarse los grficos de media mvil. c) Cuando la cadencia de aparicin de nuevos datos es muy lenta y sera impracticable esperar a reunir una muestra mayor porque esto supondra una reaccin demasiado tarda ante los problemas.

Вам также может понравиться