Elementos Básicos Estadística

APNDICE.
ELEMENTOS BSICOS DE ESTADSTICA
TABLA DE CONTENIDO
1. ESTADSTICA DESCRIPTIVA. 2
1.1 MEDIDAS DE TENDENCIA CENTRAL. 2
1.2 MEDIDAS DE DISPERSIN O VARIABILIDAD. 3
1.3 ESTIMACIN DE LOS PARMETROS DEL PROCESO (, ) 4
1.4 ANLISIS A PARTIR DEL HISTOGRAMA. 4
1. 5 PRUEBAS PARA DETERMINAR LA NORMALIDAD 8
2 FUNCIONES DE DISTRIBUCIN DE PROBABILIDADES. 9
2.1 TCNICAS DE ANLISIS PARA DATOS CONTINUOS. 12
2.2 TCNICAS DE ANLISIS PARA DATOS DISCRETOS. 16
3. ELEMENTOS DE INFERENCIA ESTADSTICA. 17
3.1 EL CONCEPTO DE DISTRIBUCIN DE MUESTREO. 18
3.2 DISTRIBUCIN DE MUESTREO DE LA MEDIA. 18
3.3 TEOREMA DEL LMITE CENTRAL. 19
3.4 DETERMINACIN DE PROBABILIDADES PARA LA MEDIA MUESTRAL. 19
3.5 INTERVALO DE CONFIANZA PARA UNA MEDIA. 20
3.6 DETERMINACIN DEL TAMAO DE MUESTRA REQUERIDO PARA LA ESTIMACIN DE LA MEDIA. 21
3.7 DISTRIBUCIN T E INTERVALOS DE CONFIANZA PARA LA MEDIA. 21
3.8 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS. 22
3.9 INTERVALO DE CONFIANZA PARA LA PROPORCIN DE LA POBLACIN. 23
3.10 DETERMINACIN DEL TAMAO DE MUESTRA REQUERIDO PARA LA ESTIMACIN DE LA PROPORCIN. 23
3.11 PRUEBA DE HIPTESIS REFERENTE AL VALOR DE LA MEDIA DE LA POBLACIN. 24
3.12 PRUEBAS RESPECTO A LA MEDIA DEL PROCESO EN CONTROL ESTADSTICO DE PROCESOS. 27
3.13 PRUEBA DE LA DIFERENCIA ENTRE DOS MEDIAS. 27
BIBLIOGRAFA. 29
1. ESTADSTICA DESCRIPTIVA.
1.1 Medidas de Tendencia Central.
Cuando se mide una caracterstica de calidad, el primer paso para investigar si el

proceso cumple con las especificaciones es determinar si est centrado, es decir, si
la tendencia central de la variable de salida es igual o est muy prxima al valor
nominal especificado. Los principales estadsticos que proporcionan informacin til
sobre el centrado del proceso son:
Media. Es el popular promedio, esto es, la suma de valores considerados,

dividida entre el nmero de observaciones. Si para calcular la media se utilizan
todos los elementos de la poblacin, entonces el promedio calculado es la media
del proceso y se designa con la letra griega .
( X )i
=
N
La media del proceso es igual a cierto valor, aunque casi nunca se conoce con
exactitud. El valor de X (promedio de la muestra) se conoce para cada muestra,
pero es diferente de una muestra a otra, porque depende de las piezas que se
seleccionan en la muestra.
X=
X i
Mediana. Es el valor central, cuando todos los valores se han colocado en orden
de medidas; el valor que se obtiene al dividir la distribucin exactamente a la
mitad. Si el nmero de datos es par, entonces la mediana se calcula dividiendo
entre dos la suma de los nmeros que estn en el centro del ordenamiento.
Moda. Es el valor que se presenta con mayor frecuencia. Si varios datos tienen
la frecuencia ms grande, entonces cada uno de ellos es una moda.
2
1.2 Medidas de dispersin o variabilidad.
El segundo paso para investigar si el proceso cumple con las especificaciones es

medir la variabilidad de la caracterstica de calidad bajo estudio, y despus
compararla con la variacin que toleran las especificaciones. Los principales
estadsticos que proporcionan informacin til sobre la dispersin del proceso son:
Desviacin estndar muestral, S. Mide qu tan esparcidos estn los datos

respecto a la media.
(X
2
i X)
Desviacion _ Estndar ( S ) = Varianza =
n 1
X son las observaciones numricas de la muestra, n su tamao y X es la media
muestral. Entre ms grande sea el valor de S mayor variabilidad habr entre los
datos y por tanto ms mala calidad. La desviacin estndar est expresada en
las mismas unidades de medicin que los datos.
Desviacin estndar del proceso, . Si al calcular la desviacin estndar se

utilizan todos los elementos de la poblacin o proceso, se obtiene la desviacin
estndar poblacional y se denota por la letra griega sigma ():
(X
2
i )
Desviacion _ Estndar ( ) = Varianza =
N
Para el clculo de la desviacin estndar del proceso se debe utilizar un nmero

grande de datos (120 o ms) que hayan sido obtenidos en el transcurso de un
lapso amplio de tiempo (por lo menos una semana).
Rango. La diferencia que existe entre el valor mayor y el valor menor de los
valores considerados.
Interpretacin de la Desviacin Estndar. La regla emprica afirma que en

muchos de los datos que surgen en la prctica se ha observado que:
Entre X S y X + S est el 68.3% de los datos de la muestra.

Entre X 2S y X + 2S est el 95.5%, y
Entre X 3S y X + 3S est el 99.7%.
3
Los intervalos anteriores son vlidos solo para los datos muestrales y no
necesariamente para toda la poblacin o proceso. Sin embargo, si los intervalos se
calculan con la media y la desviacin estndar del proceso o poblacin, entonces
sern vlidos para toda la poblacin (siempre y cuando la distribucin de la
poblacin sea normal). Si se tiene una muestra aleatoria lo suficientemente grande,
los intervalos anteriores podrn dar una idea aproximada de lo que pasa en el
proceso.
Lmites reales o naturales. Los lmites reales o naturales de un proceso indican el

rango entre el cual vara la variable de salida o respuesta y por lo general se
obtienen de la siguiente manera:
Lmite real inferior (LRI) = - 3 y Lmite real superior (LRS) = + 3
Estos lmites indican la amplitud real de la variacin de la salida del proceso. En un

estudio de capacidad, estos lmites reales se comparan contra las especificaciones.
1.3 Estimacin de los parmetros del proceso (, )
Si no se conocen la media y la desviacin estndar del proceso, una forma tpica de

estimarlos en procesos que producen altos volmenes de piezas (bajo la hiptesis
de normalidad) es la siguiente:
1. Tomar en un lapso de dos o ms das, entre 20 a 30 muestras, de 5 a10 piezas

cada una.
2. A cada una de las k muestras obtenidas se les calcula la media y el rango
muestral. De esta forma se tienen k medias y k rangos y se estiman los
parmetros del proceso de la siguiente manera:
R
(X ) Y
d2
1.4 Anlisis a partir del histograma.
Una distribucin de frecuencias es una tabla en la cual se agrupan en clases los

valores posibles de una variable y donde se registra el nmero de valores
observados correspondientes a cada clase. Los datos organizados en una
distribucin de frecuencias se llaman datos agrupados. Un histograma es una
4
grfica de barras de una distribucin de frecuencias. Para obtener la mayor cantidad
posible de informacin acerca de la distribucin, es necesario que se haga una
cuidadosa seleccin del nmero de intervalos de clase en la construccin de un
histograma. Si ste nmero es demasiado pequeo o muy grande, puede resultar
confusa la verdadera forma de la poblacin estimada.
Despus de construir el histograma, se dar rpida respuesta a tres preguntas:
Es consistente el producto con las verificaciones anteriores?

Est bien centrado el producto?
Responde el producto a las especificaciones de ingeniera?
Un histograma simple es til en la elaboracin de un anlisis, porque permite

evaluar en forma grfica la forma de distribucin y la presencia de datos raros,
pero su uso est limitado debido a que:
Se requiere un gran nmero de medidas.

No toma en consideracin el tiempo.
No establece una separacin entre las dos causas de variacin (las causas
comunes y las especiales).
No muestra una tendencia.
En esencia, un histograma es una ilustracin a posteriori en la que se describe una

situacin que ya ha ocurrido.
Procedimiento para elaborar un histograma
Para que exista consistencia en la elaboracin del histograma, se recomienda

cumplir con las siguientes pautas:
Paso 1. Determinar el rango de los datos, restando la medida observada ms

pequea de la ms grande. Designar el resultado como R.
Ejemplo 1: Medida observada ms grande = 4,36

Medida observada ms pequea = 1,91
R = 2,45
Ejemplo 2: Medida observada ms grande = 176
5
Medida observada ms pequea = 1
R = 175
Paso 2. Anotar la unidad de medida (UM) usada. Por lo general, sta se controla,
considerando la medida mnima que se puede leer con el instrumento de que se
disponga.
Ejemplo 1: UM = cm.
Ejemplo 2: UM = Kg.
Paso 3. Determinar el nmero y el ancho (intervalo) de las celdas (clases). El

nmero de celdas, h, depende del nmero total de medidas, n. Una regla general es
usar de 5 a 9 celdas cuando n se menor o igual a 100; de 8 a 17 celdas cuando n
est entre 100 y 500 y de 15 a 20 celdas cuando n sea mayor de 500. El intervalo
de celda, i, y la cantidad de celdas, h, se relacionan mediante la frmula h = R / i. A
partir de esta expresin se puede calcular el intervalo de las celdas cuando se
conoce el rango y se ha definido el nmero de celdas.
Otra tcnica que permite obtener el intervalo de celda es la regla de Sturgi, que se
expresa mediante la frmula:
R
i=
1 + 3.322 log n
Se recomienda que el intervalo de la celda sea un nmero impar que sea mltiplo
de la unidad de medida. En el ejemplo 1, el intervalo 0,32 (par) se reemplaza por
0,33 (impar), para el clculo de h.
Paso 4. Establecer los puntos medios y los lmites de las celdas.
El ms pequeo de los puntos intermedios de las celdas (llamados tambin marcas

de clase) deber ubicarse de manera que incluya el valor ms bajo de los datos. Se
recomienda la frmula siguiente:
i
MPL = X L + (No redondee el resultado)
2
Donde MPL es el punto intermedio de la celda ms baja y X L es la medida
observada ms pequea.
6
0,33
Ejemplo 1: MPL = 1,91 + = 2,07 (el resultado no se redondea)
2
23
Ejemplo2: MPL = 1 + = 12 (el resultado no se redondea)
2
Los puntos intermedios de las celdas restantes se obtienen aadiendo el intervalo
de celda al punto intermedio de la primera celda.
Los lmites de las celdas se definen de manera tal que no quede duda de dnde
colocar el valor de una observacin. Por tanto, los valores de los lmites cuentan con
un valor decimal o figura significativa ms de exactitud que los valores observados.
Ejemplo 1: Punto intermedio de la celda mas baja = 2,07

El intervalo de la celda es 0,33 cm. Los lmites para la primera celda
son:
0,33
2,07 O bien: 1,905 y 2,235
2
Los puntos intermedios y los lmites de las celdas son:
Puntos intermedios Lmites de las celdas

Inferior Superior
2,07 1,905 2,235
2,40 2,235 2,565
2,73 2,565 2,895
3,06 2,895 3,225
3,39 3,225 3,555
3,72 3,555 3,885
4,05 3,885 4,215
4,38 4,215 4,545
Ejemplo 2: Punto intermedio de la celda mas baja = 12

El intervalo de la celda es 23 Kg. Los lmites para la primera celda son:
23
12 O bien: 0,5 y 23,5
2
Los puntos intermedios y los lmites de las celdas son:
Puntos intermedios Lmites de las celdas
7
Inferior Superior
12 0,5 23,5
35 23,5 46,5
58 46,5 69,5
81 69,5 92,5
104 92,5 115,5
127 115,5 138,5
150 138,5 161,5
173 161,5 184,5
1. 5 Pruebas para determinar la normalidad
Debido a la importancia de la distribucin normal, con frecuencia es necesario

averiguar si los datos son normales. La observacin visual de un histograma permite
inferir el tipo de distribucin. Las medidas de forma son otra manera de probar la
normalidad. Las medidas de forma se clasifican en medidas de asimetra y medidas
de curtosis o apuntamiento.
Las medidas de asimetra tienen como finalidad elaborar un indicador que permita
establecer el grado de simetra (o asimetra) que presenta una distribucin, sin
necesidad de llevar a cabo su representacin grfica. Las medidas de curtosis
estudian la distribucin de frecuencias en la zona central de la misma. La mayor o
menor concentracin de frecuencias alrededor de la media y en la zona central de la
distribucin dar lugar a una distribucin ms o menos apuntada.
Una frmula aproximada para calcular la asimetra es la siguiente:
f (X
i =1
i i X )3 / n
a3 =
s3
Si el valor de a3 es 0, los datos son simtricos; si es mayor de 0 (positivo), los datos

se inclinan hacia la derecha, lo cual significa que la distribucin est sesgada hacia
la derecha (asimtrica positiva); si es menor de 0 (negativo), los datos se inclinan
hacia la izquierda, es decir que la distribucin est sesgada a la izquierda
(asimtrica negativa). Los valores +1 y -1 indican una fuerte distribucin asimtrica.
8
Una frmula aproximada para calcular la curtosis es la siguiente:
f (X
i =1
i i X )4 / n
a4 =
s4
La curtosis es un valor adimensional que sirve como medida de la altura de un pico

en una distribucin. Cuando la distribucin es normal (mesocrtica), el valor de
curtosis es de 3. Si a 4 > 3, la altura de la distribucin es mayor de lo normal
(leptocrtica). Si a 4 < 3, la altura de la distribucin es inferior a lo normal
(platocrtica). Muchos paquetes de software normalizan los datos a cero, restndole
a la respuesta -3.
Cuartiles, Deciles y Percentiles
Cuartiles, deciles y percentiles se asemejan a la mediana en que tambin

subdividen una distribucin de medidas de acuerdo con la proporcin de las
frecuencias observadas. Mientras que la mediana divide una distribucin en
mitades, los cuartiles la dividen en cuartos, los deciles en dcimos y los puntos
percentiles en 100 partes.
2 FUNCIONES DE DISTRIBUCIN DE PROBABILIDADES.
Histricamente se han desarrollado tres aproximaciones conceptuales para definir la

probabilidad y determinar valores de probabilidad: la clsica, la emprica y la
subjetiva.
La clsica. Est dada por la razn entre las formas en que puede ocurrir un evento
y el total de formas para todos los casos posibles.
La emprica. Est dada por el valor lmite para la frecuencia relativa de las formas
en que un evento ocurre conforma aumenta el nmero de ensayos indefinidamente.
La subjetiva. Es la cuantificacin de la incertidumbre que representa creer en una

persona con base en sus conocimientos anteriores, su acceso a la informacin
disponible y su interpretacin de los datos obtenidos.
9
Ejemplo: En el lanzamiento al aire de una moneda el evento E puede ser cara. La
manifestacin de probabilidades para el evento E es:
Nmero de veces que puede ser cara

Clsica: P [E] =
Total de veces
Nmero de veces que fu cara

Emprica: P [E] =
Total de lanzamientos
Probabilidades cuando se combinan eventos.
Eventos mutuamente excluyentes. Los que no pueden ocurrir en forma

simultnea.
Eventos independientes. Aquellos en los que la ocurrencia de uno no tiene efectos

en la ocurrencia de otro.
LEY DE LA ADICIN.
Eventos mutuamente excluyentes:
P [A o B] = P [A] + P [B]
Ejemplo: Si se lanza al aire una moneda,
P [cara o sello] = + = 1
Eventos no excluyentes mutuamente:
P [A o B] = P [A] + P [B] P [A y B]
Ejemplo: Supongamos que se arrojan dos monedas al aire,
P [cara en la primera moneda o cara en la segunda moneda] = P [cara en la primera

moneda] + P [cara en la segunda moneda] P [cara en la primera moneda y cara
en la segunda moneda] = + - =
10
LEY DE LA MULTIPLICACIN.
Eventos independientes.
P [A y B] = P [A] x P [B]
Eventos no independientes:
P [A y B] = P [A] x P [B /A]
P [B y A] = P [B] x P [A /B]
Ejemplo: Supongamos que una caja contiene 20 bolas, 3 blancas, 7 rojas y 10

azules. Si se extraen de la caja dos bolas en sucesin, sin regresare la primera
antes de extraer la segunda, entonces los eventos son dependientes. La posibilidad
de haber extrado dos bolas blancas est dada por:
P [blanca y blanca] = P [blanca en la primera extraccin] x P [blanca en la segunda

extraccin, dado que en la primera extraccin fue blanca] = 3/20 x 2/19 = 66/380 =
0,0158
Por comparacin, si las extracciones son independientes (la primera bola se

restituye a la caja), entonces,
P [blanca y blanca] = 3/20 x 3/20 = 9/400 = 0,0225
Algo que se debe recordar es que la prediccin de probabilidades se podr cumplir

si el nmero de observaciones es suficientemente grande. Es decir, que se obtienen
los resultados esperados en el caso de que sean muchos eventos, no si solo son
pocos.
Una variable aleatoria es un evento numrico cuyo valor se determina por medio de
un proceso aleatorio. Cuando a todos los posibles valores numricos de una
variable aleatoria X se le asignan valores de probabilidad, ya sea mediante un
listado o una funcin matemtica, el resultado es una distribucin de probabilidad.
La suma de la probabilidad de todos los resultados numricos posibles debe ser
igual a 1.0. Valores de probabilidad individuales pueden denotarse con el smbolo
f(x), lo que involucra el uso de una funcin matemtica; con P(x = X), que advierte
11
que la variable aleatoria puede tener varios valores especficos o simplemente con
P(X).
Una variable continua puede adoptar un valor en cualquier punto fraccionario a lo

largo de un intervalo especificado de valores. Los datos continuos de generan
mediante proceso de medicin. Una variable discreta puede tomar valores
observados nicamente en puntos aislados a lo largo de una escala de valores.
Estos datos ocurren usualmente por medio de un proceso de conteo, de ah que
por lo general los valores se expresen como nmeros enteros.
En una variable aleatoria continua, no pueden enlistase todos los posibles valores
fraccionarios de la variable, por esa razn las probabilidades que se determinan por
medio de una funcin matemtica son grficamente representadas por una funcin
de densidad de probabilidad, o curva de probabilidad. En una variable aleatoria
discreta, todos los posibles valores numricos de la variable pueden enlistarse en
una tabla junto con sus respectivas probabilidades.
En la prctica, se sabe que ciertos procesos y fenmenos generan resultados

numricos cuya distribucin de probabilidades se puede ajustar a determinados
modelos tericos.
2.1 Tcnicas de Anlisis para Datos Continuos.
Si bien existen diversos tipos de distribuciones de probabilidad continuas, slo la

normal o de Gauss tiene una considerable importancia en el control de calidad.
Aunque no todas las curvas unimodales simtricas son una distribucin normal, ni
es posible suponer que todos los datos de una muestra o una poblacin se ajusten
a una distribucin normal. Asumir que estn normalmente distribuidos simplifica los
clculos. En la mayora de los casos, esta hiptesis no causa mucha diferencia en
los resultados, aunque es importante desde un punto de vista terico. La ecuacin
matemtica de la funcin de Gauss es la siguiente:
( x ) 2
1 2 2
P( x) = e
2
La distribucin normal es una curva con forma de campana, con eje de simetra en
el punto correspondiente al promedio del universo . La distancia entre el eje de
12
simetra de la campana y el punto de inflexin de la curva es igual a , la desviacin
estndar de la poblacin:
El rea total debajo de la curva es igual a 1. El rea debajo de la curva comprendida

entre - y + es aproximadamente igual a 0,68 del rea total; entre - 2 y +
2 es aproximadamente igual a 0,95 del rea total:
Tiene como parmetros a , y cualquier zona bajo su curva est definida por la
distancia entre y un valor especifico de .
1. El rea total debajo de la curva es igual a 1.
2. El 99% del rea se encuentra comprendida en el intervalo [-2.58
, 2.58
].
Esto es, P(
-2.58
<X < + 2.58
) = 0.99.
, 1.96
].
Esto es, P(
-1.96
<X < + 1.96
) = 0.95.
4. El 68.3% de toda el rea se encuentra comprendida en el intervalo [-
, ].
Esto es, P(
- <X < + ) = 0.683.
, 0.67
].
Esto es, P(
-0.67
<X < + 0.67
) = 0.5.
6. Es una distribucin unimodal con valor modal en x = .
7. Tiene dos puntos de inflexin situados en - y + .
8. Es asinttica al eje de las x.
9. Un cambio en desplaza toda la distribucin, mientras que un cambio en
altera su posicin relativa con respecto a una escala fija.
13
10. Un cambio lineal en la escala genera una nueva distribucin Normal. Es
decir, si X es una variable Normal, entonces Y = a + bX tambin lo ser.
X
Z=
11. Si X se distribuye Normalmente con , ; entonces tambin se
distribuye Normalmente.
Es importante observar que los nicos parmetros necesarios para grafcare la

distribucin normal son y (Media y desviacin estndar de la poblacin).
Partiendo del hecho de que cada poblacin concebida tiene una media y una
desviacin estndar diferente, existe en teora un nmero infinito de curvas de
distribucin normales. Si se estandarizan los resultados de la distribucin normal en
una curva, sta se puede aplicar a cualquier conjunto de datos caracterizado por
dicha distribucin. Con el fin de estandarizar se puede escribir la frmula de la
distribucin normal de la siguiente manera:
2
1 x
1
P( x) = e 2
2
X
Z=
Llamando , la funcin queda as:
1
1 2Z2
P( z) = e
2
Esta es la frmula de la Distribucin Normal estndar o Tipificada. Como se puede

observar, en ella hay un slo parmetro, Z, que incluye al promedio y la desviacin
estndar de la poblacin. Esta funcin est tabulada, y para ingresar en la tabla es
necesario calcular Z, para lo cual se necesita la media y la desviacin estndar de la
poblacin. Al calcular Z, lo que se hace, en realidad, es un cambio de variable por el
cual se mueve la campana de Gauss centrndola en el 0 del eje X, y se modifica el
ancho para que la desviacin estndar sea 1.
14
Grfico de la Distribucin Normal
0,45
0,40
Densidad de Probabilidad
0,35 =0
0,30 = 1
0,25
= 15
0,20 Cambio de = 2,5
0,15 variable
0,10
0,05
Z X
0,00
-5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Variables Aleatorias X y Z
De esta manera se tiene tabulada una funcin de Gauss que no depende de cual
sea el promedio y la desviacin estndar de la poblacin real. El cambio de variable
hace que se conserve la forma de la funcin y que sirva para cualquier poblacin,
siempre y cuando esa poblacin tenga una distribucin normal. Cuando se
requieran calcular las probabilidades para una poblacin real, se calcula Z y se
entra en la tabla de la funcin normal estndar:
Muchos fenmenos de variacin en la naturaleza y en los procesos industriales se

comportan de acuerdo con la distribucin de frecuencia de las curvas normales. Las
variaciones que se producen en la mayora de las caractersticas de la calidad
industrial pueden explicarse por medio de una distribucin normal.
De los muchos otros tipos de distribuciones de probabilidad continuas solo dos

tienen aplicacin importante en control de calidad. La distribucin de probabilidad
exponencial que se usa en estudios de confiabilidad, cuando existe una tasa de falla
constante y la de Weibull que se usa cuando el lapso de falla no es constante.
15
2.2 Tcnicas de Anlisis para Datos Discretos.
Ciertas distribuciones discretas describen muchos fenmenos naturales y tienen

amplia aplicacin en el control estadstico de calidad. Dos de ellas son la
distribucin binomial y la distribucin de Poisson.
Distribucin de probabilidad binomial.
La distribucin binomial describe la probabilidad de obtener exactamente x xitos

en una secuencia de n experimentos idnticos, conocidos como ensayos. Los datos
medidos son el resultado de evaluaciones independientes, donde un xito puede ser
cualquiera de los resultados posibles de cada experimento. En algunas situaciones
podra ser un elemento defectuoso, y en otras un elemento bueno. La probabilidad
de xito en cada ensayo es de un valor constante p. La funcin de probabilidad
binomial est dada por la frmula siguiente:
P( x) = ( x ) p x q n x =
n n!
p x q n x
x!(n x )!
Donde p es la probabilidad de un xito, n es el nmero de elementos en la muestra

e y es el nmero de elementos para el cual se desea la probabilidad (0, 1,2,, n). El
valor esperado (nmero esperado de xitos), la varianza y la desviacin estndar de
la distribucin binomial son:
E (x) = =np
2
= np (1-p)
= np(1 p )
Cuando p es mayor o igual a 0,1 (p 0,1) y n veces p es mayor o igual a 5 (np 5)

se puede utilizar la distribucin normal como una aproximacin a la distribucin
binomial, lo que simplifica los clculos.
Distribucin de Poisson.
La segunda distribucin discreta empleada con frecuencia en el control de la calidad

es la distribucin de Poisson, que est dada por:
e . x
f (x) =
x!
16
En esta frmula es el valor esperado o nmero promedio de ocurrencias, x = 0, 1,
2, 3, y e = 2,71828, que es una constante.
La distribucin de Poisson est estrechamente relacionada con la distribucin

binomial. Se obtiene permitiendo que el tamao de la muestra (n) se haga muy
grande (se acerque al infinito) y la probabilidad de xito o falla (p) se convierta en
muy pequea (tienda a cero), en tanto que el valor esperado (np) se mantiene
constante. Por lo tanto, cuando n es grande en relacin con p, se puede utilizar la
ecuacin de Poisson como una aproximacin a la distribucin binomial. Una regla
prctica comn es que si p 0,05 y n 20, la distribucin de Poisson ser una
buena aproximacin con = np. Tambin es utilizada para calcular el nmero de
ocurrencias de un suceso o evento, a lo largo de un intervalo especificado de tiempo
o de espacio, como por ejemplo el nmero de defectos por metro cuadrado de una
tela.
3. ELEMENTOS DE INFERENCIA ESTADSTICA.
Una poblacin es la totalidad de posibles individuos, especimenes, objetos o

medidas de inters sobre los que se hace un estudio con el fin de acrecentar el
conocimiento que se tiene acerca de ellos. En la industria las poblaciones de inters
son los materiales, los productos terminados, partes o componentes, procesos, etc.
Un parmetro es un valor de resumen para una poblacin o proceso, mientras que

una estadstica muestral es un valor de resumen para una muestra. Debido a
factores como tiempo y costo, los parmetros de una poblacin o proceso
frecuentemente se estiman sobre la base de estadsticas muestrales.
Un estimador puntual es el valor numrico de una estadstica muestral empleado

para estimar el valor de un parmetro de la poblacin o proceso. Una de las
caractersticas ms importantes de un estimador es que sea insesgado. Un
estimador incestado es una estadstica muestral cuyo valor esperado es igual al
parmetro por estimar, entendiendo por valor esperado al promedio a largo plazo de
la estadstica muestral. La eliminacin de todo sesgo sistemtico est asegurada
cuando la estadstica muestral corresponde a una muestra aleatoria tomada de una
poblacin o un subgrupo racional tomado de un proceso
El muestreo aleatorio es un tipo de muestreo en el que todos los elementos de la

poblacin de inters tienen una oportunidad igual de ser elegidos para su inclusin
en la muestra. Una muestra aleatoria estricta no suele ser factible en el control
estadstico de procesos, ya que solo es posible inspeccionar con relativa facilidad
los artculos o transacciones ms a la mano. Para poder advertir cambios que estn
teniendo lugar en la calidad del producto o proceso, se toman muestras pequeas a
intervalos regulares de tiempo. A este esquena de muestreo se le conoce como
mtodo de subgrupos racionales.
17
Para emplear una estadstica muestral como estimador de un parmetro, la muestra
debe ser una muestra aleatoria de una poblacin o un subgrupo racional de un
proceso.
3.1 El concepto de distribucin de muestreo.
Una distribucin de la poblacin es la distribucin de la totalidad de las medidas

individuales de una poblacin, mientras que una distribucin muestral es la
distribucin de los valores individuales incluidos en una muestra. En contraste con
estas distribuciones de medidas individuales, una distribucin de muestreo se
refiere a la distribucin de los diferentes valores que una estadstica muestral, o
estimador, podra adoptar en muchas muestras del mismo tamao.
Un aspecto clave en la interpretacin y uso de cualquier estadstico es que se trata

de una variable aleatoria, ya que su valor depende de los elementos que son
seleccionados en la muestra. La forma de tomar en cuenta este hecho es conocer la
distribucin de probabilidad de cada estadstico.
3.2 Distribucin de muestreo de la media.
Podemos conocer tanto el valor esperado (a largo plazo) y la variabilidad por

esperar de una muestra a otra cuando conocemos de antemano la media y la
desviacin estndar de la poblacin o proceso. Como la estimacin puntual de un
parmetro se genera a travs de un estadstico, y como el valor de este es aleatorio,
ya que depende de los elementos que hayan sido seleccionados en la muestra,
entonces la estimacin que se hace a partir del parmetro, variar de una muestra a
otra. Una forma de saber que tan variable es el estimador, es calcular de desviacin
estndar o error estndar del estadstico visto como una variable aleatoria.
La distribucin de muestreo de la media se describe determinando la media de

dicha distribucin, la cual es el valor esperado E(x), y la desviacin estndar de la
distribucin de las medias muestrales, designada como x . Debido a que esta
desviacin estndar es indicativa de la exactitud de la estadstica muestral como
estimador de una media poblacional, x suele designarse con el nombre de error
estndar de la media. Cuando los parmetros de la poblacin son conocidos y la
poblacin es infinita:
E(x) =

x
=
n
18
Si la desviacin estndar de la poblacin o proceso es desconocida, el error
estndar de la media puede estimarse usando la desviacin estndar de la muestra
como estimador de la desviacin estndar de la poblacin:
s
sx =
n
3.3 Teorema del Lmite central.
Si la poblacin o proceso del cual se toma una muestra tiene una distribucin
normal, tambin la distribucin de muestreo de la media tendr distribucin normal,
sin importar el tamao de la muestra. Sin embargo, Qu pasa si la distribucin de
la poblacin no es normal?
Una de las razones por las cuales la distribucin normal es tan importante es por
este teorema que afirma que para una muestra aleatoria de cualquier poblacin,
independientemente de cmo sea la distribucin de la poblacin de donde se extrajo
la muestra, la distribucin de X (media de la muestra) se aproxima a la normal
conforme n (el tamao de la muestra) crece. Cuando la distribucin de donde
proviene la muestra no sea radicalmente distinta a la normal, entonces la
aproximacin empieza a ser buena para tamaos de muestra mayores o iguales
que n = 4. En caso de que sea muy diferente se requieren tamaos de muestra
mayores.
Para efectos prcticos puede suponerse que la distribucin de muestreo de la media

tiene una distribucin aproximadamente normal, incluso en las poblaciones o
procesos menos normales, siempre que el tamao de la muestra sea n 30. Para
poblaciones solo ligeramente no normales, bastar incluso un tamao de muestra
menor.
3.4 Determinacin de probabilidades para la media muestral.
Si la distribucin de muestreo de la media tiene una distribucin normal, ya sea

porque la poblacin tiene distribucin normal o por la aplicacin del teorema del
lmite central, podemos determinar probabilidades en relacin con los posibles
valores de la media muestral, dado que conocemos la media y la desviacin
estndar de la poblacin. El proceso es anlogo a la determinacin de
probabilidades para observaciones individuales mediante el uso de la distribucin
19
normal, tal como se describi en la seccin 6.1.2. Pero en este caso es el valor
asignado a la media muestral el que se convierte en un valor de z con el fin de
emplear la tabla de probabilidades normales. En esta frmula de conversin se hace
uso del error estndar de la media, porque ste es la desviacin estndar de la
variable X . As, la frmula de conversin es:
z = ( X - ) / x
3.5 Intervalo de confianza para una media.
En la determinacin de probabilidades para la media muestral se trata de determinar

la probabilidad de que la media muestral tenga diversos valores cuando se conocen
la media y la desviacin estndar de la poblacin. Esto implica un razonamiento
deductivo. Veamos ahora el razonamiento inductivo que permita el uso de datos
muestrales para hacer enunciados sobre el valor de la media de la poblacin.
A continuacin se explica la metodologa a emplear cuando se tiene una distribucin

normal de la muestra, lo cual se logra cuando n 30 (por efecto del teorema del
lmite central) o cuando se tiene n < 30 pero se sabe que la distribucin de la
poblacin es normal y es conocida.
Un intervalo de confianza para la media es un intervalo estimado construido en

relacin con la media muestral por medio del cual puede especificarse la
verosimilitud de que el intervalo incluya el valor de la media de la poblacin. El nivel
de confianza asociado con un intervalo de confianza indica el porcentaje de tales
intervalos que a largo plazo incluyen el parmetro que est siendo estimado.
Los intervalos de confianza para la media se elaboran por lo general con el

estimador insesgado X en el punto medio del intervalo. Cuando est garantizado el
uso de la distribucin normal de probabilidad, el intervalo de confianza para la media
se determina mediante
X z. x
o cuando la de la poblacin se desconoce, mediante
X z. s x
20
3.6 Determinacin del tamao de muestra requerido para la estimacin de la
media.
Supongamos que se especifican el tamao deseado de un intervalo de confianza y

el nivel de confianza asociado con l. Si es conocida o puede estimarse (por
ejemplo, a partir de resultados de estudios similares), el tamao de muestra
requerido con base en el uso de la distribucin normal es:
2
z
n=
E
Donde z es el valor utilizado para el nivel de confianza especificado, es la

desviacin estndar de la poblacin (o su estimacin) y E es el error de muestreo de
ms o de menos permitido en el intervalo (siempre la mitad del intervalo de
confianza). Todo resultado fraccionario deber redondearse al valor inmediato
superior. Adicionalmente, a menos que sea conocida y la poblacin tenga
distribucin normal, todo tamao de muestra calculado por debajo de 30 debe ser
incrementado a 30, porque la frmula anterior se basa en el uso de la distribucin
normal.
3.7 Distribucin t e intervalos de confianza para la media.
El uso de la distribucin normal en la estimacin de la media poblacional est

garantizado para: 1) cualquier muestra grande (n 30), y 2) para una muestra
pequea (n < 30) slo si la poblacin tiene una distribucin normal y es conocida.
Pero, qu pasa si en el caso 2) (muestra pequea y poblacin normal) no se
conoce ?
Si una poblacin tiene distribucin normal, tambin la distribucin de muestreo de la

media para cualquier tamao de muestra tendr una distribucin normal; esto se
aplica sea que sea conocida o no. Si embargo, en el proceso de la inferencia
cada valor de la media es convertido a un valor normal estndar. El problema radica
en que al no disponer de , no podemos calcular z. en esos casos se calcula el
estadstico t.
21
x
t= , donde s es la desviacin estndar muestral calculada con n-1
s
grados de libertad:
s=
(X X i )2
n 1
El estadstico t tiene una distribucin que se denomina distribucin t de Student, que

est tabulada para 1, 2, 3,...etc. grados de libertad de la muestra con la cual se
calcul la desviacin estndar. La distribucin t tiene en cuenta la incertidumbre en
la estimacin de la desviacin estndar de la poblacin, porque en realidad la tabla t
contiene las distribuciones de probabilidad para distintos grados de libertad. Para un
nmero de grados de libertad pequeo, es mas ancha la distribucin normal
tipificada. Cuando los grados de libertada tienden a infinito, la distribucin t tiende a
coincidir con la distribucin normal estndar. En clculos manuales, una regla
general es que los valores t requeridos pueden aproximarse con los valores z
cuando n 30. En aplicaciones de cmputo no es necesario usar aproximaciones, y
por lo tanto la distribucin t se emplea tanto para muestras grandes como pequeas
cuando el error estndar se estima con base en la desviacin estndar de la
muestra.
3.8 Intervalos de confianza para la diferencia entre dos medias.
Con frecuencia es necesario estimar la diferencia entre dos medias poblacionales,

como la diferencia entre el desempeo de dos mquinas que realizan la misma
operacin. El estimador puntual insesgado de (1 2 ) es ( X 1 X 2 ) . El intervalo de
confianza se elabora en forma similar al usado para la estimacin de la media,
excepto que el error estndar pertinente para la distribucin de muestreo es el error
estndar de la diferencia entre medias. El uso de la distribucin normal se basa en
las mismas condiciones que en el caso de la distribucin de muestreo de la media,
solo que estn implicadas dos muestras. Las frmulas empleadas para estimar la
diferencia entre dos medias poblacionales, dado con intervalos de confianza son:
(X 1 X 2 ) z. x1 x 2 (Cuando se conoce )
(X 1 X 2 ) z.s x1 x 2 (Cuando no se conoce )
22
El error estndar de la diferencia entre medias es:
x1 x2 = x21 + x22 (Cuando se conoce )
x1 x2 = s x21 + s x22 (Cuando no se conoce )
3.9 Intervalo de confianza para la proporcin de la poblacin.
La distribucin de probabilidad aplicable a las proporciones es la distribucin

binomial de probabilidad. No obstante, los clculos matemticos asociados con la
determinacin de un intervalo de confianza para una proporcin poblacional
desconocida con base en el proceso de Bernoulli son complejos. Por tanto,
generalmente se utiliza la distribucin normal como aproximacin de la solucin
exacta de intervalos de confianza para proporciones. Como se explic en la seccin
6.2.2, esta aproximacin es adecuada cuando n 30 y tanto np como nq 5. Sin
embargo, cuando la proporcin de la poblacin p es desconocida, la mayora de los
expertos en estadstica recomienda tomar una muestra n 100. Ntese que en el
contexto de la estimacin estadstica, p es desconocida, pero es estimada por p .

Dada una proporcin muestral observada, el error estndar de la proporcin

p
estimado es:

p (1 p )
s p
=
n
La proporcin de la poblacin, p, se desconoce porque es precisamente el valor por
estimar. El intervalo de confianza aproximado para una proporcin poblacional es:

p z. s p
3.10 Determinacin del tamao de muestra requerido para la estimacin de la

proporcin.
Antes de recolectar una muestra, el tamao de muestra mnimo requerido puede

determinarse especificando el nivel de confianza requerido y el error de muestreo
23
aceptable y haciendo una estimacin inicial (subjetiva) de , la proporcin
poblacional desconocida.
z 2 (1 )
n=
E2
Donde z es el valor usado para el intervalo de confianza especificado, es la

estimacin inicial de la proporcin poblacional y E es el error de muestreo de mas o
de menos permitido en el intervalo (siempre la mitad del intervalo de confianza
completo).
Si no es posible determinar un estimado inicial de , se le deber estimar en 0,50.

Con base en este supuesto, la frmula general para el tamao de muestra se
simplifica en esta forma:
2
z
n=
2E
Todo resultado fraccionario se redondea siempre al valor inmediato superior.

Adems, todo tamao de muestra calculado por debajo de 100 se debe incrementar
a 100, porque las frmulas anteriores se basan en el uso de la distribucin normal.
3.11 Prueba de hiptesis referente al valor de la media de la poblacin.
Una prueba de hiptesis tiene como propsito determinar si el valor supuesto de un

parmetro poblacional, como por ejemplo la media (), debe aceptarse como
verosmil con base en evidencias muestrales. Recurdese que un aspecto clave en
la interpretacin y uso de cualquier estadstico es que se trata de una variable
aleatoria, ya que su valor depende de los elementos que son seleccionados en la
muestra. Esto significa que, en el caso de la media muestral, sta ser diferente en
valor de la media poblacional. Si el valor observado en la muestra se acerca al valor
paramtrico supuesto y slo difiere de l en el monto que cabra esperar del
muestreo aleatorio, el valor hipottico no se rechaza. Si la estadstica muestral
difiere de la supuesta en un monto que no es posible atribuir al azar, la hiptesis se
rechaza por inverosmil.
Pasos bsicos de la prueba de hiptesis.
A continuacin se describen los pasos fundamentales que conforman el

procedimiento de prueba de hiptesis por el mtodo del valor crtico.
24
Paso 1. Formulacin de la hiptesis nula y la hiptesis alternativa. Una
hiptesis estadstica es una afirmacin sobre los valores de los parmetros de una
poblacin o proceso, que es susceptible de probarse a partir de la informacin
contenida en una muestra representativa obtenida de la poblacin. La hiptesis nula
(H 0 ) es el valor paramtrico hipottico que se compara con el resultado muestral.
Se la rechaza solo si es poco probable que el resultado muestral haya ocurrido dado
lo correcto de la hiptesis. La hiptesis alternativa (H 1 ) se acepta solo si la hiptesis
nula es rechazada. Por ejemplo, la afirmacin este proceso produce menos de 5%
de defectuosos se puede plantear estadsticamente, en trminos de la proporcin p
desconocida de artculos defectuosos que genera el proceso:
H 0 : p = 0,05 (la proporcin de defectuosos es 0,05).
H 1 : p < 0,05 (la proporcin es menor que 0,05)
Paso 2. Especificacin del nivel de significancia por aplicar. El nivel de

significancia es el estndar estadstico que se especifica para rechazar la hiptesis
nula. Si se especifica, por ejemplo, un nivel de significancia de 5%, la hiptesis nula
se rechaza solo si el resultado muestral es tan diferente del valor hipottico que una
diferencia por ese monto o un monto superior ocurrira al azar con una probabilidad
de 0.05 o menos.
Es importante observar que con un nivel de significancia de 5%, hay una

probabilidad de 0.05 de rechazar la hiptesis nula an siendo cierta. Esto se conoce
como error tipo I. La probabilidad del error tipo I siempre es igual al nivel de
significancia empleado como estndar para rechazar la hiptesis nula; se la designa
con la letra griega (alfa), de modo que designa tambin el nivel de significancia.
El error tipo II ocurre cuando la hiptesis nula no se rechaza (es aceptada) cuando
en realidad es falsa.
Paso 3. Seleccin del estadstico de prueba. El estadstico de prueba ser la

estadstica muestral o una versin estandarizada de la misma. Si la distribucin de
muestreo de la media es normal, el valor de la media muestral se transforma en un
valor z que se emplea como estadstico de prueba.
Paso 4. Establecimiento del valor o los valores crticos del estadstico de

prueba. Una vez especificada la hiptesis nula, el nivel de significancia y el
25
estadstico de prueba a emplear, se establece el valor o los valores crticos del
estadstico de prueba. Estos valores pueden ser uno o dos, dependiendo de si se va
a hacer una prueba unilateral o bilateral. El estadstico de prueba construido bajo el
H0
supuesto de que es verdadera, es una variable aleatoria con distribucin
H
conocida. Si 0 es verdad, el valor del estadstico de prueba debera caer dentro
del rango de valores ms probables de su distribucin asociada, rango que se
conoce como regin de aceptacin. Si cae en una de las colas de su distribucin
asociada, fuera del rango de valores ms probables (en la regin de rechazo), es
evidencia de que este valor no pertenece a dicha distribucin.
La frmula que se emplea para establecer los valores crticos de la media muestral
es similar a la frmula para determinar los lmites de confianza para la estimacin de
la media de la poblacin, excepto que el valor hipottico de la media poblacional 0
es en este caso el punto de referencia, en lugar de la media muestral. Los valores
crticos de la media muestral para una prueba de dos extremos, de acuerdo con el
hecho de si se conoce o no, son:
X CR = 0 z. x
X CR = 0 z.s x
Aunque los valores crticos se pueden establecer en trminos de la media muestral,

lo ms comn es expresarlos en trminos de valores z. Una vez determinado el
valor de la media muestral, se le convierte a un valor z para que pueda
comparrsele con los valores crticos de z. Por ejemplo, para el nivel de
significancia de del 5% los valores crticos de z para una prueba de dos extremos
son -1.96 y +1.96.
Paso 5. Determinacin del valor del estadstico de prueba. Probar una hiptesis
consiste en investigar, con base en la evidencia contenida en una muestra
adecuadamente seleccionada, si lo afirmado por la hiptesis nula es verdad o no, y
en caso de ser falsa, se toma como verdadera la alternativa H 1 .
Al probar un valor hipottico de la media poblacional, se colecta una muestra

aleatoria (o se obtienen datos mediante un experimento planeado de acuerdo con la
hiptesis) y se determina el valor de la media muestral. Si el valor crtico fue
establecido como un valor z, la media muestral se convierte a un valor z. La frmula
de conversin, segn si es conocida o no, es:
26
X 0 X 0
z= z=
x sx
Paso 6. Toma de la decisin. El valor observado de la estadstica muestral se

compara con el valor (o valores) crtico(s) de la estadstica de prueba. Se rechaza o
no entonces la hiptesis nula. Si la hiptesis nula es rechazada, se acepta la
hiptesis alternativa. La estrategia para probar la hiptesis parte del supuesto de
H0
que es verdadera, y si los resultados de la investigacin contradicen en forma
H
suficiente dicho supuesto, entonces se rechaza 0 y se acepta la hiptesis
alternativa. En caso de que los resultados de la investigacin no demuestren

H
claramente la falsedad de 0 , sta no se rechaza. Esto es, la hiptesis nula es
verdadera mientras no se demuestre lo contrario.
3.12 Pruebas respecto a la media del proceso en Control Estadstico de

Procesos.
Las grficas de control en el control estadstico de procesos son una aplicacin

directa de los mtodos y conceptos de la prueba de hiptesis. La hiptesis nula es
que el proceso es estable y que solo existen causas comunes de variacin. La
hiptesis alternativa es que el proceso es inestable e incluye variacin por causas
asignables. El mtodo que se emplea para la prueba de hiptesis es el mtodo del
valor crtico, sobre la norma de que los lmites de control inferior y superior (valores
crticos) se definen en 3 unidades de error estndar respecto a la media hipottica
del proceso.
3.13 Prueba de la diferencia entre dos medias.
El procedimiento para probar una hiptesis referente a la diferencia entre dos

medias de la poblacin es similar al de la prueba de una hiptesis referente al valor
de una media poblacional. Slo difiere en que el error estndar de la diferencia entre
las medias se emplea para determinar el valor z (o t) asociado con el resultado
muestral. El uso de la distribucin normal se basa en las mismas condiciones que
en el caso de una muestra, salvo que estn implicadas dos muestras aleatorias
independientes. Las frmulas generales para determinar el valor z para probar una
hiptesis referente a la diferencia entre dos medias, son:
27
( X 1 X 2 ) ( 1 2 ) 0
z= (Con conocida)
&x&1 x2
( X 1 X 2 ) ( 1 2 ) 0
z= (Con desconocida)
s &x&1 x2
Como se deduce de las frmulas anteriores, podemos comenzar con cualquier
diferencia hipottica particular, ( 1 2 ) 0 por probar. Sin embargo, la hiptesis nula
usual es que las dos muestras se han obtenido de poblaciones con medias iguales.
En este caso ( 1 2 ) 0 = 0 , de modo que las frmulas anteriores se simplifican as:
(X1 X 2 )
z= (Con conocida)
&x&1 x2
(X1 X 2 )
z= (Con desconocida)
s &x&1 x2
En general, el error estndar de la diferencia entre medias se calcula con la frmula

x1 x2 = x21 + x22 . Si embargo, al probar la diferencia entre dos medias por lo
general la hiptesis nula de inters no es solo que las medias muestrales se
obtuvieron de poblaciones con medias iguales, sino tambin que, en realidad, las
dos muestras se obtuvieron de la misma poblacin de valores. Esto significa que
1 = 2 , lo que podemos designar sencillamente como . La supuesta varianza
comn suele estimarse mediante la combinacin de las dos varianzas muestrales,
tras lo cual el valor estimado de 2 sirve como base para el error estndar de la
diferencia. La estimacin combinada de la varianza de la poblacin es
(n1 1) s12 + (n2 1) s 22

2 =
n1 + n2 2
El error estndar estimado de la diferencia basado en el supuesto de que las

desviaciones estndar de la poblacin son iguales es:
2 2
x1 x2 = +
n1 n2
28
BIBLIOGRAFA.
BESTERFIELD Dale H. Control de calidad. Editorial Prentice Hill, Mxico 1994.

BOUNDS, Greg, Yorks, Lyle, Adams, Mel, Ranney y Gipsie, Beyond Total Quality Management;
Toward the Emerging Paradigm, McGraw-Hill, 1994.
BROWNLEE K. A., Statistical Theory and Methodology. Segunda edicin. Editorial John Willey.
1965.
CANAVOS G. C., Probabilidad y Estadstica. Editorial Mc Graw Hill. Mxico 2000.
CANT Humberto. El desarrollo de una cultura de calidad. Editorial Mc-grawhill, Unam Mxico 1999
CHOU Y. L., Anlisis Estadstico. Editorial Interamricana. Mxico 1986.
CRAIG John Clark and WEBB Jeff . Microsoft Visual Basic 6.0 Developers Worshop, Microsoft
press, editorial Mc Graw Hill, 1999.
DEMING, W. Edwards, Out of the Crisis, MIT Center for Advanced Engineering Studies, 1986.
DOTY, L. A., Statistical Process Control, Industrial Press, Nueva York.
FEIGENBAUM, ARMAND V., Total Quality Control, 4a ed., McGraw-Hill, 1990.
ISHIKAWA, Kaoru, What is Total Quality Control: The Japanese Way, Prentice-Hall, 1985.
IMAI, Masaaki, KAIZEN: La clave de la ventaja competitiva japonesa, CECSA, 1989
JURAN, J. M. y Gryna, F. M. Anlisis y planeacin de la calidad, 3. ed., McGraww-Hill, Mxico,
1995.
KEEPING E. S., Introduction to Statistical Inference. Editorial Princeton. New Jersey. 1962.
MIZUNO, Shigeru, Company-Wide Total Quality Control, Asian Productivity Organization, 1988.
Management for Quality Improvement, Productivity Press, 1988.
NETER J. y WASSERMANN W., Fundamentos de Estadstica para Economa y Administracin.
Sexta edicin. Editorial Allyn and Bacon. Boston 1978.
PORTUS L., Curso prctico de Estadstica. Editorial Mc Graw Hill. Bogot 1992.
PRESSMAN Roger, Ingeniera de Software, un enfoque prctico. Editorial Mc Graw Hill. Madrid.
1998.
RINCN Luis A., Modelos de Regresin, desarrollo y aplicacin con el computador. Universidad
Nacional de Colombia. Palmira 1995.
SHEWHART, Walter, Economic Control of Quality of Manufactured Product, 50th. Anniversary
Commemorative Reissue, ASQ Quality Press, 1980
SPIEGELS Murray R, Estadstica. Coleccin Schaum. Editorial Mc Graw Hill. Mxico 2000.
WALPOLE, MYERS y MYERS, Probabilidad y Estadstica para Ingenieros. Editorial Prentice Hall.
Mxico 1999.
YAMANE T., Estadstica. Editorial Harla. Mxico 1984.
29

Elementos Básicos Estadística

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Elementos Básicos Estadística

Загружено:

Авторское право:

Доступные форматы

APNDICE.

ELEMENTOS BSICOS DE ESTADSTICA

1.1 Medidas de Tendencia Central.

Cuando se mide una caracterstica de calidad, el primer paso para investigar si el

Media. Es el popular promedio, esto es, la suma de valores considerados,

El segundo paso para investigar si el proceso cumple con las especificaciones es

Desviacin estndar muestral, S. Mide qu tan esparcidos estn los datos

Desviacin estndar del proceso, . Si al calcular la desviacin estndar se

Para el clculo de la desviacin estndar del proceso se debe utilizar un nmero

Interpretacin de la Desviacin Estndar. La regla emprica afirma que en

Entre X S y X + S est el 68.3% de los datos de la muestra.

Lmites reales o naturales. Los lmites reales o naturales de un proceso indican el

Lmite real inferior (LRI) = - 3 y Lmite real superior (LRS) = + 3

Estos lmites indican la amplitud real de la variacin de la salida del proceso. En un

1.3 Estimacin de los parmetros del proceso (, )

Si no se conocen la media y la desviacin estndar del proceso, una forma tpica de

1. Tomar en un lapso de dos o ms das, entre 20 a 30 muestras, de 5 a10 piezas

1.4 Anlisis a partir del histograma.

Una distribucin de frecuencias es una tabla en la cual se agrupan en clases los

Despus de construir el histograma, se dar rpida respuesta a tres preguntas:

Es consistente el producto con las verificaciones anteriores?

Un histograma simple es til en la elaboracin de un anlisis, porque permite

Se requiere un gran nmero de medidas.

En esencia, un histograma es una ilustracin a posteriori en la que se describe una

Procedimiento para elaborar un histograma

Para que exista consistencia en la elaboracin del histograma, se recomienda

Paso 1. Determinar el rango de los datos, restando la medida observada ms

Ejemplo 1: Medida observada ms grande = 4,36

Ejemplo 2: Medida observada ms grande = 176

Paso 3. Determinar el nmero y el ancho (intervalo) de las celdas (clases). El

Paso 4. Establecer los puntos medios y los lmites de las celdas.

El ms pequeo de los puntos intermedios de las celdas (llamados tambin marcas

Ejemplo 1: Punto intermedio de la celda mas baja = 2,07

Los puntos intermedios y los lmites de las celdas son:

Puntos intermedios Lmites de las celdas

Ejemplo 2: Punto intermedio de la celda mas baja = 12

Los puntos intermedios y los lmites de las celdas son:

Puntos intermedios Lmites de las celdas

1. 5 Pruebas para determinar la normalidad

Debido a la importancia de la distribucin normal, con frecuencia es necesario

Una frmula aproximada para calcular la asimetra es la siguiente:

Si el valor de a3 es 0, los datos son simtricos; si es mayor de 0 (positivo), los datos

La curtosis es un valor adimensional que sirve como medida de la altura de un pico

Cuartiles, Deciles y Percentiles

Cuartiles, deciles y percentiles se asemejan a la mediana en que tambin

2 FUNCIONES DE DISTRIBUCIN DE PROBABILIDADES.

Histricamente se han desarrollado tres aproximaciones conceptuales para definir la

La subjetiva. Es la cuantificacin de la incertidumbre que representa creer en una

Nmero de veces que puede ser cara

Nmero de veces que fu cara

Probabilidades cuando se combinan eventos.

Eventos mutuamente excluyentes. Los que no pueden ocurrir en forma

Eventos independientes. Aquellos en los que la ocurrencia de uno no tiene efectos

Eventos mutuamente excluyentes:

Ejemplo: Si se lanza al aire una moneda,

Eventos no excluyentes mutuamente:

Ejemplo: Supongamos que se arrojan dos monedas al aire,

P [cara en la primera moneda o cara en la segunda moneda] = P [cara en la primera

Ejemplo: Supongamos que una caja contiene 20 bolas, 3 blancas, 7 rojas y 10

P [blanca y blanca] = P [blanca en la primera extraccin] x P [blanca en la segunda

Por comparacin, si las extracciones son independientes (la primera bola se

P [blanca y blanca] = 3/20 x 3/20 = 9/400 = 0,0225

Algo que se debe recordar es que la prediccin de probabilidades se podr cumplir

Una variable continua puede adoptar un valor en cualquier punto fraccionario a lo