Академический Документы
Профессиональный Документы
Культура Документы
TABLA DE CONTENIDO
1. ESTADSTICA DESCRIPTIVA. 2
1.1 MEDIDAS DE TENDENCIA CENTRAL. 2
1.2 MEDIDAS DE DISPERSIN O VARIABILIDAD. 3
1.3 ESTIMACIN DE LOS PARMETROS DEL PROCESO (, ) 4
1.4 ANLISIS A PARTIR DEL HISTOGRAMA. 4
1. 5 PRUEBAS PARA DETERMINAR LA NORMALIDAD 8
2 FUNCIONES DE DISTRIBUCIN DE PROBABILIDADES. 9
2.1 TCNICAS DE ANLISIS PARA DATOS CONTINUOS. 12
2.2 TCNICAS DE ANLISIS PARA DATOS DISCRETOS. 16
3. ELEMENTOS DE INFERENCIA ESTADSTICA. 17
3.1 EL CONCEPTO DE DISTRIBUCIN DE MUESTREO. 18
3.2 DISTRIBUCIN DE MUESTREO DE LA MEDIA. 18
3.3 TEOREMA DEL LMITE CENTRAL. 19
3.4 DETERMINACIN DE PROBABILIDADES PARA LA MEDIA MUESTRAL. 19
3.5 INTERVALO DE CONFIANZA PARA UNA MEDIA. 20
3.6 DETERMINACIN DEL TAMAO DE MUESTRA REQUERIDO PARA LA ESTIMACIN DE LA MEDIA. 21
3.7 DISTRIBUCIN T E INTERVALOS DE CONFIANZA PARA LA MEDIA. 21
3.8 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS. 22
3.9 INTERVALO DE CONFIANZA PARA LA PROPORCIN DE LA POBLACIN. 23
3.10 DETERMINACIN DEL TAMAO DE MUESTRA REQUERIDO PARA LA ESTIMACIN DE LA PROPORCIN. 23
3.11 PRUEBA DE HIPTESIS REFERENTE AL VALOR DE LA MEDIA DE LA POBLACIN. 24
3.12 PRUEBAS RESPECTO A LA MEDIA DEL PROCESO EN CONTROL ESTADSTICO DE PROCESOS. 27
3.13 PRUEBA DE LA DIFERENCIA ENTRE DOS MEDIAS. 27
BIBLIOGRAFA. 29
1. ESTADSTICA DESCRIPTIVA.
( X )i
=
N
La media del proceso es igual a cierto valor, aunque casi nunca se conoce con
exactitud. El valor de X (promedio de la muestra) se conoce para cada muestra,
pero es diferente de una muestra a otra, porque depende de las piezas que se
seleccionan en la muestra.
X=
X i
Mediana. Es el valor central, cuando todos los valores se han colocado en orden
de medidas; el valor que se obtiene al dividir la distribucin exactamente a la
mitad. Si el nmero de datos es par, entonces la mediana se calcula dividiendo
entre dos la suma de los nmeros que estn en el centro del ordenamiento.
Moda. Es el valor que se presenta con mayor frecuencia. Si varios datos tienen
la frecuencia ms grande, entonces cada uno de ellos es una moda.
2
1.2 Medidas de dispersin o variabilidad.
(X
2
i X)
Desviacion _ Estndar ( S ) = Varianza =
n 1
X son las observaciones numricas de la muestra, n su tamao y X es la media
muestral. Entre ms grande sea el valor de S mayor variabilidad habr entre los
datos y por tanto ms mala calidad. La desviacin estndar est expresada en
las mismas unidades de medicin que los datos.
(X
2
i )
Desviacion _ Estndar ( ) = Varianza =
N
Rango. La diferencia que existe entre el valor mayor y el valor menor de los
valores considerados.
3
Los intervalos anteriores son vlidos solo para los datos muestrales y no
necesariamente para toda la poblacin o proceso. Sin embargo, si los intervalos se
calculan con la media y la desviacin estndar del proceso o poblacin, entonces
sern vlidos para toda la poblacin (siempre y cuando la distribucin de la
poblacin sea normal). Si se tiene una muestra aleatoria lo suficientemente grande,
los intervalos anteriores podrn dar una idea aproximada de lo que pasa en el
proceso.
R
(X ) Y
d2
5
Medida observada ms pequea = 1
R = 175
Paso 2. Anotar la unidad de medida (UM) usada. Por lo general, sta se controla,
considerando la medida mnima que se puede leer con el instrumento de que se
disponga.
Ejemplo 1: UM = cm.
Ejemplo 2: UM = Kg.
Otra tcnica que permite obtener el intervalo de celda es la regla de Sturgi, que se
expresa mediante la frmula:
R
i=
1 + 3.322 log n
Se recomienda que el intervalo de la celda sea un nmero impar que sea mltiplo
de la unidad de medida. En el ejemplo 1, el intervalo 0,32 (par) se reemplaza por
0,33 (impar), para el clculo de h.
6
0,33
Ejemplo 1: MPL = 1,91 + = 2,07 (el resultado no se redondea)
2
23
Ejemplo2: MPL = 1 + = 12 (el resultado no se redondea)
2
Los puntos intermedios de las celdas restantes se obtienen aadiendo el intervalo
de celda al punto intermedio de la primera celda.
Los lmites de las celdas se definen de manera tal que no quede duda de dnde
colocar el valor de una observacin. Por tanto, los valores de los lmites cuentan con
un valor decimal o figura significativa ms de exactitud que los valores observados.
7
Inferior Superior
12 0,5 23,5
35 23,5 46,5
58 46,5 69,5
81 69,5 92,5
104 92,5 115,5
127 115,5 138,5
150 138,5 161,5
173 161,5 184,5
Las medidas de asimetra tienen como finalidad elaborar un indicador que permita
establecer el grado de simetra (o asimetra) que presenta una distribucin, sin
necesidad de llevar a cabo su representacin grfica. Las medidas de curtosis
estudian la distribucin de frecuencias en la zona central de la misma. La mayor o
menor concentracin de frecuencias alrededor de la media y en la zona central de la
distribucin dar lugar a una distribucin ms o menos apuntada.
f (X
i =1
i i X )3 / n
a3 =
s3
8
Una frmula aproximada para calcular la curtosis es la siguiente:
f (X
i =1
i i X )4 / n
a4 =
s4
La clsica. Est dada por la razn entre las formas en que puede ocurrir un evento
y el total de formas para todos los casos posibles.
La emprica. Est dada por el valor lmite para la frecuencia relativa de las formas
en que un evento ocurre conforma aumenta el nmero de ensayos indefinidamente.
9
Ejemplo: En el lanzamiento al aire de una moneda el evento E puede ser cara. La
manifestacin de probabilidades para el evento E es:
LEY DE LA ADICIN.
P [A o B] = P [A] + P [B]
P [cara o sello] = + = 1
P [A o B] = P [A] + P [B] P [A y B]
10
LEY DE LA MULTIPLICACIN.
Eventos independientes.
P [A y B] = P [A] x P [B]
Eventos no independientes:
P [A y B] = P [A] x P [B /A]
P [B y A] = P [B] x P [A /B]
Una variable aleatoria es un evento numrico cuyo valor se determina por medio de
un proceso aleatorio. Cuando a todos los posibles valores numricos de una
variable aleatoria X se le asignan valores de probabilidad, ya sea mediante un
listado o una funcin matemtica, el resultado es una distribucin de probabilidad.
La suma de la probabilidad de todos los resultados numricos posibles debe ser
igual a 1.0. Valores de probabilidad individuales pueden denotarse con el smbolo
f(x), lo que involucra el uso de una funcin matemtica; con P(x = X), que advierte
11
que la variable aleatoria puede tener varios valores especficos o simplemente con
P(X).
En una variable aleatoria continua, no pueden enlistase todos los posibles valores
fraccionarios de la variable, por esa razn las probabilidades que se determinan por
medio de una funcin matemtica son grficamente representadas por una funcin
de densidad de probabilidad, o curva de probabilidad. En una variable aleatoria
discreta, todos los posibles valores numricos de la variable pueden enlistarse en
una tabla junto con sus respectivas probabilidades.
La distribucin normal es una curva con forma de campana, con eje de simetra en
el punto correspondiente al promedio del universo . La distancia entre el eje de
12
simetra de la campana y el punto de inflexin de la curva es igual a , la desviacin
estndar de la poblacin:
Tiene como parmetros a , y cualquier zona bajo su curva est definida por la
distancia entre y un valor especifico de .
1. El rea total debajo de la curva es igual a 1.
2. El 99% del rea se encuentra comprendida en el intervalo [-2.58
, 2.58
].
Esto es, P(
-2.58
<X < + 2.58
) = 0.99.
3. El 95% del rea se encuentra comprendida en el intervalo [-1.96
, 1.96
].
Esto es, P(
-1.96
<X < + 1.96
) = 0.95.
4. El 68.3% de toda el rea se encuentra comprendida en el intervalo [-
, ].
Esto es, P(
- <X < + ) = 0.683.
5. El 50% del rea se encuentra comprendida en el intervalo [-0.67
, 0.67
].
Esto es, P(
-0.67
<X < + 0.67
) = 0.5.
6. Es una distribucin unimodal con valor modal en x = .
7. Tiene dos puntos de inflexin situados en - y + .
8. Es asinttica al eje de las x.
9. Un cambio en desplaza toda la distribucin, mientras que un cambio en
altera su posicin relativa con respecto a una escala fija.
13
10. Un cambio lineal en la escala genera una nueva distribucin Normal. Es
decir, si X es una variable Normal, entonces Y = a + bX tambin lo ser.
X
Z=
11. Si X se distribuye Normalmente con , ; entonces tambin se
distribuye Normalmente.
Partiendo del hecho de que cada poblacin concebida tiene una media y una
desviacin estndar diferente, existe en teora un nmero infinito de curvas de
distribucin normales. Si se estandarizan los resultados de la distribucin normal en
una curva, sta se puede aplicar a cualquier conjunto de datos caracterizado por
dicha distribucin. Con el fin de estandarizar se puede escribir la frmula de la
distribucin normal de la siguiente manera:
2
1 x
1
P( x) = e 2
2
X
Z=
Llamando , la funcin queda as:
1
1 2Z2
P( z) = e
2
14
Grfico de la Distribucin Normal
0,45
0,40
Densidad de Probabilidad
0,35 =0
0,30 = 1
0,25
= 15
0,20 Cambio de = 2,5
0,15 variable
0,10
0,05
Z X
0,00
-5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Variables Aleatorias X y Z
De esta manera se tiene tabulada una funcin de Gauss que no depende de cual
sea el promedio y la desviacin estndar de la poblacin real. El cambio de variable
hace que se conserve la forma de la funcin y que sirva para cualquier poblacin,
siempre y cuando esa poblacin tenga una distribucin normal. Cuando se
requieran calcular las probabilidades para una poblacin real, se calcula Z y se
entra en la tabla de la funcin normal estndar:
15
2.2 Tcnicas de Anlisis para Datos Discretos.
P( x) = ( x ) p x q n x =
n n!
p x q n x
x!(n x )!
E (x) = =np
2
= np (1-p)
= np(1 p )
Distribucin de Poisson.
e . x
f (x) =
x!
16
En esta frmula es el valor esperado o nmero promedio de ocurrencias, x = 0, 1,
2, 3, y e = 2,71828, que es una constante.
17
Para emplear una estadstica muestral como estimador de un parmetro, la muestra
debe ser una muestra aleatoria de una poblacin o un subgrupo racional de un
proceso.
E(x) =
x
=
n
18
Si la desviacin estndar de la poblacin o proceso es desconocida, el error
estndar de la media puede estimarse usando la desviacin estndar de la muestra
como estimador de la desviacin estndar de la poblacin:
s
sx =
n
Si la poblacin o proceso del cual se toma una muestra tiene una distribucin
normal, tambin la distribucin de muestreo de la media tendr distribucin normal,
sin importar el tamao de la muestra. Sin embargo, Qu pasa si la distribucin de
la poblacin no es normal?
Una de las razones por las cuales la distribucin normal es tan importante es por
este teorema que afirma que para una muestra aleatoria de cualquier poblacin,
independientemente de cmo sea la distribucin de la poblacin de donde se extrajo
la muestra, la distribucin de X (media de la muestra) se aproxima a la normal
conforme n (el tamao de la muestra) crece. Cuando la distribucin de donde
proviene la muestra no sea radicalmente distinta a la normal, entonces la
aproximacin empieza a ser buena para tamaos de muestra mayores o iguales
que n = 4. En caso de que sea muy diferente se requieren tamaos de muestra
mayores.
z = ( X - ) / x
X z. x
o cuando la de la poblacin se desconoce, mediante
X z. s x
20
3.6 Determinacin del tamao de muestra requerido para la estimacin de la
media.
2
z
n=
E
21
x
t= , donde s es la desviacin estndar muestral calculada con n-1
s
grados de libertad:
s=
(X X i )2
n 1
(X 1 X 2 ) z. x1 x 2 (Cuando se conoce )
22
El error estndar de la diferencia entre medias es:
estimado es:
p (1 p )
s p
=
n
La proporcin de la poblacin, p, se desconoce porque es precisamente el valor por
estimar. El intervalo de confianza aproximado para una proporcin poblacional es:
p z. s p
23
aceptable y haciendo una estimacin inicial (subjetiva) de , la proporcin
poblacional desconocida.
z 2 (1 )
n=
E2
El error tipo II ocurre cuando la hiptesis nula no se rechaza (es aceptada) cuando
en realidad es falsa.
25
estadstico de prueba a emplear, se establece el valor o los valores crticos del
estadstico de prueba. Estos valores pueden ser uno o dos, dependiendo de si se va
a hacer una prueba unilateral o bilateral. El estadstico de prueba construido bajo el
H0
supuesto de que es verdadera, es una variable aleatoria con distribucin
H
conocida. Si 0 es verdad, el valor del estadstico de prueba debera caer dentro
del rango de valores ms probables de su distribucin asociada, rango que se
conoce como regin de aceptacin. Si cae en una de las colas de su distribucin
asociada, fuera del rango de valores ms probables (en la regin de rechazo), es
evidencia de que este valor no pertenece a dicha distribucin.
La frmula que se emplea para establecer los valores crticos de la media muestral
es similar a la frmula para determinar los lmites de confianza para la estimacin de
la media de la poblacin, excepto que el valor hipottico de la media poblacional 0
es en este caso el punto de referencia, en lugar de la media muestral. Los valores
crticos de la media muestral para una prueba de dos extremos, de acuerdo con el
hecho de si se conoce o no, son:
X CR = 0 z. x
X CR = 0 z.s x
Paso 5. Determinacin del valor del estadstico de prueba. Probar una hiptesis
consiste en investigar, con base en la evidencia contenida en una muestra
adecuadamente seleccionada, si lo afirmado por la hiptesis nula es verdad o no, y
en caso de ser falsa, se toma como verdadera la alternativa H 1 .
27
( X 1 X 2 ) ( 1 2 ) 0
z= (Con conocida)
&x&1 x2
( X 1 X 2 ) ( 1 2 ) 0
z= (Con desconocida)
s &x&1 x2
Como se deduce de las frmulas anteriores, podemos comenzar con cualquier
diferencia hipottica particular, ( 1 2 ) 0 por probar. Sin embargo, la hiptesis nula
usual es que las dos muestras se han obtenido de poblaciones con medias iguales.
En este caso ( 1 2 ) 0 = 0 , de modo que las frmulas anteriores se simplifican as:
(X1 X 2 )
z= (Con conocida)
&x&1 x2
(X1 X 2 )
z= (Con desconocida)
s &x&1 x2
2 2
x1 x2 = +
n1 n2
28
BIBLIOGRAFA.
WALPOLE, MYERS y MYERS, Probabilidad y Estadstica para Ingenieros. Editorial Prentice Hall.
Mxico 1999.
YAMANE T., Estadstica. Editorial Harla. Mxico 1984.
29