Академический Документы
Профессиональный Документы
Культура Документы
INGENIERIA INDUSTRIAL
Pgina 2
Pgina 3
Pgina 4
Bibliografa
1. DeVore, J. (2005). Probabilidad y Estadstica para Ingeniera y Ciencias. Mxico: Thomson 2. Hines, W. y Montgomery, D. (2003). Probabilidad y Estadstica para Ingeniera y Administracin. Mxico: CECSA 3. Montgomery, D. C. y Runger, G. C. (1998). Probabilidad y Estadstica aplicadas a la Ingeniera. Mxico: McGraw Hill. 4. Ross, S. M. (2001). Probabilidad y Estadstica para Ingenieros. Mxico: McGraw Hill. 5. Salvatore, D., Reagle, D. (2004). Estadstica y econometra. Espaa: Mc Graw-Hill. 6. Spiegel, M. R. (1992). Manual de Frmulas y Tablas Matemticas. Mxico: McGraw Hill. 7. Spiegel, M. R. (1988). Probabilidad y Estadstica. Mxico: McGraw Hill. 8. Walpole, R. E., Myers, R. H., Myers, S. L. (1999). Probabilidad y Estadstica para Ingenieros. Mxico: Pearson Prentice Hall.
Pgina 5
Muestreo: Introduccin al muestreo y tipos de muestreo. Uno de los propsitos de la estadstica inferencial es estimar las caractersticas poblacionales desconocidas, examinando la informacin obtenida de una muestra, de una poblacin. El punto de inters es la muestra, la cual debe ser representativa de la poblacin objeto de estudio. Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras reflejen observaciones a la poblacin de la que proceden, ya que solo se pueden hacer observaciones probabilsticas sobre una poblacin cuando se usan muestras representativas de la misma. Una poblacin est formada por la totalidad de las observaciones en las cuales se tiene cierto observa. Una muestra es un subconjunto de observaciones seleccionadas de una poblacin. Muestras Aleatorias Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan muestras por muchas razones; una enumeracin completa de la poblacin, llamada censo, puede ser econmicamente imposible, o no se cuenta con el tiempo suficiente. A continuacin se ver algunos usos del muestreo en diversos campos: 1. Poltica. Las muestras de las opiniones de los votantes se usan para que los candidatos midan la opinin pblica y el apoyo en las elecciones. 2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes se usan para determinar la eficiencia de una tcnica o programa de enseanza. 3. Industria. Muestras de los productos de una lnea de ensamble sirve para controlar la calidad. 4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos prueban la eficacia de una tcnica o de un frmaco nuevo. 5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la produccin los efectos de un fertilizante nuevo. 6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar los criterios del pblico sobre cuestiones relacionadas con el bienestar y la seguridad nacional. Errores en el Muestreo ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 6
Pgina 7
Ejemplo Para la distribucin muestral de medias del ejercicio pasado, encuentre: El error muestral de cada media: a. La media de los errores mustrales b. La desviacin estndar de los errores mustrales Solucin: a. En la tabla siguiente se ven las muestras, las medias de las muestras y los errores mustrales:
Muestra (0,0) (0,2) (0,4) (0,6) (2,0) (2,2) (2,4) (2,6) (4,0) (4,2) (4,4) (4,6) (6,0) (6,2) (6,4) (6,6) x 0 1 2 3 1 2 3 4 2 3 4 5 3 4 5 6
e,
Error muestral, e=x0 - 3 = -3 1 - 3 = -2 2 - 3 = -1 33=0 1 3 = -2 2 3 = -1 33=0 43=1 2 3 = -1 33=0 43=1 53=2 33=0 43=1 53=2 63=3
es:
Pgina 8
La desviacin estndar de la distribucin muestral de un estadstico se conoce como error estndar del estadstico. Para el ejercicio anterior el error estndar de la media denotado por x, es 1.58. Con esto se puede demostrar que si de una poblacin se eligen muestras de tamao n con reemplazo, entonces el error estndar de la media es igual a la desviacin estndar de la distribucin de los errores mustrales. En general se tiene: Cuando las muestras se toman de una poblacin pequea y sin reemplazo, se puede usar la formula siguiente para encontrar x .
donde es la desviacin estndar de la poblacin de donde se toman las muestras, n es el tamao de la muestra y N el de la poblacin. Como rfegla de clculo, si el muestreo se hace sin reemplazo y el tamao de la poblacin es al menos 20 veces el tamao de la muestra (N 20), entonces se puede usar la frmula.
El factor Ejemplo:
Suponga que la tabla siguiente muestra la antiguedad en aos en el trabajo de tres maestros universitarios de matemticas: Maestro de matemticas A B C Antiguedad 6 4 2 Pgina 9
Si utilizamos la frmula del error estndar sin el factor de correccin tendramos que:
Por lo que observamos que este valor no es el verdadero. Agregando el factor de correccin obtendremos el valor correcto:
Pgina 10
El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el valor del error estndar:
Distribuciones fundamentales para el muestreo Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia, impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas de la misma poblacin tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadstico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribucin de todos los valores posibles de un estadstico. Tales distribuciones sern muy importantes en el estudio de la estadstica inferencial, porque las inferencias sobre las poblaciones se harn usando estadsticas mustrales. Como el anlisis de las distribuciones asociadas con los estadsticos mustrales, podremos juzgar la confiabilidad de un estadstico muestral como un instrumento para hacer inferencias sobre un parmetro poblacional desconocido. ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 11
Suponga que se eligen muestras aleatorias de tamao 20, de una poblacin grande, y se calcula la deviacin estndar de cada una. La coleccin de todas estas desviaciones estndar mustrales se llama distribucin muestral de la desviacin estndar, y lo podemos ver en la siguiente figura:
Pgina 12
Ejemplo 1.6 Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0, 2, 4 y 6. Encuentre: , la media poblacional. , la desviacin estndar poblacional.
x, la x,
Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de medias. Solucin: a. La media poblacional es:
Pgina 13
c. A continuacin se listan los elementos de la distribucin muestral de la media y la correspondiente distribucin de frecuencias.
Pgina 14
De aqu que podamos deducir que: Como para cualquier variable aleatoria, la distribucin muestral de medias tiene una media o valor esperado, una varianza y una desviacin estndar, se puede demostrar que la distribucin muestral de medias tiene una media igual a la media poblacional. Esto es:
Despus de haber realizado el ejercicio anterior se puede ver que una distribucin muestral se genera extrayendo todas las posibles muestras del mismo tamao de la poblacin y calculndoles a stas su estadstico. Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de medias ser normal sin importar el tamao de la muestra.
Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la muestra debe ser mayor o igual a 30, para que la distribucin muestral tenga una forma acampanada. Mientras mayor sea el tamao de la muestra, ms cerca estar la distribucin muestral de ser normal. Para muchos propsitos, la aproximacin normal se considera buena si se cumple n=30. La forma de la distribucin muestral de medias sea aproximadamente normal, an en casos donde la poblacin original es bimodal, es realmente notable.
Pgina 15
Distribucin Muestral de Medias Si recordamos a la distribucin normal, esta es una distribucin continua, en forma de campana en donde la media, la mediana y la moda tienen un mismo valor y es simtrica. Con esta distribucin podamos calcular la probabilidad de algn evento relacionado con la variable aleatoria, mediante la siguiente frmula:
En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta frmula se pueden a hacer los clculos de probabilidad para cualquier ejercicio, utilizando la tabla de la distribucin z. Sabemos que cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao de una poblacin normal, la distribucin muestral de medias tiene un comportamiento aproximadamente normal, por lo que se puede utilizar la formula de la distribucin normal con y , entonces la frmula para calcular la probabilidad del comportamiento del estadstico, en este caso la media de la muestra , quedara de la siguiente manera:
Pgina 16
Ejemplo: Una empresa elctrica fabrica focos que tienen una duracin que se distribuye aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas. Solucin:
La interpretacin sera que la probabilidad de que la media de la muestra de 16 focos sea menor a 775 horas es de 0.0062. Ejemplo: Las estaturas de 1000 estudiantes estn distribuidas aproximadamente en forma normal con una media de 174.5 centmetros y una desviacin estndar de 6.9 centmetros. Si se extraen 200 muestras aleatorias de tamao 25 sin reemplazo de esta poblacin, determine: a. El nmero de las medias mustrales que caen entre 172.5 y 175.8 centmetros. b. El nmero de medias mustrales que caen por debajo de 172 centmetros. Solucin: Como se puede observar en este ejercicio se cuenta con una poblacin finita y un muestreo sin reemplazo, por lo que se tendr que agregar el factor de correccin. Se proceder a calcular el denominador de Z para slo sustituirlo en cada inciso.
Pgina 17
a.
b.
Pgina 18
Una poblacin binomial est estrechamente relacionada con la distribucin muestral de proporciones; una poblacin binomial es una coleccin de xitos y fracasos, mientras que una distribucin muestral de proporciones contiene las posibilidades o proporciones de todos los nmeros posibles de xitos en un experimento binomial, y como consecuencia de esta relacin, las afirmaciones probabilsticas referentes a la proporcin muestral pueden evaluarse usando la aproximacin normal a la binomial, siempre que np 5 y n(1-p) 5. Cualquier evento se puede convertir en una proporcin si se divide el nmero obtenido entre el nmero de intentos. Generacin de la Distribucin Muestral de Proporciones Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos defectuosos. Se van a seleccionar 5 artculos al azar de ese lote sin reemplazo. Genere la distribucin muestral de proporciones para el nmero de piezas defectuosas. Como se puede observar en este ejercicio la Proporcin de artculos defectuosos de esta poblacin es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote estn defectuosas. ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 19
1 2 3 4 5 Total
4 3 2 1 0
Para calcular la media de la distribucin muestral de proporciones se tendra que hacer la sumatoria de la frecuencia por el valor de la proporcin muestral y dividirla entre el nmero total de muestras. Esto es:
Como podemos observar la media de la distribucin muestral de proporciones es igual a la Proporcin de la poblacin.
p
=P
La varianza de la distribucin binomial es = npq, por lo que la varianza de la 2 distribucin muestral de proporciones es p =(Pq)/n. Si se sustituyen los valores en esta frmula tenemos que:
2
Pgina 20
, este valor no coincide con el de 0.1681, ya que nos falta agregar el factor de correccin para una poblacin finita y un muestreo sin reemplazo:
La frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de proporciones est basada en la aproximacin de la distribucin normal a la binomial. Esta frmula nos servir para calcular la probabilidad del comportamiento de la proporcin en la muestra.
A esta frmula se le puede agregar el factor de correccin de con las condiciones necesarias.
si se cumple
Pgina 21
p(x< 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.
Pgina 22
Observe que este valor es igual al obtenido en el mtodo de la aproximacin de la distribucin normal a la binomial, por lo que si lo buscamos en la tabla de "z" nos da la misma probabilidad de 0.0017. Tambin se debe de tomar en cuenta que el factor de correccin de 0.5 se est dividiendo entre el tamao de la muestra, ya que estamos hablando de una proporcin. La interpretacin en esta solucin, estara enfocada a la proporcin de la muestra, por lo que diramos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa universidad, la proporcin de estudiantes que fuman cigarrillos sea menor al 55% es del 0.17%. Ejemplo: Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reaccin adversa a l, ms an, se piensa que alrededor del 3% de los usuarios tienen tal reaccin. Si una muestra aleatoria de 150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporcin de la muestra de los usuarios que realmente presentan una reaccin adversa, exceda el 4%. a. Resolverlo mediante la aproximacin de la normal a la binomial b. Resolverlo con la distribucin muestral de proporciones
Pgina 23
p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al extraer una muestra de 150 personas, mas de 6 presentarn una reaccin adversa. b. Distribucin Muestral de Proporciones Datos: n=150 personas P=0.03 p= 0.04 p(p>0.04) = ?
Pgina 24
Observe que este valor es igual al obtenido y la interpretacin es: existe una probabilidad del 17% de que al tomar una muestra de 150 personas se tenga una proporcin mayor de 0.04 presentando una reaccin adversa. Ejemplo: Se sabe que la verdadera proporcin de los componentes defectuosos fabricados por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamao 60 tenga: a. Menos del 3% de los componentes defectuosos. b. Ms del 1% pero menos del 5% de partes defectuosas. Solucin: Datos: n= 60 artculos P=0.04 p= 0.03 p(p<0.03) = ?
La probabilidad de que en una muestra de 60 artculos exista una proporcin menor de 0.03 artculos defectuosos es de 0.2327.
Pgina 25
Distribucin muestral de la diferencia de medias Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviacin estndar 1, y la segunda con media 2 y desviacin estndar 2. Ms an, se elige una muestra aleatoria de tamao n1 de la primera poblacin y una muestra independiente aleatoria de tamao n2 de la segunda poblacin; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. La coleccin de todas esas diferencias se llama distribucin muestral de las diferencias entre medias o la distribucin muestral del estadstico
Pgina 26
y que
, por lo que no es
y que
La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de medias es:
Ejemplo: En un estudio para comparar los pesos promedio de nios y nias de sexto grado en una escuela primaria se usar una muestra aleatoria de 20 nios y otra de 25 nias. Se sabe que tanto para nios como para nias los pesos siguen una distribucin normal. El promedio de los pesos de todos los nios de sexto grado de esa escuela es de 100 libras y su desviacin estndar es de 14.142, mientras que el promedio de los pesos de todas las nias del sexto grado de esa escuela es de 85 libras y su desviacin estndar es de 12.247 libras. Si representa el promedio de los pesos de 20 nios y es el promedio de los pesos de una muestra de 25 nias, encuentre la probabilidad de que el promedio de los pesos de los 20 nios sea al menos 20 libras ms grande que el de las 25 nias. Solucin: Datos:
1=
100 libras 2 = 85 libras 1 = 14.142 libras 2 = 12.247 libras n1 = 20 nios n2 = 25 nias =? ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 27
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de nios sea al menos 20 libras ms grande que el de la muestra de las nias es 0.1056.
Ejemplo: Uno de los principales fabricantes de televisores compra los tubos de rayos catdicos a dos compaas. Los tubos de la compaa A tienen una vida media de 7.2 aos con una desviacin estndar de 0.8 aos, mientras que los de la B tienen una vida media de 6.7 aos con una desviacin estndar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compaa A tenga una vida promedio de al menos un ao ms que la de una muestra aleatoria de 40 tubos de la compaa B. Solucin: Datos: 7.2 aos B = 6.7 aos A = 0.8 aos B = 0.7 aos nA = 34 tubos nB = 40 tubos =?
A=
Pgina 28
Ejemplo: Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrndose una desviacin estndar de 1.23km/L para la primera gasolina y una desviacin estndar de 1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos. a. Cul es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L que la segunda gasolina? b. Cul es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?. Solucin: En este ejercicio no se cuenta con los parmetros de las medias en ninguna de las dos poblaciones, por lo que se supondrn que son iguales. Datos:
1=
Pgina 29
La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre entre 0.65 y 0.83 Km/Lto a favor de la gasolina 1 es de 0.0117.
Educacin.- Es mayor la proporcin de los estudiantes que aprueban matemticas que las de los que aprueban ingls? Medicina.- Es menor el porcentaje de los usuarios del medicamento A que presentan una reaccin adversa que el de los usuarios del frmaco B que tambin presentan una reaccin de ese tipo? Administracin.- Hay diferencia entre los porcentajes de hombres y mujeres en posiciones gerenciales. Ingeniera.- Existe diferencia entre la proporcin de artculos defectuosos que genera la mquina A a los que genera la mquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones mustrales, la distribucin muestral de diferencia de proporciones es ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 30
Cuando se estudi a la distribucin muestral de proporciones se comprob que que , por lo que no es difcil deducir que
y y
que
La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de proporciones es:
Ejemplo: Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la promulgacin de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos estn a favor de la pena de muerte, mientras que slo 10% de las mujeres adultas lo estn. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinin sobre la promulgacin de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres. ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 31
Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3% mayor que el de mujeres es de 0.4562. Ejemplo: Una encuesta del Boston College const de 320 trabajadores de Michigan que fueron despedidos entre 1979 y 1984, encontr que 20% haban estado sin trabajo durante por lo menos dos aos. Supngase que tuviera que seleccionar otra muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos entre 1979 y 1984. Cul sera la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos aos, difiera del porcentaje obtenido en la encuesta de Boston Collage, en 5% o ms? Solucin: En este ejercicio se cuenta nicamente con una poblacin, de la cual se estn extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 32
Pgina 33
La probabilidad de que su proporcin muestral de trabajadores sin empleo durante por lo menos dos aos, difiera del porcentaje obtenido en la encuesta de Boston Collage, en 0.05 o ms es de 0.1260.
Ejemplo: Se sabe que 3 de cada 6 productos fabricados por la mquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la mquina 2 son defectuosos; se toman muestras de 120 objetos de cada mquina: a. cul es la probabilidad de que la proporcin de artculos defectuosos de la mquina 2 rebase a la mquina 1 en por lo menos 0.10? b. cul es la probabilidad de que la proporcin de artculos defectuosos de la mquina 1 rebase a la mquina 2 en por lo menos 0.15? Solucin: Datos: P1 = 3/6 = 0.5 P2 = 2/5 = 0.4 n1 = 120 objetos n2 = 120 objetos a. p(p2-p1 0.10) = ?
Pgina 34
La probabilidad de que exista una diferencia de proporciones de artculos defectuosos de por lo menos 10% a favor de la mquina 2 es de 0.0011. b. p(p1-p2 0.15)=?
Pgina 35
La probabilidad de que exista una diferencia de proporciones de artculos defectuosos de por lo menos 15% a favor de la mquina 1 es de 0.2357. Distribucin Muestral de Nmero de Defectos En el control de calidad y especficamente en los grficos de control "c" se aplica esta distribucin, la cual consiste en que al extraer un artculo contabilicemos el nmero de defectos que tiene ese artculo. Esta distribucin muestral proviene de la distribucin de Poisson, en la cual le media es y que en este caso es el nmero promedio de defectos por unidad. Como ya es conocido la varianza de la distribucin de Poisson es igual a por lo que se puede deducir la formula de la siguiente manera:
Para la distribucin muestral de nmero de defectos la nomenclatura utilizada es: c = nmero defectos por unidad de inspeccin C = nmero de defectos promedio por unidad de inspeccin Se debe de recordar que la distribucin de Poisson es una distribucin discreta, y se est utilizando la aproximacin de la normal a la Poisson, debiendo aplicar el factor de correccin de 0.5 segn sea el caso. La frmula para la distribucin muestral de nmero de defectos quedara de la siguiente manera:
Ejemplo:
Pgina 36
La probabilidad de que el siguiente producto inspeccionado tenga por lo menos 6 defectos es de 0.8106.
b.
Pgina 37
La probabilidad de que el siguiente producto inspeccionado tenga a lo ms 9 defectos es de 0.7019. DISTRIBUCION "t DE STUDENT" Supngase que se toma una muestra de una poblacin normal con media varianza . Si y
aleatoria, entonces la distribucin es una distribucin normal estndar. 2 Supngase que la varianza de la poblacin es desconocida. Qu sucede con la distribucin de esta estadstica si se reemplaza por s? La distribucin t proporciona la respuesta a esta pregunta. La media y la varianza de la distribucin t son respectivamente. = 0y para >2,
La siguiente figura presenta la grfica de varias distribuciones t. La apariencia general de la distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas y unimodales, y el valor mximo de la ordenada se alcanza en la media = 0. Sin embargo, la distribucin t tiene colas ms amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribucin normal. A medida que el nmero de grados de libertad tiende a infinito, la forma lmite de la distribucin t es la distribucin normal estndar. ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 38
Propiedades de las distribuciones t 1. Cada curva t tiene forma de campana con centro en 0. 2. Cada curva t, est ms dispersa que la curva normal estndar z. 3. A medida que aumenta, la dispersin de la curva t correspondiente disminuye. 4. A medida que , la secuencia de curvas t se aproxima a la curva normal estndar, por lo que la curva z recibe a veces el nombre de curva t con gl = La distribucin de la variable aleatoria t est dada por:
grados de libertad.
Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con
media
y desviacin estndar
tiene una
distribucin t con
La distribucin de probabilidad de t se public por primera vez en 1908 en un artculo de W. S. Gasset. En esa poca, Gasset era empleado de una cervecera irlandesa que desaprobaba la publicacin de investigaciones de sus empleados. Para evadir esta prohibicin, public su trabajo en secreto bajo el nombre de "Student". En ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 39
Se acostumbra representar con el valor t por arriba del cual se encuentra un rea igual a . Como la distribucin t es simtrica alrededor de una media de cero, tenemos ; es decir, el valor t que deja un rea de a la derecha y por tanto un rea de a la izquierda, es igual al valor t negativo que deja un rea de en la cola derecha de la distribucin. Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc. Para encontrar los valores de t se utilizar la tabla de valores crticos de la distribucin t del libro Probabilidad y Estadstica para Ingenieros de los autores Walpole, Myers y Myers. Ejemplo: El valor t con = 14 grados de libertad que deja un rea de 0.025 a la izquierda, y por tanto un rea de 0.975 a la derecha, es t0.975=-t0.025 = -2.145
Si se observa la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que se tiene que hacer la resta de . La manera de encontrar el valor de t es
Pgina 40
libertad en la primer columna y donde se intercepten Ejemplo: Encuentre la probabilidad de t0.025 < t < t0.05. Solucin:
Como t0.05 deja un rea de 0.05 a la derecha, y t0.025 deja un rea de 0.025 a la izquierda, encontramos un rea total de 1-0.05-0.025 = 0.925. P( t0.025 < t < t0.05) = 0.925 Ejemplo: Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamao 15 que se selecciona de una distribucin normal. Solucin:
Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a este valor le corresponde un rea de 0.05 a la izquierda, por ser negativo el valor. Entonces si se resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a . Luego se busca el valor de 0.005 en el primer rengln con 14 grados de libertad y se obtiene
Pgina 41
Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de 0.02. De aqu que es probable que el fabricante concluya que el proceso produce un mejor producto del que piensa.
2
Distribucin muestral de la varianza o Distribucin JI-Cuadrada (X ) En realidad la distribucin ji-cuadrada es la distribucin muestral de s2. O sea que si se extraen todas las muestras posibles de una poblacin normal y a cada muestra se le calcula su varianza, se obtendr la distribucin muestral de varianzas. Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer el estadstico X2. Si se elige una muestra de tamao n de una poblacin normal con varianza , el estadstico:
Pgina 42
tiene una distribucin muestral que es una distribucin ji-cuadrada con gl=n-1 grados de libertad y se denota X2 (X es la minscula de la letra griega ji). El estadstico jicuadrada esta dado por:
donde n es el tamao de la muestra, s2 la varianza muestral y la varianza de la poblacin de donde se extrajo la muestra. El estadstico ji-cuadrada tambin se puede dar con la siguiente expresin:
Propiedades de las distribuciones ji-cuadrada 1. Los valores de X2 son mayores o iguales que 0. 2. La forma de una distribucin X2 depende del gl=n-1. En consecuencia, hay un nmero infinito de distribuciones X2. 3. El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1. 4. Las distribuciones X2 no son simtricas. Tienen colas estrechas que se extienden a la derecha; esto es, estn sesgadas a la derecha. 5. Cuando n>2, la media de una distribucin X2 es n-1 y la varianza es 2(n-1). 6. El valor modal de una distribucin X2 se da en el valor (n-3). La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n-3) = (gl-2).
La funcin de densidad de la distribucin X2 est dada por: ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 43
para x>0 La tabla que se utilizar para estos apuntes es la del libro de probabilidad y estadstica de Walpole, la cual da valores crticos (gl) para veinte valores especiales de . 2 Para denotar el valor crtico de una distribucin X con gl grados de libertad se usa el smbolo (gl); este valor crtico determina a su derecha un rea de bajo la curva X2 y sobre el eje horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6 gl en el lado izquierdo y a o largo del lado superior de la misma tabla.
Clculo de Probabilidad El clculo de probabilidad en una distribucin muestral de varianzas nos sirve para saber como se va a comportar la varianza o desviacin estndar en una muestra que proviene de una distribucin normal. Ejemplos: 1. Suponga que los tiempos requeridos por un cierto autobs para alcanzar un de sus destinos en una ciudad grande forman una distribucin normal con una desviacin estndar =1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor que 2. Solucin: Primero se encontrar el valor de ji-cuadrada correspondiente a s2=2 como sigue: ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 44
El valor de 32 se busca adentro de la tabla en el rengln de 16 grados de libertad y se encuentra que a este valor le corresponde un rea a la derecha de 0.01. En consecuencia, el valor de la probabilidad es P(s2>2)
2. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una poblacin normal con varianza a. Mayor que 9.1 b. Entre 3.462 y 10.745 Solucin. a. Primero se proceder a calcular el valor de la ji-cuadrada: , tenga una varianza muestral:
Al buscar este nmero en el rengln de 24 grados de libertad nos da un rea a la derecha de 0.05. Por lo que la P(s2 >9.1) = 0.05 1. Se calcularn dos valores de ji-cuadrada:
y Aqu se tienen que buscar los dos valores en el rengln de 24 grados de libertad. Al buscar el valor de 13.846 se encuentra un rea a la derecha de 0.95. El valor de 42.98 da un rea a la derecha de 0.01. Como se est pidiendo la probabilidad entre dos valores se resta el rea de 0.95 menos 0.01 quedando 0.94. Por lo tanto la P(3.462 s2 10.745) = 0.94
Pgina 45
Estimacin de la Varianza Para poder estimar la varianza de una poblacin normal se utilizar la distribucin jicuadrada.
Los valores de X2 dependern de nivel de confianza que se quiera al cual le llamamos . Si nos ubicamos en la grfica se tiene:
Ejemplos: 1. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 46
al elevar este resultado al cuadrado se obtiene la varianza de la muestra s 2= 0.286. Para obtener un intervalo de confianza de 95% se elige un = 0.05. Despus con el uso de la tabla con 9 grados de libertad se obtienen los valores de X2.
Se puede observar en la grfica anterior que el valor de X2 corre en forma normal, esto es de izquierda a derecha. Por lo tanto, el intervalo de confianza de 95% para la varianza es:
Graficamente:
Pgina 47
Se observa que la varianza corre en sentido contrario, pero esto es slo en la grfica. La interpretacin quedara similar a nuestros temas anteriores referentes a estimacin. Con un nivel de confianza del 95% se sabe que la varianza de la poblacin de los pesos de los paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.
2. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de los resultados que producen muestras estndar. En un estudio de la cantidad de calcio en el agua potable, el cual se efecta como parte del control de calidad, se analiz seis veces la misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados en partes por milln fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la varianza de los resultados de la poblacin para este estndar, usando un nivel de confianza del 90%. Solucin: Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285. Se busca en la tabla los valores correspondientes con 5 grados de libertad, obtenindose dos resultados. Para X2(0.95,5)= 1.145 y para X2(0.0,5)= 11.07. Entonces el intervalo de confianza esta dado por:
Pgina 48
Distribucin muestral de la relacin de varianzas. "F" Fisher La necesidad de disponer de mtodos estadsticos para comparar las varianzas de dos poblaciones es evidente a partir del anlisis de una sola poblacin. Frecuentemente se desea comparar la precisin de un instrumento de medicin con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que vara el procedimiento para calificar de un profesor universitario con la de otro.
Intuitivamente, podramos comparar las varianzas de dos poblaciones, y , utilizando la razn de las varianzas mustrales s21/s22. Si s21/s22 es casi igual a 1, se tendr poca evidencia para indicar que y no son iguales. Por otra parte, un valor muy grande o muy pequeo para s21/s22, proporcionar evidencia de una diferencia en las varianzas de las poblaciones. La variable aleatoria F se define como el cociente de dos variables aleatorias jicuadrada independientes, cada una dividida entre sus respectivos grados de libertad. Esto es,
respectivamente.
Pgina 49
aleatoria
para
para
La variable aleatoria F es no negativa, y la distribucin tiene un sesgo hacia la derecha. La distribucin F tiene una apariencia muy similar a la distribucin ji-cuadrada; sin embargo, se encuentra centrada respecto a 1, y los dos parmetros proporcionan una flexibilidad adicional con respecto a la forma de la distribucin. Si s12 y s22 son las varianzas mustrales independientes de tamao n 1 y n2 tomadas 2 2 de poblaciones normales con varianzas 1 y 2 , respectivamente, entonces:
Pgina 50
P 6
1 2 3 . .. 500
El valor de 30.4 es el correspondiente a una Fisher que tiene 3 grados de libertad uno y 6 grados de libertad dos con un rea de cero a Fisher de 0.995. Si lo vemos grficamente:
Como nos podemos imaginar existen varias curvas Fisher, ya que ahora su forma depende de dos variables que son los grados de libertad. Ejemplos : 1. Encontrar el valor de F, en cada uno de los siguientes casos: a. El rea a la derecha de F, es de 0.25 con b. El rea a la izquierda de F, es de 0.95 con c. El rea a la derecha de F es de 0.95 con con ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS =4 y =15 y =6 y =9. =10. =8. Pgina 51
b. En este caso se puede buscar el rea de 0.95 directamente en la tabla con sus respectivos grados de libertad.
c. Se tiene que buscar en la tabla un rea de 0.05, puesto que nos piden un rea a la derecha de F de 0.95.
d. Se busca directamente el rea de 0.10, con sus respectivos grados de libertad. ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 52
1. Si s12 y s22 son las varianzas mustrales de muestras aleatorias independientes de tamaos n1=10 y n2 =20, tomadas de poblaciones normales que tienen las mismas varianzas, encuentre P(s12/s22 2.42). Solucin: Primero se establecen los grados de libertad. Como en el numerador est la poblacin uno y en el denominador la poblacin dos, entonces los grados de libertad uno equivalen a 10-1=9 y los grados de libertad dos a 20-1=19. Se procede a ir a la tabla a buscar los grados de libertad dos que son 19 y se observa que no estn, por lo tanto se tiene que interpolar entre 15 y 20 grados de libertad, buscando el valor de fisher que quedara:
Este valor de 2.42 se busca en la columna de 9 grados de libertad uno, con 15 grados de libertad dos, y se encuentra los siguiente: rea 0.90 0.95 2.09 2.59
Al interpolar entre estos dos valores nos queda un rea de 0.933. Se procede a hacer lo mismo pero con 20 grados de libertad dos: rea 0.95 0.975 2.39 2.84 Pgina 53
Al interpolar nos queda que para 9 grados de libertad uno y 19 grados de libertad dos con un valor de Fisher de 2.42 el rea a la izquierda es de 0.9478.
2. Si s12 y s22 representan las varianzas de las muestras aleatorias independientes de tamao n1= 25 y n2 = 31, tomadas de poblaciones normales con varianzas 2 1 =10 y
2 2
Luego se va a la tabla de Fisher a buscar 30 grados de libertad 2 con 24 grados libertad uno. Cuando se est en esta posicin se busca adentro de la tabla el valor Fisher de 1.89. Al localizarlo y ver a la izquierda de este valor se obtiene un rea 0.95, pero esta rea correspondera a la probabilidad de que las relaciones ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS
de de de de
Pgina 54
Intervalo de Confianza para el Cociente de Varianzas de Dos Distribuciones Normales Supngase que se tienen dos poblaciones normales e independientes con varianzas 2 2 desconocidas 1 y 2 , respectivamente. De este par de poblaciones, se tienen disponibles dos muestras aleatorias de tamaos n1 y n2, respectivamente, sean s12 y s22 las dos varianzas mustrales. Se desea conocer un intervalo de confianza del 2 2 100( ) por ciento para el cociente de las dos varianzas, 1 / 2 . Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales, se coloca la varianza muestral mayor en el numerador del estadstico F. Ejemplos: 1. Un fabricante de automviles pone a prueba dos nuevos mtodos de ensamblaje de motores respecto al tiempo en minutos. Los resultados se muestran el la tabla: Mtodo 1 n1 = 31 s12 = 50 Mtodo 2 n2 = 25 s22 = 24
2 1 / 2 2 .
Por la recomendacin de que la varianza muestral mayor va en el numerador se tiene la siguiente frmula:
Pgina 55
al despejar:
F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En este caso los grados de libertad uno valen 30 y los grados de libertad dos 24.
2. Una compaa fabrica propulsores para uso en motores de turbina. Al ingeniero de manufactura le gustara seleccionar el proceso que tenga la menor variabilidad en la rugosidad de la superficie. Para ello toma una muestra de n1=16 partes del primer proceso, la cual tiene una desviacin estndar s 1 = 4.7 micro pulgadas, y una muestra aleatoria de n2=12 partes del segundo proceso, la cual tiene una desviacin estndar s2 = 5.1 micro pulgadas. Se desea encontrar 2 un intervalo de confianza del 90% para el cociente de las dos varianzas 1 /
2 2 .
Suponga que los dos procesos son independientes y que la rugosidad de la superficie est distribuida de manera normal. Solucin:
Pgina 56
al despejar:
En este caso los grados de libertad uno valen 11 y los grados de libertad dos 15.
y Estos resultados los podemos interpretar de la siguiente manera: Puesto que este intervalo de confianza incluye a la unidad, no es posible afirmar que las desviaciones estndar de la rugosidad de la superficie de los dos procesos sean diferentes con un nivel de confianza del 90%.
Pgina 57