Вы находитесь на странице: 1из 64

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

INTRODUCCIN Por qu estudiar estadstica? Existen cuando menos cuatro razones para estudiar estadstica, al hacerlo seremos capaces de: 1. Aprender las reglas y mtodos para tratar informacin estadstica. 2. Evaluar las reglas y cuantificar la importancia de los resultados estadsticos que veamos publicados. 3. Conocer los aspectos del pensamiento estadstico como un componente esencial de una educacin humanstica. 4. Entender mejor el mundo real de nuestro entorno.

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 1

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

UNIDAD 1
1. DISTRIBUCIN DE FRECUENCIA Y SU CLASIFICACIN 1.1.Concepto de estadstica y su clasificacin. La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables basadas en tal anlisis. En un sentido menos amplio el trmino estadstica se usa para denotar los propios datos, o nmeros derivados de ellos, tales como los promedios. As se habla de estadstica de empleo, estadstica de muertes, etc. La estadstica se divide en dos categoras generales, dependiendo del propsito del estudio Estadstica Descriptiva Estadstica Inferencial

La estadstica descriptiva comprende aquellos mtodos usados para organizar y describir la informacin recabada. Estos mtodos se usan para analizar la informacin y desplegarla en forma grfica tal, que permita interpretaciones con significado, ayudando a describir el mundo en torno nuestro. Usamos estadstica Descriptiva cuando recolectamos informacin: como la produccin promedio de trigo por hectrea, en una cierta regin agrcola, etc. Esperamos saber cmo son las cosas mediante la estadstica descriptiva. Por ejemplo, las situaciones siguientes utilizan estadstica descriptiva. 1. Un jugador de Boliche quiere conocer su promedio de anotaciones en los pasados 12 juegos. 2. Una mujer dedicada al hogar desea saber cunto gasta en promedio en tortillas en un mes. 3. Un comerciante desea conocer que artculo se vende ms en una semana, esto lo lograra calculando el promedio de venta en la semana. Por otro lado la Estadstica Inferencial involucra teora de probabilidad. La Estadstica Inferencial comprende aquellos mtodos y tcnicas usadas para hacer generalizaciones, predicciones o estimaciones sobre poblaciones a partir de una muestra.

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 2

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

La habilidad para hacer generalizaciones sobre la poblacin a partir de una muestra es un aspecto importante en estadstica. Rara vez tenemos la informacin completa que necesitamos para llegar a la verdad absoluta sobre algn evento total. Las decisiones e inferencias se basan en informacin limitada e incompleta, los mtodos de la estadstica inferencial y el conocimiento obtenido al usarlos, nos permite utilizar informacin disponible limitada para entender y tratar con las incertidumbres de este mundo cambiante y azaroso. Usando mtodos de probabilidad intentaremos medir el grado de incertidumbre asociado con una inferencia. Los siguientes ejemplos requieren estadstica inferencial. Un jugador de boliche quiere estimar la oportunidad que tiene de ganar un torneo prximo con base en su promedio de la temporada actual y en los promedios de sus futuros contrincantes. 1. El ama de casa desea estimar si el precio de un artculo subir de acuerdo a compras pasadas y pocas de temporada. 1.2 RECOPILACIN DE DATOS El aspecto fundamental de la estadstica es la informacin que contiene; sin informacin que recabar, organizar, analizar e interpretar, no habra razn para usar a estudiar estadstica; a la informacin usada en estadstica se le llama datos. Para que sea til dicha informacin en la toma de decisiones, debe organizarse y mostrarse apropiadamente. El tipo de datos indicar los mtodos a usar en su anlisis. Cabe distinguir entre el trmino datos y dato. Dato: es una porcin de informacin. Datos: es un sinnimo de muestra Los datos pueden clasificarse en Cualitativos y Cuantitativos. Datos Cualitativos representan categoras o atributos que pueden clasificarse segn un criterio o cualidad. Datos Cuantitativos se refieren a informacin numrica, como cunto o cuantos, y se miden en una escala numrica.

Los datos Cuantitativos pueden clasificarse como. DISCRETOS (son obtenidos de un proceso de conteo) Nios, Cantidad de coches, el salario de un individuo, la presin sangunea, CONTINUOS (son obtenidos de un proceso de medicin) Peso en kg., estatura en metros, tiempo en minutos, distancia en km.,

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 3

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

etc.

tiempo en que tarda en llegar a la escuela, etc. Otra forma comn de clasificacin de los datos es el uso de cuatro niveles de medicin: 1. Nominal 3. Ordinal 2. De intervalo 4. De razn

1. Nivel de medicin nominal: son los datos consistentes exclusivamente en nombres, etiquetas o categoras que no pueden acomodarse segn un esquema de orden. por ejemplo De bajo a alto, en la descripcin de un escaln. si /no/indeciso: Respuesta de una encuesta. Colores: los colores preferentes de blusas de las nias de 12 aos. 1. Nivel de medicin ordinal: son datos que pueden acomodarse en algn orden, aunque no es posible determinar diferencias entre los valores de los datos o tales diferencias carecen de significado. Las clasificaciones de un corso: Un profersor asigna calificaciones de A, B, C y D, las cuales pueden acomodarse en orden; sin embargo no es posible determinar diferencias en ellas. Rangos ordenados. Calidad de vida de ciudades ( 1ro, 2do, 3ro, tec), determinan un orden, sin embargo las diferencias entre ellas no tienen significado alguno. 1. Nivel de medicin de intervalo: se parece al nivel ordinal, pero con la propiedad adicional de que la diferencia entre dos valores de datos cualesquiera tiene un significado. Por ejemplo. Las temperaturas corporales de 98.2F y 98.6F son ejemplos de datos de medicin en este nivel. 1. El nivel de medicin de Razn: se parece al nivel de intervalo, aunque tiene la propiedad adicional de que s tiene un punto de partida o cero que indica que nada de la cantidad presente. Por ejemplo. Pesos (en quilates) de anillos engastados con diamantes (0 efectivamente representa ausencia de peso y cuatro quilates es dos veces el peso de 2 quilates). Precios: de los libros de texto ($0 efectivamente representa ningn costo y un libro de $90 es tres veces ms costoso que uno de $30).
Tabla 1.1 Niveles de medicin de datos
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 4

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Nivel Nominal

Resumen Slo rangos de orden, los datos no pueden acomodarse en un esquema de orden. Rangos de orden que pueden acomodarse, pero no hay diferencias o carecen de significado Las diferencias son significativas, pero no hay punto de partida natural y las razones no tienen significado. Hay un punto de partida natural y las razones tienen significado.

Ejemplo Origen de estudiantes: 5 californianos 20 texanos 40 neoyorquinos Automviles de estudiantes: 5 compactos 20 medianos 40 grandes Temperaturas del campus: 5F 20F Distancias de viaje de estudiantes: 5km,20km,40km

Explicacin Solo rangos de orden o nombres

Ordinal

Orden determinado por Compacto Mediano Grande 0F no es sin calor, 40F no es dos veces ms caliente que 20F 40km es dos veces ms lejos que 20 km

De intervalo

De razn

1.3Distribucin de Frecuencias. Una frecuencia de una medida o de una categora, es el nmero de veces que aparece en una coleccin de datos. El uso de frecuencias es ms conveniente para datos cualitativos o discretos; el smbolo f se usa para denotar la frecuencia de una medida. Frecuencia de un Intervalo. Se refiere al nmero de valores que caen dentro del intervalo. Frecuencia relativa de un intervalo. Se refiere a la proporcin de todos los valores dados que caen dentro del intervalo. Tabla de Frecuencias. Llamada tambin distribucin de frecuencias, es un arreglo sistemtico de los valores agrupados en intervalos de clase. Se usan para resumir datos de tal modo que la frecuencia de cada intervalo est claramente mostrada y pueda calcularse fcilmente la frecuencia relativa de cada intervalo. Ilustremos los conceptos anteriores con los siguientes ejemplos.

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 5

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

1. La muestra de datos siguientes representa el nmero de tiros libres fallados por un equipo de basquetbol durante los ltimos siete juegos. 7, 2, 8, 4, 2, 7, 2 El nmero 7 aparece con una frecuencia de f=2 El nmero 2 aparece con una frecuencia de f=3 El nmero 8 aparece con una frecuencia de f=1 El nmero 4 aparece con una frecuencia de f=1 2. Los datos sobre los tiros libres citados anteriormente pueden resumirse como lo muestra la tabla 1.2., donde x denota las medidas y f, la frecuencia de cada medida; la tabla 1.2 es un ejemplo de una tabla de frecuencias no agrupadas para datos discretos. x 2 4 7 8 f 3 1 2 1

Tabla 1.2 Tabla de frecuencias de datos sobre tiros libres

Una tabla de frecuencias no agrupadas, en contraste presenta las frecuencias de acuerdo con grupos o clases de medidas. Esto se logra siguiendo los tres pasos: 1. Uniformidad: cada clase deber tener la misma amplitud. 2. Unicidad: dos clases no se traslapan. 3. Completes: cada uno de los datos debe pertenecer a alguna clase. Procedimiento de construccin de una distribucin de frecuencias. Decida el nmero de clases que desea tener. Debe ser de entre 5 y 20, y debe utilizarse nmeros enteros o redondeados. Calcule la anchura de clase que es igual a valor mas alto-valor mas bajonmero de clases redondee el resultado para obtener un nmero ms adecuado (generalmente se redondea hacia arriba). Es probable que necesite cambiar el nmero de clases, pero la prioridad debe ser utilizar valores que sean fciles de comprender. Punto de partida: comience por elegir un nmero para el lmite inferior de la primera clase. Elija el valor del dato ms bajo o un valor conveniente que sea un poco ms pequeo.

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 6

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Con el uso del lmite ms bajo de la primera clase y la anchura de la clase, proceda a listar los dems lmites de clase inferior (sume la anchura de clase al punto de partida para obtener el segundo lmite de clase inferior). Despus sume la anchura de clase al segundo lmite de clase inferior para obtener el tercero y as sucesivamente. Anote los lmites inferiores de clase en una columna vertical y luego proceda a anotar los limites superiores de clase, que pueden identificarse con facilidad. Ponga una marca en la clase apropiad para cada dato. Utilice las marcas para obtener la frecuencia total de cada clase.

Ejemplo1: niveles de nicotina de fumadores. Utilice los 40 niveles de nicotina de los fumadores de la tabla 1.3 y siga el procedimiento anterior para crear la distribucin de frecuencias que se muestra en la tabla 1.4. 1 35 13 0 12 3 Solucin. Paso 1. Comience por elegir el nmero de clases, tomemos cinco. Paso 2. Calcule la anchura de clase, anchura de clase=numero mas grande-nmero mas pequeonmero de clase=491-05=98.299 Paso 3. Elija un punto de partida, tomemos el cero por ser el ms pequeo de todos los datos. Paso 4. Sume a 0 la anchura de clase, 0+99, e inicie en el siguiente nmero, 100+99, y as sucesivamente. Paso 5. Liste los lmites de clase inferiores de forma vertical, con esta lista se identificaran fcilmente los limites superiores correspondientes . Paso 6. Forme la tabla1.4 Nicotina Frecuencias Frecuencia Relativa Frecuencia Acumulada 0 11 2 23 4 16 7 13 17 1 3 47 28 7 9 16 19 4 8 25 24 0 5 Tabla 1.3 26 5 22 7 17 48 21 0 10 3 25 3 86 44 22 2 87 27 7 14 9 12 1 1 32 31 3 26 6 20 8 3 49 1 29 0 17 3

28 4 Niveles de nicotina

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 7

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

0-99 100-199 200-299 300-399 400-499

11 12 14 1 2

27.5% 30% 35% 2.5% 5% 100%

11 23 37 38 40

Tabla 1.4 Distribuciones de frecuencias relativas de los niveles de nicotina en fumadores.

La frecuencia relativa se calcula, haciendo: Frecuencia relativa=Frecuencia de clasetotal de datos 1.3.1 Polgonos de frecuencias, Histogramas y ojivas. Polgonos de Frecuencia Una grfica lineal o polgono de Frecuencia se construye usando una tabla de frecuencia agrupada con marcas de clase. La grfica de lneas ofrece una alternativa til respecto al histograma; la eleccin de cul se usar es de tipo personal; una grfica lineal crea la impresin de que las frecuencias cambian abruptamente; puede construirse una grfica lineal o un polgono de frecuencias para los datos exhibidos, en una tabla de frecuencia agrupada identificando cada marca de clase y su correspondiente frecuencia (x,f) con un punto de la grfica. Ejemplo 2: La tabla de frecuencia agrupada 1-5 reporta los ingresos anuales promedio, hasta los 100 ms cercanos, de los trabajadores fabriles en 27 ciudades del este de Mxico. Construye un polgono de frecuencia para estos datos. f Ingreso Promedio 12,500-14,300 14,400-16,200 16,300-18,000 18,200-20,000 20,100-21,900 22,000-23,800 No. De Ciudades 1 5 3 7 6 1 x Marcas de clase 13,400 15,300 17,200 19,100 21,000 22,900

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 8

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

23,900-25,700 25,800-27,600

3 1

24,800 26,700

Tabla 1.5 frecuencias agrupadas

Solucin: Paso 1. Encontrar las marcas de clase, designadas por x. Paso 2. Construir la grfica de x contra f. Como lo muestra la figura 1.1.

Figura 1.1. Polgono de frecuencias

La mayora de las ciudades caen entre los extremos de la escala. Solo una ciudad tiene trabajadores fabriles con un ingreso promedio anual de aproximadamente 13,400 dlares. Los datos parecen tener su centro aproximadamente en 19,000 dlares. Ojivas Una grfica lineal construida a partir de una tabla de Frecuencia acumulada o de una tabla de frecuencia relativa acumulada, se llama OJIVA. Las ojivas ofrecen un medio grfico para interpolar o aproximar el nmero o porcentaje de observaciones menores o iguales que un valor especfico. Ejemplo 2: Construyamos la frecuencia acumulada y los extremos del ejemplo 1.

HISTOGRAMAS Un histograma es un tipo de grfica de barras para una distribucin de frecuencia. Los histogramas pueden construirse para distribuciones de frecuencia agrupada y no agrupada. Consideremos primero histogramas para distribuciones de frecuencia no agrupadas. La idea de construir un histograma para frecuencias no agrupada de los datos, es representar cada frecuencia por una barra cuya rea sea proporcional a ella. Tpicamente el ancho de cada barra se escoge con un uno y as el rea de la barra es igual a la frecuencia de la medida. Ejemplo 3: la tabla 1.6 contiene el nmero de nios en edad escolar en cada una de las 50 familias de una muestra. Construya un histograma para datos.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 9

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

No. De nios en edad escolar 0 1 2 3 4 TABLA 1.6

Frecuencia f 15 8 14 9 4

Solucin. El histograma re representa como lo muestra la figura 1.3 Figura 1.3

1.4Medidas de Tendencia Central para un conjunto de datos y datos no agrupados. Recuerde que el objetivo principal de esta unidad es lograr manejar las herramientas bsicas para medir y describir diferentes caractersticas de un conjunto de datos. En este captulo queremos complementar las interpretaciones visuales, hechas posibles por tablas y grficas, con medidas numricas de caractersticas posedas por muchas colecciones de datos cuantitativos. El propsito de una medida de tendencia central es resumir un conjunto de datos de forma que podamos tener un panorama general. Definicin: Medida de Tendencia Central: valor que se encuentra en el centro o a la mitad de un conjunto de datos.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 10

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Hay muchas formas distintas de determinar el centro; por lo tanto, tenemos diferentes definiciones de las medidas de tendencia central, incluyendo media, mediana, moda y mitad de rango (rango medio).
1. MEDIA: es el promedio (sumar los puntajes y dividirlos entre el total de datos) que denotaremos con x. En expresin matemtica

queda:
x=i=1nxin 2. MEDIANA: es el valor que se muestra en medio cuando los valores

originales de los datos se presentan en orden de magnitud creciente (o decreciente) y se denota con x. Para calcular la mediana, primero cuente cuantos datos son: Si el nmero de datos es impar, la mediana es el nmero que se localiza exactamente a la mitad de la lista de datos (previamente ordenados). Si el nmero de datos es par, la mediana se obtiene calculando la media de los dos nmeros que estn a la mitad. 1. MODA: Suele denotarse con M y es el valor o el dato que ocurre con mayor frecuencia. Cuando dos valores con la misma frecuencia y est es la mas alta, ambos valores son modas, por lo que el conjunto de datos es llamado bimodal. Cuando mas de dos valores ocurren con la misma frecuencia y est es la mas alta, todos los valores son modas por lo que el conjunto de datos es llamado multimodal. Cuando ningn valor se repite, se dice que no hay moda. 1. MITAD DEL RANGO: Medida de tendencia central que constituye el valor que est a medio camino, entre el puntaje ms alto y el ms bajo, en el conjunto original de datos. Se calcula usando la formula.
mitad del rango=valor maximo+valor minimo2

La tabla 1.7 muestra un resumen de las medidas de Tendencia Central.


Tabla 1-7 Comparacin de la media, mediana, moda y mitad del rango Medida de tenden cia central Definicin Qu tan comn es? Existe ncia Toma en cuenta cada valor? Se ve afectada por valores extremos? Ventajas y desventajas

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 11

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Media

x=i=1nxin

Prome dio ms conocid o

Siemp re existe

Se usa a lo largo de la asignatura; funciona bien con muchos mtodos estadsticos Suele ser una buena opcin si hay algunos valores extremos. Apropiada para datos en el nivel nominal.

Median a

Valor en medio

De uso comn

Siemp re existe

no

no

Moda

Valor ms frecuente

Se usa en ocasion es

Podra no existir, haber ms de una Siemp re existe

no

no

Mitad del rango

v max+v mini2

Poco usada

No

Muy sensible a los valores extremos.

1.3Medidas de dispersin para un conjunto de datos y datos agrupados. Medida de variabilidad. Es un solo nmero que representa el desarrollo o el valor de la dispersin en un conjunto de datos. La variabilidad es un concepto fundamental en estadstica. Hay muchas medidas de variabilidad o medidas de dispersin para una coleccin de datos cuantitativos. Entre estas medidas estn incluidos. Rango, desviacin de la media, varianza y desviacin estndar.

RANGO: El rango de un conjunto de datos es la diferencia entre el valor mximo y el valor mnimo.
rango=valor mximo-valor mnimo

DESVIACIN DE LA MEDIA: Es una medida de variacin de todos los valores con respecto a la media.
desviacin de x=xi-x

Una desviacin positiva para una medida, indica que la medida est por encima de la media, mientras que una desviacin negativa nos seala que est por debajo de la

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 12

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

media, una desviacin de cero para una medida indica que la medida es igual a la media. DESVIACIN ESTANDAR: Medida de variacin de los valores con respecto a la media. Es un tipo de desviacin promedio de los valores, con respecto a la media. Que se calcula utilizando la formula. s=x-x2n-1 VARIANZA: Usamos el trmino variacin como una descripcin general de la cantidad que varan los valores entre s. Esta dada por la formula. s2=x-x2n-1

Mostremos con un ejemplo el clculo y aplicacin de todas las medidas de dispersin para un conjunto de datos. Ejemplo 5. A continuacin se presentan los tiempos de espera (en minutos) de los clientes del Banco Santander (donde todos los clientes forman una sola fila). 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7

Solucin:
1. rango=7.7-6.5=1.2 2. desviacin de la media para los datos son: 6.5-7.15=-0.656.8-7.15=-0.357.4-7.15=0.256.6-7.15=-0.557.1-7.15=0.057.7-7.15=0.556.7-7.15=-0.457.3-7.15=0.157.7-7.15=-0.657.77.15=0.55 3. varianza s2=x-x2n-1=-0.6592+-0.5529++-0.6529= 4. desviacin estandar s=

Ejemplo 6. Precios del asado de cerdo y del queso en capitales del mundo. Los datos de la tabla 1.8 indican los precios, en dlares, por libra, de asado de cerdo y queso cheddar en 15 capitales del mundo. CAPITAL Berna Bonn Brasilia Buenos Aires ASADO DE CERDO 6.61 2.38 1.27 1.36 QUESO CHEDDDAR 4 2.74 1.08 2.03

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 13

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Camberra Londres Madrid Mxico Ottawa Pars Pretoria Roma Estocolmo Tokio washington

2.06 1.56 2.33 1.08 1.99 2.47 1.95 2.46 5.35 4.19 3.29

2.60 1.81 3.15 2.29 3.98 2.37 1.76 2.96 2.54 2.38 2.69

Tabla 1.8 precios del asado de cerdo y el queso cheddar en 15 capitales del mundo. Para cual alimento, el asado de cerdo o el queso cheddar, con menos variables y ms estables los precios? Solucin. Para responder la pregunta necesitamos calcular la variabilidad en cada producto, que se refiere a calcular la varianza, entonces realizando estos clculos obtenemos.
sac2=2.46 sq2=0.60

Lo que significa que la variacin de los precios entre capitales del mundo, para el asado de cerdo es de 2.46 dlares, mientras que para el queso cheddar hay una variabilidad de 0.60 dlares. Lo que responde la pregunta, el queso cheddar es el que tiene menos variabilidad. Tendencia Central y Dispersin para datos contenidos en tablas de frecuencia agrupadas. Es posible calcular las medidas de tendencia central y dispersin para datos exhibidos en una tabla de frecuencia agrupada, pero sus valores
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 14

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

no son exactos sino nicamente aproximados; eso se debe al desconocimiento de las medidas en grupo, las cuales se han colocado en intervalos de clase. Se preguntara porque nos interesa calcular valores aproximados de ciertos estadsticos a partir de tablas de Frecuencias agrupadas; existe una gran cantidad de datos resumidos en tablas de frecuencia agrupadas construidas por otros y la nica forma de calcular sus medidas de tendencia central es usar los datos agrupados. Media para datos agrupados: si sabemos encontrar la media para datos proporcionados en tablas de frecuencia agrupada usamos marcas de clase para representar las medidas para cada clase. Entonces la frmula es:
x=fxf

o x=i=1kxifin se utiliza para determinar la media muestral aproximada xa, puesto que los datos originales se desconocen y cada observacin est representada por su marca de clase. Varianza para datos agrupados. Esta dada por la frmula
s2=ni=1kxi2fi-i=1kxifi2n(n-1)

Mostremos la media, la varianza y la desviacin estndar para datos agrupados con el siguiente ejemplo. Ejemplo 8. En la parte de abajo se muestran las concentraciones de alcohol en la sangre de conductores que se vieron envueltos en accidentes fatales y que despus fueron sentenciados a prisin. Cuando un estado lanza una campaa para Reducir el nmero de conductores alcoholizados, es la intencin de la compaa disminuir la desviacin estndar? 0.27 0.14 0.17 0.16 0.17 0.12 0.16 0.16 0.13 0.21 0.24 0.17 0.29 0.18 0.24

UNIDAD 2
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 15

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

2.1 Introduccin a la probabilidad y valor esperado


El propsito de esta unidad es desarrollar ideas bsicas que se necesitaran para una adecuada comprensin de la estadstica inferencial. Todos los das enfrentamos tomas de decisiones y planteamientos probabilsticos. Los planteamientos que contienen las palabras posibilidad, plausibilidad, oportunidad, parecido, esperado, posible, incierto y probabilidad, se refieren todos al mismo tema: la incertidumbre. A diario hacemos u omos planteamientos como los siguientes: 1. Cul es la probabilidad de que tengamos un examen hoy? 2. Las oportunidades de que lo golpee un poste del alumbrado, son de 1 en 2 millones. 3. Las posibilidades de que hoy salga el sol 4. Si se arroja una moneda, hay una posibilidad de 50-50 para que salga cara. 5. Tengo confianza de que puedo aprobar este curso. La probabilidad nos ofrece el fundamento para desarrollar la ciencia de la estadstica inferencial; mediante la teora de la probabilidad, podemos deducir la posibilidad de que aparezcan ciertas muestras con propiedades especficas. Tal informacin nos permitir obtener inferencias sobre una poblacin.

Empecemos con experimentos y eventos.


Definicin: Un experimento es cualquier proceso planteado que da lugar a observaciones o a recoleccin de datos. Todos los experimentos tienen resultados y la mayor parte de ellos son inciertos y dependen del azar, los resultados de un experimento forman un conjunto llamado espacio muestral. Un espacio muestral de un experimento es la coleccin de todos los resultados posibles. El experimento ms simple referente a incertidumbre es uno que tiene dos resultados y un espacio muestral nico. Sin embargo, un experimento puede tener ms de un espacio muestral, es decir, se puede usar ms de un espacio muestral para describir los resultados de un experimento. En general, es deseable elegir un espacio muestral que proporcione la mxima informacin referente al experimento.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 16

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Ejemplo 1. Observar el sexo del siguiente bebe que nazca en el hospital de Acatln es un experimento con dos resultados; un espacio muestral para este experimento consiste en el conjunto denotado por S=H, M, donde H representa a un hombre y M una mujer, y las llaves se usan para indicar coleccin o conjunto. Ejemplo 2. Si se observa el nacimiento de dos bebes nacidos en el hospital, entonces un espacio muestral para el experimento podra ser S=HH, HM,MM,MH. Ejercicios: muestre un espacio muestral para cada experimento. a) Lanzar una moneda de un peso y otra de dos pesos en ese orden, y observar cmo caen. b) Seleccionar a una estudiante de Lic. En informtica y preguntarle su estatura, realizar este experimento con al menos 10 estudiantes.

EVENTO
Para un cierto experimento, podemos estar interesados en determinar la probabilidad de que ocurra una coleccin de resultados, en lugar de la probabilidad de que se d uno solo. Por ejemplo cuando se lanzan tres monedas a la vez, podemos estar interesados en los resultados que indiquen que al menos han salido dos soles, en esta coleccin de resultados escrito como SSA, SAS, ASS, SSS se llama evento. Definicin: Un evento es cualquier sub coleccin (o subconjunto) de un espacio muestral S. Ejemplo 3. Suponga que el experimento es lanzar primero una moneda de un peso y luego una moneda de diez pesos. Un espacio muestral para esta experimento podra ser S=ss, sa,as,aa algunos eventos posibles son: E1=ss, E2=sa, E3=sa,aa Por mencionar algunos, ya que hay 16 eventos posibles. En particular tenemos el evento o conjunto llamado vaco y denotado por , el cual no posee ningn elemento. Definicin de evento simple: un evento simple es un evento que contiene solo un resultado o consta de un solo dato. Por ejemplo, el evento E2=sa del ejemplo 3 es un evento simple, mientras que E3 no lo es. Recuerde que un evento es siempre una coleccin de resultados del universo de todos los resultados como el espacio muestral. Para
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 17

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

representar grficamente espacios mustrales y relacionarlos entre eventos se puede usar un DIAGRAMA DE VENN, el cual se representa por un rectngulo el cual denota el espacio muestral y los eventos se representaran con crculos dentro del rectngulo, como se indica en la figura 2.1
ESPACIO MUESTRAL EVENTO

Figura 2.1 Diagrama de Venn Los diagramas de Venn se usan a menudo para verificar relaciones entre conjuntos, lo que vuelve innecesario aplicar pruebas formales basadas en el lgebra de conjuntos. A manera de ilustracin las regiones sombreadas de los cuatro diagramas de Venn de la figura 2.2 representas el evento A, el complemento del evento Ac , la unin de los elementos A y B expresada simblicamente AB, la interseccin de los eventos A y B expresada simblicamente por AB.

Ac

Diagrama de Venn, con el evento A

Diagrama de Venn, complemento de A

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 18

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Diagrama de Venn, unin de conjuntos

Diagrama de Venn, interseccin

Figura 2.2 Expresiones de los Diagramas de Venn Eventos compuestos Como los eventos son compuestos, los operadores de unin ( ) pueden usarse para formar eventos compuestos. Si A y B son eventos, entonces AB y AB son ejemplos de eventos compuestos.
AB es el evento de que ocurran A B, o ambos. AB es el evento de que ocurran tanto A como B ocurran al mismo tiempo.

Eventos mutuamente excluyentes Si A y B son eventos que no tienen resultados en comn, entonces se denominaron eventos mutuamente excluyentes. Esto es: s EF=. Se puede ilustrar con un diagrama de Venn, como lo muestra la figura 2.3

Figura 2.3 Eventos Mutuamente Excluyentes Ejemplos: 1. A una fbrica de motores pequeos le preocupan tres tipos principales de defectos. Si A=es el evento en el que el eje es demasiado grande. B=el evento en el que las bobinas son inadecuadas. C=el evento en el que las conexiones elctricas don insatisfactorias.

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 19

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Exprese verbalmente qu eventos estn representados siguientes regiones del diagrama de Venn de la figura 2.4. a) Regin 2 b) Regin 1 y 2 juntas c) Regiones 3,5,6 y 8 juntas

por

las

A 7 4 2 5 1 3

8 6 C

Figura 2.4 Solucin: a) Dado que la regin est contenida en A y B pero no en C, representa el evento en que el eje es demasiado grande y las bobinas inadecuadas, pero las conexiones elctricas satisfactorias. b) En vista de que esta regin es comn a B y C representa el evento en el que las bobinas son inadecuadas y las conexiones elctricas insatisfactorias. c) Como esta es toda la regin fuera de A representa el evento en el que el eje no es demasiado largo. 1. Sea A=Jos va al cine y B=Jos come una barra de dulce. Interprete los siguientes conjuntos.
a) AB b) BA c) A(BAc)
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 20

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Solucin:
a) AB=representa el evento de que Jse va al cine y come una barra de dulce. b) BA=representa el evento de que Jos come una barra de dulce o va al cine. c) ABAc=representa el evento de que Jos come una barra de dulce.

TECNICAS DE CONTEO
A veces puede resultar sumamente difcil o al menos tedioso, determinar el nmero de elementos en un espacio muestral finito mediante la enumeracin directa. Para ilustrarlo supongamos que un consumidor que realiza pruebas de consumo, clasifica los refrescos por sabor (Naranja, Pia y Grosella), costo ( 8 y 15 pesos) y tamao (Chico, mediano y grande). De cuantas maneras diferentes podemos elegir un refresco? Evidentemente existen varias posibilidades. Un refresco puede ser de sabor Naranja, costar $8 y ser de tamao mediano, otra eleccin ser de sabor naranja que cueste $15 y ser de tamao chico, etc. Para el manejo sistemtico de este tipo de problemas es til trazar un Diagrama, dentro de los que existen los llamados Diagrama de rbol, como se muestra en la figura 2.3. Donde las tres alternativas, sabor Ei, costo Ci y tamao Ti, estan denotadas por E1, E2 y E3, C1y C2 , T1, T2 y T3 respectivamente.

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 21

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

C1

T1 T2

Naranj a

T3 T1 C2 T2

T3 C1 T1 T2

T3

Pia

T1 T2 C2 T3 C1 T1

T2

Grosel la

T3 T1 C2 T2

T3

Figura 2.3. Diagrama de rbol para los refrescos de sabor.


INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 22

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Siguiendo un curso dado de izquierda a derecha por las ramas del rbol (que son las lneas que dan direccin), obtenemos una clasificacin en particular a saber, adems de lo cual salta a la vista que en total existen 18 posibilidades. Mediante la observacin se poda haber obtenido el resultado de que hay tres ramas E, de cada rama E se bifurca (salen) dos ramas C y de cada rama C se bifurcan a su vez tres ramas T. As, existen 3*2*3=18 combinaciones de ramas o rutas. Este resultado es un caso especial del siguiente teorema. TEOREMA 2.1. Si los conjuntos A1, A2, , Ak contienen respectivamente, n1,n2, , nk elementos, existen n1n2 nk maneras de elegir primero un elemento de A1, despus un elemento de A2, y as sucesivamente hasta un elemento de Ak. Al teorema 2.1 se le conoce como el principio multiplicativo o Regla de multiplicacin. Ejemplos. 1. De cuantas maneras diferentes una seccin sindical con 25 miembros puede elegir un presidente y un vicepresidente? Solucin: Expresemos como eventos, cada una de las formas de eleccin, es decir, A1=elegir presidente, y existen 25 formas de eleccin, n1=25 A2=elegir vicepresidente, como ya se eligi una persona, solo quedan, 24 formas de elegir un vicepresidente, n2=24 Entonces, existen, n1n2=2524=600 maneras o formas en que puede tomarse la decisin. 2. En un estuche de instrumentos pticos hay seis lentes cncavas, cuatro lentes convexas y tres prismas. de cuantas maneras se puede seleccionar una de las cncavas, una de las convexas y una de las prismas? A1=6 lentes concavas, n1=6 A2=4 lentes convexas, n2=4 A3=3 prismas, n3=3 Entonces existen, 643=72 maneras de realizar la seleccin.

PERMUTACIONES
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 23

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Un arreglo ordenado de n objetos se llama permutacin. Hay seis permutaciones de un conjunto de tres letras, A, B y C, que son:
ABC, ACB, BAC, BCA, CAB y CBA

Para determinar el nmero r de permutaciones de n objetos, utilizaremos la notacin , nPr, junto con el siguiente teorema.

TEOREMA 2. El nmero de permutaciones de r objetos seleccionados de un conjunto de n objetos distintos es. nPr=nn-1n-2(n-r+1) o en notacin factorial que es la ms utilizada y comn.
nPr=n!n-r!

Ejemplo. Suponga que 10 estudiantes estn disponibles para tres tareas distintas en el campus de cuantas formas pueden realizar dichas tareas? Solucin: Necesitamos determinar cuntas formas hay de asignar las tres tareas entre 10 estudiantes, o el nmero de acomodos de 10 objetos tomados de tres en tres. Por el teorema 2 de permutacin, el nmero de permutaciones de 10 objetos tomados de tres en tres ser n=10 , r=3, nPr=10P3=10!10-3!
=10987654321765432=1098=720

Nota: observe que las permutaciones trabajan un arreglo ordenado de objetos, lo que indica que el orden de colocacin de los objetos si importa. Sin embargo hay muchos problemas en los que debemos determinar el nmero de maneras en las cuales pueden seleccionarse r objetos de un conjunto de n, pero sin tomar en cuenta el orden en que se realiza la seleccin. Es a esto a lo que le llamamos una combinacin. COMBINACIN Una seleccin de r objetos de un conjunto de n objetos distintos, sin importar el orden en que los r objetos son seleccionados, se llama combinacin, y el nmero de combinaciones de n objetos tomados de r en r se denota por nr o Crn que se llama coeficiente binomial y est dado por la formula,
nr=Crn=n!n-r!(r)!

Ejemplos 1. De cuantas maneras diferentes pueden seleccionarse 3 de 20 asistentes de laboratorio para colaborar en un experimento?
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 24

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Solucin:
n=20 , r=3 Crn=n!n-r!(r)!=20!20-3!(3)!=1140. 2. De cuantas maneras diferentes el director de un laboratorio de

investigacin candidatos? Solucin:

puede

seleccionar

dos

qumicos

entre

n=7 , r=2, C29=n!n-r!(r)!=7!7-2!(2)!=21

3. De cuantas maneras diferentes el director de un laboratorio de

investigacin puede seleccionar a 2 qumicos entre 7 candidatos y a 3 fsicos entre 9 candidatos? Solucin: Las formas de elegir a 2 qumicos entre 7 candidatos es, 72=21 y las formas de elegir 3 fsicos entre 9 candidatos es, 93=84 y luego utilizando la regla de multiplicacin, la respuesta a la pregunta es:
2184=1764

1.3INTRODUCCIN A LA PROBABILIDAD La probabilidad es la base sobre la que se construyen los mtodos importantes de la estadstica inferencial. Como un sencillo ejemplo, suponga que usted hubiera ganado el premio mayor de la lotera nacional cinco veces seguidas. Habra acusaciones de que usted hizo trampa de alguna forma. Las personas saben que aun cuando existe la probabilidad de que alguien gane cinco veces consecutivas, por pura suerte, la posibilidad es tan increblemente baja, que rechazaran la suerte como una explicacin razonable. sta es precisamente la forma de pensar de los estadsticos: las personas rechazan las explicaciones basadas en probabilidades muy bajas. Los estadsticos usan la regla del suceso o evento inferencial. Regla del evento infrecuente para estadstica inferencial Si, bajo un supuesto dado (como un juego de lotera justo), la probabilidad de un suceso particular observado (como ganar tres veces
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 25

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

seguidas) es extremadamente pequea, concluimos que el supuesto probablemente es incorrecto. La probabilidad de un evento es un nmero entre cero y uno, inclusive, que se asocia al evento; si E es un evento, entonces PE denota la probabilidad de E. Si la probabilidad es cero, entonces el evento no ocurre, si es 1, el evento ocurre; mientras ms cercano a 1 sea PE, ms posibilidad hay de que ocurra, y mientras ms cercano a cero sea PE, menos probable es que suceda, como lo muestre la figura 2.3.1 Aumento de Probabilidad

0 1
E no ocurrir

0.5
E puede o no ocurrir E si

ocurrir Figura 2.3.1

Hay diferentes formas para definir la probabilidad de un evento, como lo que ya mencionamos, presentaremos una lista de algunas notaciones bsicas. NOTACIN DE PROBABILIDAD
P denota una probabilidad A, B C y E denotan evetos o sucesos especificos PA denota la probabilidad de que ocurra el evento A.

Tenemos varias reglas para calcular una probabilidad, segn el o los eventos ocurridos. Regla 1: aproximacin de la probabilidad por frecuencias relativas. Realice (u observe) un procedimiento un gran nmero de veces y cuente las ocasiones que el evento A ocurre en realidad. Con base en estos resultados reales, PA se estima de la siguiente forma.
PA=nmero de veces que ocurre Anmero de veces que se repito el ensayo

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 26

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Regla 2. Mtodos clsicos de la probabilidad (requiere resultados igualmente probables) Suponga que un procedimiento dado tiene n sucesos simples distintos, cada uno de los cuales tiene la misma probabilidad de ocurrir. S el evento A puede ocurrir en S de estas n formas, entonces
PA=nmero de formas en que puede ocurrir Anmero de eventos simples diferentes=Sn

Regla 3. Probabilidades subjetivas


P(A), la probabilidad del evento A, se obtiene simplemente suponiendo o

estimando su valor con base en el conocimiento de las circunstancias relevantes. Ejemplos: ilustremos con un ejemplo cada una de las reglas de probabilidad.
a) Mtodos de las frecuencias relativas (Regla 1). Cuando se trata de determinar: P(tachuela cae con la punta hacia arriba),

debemos repetir muchas veces el procedimiento de lanzar la tachuela y despus calcular el cociente del nmero de veces que la tachuela cae con la punta hacia arriba entre el nmero de lanzamientos. b) Mtodo clsico (Regla 2). Cuando se trata de determinar, P(2) con un dado balanceado, cada una de las seis caras tiene la misma probabilidad de ocurrir.
P2=nmero de formas en que 2 puede ocurrirnumero total de sucesos simples=16 c) Probabilidad subjetiva (Regla 3). Cuando se trata de estimar

la probabilidad de que maana llueva. Los meteorlogos usan su conocimiento experto de las condiciones del tiempo para desarrollar un estimado de la probabilidad. Ejemplo. Para evaluar el desarrollo de la coordinacin fsica en infantes en edad preescolar, una profesora selecciona aleatoriamente a cinco criaturas de una clase de ocho nios y cinco nias de una guardera. Cul es la probabilidad de obtener cinco nias? Cul es la probabilidad de obtener cinco nios? cuatro nios y una nia?

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 27

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Solucin: ya que el muestreo esta dado sin reemplazo el orden de la seleccin no es importante, por tanto todos los nios deben ser contados por medio de combinaciones.
n=nmero de nios r=elegir nmero de nios de n Crn=135=13!8!5!=1287

Elegir cinco nias


C55=55=5!0!5!=1 Psean escogidas cinco nias=11287=0.0008

Si Pelegir cinco nios=561287=0.0435 Donde 85=8!3!5!=56 Elegir cuatro nios y una nia
8451=8!4!4!=350 Pelegir cuatro nios y una nia=3501287=0.2720.

Al calcular probabilidades con la regla 1, obtenemos un estimado en lugar de un valor exacto. Con forme el nmero total de observaciones se incrementa, los estimados correspondientes tienden a acercarse a la probabilidad real. Tal propiedad se enuncia en forma de Teorema, al que se conoce comnmente como la ley de los grandes nmeros. LEY DE LOS GRANDES NMEROS Conforme un procedimiento se repite una y otra vez, la probabilidad de frecuencias relativas de un evento, tiende a aproximarse a la probabilidad real. Ejemplo: Calcule la probabilidad de que un adulto que se selecciona aleatoriamente haya volado en una lnea area comercial. Solucin: el espacio muestral consta de dos eventos simples: la persona ya vol en una lnea comercial o no lo ha hecho. Usando la regla 1 de 855 adultos que se seleccionaron al azar, 710 indicaron que ya volaron en lneas areas comerciales. Obteniendo
Phaber volado en una lnea area comercial=710855=0.830

PROPIEDADES DE LA PROBABILIDAD
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 28

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

La probabilidad satisface las siguientes propiedades:


1. PAi0 2. PAi1 3. i=1nPAi=1

Ejemplo: supngase que se lanza un dado una vez y la probabilidad de cualquier cara de quedar hacia arriba es 16; si A es el evento de sacar un nmero par y B el de sacar un nmero impar, encuentre:
a) b) c) d) P(A) P(B) P(AB) P(AB)

Solucin: como tiene la misma probabilidad de ocurrir, el espacio muestral es M=1, 2, 3, 4, 5, 6 y los eventos A=2, 4, 6, B=1, 3, 5, as
a) b) c) d) PA=P2+P4+P6=16+16+16=36=12 PB=P1+P3+P5=16+16+16=36=12 PAB=PA+PB=12+12=1 PAB=0, ya que AB= son eventos mutuamente excluyentes (esto

se explicara en la seccin 2.4). 1.3EVENTOS MUTUAMENTE EXCLUYENTE Y NO EXCLUYENTES Notacin de la regla de la suma
i. PAB=PA oB=PA+P(B) siempre y cuando A y B sean eventos

mutuamente excluyentes.
ii. PAB=PA oB=PA+PB-P(AB) siempre y cuando A y B sean cualesquiera eventos en M. P(B) P(A) P(B)

P(A)

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 29

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Diagrama de Venn que muestra A y B no Excluyentes.

Diagrama de Venn que muestra A y B mutuamente excluyentes.

iii. Generalizacin de i. S A1,A2, ,An son mutuamente excluyentes en un espacio muestral M, entonces P( A1A2 An)=P(A1)+P(A2)++P(An) iv. Probabilidad de complemente. S A es cualquier evento en M, entonces PAc=1-P(A)

Ejemplos:
1. Una caja contiene 6 billetes de $500, 1 de $100 y 3 de $50.

Determine la probabilidad de que, al extraer al azar uno de estos billetes, este sea de $50 o de $100. Solucin: como los eventos son independientes, la probabilidad total es la suma de las probabilidades individuales, por lo tanto.
Pbillete de $50 o billete de $100=Pbillete de $50+Pbillete de $100=No. de billetes de $50total de billetes+No. de billetes de $100total de billetes =310+110=410=0.40=40%

Solucin alternativa:
Pbillete de $50 o billete de $100=1-Pbilletes de $500=1-No. de billetes de $500total de billetes=1-610=410=40%

2. De un grupo de 45 estudiantes universitarios, 28 estudian ingls y

16 estudian francs, adems de que 12 no estudian idiomas. Prepare un diagrama de Venn que ilustre esta situacin, y determine la probabilidad de que, al entrevistar al azar a un alumno del grupo, este estudie ingls y francs. Solucin: Datos para formar el diagrama de Venn
A=28 estudian ingls B=16 estudian frances C=12 no estudian idiomas No. de estudiantes de ambos idiomas=estudian ingls+estudian francs+no estudian idiomas-total de estudiantes=28+16+1245=56-45=11
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 30

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

No. de estudiantes slo ingls=No. de estudiantes inglesestudiantes de ambos idiomas=28-11=17 No. de estudiantes slo francs=No. estudiantes de Francsestudiantes de ambos idiomas=16-11=5 PAB=1145=0.244=24.4%

PROBABILIDAD CONDICIONAL Si se lanzan dos dados, uno rojo y otro azul, y si sabemos que el dado azul muestra un nmero divisible por 3, cul es la probabilidad de que la suma de puntos de ambos dados sea mayor que 8? La condicin de que el nmero mostrado por el primer dado sea divisible por 3, cambia el espacio muestral que estamos considerando. Para dos eventos cualesquiera A y B usaremos el smbolo P(AB) para designar la probabilidad de que ocurra un evento A , siempre que haya ocurrido el evento B. Esto recibe el nombre de PROBABILIDAD CONDICIONAL, porque se conoce la condicin de que el evento B ha ocurrido. Definicin: para dos eventos, cualesquiera A y B tales que P(B)0, PAB=P(AB)P(B) y cumple con las tres propiedades de probabilidad. Definicin: A y B son eventos independientes si y solo si PAB=PAPB. Teorema. Si A y B son eventos independientes y P(A)0 y entonces PAB=PA y PAB=PB. Ejemplos: 1. La siguiente tabla presenta la distribucin del nmero de das lluviosos o secos, y nublados o soleados de una regin. Amanecer Lluvioso Seco Total de das Nublado Soleado Total 44 29 73 95 197 297 139 226 365
P(B)0,

Determine las probabilidades que se indican a) La probabilidad de que llueva un da cualquiera


INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 31

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

b) La probabilidad de que un da cualquiera est soleado al amanecer y seco durante el da. c) Si se selecciona al azar un amanecer nublado, Cul es la probabilidad de que llueva? d) Si se selecciona al azar un da lluvioso, Cul es la probabilidad de que el amanecer hubiera estado nublado? Solucin.
a) Pllueva un da cualquiera=Sn=No. de das lluviososTotal de das=73365=0.2 b) Pamanecer soleado y seco durante el da=P(amanezca soleado dado que estuvo seco el da)dias soleados=197226 c) Pdalluviosoamanecenublado=No de amaneceres nublado y das lluviosostotal amaneceres nublados=44139 d) Pamanecer nubladodalluvioso=No de das lluviosos con amanecer nubladototal de das lluviosos=4473 1. La siguiente tabla presenta la clasificacin por color y

nmero de puertas de los automviles estacionados en la patio de un centro comercial. Calcule las probabilidades condicionales que resulten. concepto Color blanco Otros colores Total 2 puertas 35 148 183 4 puertas 52 174 226 Total 87 322 409

Las probabilidades condicionales son las probabilidades de que ocurra un evento A, si se sabe que ya ocurri otro relacionado B, es decir, P(AB). Claro que tambin se puede calcular PBA, como se indica a continuacin:

En este caso, A es el evento nmero de puertas; B es el evento Color, y la probabilidad es P(A/B).

En este caso, A es el evento nmero de puertas; B es el evento Color; y la probabilidad es P(B/A).


INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 32

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

TEOREMA DE BAYES Un que en pginas anteriores hemos resuelto algunos ejemplos de probabilidad condicional por medio de los diagramas de Venn, los rboles de probabilidad y las tablas de contingencia, Thomas Bayes (matemtico Ingls; 1702-1761) desarrollo una frmula que puede simplificar el clculo de las probabilidades condicionales. La frmula de Bayes, en su forma mas sencilla, permite calcular la probabilidad de que ocurra el evento B, si se sabe que ya ocurrio el evento A, esto es P(B/A). Para ello se requiere conocer la probabilidad simple de que ocurra el evento A, si se sabe que ya ocurri el evento B, es decir, P(B) y la probabilidad de que ocurra el evento A, se sabe que ya ocurri el evento B, o sea, P(A/B). Lo anterior puede expresarse mediante la siguiente formula.
PB/A=P(A/B)P(B)P(A)

Adems de la regla de Bayes, se tiene el Teorema de Bayes, que no es ms que la generalizacin de que sucedan Bi particiones de B y A es el subconjunto de B, entonces. TEOREMA DE BAYES: si los eventos B1, B2,,Bn forman una particin de B, y A es un subconjunto de B, entonces
PBi/A=P(A/Bi)P(Bi)PB1PA/B1++P(Bn)P(A/Bn)

Ejemplos: 1. El 55.26% de los autos de un estacionamiento son de cuatro puertas. Los autos blancos son el 21.17% del total, y los autos de 4 puertas escogidos de entre los blancos son el 59.77%. determine el porcentaje de autos blancos escogidos de entre los de cuatro puertas Solucin. Definamos los eventos correspondientes, y las probabilidades conocidas.
A=autos con cuatro puertas, PA=0.5526 B=autos blancos, PB=0.2127 AB=autos de cuatro puertas que son blancos, PAB=0.5977

As,
PBA=Pautosblancosconcuatro puertas=0.5977*0.21270.5526=0.2301
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 33

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

2. Tres mquinas traga monedas se arreglan de modo que, generalmente, paguen al jugador una de cada 10 veces y que el jugador pierda nueve de cada 10 veces. Sin embargo una de las maquinas est descompuesta y pagara al jugador tres de cada diez veces, pero no se sabe cul es la mquina descompuesta. Si usted elige una mquina, juega una vez y gana, Cul es la probabilidad de que haya seleccionado la mquina descompuesta?

Solucin. Identifiquemos los eventos B=3 maquinas, entonces tenemos las particiones:
B1=mquina 1, con PB1=13 B2=mquina 2, con PB2=13 B3=mquina 3, con PB3=13 A=pagar al jugador, PA=110 ABi=maquina i que paga dado que esta descompuesta, PABi=310 Pelegir la maquina descompuesta si gano a la primera=PB2A=P(B2)P(AB2)PB1PAB1+PB2PAB2+P(B3)P(AB3)= 1331013110+13310+13110=35=60%.

ESPERANZA MATEMTICA O VALOR ESPERADO Con frecuencia es conveniente calcular el promedio de los resultados de un proceso o experimento ponderado por las probabilidades de que suceda cada uno de los resultados posibles. A este promedio se le conoce como esperanza matemtica y permite entre otras cosas, comparar dos o ms alternativas; por ejemplo, Qu es mejor: una probabilidad de 0.001 de ganar un contrato de $3000000 o una probabilidad de 0.002 de ganar un contrato de $2000000? La frmula para calcular la esperanza matemtica o valor esperado es:
EM=i=1nxiPi, donde EM denota esperanza matemtica, xi, son los datos y Pi, las ponderaciones o probabilidades, otra notacin de esperanza matemtica es Ex, que denota el valor esperado de x.

Ejemplos

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 34

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

1. Una caja contiene 6 billetes de $500, tres de $50 y uno de

$100. Determine la esperanza matemtica al extraer al azar un billete. Solucin. Total de billetes son 10.
P500=610, P50=310, P100=110 EM=500610+100310+100110=325010=325.

entonces,

2. En un sorteo se ofrecan seis premios, uno de $1000, dos de $500 y tres de $300. Suponiendo que se distribuyan los mil boletos del sorteo, y sin considerar gastos de administracin u otros. Cunto debe costar cada boleto para cubrir el costo de los premios? Solucin: el valor esperado del costo de cada boleta es:
Ex=total de premiosNo boletos=11000+2500+33001000=$2.90 de

Lo que sugiere que cada boleto debe costar $2.90 solo para cubrir gastos de premiacin.

UNIDAD III
TIPOS DE DISTRIBUCIN, VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS En esta unidad combinamos los mtodos de estadstica descriptiva que se presentan en la unidad I y los de probabilidad que se estudiaron en la
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 35

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

unidad II. La figura 3.1 presenta un resumen esquemtico de los objetivos.


Unidad I III II

Figura 3.1 combinacin de mtodos descriptivos y probabilidades para formar un modelo terico de comportamiento.

Existen dos tipos de distribuciones Discretas y Continuas, que se clasifican en: DISCRETAS Binomial Poisson Hipergeometrica Normal Logaritmico-Normal Aproximacin de la Binomial a la Normal CONTINUAS

FUNCIN DE DISTRIBUCIN BINOMIAL Las distribuciones binomiales forman una clase importante de distribuciones discretas en estadstica; se usan para describir una amplia variedad de procesos de muchas formas, y resultan de la repeticin de experimentos binomiales. La distribucin binomial, requiere que los experimentos sean binomiales y para verificarlo debe constar de las siguientes propiedades.
1. El experimento consiste de n intentos idnticos.

2. Cada intento da lugar a exactamente dos resultados, llamados xito o fracaso. 3. Los n intentos son independientes. 4. La probabilidad P de un xito permanece constante de un intervalo a otro. La distribucin de probabilidad para el nmero de xitos se denomina distribucin binomial. Una frmula general para calcular Px, la probabilidad de obtener x xitos en un experimento binomial teniendo n intentos con probabilidad
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 36

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

P, se conoce como Frmula de probabilidad binomial, y se calcula, con la

siguiente formula.
Px=nxPx1-Pn-x

Ejemplo3.1. Un estudio reciente mostro que el 60% de los estudiantes universitarios fuman, Cul es la probabilidad de que al elegir a cinco estudiantes, tres de ellos fumen? Solucin: Paso 1. Un intento consiste en determinar si un estudiante universitario fuma, un xito x es encontrar que un estudiante fume. Paso2. Px=0.6 Paso 3. Tamao de la muestra es de n=5 Paso 4. Se desea saber que tres fumen, lo que indica que x=3. Paso 5. Realizar el clculo,
Px=nxPx1-Pn-x P3=530.631-0.65-3=0.3456.

Mucha gente confunde los experimentos binomiales con las distribuciones binomiales, pero hay una diferencia, esto es, un experimento binomial consiste en n intentos dando lugar a exactamente un resultado de los n+1 posibles para la variable binomial aleatoria asociada. Por otro lado, una distribucin binomial describe las probabilidades asociadas con los n+1 valores de la variable aleatoria x que denota el nmero de xitos que puede obtenerse. Para una distribucin binomial aleatoria, la media es el valor esperado E(x) para el nmero de xitos x, =Ex=xiP(xi), pero manejaremos la frmula =nP. Ejemplo 3.2. La probabilidad de que un paciente se recupere de una ciruga de pulmn es 0.95, si 25 personas se someten a esta ciruga, encuentre el nmero de la media de recuperaciones e interprete el resultado. Solucin. Usando la formula =nP tenemos, =nP=250.95=23.75 Lo que significa, si se realiza una ciruga de pulmn en cada uno de los hospitales a 25 pacientes y se registra la cantidad de los que se
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 37

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

recuperacin, el promedio de recuperacin en todos los hospitales estudiados ser cercano a 23.75. Varianza de una distribucin binomial La varianza se calcula por medio de la frmula
2=nP1-P

La desviacin estndar es la raz cuadrada de la varianza, es decir,


=nP1-P

Ejemplo 3.3. Un estudiante presenta un examen de opcin mltiple con 50 preguntas cada una de ellas con 5 elecciones posibles, si responde cada pregunta adivinando, encuentre la media y la desviacin estndar de la distribucin del nmero de preguntas contestadas correctamente, as como la media y la desviacin estndar para la distribucin del nmero de preguntas en que falla el estudiante. Solucin: P=15, n=50, =np=50*0.20=10, lo que indica que el estudiante solo responder correctamente adivinando solo 10 de las 50 preguntas. El nmero de respuestas incorrectas ser, =n1-P=50*0.8=40 La =500.20.8=2.83. Interpretemos en una grfica para diferentes valores de P , como lo muestra la figura 3.2
x P(x)

0 0.328

1 0.410

2 0.205

3 0.051

4 0.06

5 0

Figura 3.2, Expresa la localizacin de la media. FUNCIN DE DISTRIBUCIN DE POISSON El clculo de probabilidades binomiales puede ser tedioso, especialmente si el nmero de intentos es grande. Cuando el nmero de intentos es grande n100 y 10, las probabilidades binomiales pueden aproximarse mediante una forma particular de la funcin de probabilidad de Poisson. La distribucin de probabilidad de Poisson se define por la formula
Px=xe-x!

Donde el parmetro >0, e2.71828 y x=1,2,3,.


INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 38

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Podemos sustituir a por la expresin =nP , que es la media de una variable aleatoria de Poisson, entonces tenemos la formula equivalente:
Px=nPxe-nPx!

Ejemplo 3.4 si la probabilidad de que la empresa Aurrera de Acatln quiebre es de 0.0001, Cul es la probabilidad de que 10 de las 30,000 sucursales quiebre? Solucin: utilizaremos distribucin binomial y Poisson para que el estudiante vea la ventaja de utilizar Poisson. Con Binomial, P10=30000100.0001100.99929900=0.00081 Es extremadamente tedioso realizar los clculos sin la ayuda de una computadora o de hacerlo con mucho cuidado. Sin embargo si utilizamos distribucin de Poisson tenemos:
P10=310e-310!=0.00081

Que da la misma respuesta, indicando que la probabilidad de que quiebren 10 de las 30000 sucursales es del 0.081%, casi nula. Propiedades de una variable aleatoria de Poisson x con un parmetro
>0 x= x2=

DISTRIBUCIN HIPERGEOMTRICA Consideraremos experimentos que obedezcan tres de las cuatro propiedades de un experimento binomial; se debilitar la propiedad de independencia entre los intentos, es decir, los intentos, individuales se considerarn dependientes, el experimento resultante se llamar experimento hipergeometrico. Los experimentos hipergeometricos se usan comnmente cuando el muestreo se hace sin reemplazo. Formula de probabilidad hipergeometrica.
Px=n1xn2n-xn1+n2n, para x=0,1,2, y nn1+n2.

Ejemplo3.5. Se embarcan abanicos elctricos en lotes de diez; antes de aceptar un lote, un inspector elige tres de esos abanicos y los inspecciona, si ninguno de los abanicos aprobados est defectuoso, el
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 39

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

lote se acepta; si uno o ms salen con defectos, revisan todo el lote. Suponga que hay dos abanicos deficientes, Cul es la probabilidad de que se muestre un 100% de inspeccin? Solucin: Sea x=nmero de abanicos defectuosos
Px=0=2083103=0.467, si x1

Se necesitara un 100% de inspeccin s x1. Px1=1-Px=0, dicha probabilidad es de 1-0.467=0.533. entonces hay una probabilidad del 53.3% de que se realice un 100% de inspeccin. La media y la varianza para la distribucin hipergeometrica son:
=nn2n1+n2 x2=nn1n2n1+n2-nn1+n22n1+n2-1

DISTRIBUCION NORMAL
Una de las clases ms importantes de distribuciones continuas es la distribucin normal; desde su descubrimiento hace ya ms de 350 aos, se ha desenvuelto como una herramienta indispensable en cualquier rama de la ciencia, la industria y el comercio. Muchos eventos reales y naturales tienen una distribucin de frecuencias cuya forma es muy parecida a la distribucin normal. La distribucin de frecuencias del contenido de nitrgeno de la hojas de un rbol tiende a ser normal. Las medidas fsicas suelen distribuirse normalmente; las pulsaciones del corazn, los niveles de colesterol en la sangre, las estaturas de los hombres adultos, son todos ejemplos de distribuciones de datos que tienden a seguir la distribucin normal. Grfica de una Distribucin Normal Una distribucin normal tiene la forma de una montaa o la apariencia de una campana, como lo ilustra la figura. 3.1. La ecuacin de una curva con forma de campana est dada por:
y=12e-x-222

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 40

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Figura 3.1

Los parmetros y especifican por completo la posicin y la forma respectivamente, de una distribucin normal; un valor pequeo de significa que la curva normal es una campana delgada picuda; mientras que un valor grande de significa que la curva normal es ancha, aplanada, como lo muestran las figuras 3.2 y 3.3.
y y

Figura 3.2. pequea.

Figura 3.3 grande

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 41

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Propiedades de la distribucin normal 1. Una distribucin normal tiene forma de montaa o de campana. 2. El rea bajo una curva normal y sobre el eje x es siempre igual a 1. 3. La media se localiza en el centro de la distribucin y la curva normal es simtrica con respecto a la lnea perpendicular al eje horizontal en el valor de la media. 4. La media, la moda y la mediana coinciden. 5. Una curva para una distribucin normal se extiende indefinidamente a la izquierda y a la derecha de la media y tiende hacia el eje horizontal. 6. Una curva para una distribucin normal nunca toca el eje horizontal. 7. La forma y la posicin de una distribucin normal depende de los parmetros y , en consecuencia hay un nmero infinito de distribuciones normales. Definicin: Distribucin normal estndar: distribucin normal de probabilidad con una media de cero y una desviacin estndar de 1, en tonto el rea total debajo de su curva de densidad es igual a 1. Notacin:
a) Pazb, denota la probabilikdad de que la puntuacin z este entre a y b. b) Pza, denota la probabilidad de que la puntuacin z sea mayor que a c) Pzb, denota la probabilidad de que la puntuacin z sea menor que b. d) Cabe resaltar que para calcular Pazb es equivalente a

obtener,
Pazb=Pzb-P(za).

Para calcular dichas probabilidades, utilizaremos la tabla 1 del apndice A. Puntuacin z: Distancia a lo largo de la escala horizontal de la distribucin normal estndar; remtase a la columna del extremo izquierdo y al rengln superior de la tabla 1 del apndice A.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 42

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

rea o Probabilidad: regin bajo la curva; remtase a los valores de la tabla 1, apndice A. El siguiente ejemplo requiere que calculemos la probabilidad que se asocia con un valor menor que 1.58. Comience con la puntuacin z de 1.58, localizando 1.5 en la columna izquierda, despus, calcule el valor de 0.08 en el rengln superior , para as obtener la probabilidad buscado en la interseccin de esta fila y columna, como lo ilustra la tabla 3.1. z . . . 1.5 . . . . . . 0.08

0.9429

Tabla 3.1. Calcular la distribucin de probabilidad normal. Ejemplo 3.6 Utilice la tabla 1 del apndice A, para calcular las siguientes probabilidades.
1. Pz2.5 2. Pz-1.2 3. Pz0.5

Solucin. Se deja al alumno. Existe lo que llamamos regla emprica La regla emprica se aplica a cualquier distribucin normal. La figura 3.4. ilustra la regla emprica
a) Aproximadamente el 68% de las medidas distan menos de

una desviacin estndar de la media, es decir caen en el intervalo . b) Casi un 95% de las medidas distan menos de dos desviaciones estndar de la media, caen en el intervalo 2. c) Alrededor del 99.7% de las medidas distan menos de tres desviaciones estndar de la media, esto es, pertenecen al intervalo 3.

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 43

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

-3

-2

+2

+3

68 % 95% 99.7% Figura 3.4

Valor estandarizado z. Cuando 1 y 0 Cualquier variable aleatoria normal x se puede transformar en una variable aleatoria normal estandarizada (o tipificada) z sustituyendo el valor esperado y dividiendo entre la desviacin estndar .
z=x-

Para un valor dado de x, el valor correspondiente de z, llamado en ocasiones valor estandarizado z , es el nmero de desviaciones estndar que x dista de . Si =100y =20 , un valor de x igual a 130 se encuentra a 1.5 desviaciones estndar por encima de la media y el valor z correponddiente es:
z=130-10020=1.5

Ejemplo 3.7. Los ingresos anuales de los profesores de una universidad siguen aproximadamente una distribucin normal con media de $18600 y una desviacin estndar de $2700. Encuentre la probabilidad de que un profesor seleccionado al azar tenga a) Un ingreso anual inferior a $15000 b) Un ingreso anual mayor que $21,000 Solucin: tenemos =$18000,
=$2700,

con z=15000-180002700=-

1.33 a) Pz=ingreso anual<$15000=Pz<-1.33=0.0918

b)Pz>21000=Pz>0.89=1-Pz<0.89=0.1867
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 44

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Aproximacin Normal de la distribucin binomial Una de las muchas aplicaciones de la curva normal es su uso como aproximacin a otras distribuciones de probabilidad, particularmente a la binomial. La frmula a utilizar para realizar la aproximacin es: Supongamos que la variable aleatoria binomial x tiene una distribucin normal y utiliza la media binomial =nP y la desviacin estndar =np(1p). Esta aproximacin solo debe utilizarse cuando =np5 y n(1-P)5. Ejemplo 3.8. Una compaa de seguros su ha fijado la meta de que el 10% de los clientes posibles tome un seguro. Suponga que hay independencia entre los prospectos, de modo que se pueden aplicar las probabilidades binomiales. Cul es la probabilidad de que de 600 clientes posibles, 30 o menos de ellos contraten un seguro? Solucin: n=600, P=0.10 Como no tenemos tablas para n=600, utilizamos una aproximacin normal con
=nP=600*0.10=60 y =np(1-p)=6*(0.90)=7.348

As, Px30=Pz30-607.348=Pz4.08 que es prcticamente cero. Si un agente vendi slo 30 plizas en los ltimos 600 clientes potenciales, deberamos concluir que el agente no cumpli con la meta. Observacin. La aproximacin normal de la distribucin binomial puede ser muy mala si nP5 o n(1-P)<5. Si P, la probabilidad de un xito, es pequea y n, el tamao de la muestra, es modesto, la verdadera distribucin binomial est seriamente sesgada hacia la derecha. En tal caso, la curva normal simtrica constituye una mala aproximacin. Si x es prximo a 1, de modo que n1-P<5, la verdadera distribucin binomial esta sesgada hacia la izquierda y nuevamente la aproximacin normal es bastante buena. En la zona central, n o n1-P entre 5 y 10, una modificacin llamada correccin por continuidad mejora en gran medad la calidad de la aproximacin. La razn por la que se hace la correccin por continuidad es que estamos utilizando la curva normal continua para aproximar una distribucin binomial discreta. La idea general de la correccin por
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 45

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

continuidad es sumar o restar 0.5 del valor binomial antes de utilizar las probabilidades normales, es decir z=x0.5-. Ejemplo 3.9. Una fbrica de medicamentos realiza pruebas clnicas con 100 nuevos frmacos potenciales. Cerca del 20% de las sustancias que alcanzan esta etapa reciben finalmente la aprobacin para su venta. Cul es la probabilidad de que se aprueben al menos 15 de los 100 medicamentes? Solucin: la =1000.2=20>5, =100(0.2)(0.8)=4<5, entonces , pero como <5, hay que realizar una correccin por continuidad y consiste en tomar el evento con x14.5.
P(z15) z=150.5-204=-1.375

As, Pz15=Pz14.5=Pz-1.375=0.92 Nota. Cuando Pzx restar 0.5 y cuando Pzx sumar 0.5.

UNIDAD IV
MUESTREO
El uso del trmino poblacin es estadstica es herencia de la poca en la que la estadstica se aplicaba sobre todo a fenmenos sociolgicos y econmicos. Hoy se aplica a conjuntos o series de objetos, reales o conceptuales, y en particular a conjuntos de nmeros, medidas u
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 46

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

observaciones. Por ejemplo, si nos interesa determinar el nmero promedio de televisores por hogar en Mxico, la totalidad de estas cifras, una por cada hogar, constituir la poblacin de este estudio. De igual manera, la poblacin de la cual inspectores extraen una muestra, a fin de determinar alguna caracterstica de calidad de un producto manufacturado, puede ser la de las correspondientes medidas de todas las unidades en un lote dado. Para garantizar que una muestra es representativa de la poblacin de la cual se obtuvo, as como para establecer un marco para la aplicacin de la teora de la probabilidad a problemas de muestreo, limitaremos nuestra exposicin a muestras aleatorias. Por lo que respecta al muestreo de poblaciones finitas, stas se definen de la siguiente manera. DEFINICIN 1: Muestra aleatoria finita. Un conjunto de observaciones x1,x2,. . ., xn constituye una muestra aleatoria de tamao n de una poblacin finita de tamao N si se elige de tal forma que cada subconjunto de n de los N elementos de la poblacin tenga la misma probabilidad de ser seleccionado. 1.1.1 Tipos de muestreo aleatorio, sistematizado, estratificado y conglomerado. MUESTREO ALEATORIO ESTRATIFICADO En el muestreo aleatorio estratificado los elementos de la poblacin primero se dividen en grupos, a los que se les lama estratos, de manera que cada elemento pertenezca a uno y slo un estrato. La base para la formacin de los estratos, que puede ser departamento, edad tipo de industria, etc., est a discrecin de la persona que disea la muestra. Sin embargo, se obtienen mejores resultados cuando los elementos que forman un estrato son lo ms parecido posible. La figura 4.1 es un diagrama de una poblacin dividida en H estratos.
Poblacin

Estrato 1

Estrato 2

Estrato H

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 47

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Figura 4.1 Diagrama de un muestreo aleatorio estratificado.

Una vez formados los estratos, se toma una muestra aleatoria simple de cada estrato. Existen frmulas para combinar los resultados de las muestras de los varios estratos en una estimacin del parmetro poblacional de inters. El valor del muestreo aleatorio estratificado depende de qu tan homogneos sean los elementos dentro de cada estrato. Si los elementos de un estrato son homogneos, el estrato tendr una varianza pequea. Por tanto, con muestras relativamente pequeas de los estratos se obtienen buenas estimaciones de las caractersticas de los estratos. Si los estratos son homogneos, el muestreo aleatorio estratificado, proporciona resultados tan precisos como los de un muestreo aleatorio simple, pero con una muestra de tamao total menor. MUESTREO POR CONGLOMERADOS En el muestreo por conglomerados los elementos de la muestra primera se dividen en grupos separados, llamados conglomerados. Cada elemento de la poblacin pertenece a una y slo un conglomerado como lo muestra la figura 4.2. Se toma una muestra aleatoria de los conglomerados. La muestra est formada por todos los elementos dentro de cada uno de los conglomerados que forman la muestra. El muestreo por conglomerados tiende a proporcionar mejores resultados cuando los elementos dentro de los conglomerados no son semejantes. Lo ideal es que cada conglomerado sea una representacin, a pequea escala, de la poblacin. Si todos los conglomerados son semejantes en este aspecto, tomando en la muestra un nmero pequeo de conglomerados se obtendr una buena estimacin de los parmetros poblacionales.
Poblacin

Conglomerado 1

Conglomerado 2

Conglomerado K

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 48

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Figura 4.2 Diagrama del muestreo por conglomerado.

Una de las principales aplicaciones del muestreo por conglomerados es el muestreo por reas, en el que los conglomerados son las manzanas de una ciudad u otras reas bien definidas. El muestreo por conglomerado requiere, por lo general, tamaos de muestra mayores que los requeridos en el muestreo aleatorio simple o en el muestreo aleatorio estratificado. Sin embargo, es posible reducir costos debido a que cuando se enva a un entrevistador a uno de los conglomerados de la muestra (por ejemplo, a una manzana de una ciudad), es posible obtener muchas observaciones en poco tiempo. Por tanto, se obtiene una muestra de tamao grande a un costo significativamente menor. MUESTREO SISTEMATIZADO. Para ciertos muestreos, en especial en aquellos con poblaciones grandes, se necesita mucho tiempo para tomar una muestra aleatoria simple (hallando primero los nmeros aleatorios y despus contando y recorriendo todo una lista de la poblacin hasta encontrar los elementos correspondientes). Una alternativa al muestreo aleatorio simple es el muestreo sistemtico. Por ejemplo, si se quiere una muestra de tamao 50 de una poblacin que tiene 5000 elementos, se muestrea una de cada 5000/50=100 elementos de la poblacin. En este caso, un muestreo sistemtico consiste en seleccionar en forma aleatoria una de los primeros elementos de la lista de la poblacin. Los otros elementos que tengan la posicin 100 en la lista de la poblacin, a partir de este elemento se cuentan otros 100 y as se continua. Por lo general, de esta manera es ms fcil de identificar la muestra de 50 que si se usara el muestreo aleatorio simple. Como el primer elemento que se selecciona es elegido en forma aleatoria, se supone que una muestra sistemtica tiene las propiedades de una muestra aleatoria simple. Esta suposicin es aplicable, en especial, cuando la lista de los elementos de la poblacin en un orden aleatorio de los elementos. Muestreo aleatorio estratificado: Mtodo probabilstico en el que primero se divide la poblacin en estratos y despus se toma una muestra aleatoria simple de cada estrato.

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 49

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Muestreo por conglomerado: Mtodo probabilstico en el que primero se divide la poblacin en conglomerados y despus se toma una muestra aleatoria de los conglomerados. Muestreo sistemtico: Mtodo probabilstico en el que primero se selecciona uno de los primeros k elementos de una poblacin y despus se selecciona cada k-simo elemento de la poblacin.

4.2 Concepto de distribucin de muestreo de la media La distribucin muestral de x es la distribucin de probabilidad de todos los valores de la media muestral x. En este subtema se describen las propiedades de la distribucin muestral de x. Como ocurre con otras distribuciones de probabilidad estudiadas, la distribucin muestral de x tiene una valor esperado, una desviacin estndar y una forma caracterstica. Para empezar se considerar la media de todos los valores de x, a la que se conoce como valor esperado de x. Valor esperado de x.
Ex= 4.1

Donde
Ex=valor esperado de x =media poblacional

Esto ensea que usando el muestreo aleatorio simple, el valor esperado o medio de la distribucin muestral de x es igual a la media de la poblacin. Por ejemplo si el sueldo anual medio de los administradores de un hospital es de =$51,800. Por lo tanto, de acuerdo con la ecuacin 4.1 la media de todas las medias mustrales en el estudio del sueldo es tambin $5,800. Cuando el valor esperado de un estimador puntual es igual al parmetro poblacional, se dice que el estimador puntual es insesgado. Por lo tanto, la ecuacin 4.1 muestra que x es un estimador insesgado de la media poblacional . 1. 1.2 1.2.1 Distribucin muestral de la media con varianza conocida y desconocida
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 50

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Desviacin estndar de x Ahora se definir la desviacin estndar de la distribucin muestral de x. Se emplear la notacin siguiente.
x=desviacin estandar de x =desviacin estandar de la poblacin n=tamao de la muestra N=tamao de la pobalcin

Es posible demostrar que usando el muestreo aleatorio simple, la desviacin estndar de x depende de si la poblacin es finita o infinita. Las dos frmulas para la desviacin estndar son las siguientes. Poblacin finita
x=N-nN-1n

Poblacin infinita
x=n

4.2

Nota. El uso de la frmula 4.2 para poblacin infinita, es vlida para poblaciones finitas siempre y cuando el tamao de la muestra sea menor o igual a 5% del tamao de la poblacin; es decir, nN0.05. Ejemplo. Suponga que una poblacin consiste en los nmeros 8. 10 y 12. Si una muestra de medida 2 es seleccionada con reemplazamiento muestre que x= y tambin que x=n. Solucin:
=8+10+123=303=10 2=x-2N=83 2n=8/32=43

La figura 4.2.1 muestra los datos. Todas la muestras posibles 8,8 8,10 Poblacin de medidas x 8 9 Todas la muestras posibles 10,12 12,8 Poblacin de medidas x 11 10

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 51

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

8,12 10,8 10,10

10 9 10

12,10 12,12

11 12

Figura 4.2.1

x=8+9++11+129=10 x=2n=8/32=43

Lo que responde a la pregunta solicitada. Media poblacional: desconocida. Cuando se calcula un intervalo de confianza para la media poblacional, suele no contarse con una buena estimacin de la desviacin estndar poblacional. En tales casos se usa la misma muestra para estimar y . Esta situacin es el caso que se conoce como desconocida. Cuando se usa s para estimar , el margen de error y la estimacin por intervalo de la media poblacional se basan en una distribucin de probabilidad conocida como distribucin t. Aunque la elaboracin matemtica de la distribucin t parte de la suposicin de que la poblacin de la distribucin t se aplica en muchas situaciones en que la poblacin se desva significativamente de una poblacin normal. La distribucin t es una familia de distribuciones de probabilidad similares: cada distribucin t depende de un parmetro conocido como grado de libertad. La distribucin t para un grado de libertad es nica, como lo es la distribucin t para dos grados de libertad, para tres grados de libertad, etc. A medida que l nmero de grados de libertad aumenta, la diferencia entre la distribucin t y la distribucin normal estndar se va reduciendo. En la figura 4.2.2 se muestran las distribuciones t para 10 y 20 grados de libertad y su relacin con la distribucin de probabilidad normal estndar. Observe que una distribucin tpara ms grados de libertad exhibe menos variabilidad y un mayor parecido con la distribucin normal estndar, tambin que la media de toda distribucin t es cero.

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 52

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Distribucin normal estndar Distribucin t (20 grados de libertad) Distribucin t (10 grados de libertad)

Figura 4.2.2 comparacin de la distribucin normal estndar con las distribuciones t para 10 y 20 grados de libertad.
0 Z, t

Definicin: Estimacin de la media desconocida.


xt2sn 4.2.0

Donde s es la desviacin estndar muestral, 1- es el coeficiente de confianza y t2 es el valor de t que proporciona un rea de 2 en la cola superior de la distribucin t para n-1 grados de libertad. Mostremos con un ejemplo el uso de esta frmula. Suponga que se desea realizar un estudio para estimar la media del adeudo en las tarjetas de crdito en la poblacin de familias de Puebla. En la tabla 4.2.1 se presentan los saldos en las tarjetas de crdito de una muestra de n=70 familias. En esta ocasin no se cuenta con una estimacin previa de la desviacin estndar poblacional . De manera que los datos mustrales debern usarse para estimar tanto la media poblacional como la desviacin estndar poblacional. Tabla 4.2.1 SALDOS EN LAS TARJETAS DE CRDITO DE UNA MUESTRA DE 70 FAMILIAS 9430 14661 7159 9071 9641 11032

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 53

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

7535 4078 5604 5179 4416 10676 1627 10112 6567 13627 18719

12195 10544 13659 7061 6245 13021 9719 22000 10746 12744 5742

8137 9467 12595 7917 11346 12806 4972 11356 7117 9465 19263

3603 16804 13479 14044 6817 6845 10493 615 13627 12557 6232

11448 8279 5649 11298 4353 3467 6191 12851 5337 8372 7445

6525 5239 6195 12584 15415 15917 12591 9743 10324

Con los datos de la tabla 4.2.1 se calcula x=$9312 y s=$4007. Ahora se usa la tabla 2 del apndice A para obtener el valor de t0.025 correspondiente a 95% de confianza y n-1=69 grados de libertad. El valor de t que se necesita est en el rengln correspondiente a 69 grados de libertad y en la columna correspondiente a 0.025 en la cola superior. El valor que se encuentra es t0.025=1.995. Entonces utilizando la frmula de estimacin, tenemos
xt2sn =93121.995400770=9312955

Donde la estimacin puntual de la media es de $9312, el margen de error es $955 y el intervalo de confianza de 955 va de $8357 a $10267, en consecuencia, 95% de confianza de la media de los saldos en las tarjetas de crdito de la poblacin de todas las familias estn en el intervalo mencionado. Recomendacin prctica. Si la poblacin tiene una distribucin normal, el intervalo de confianza suministrado en la expresin 4.2.0 ser aproximado. En este caso la calidad de la aproximacin depende tanto de la distribucin de la poblacin como del tamao de la muestra.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 54

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

En la mayora de las aplicaciones un tamao de muestra n30 es suficiente al usar la expresin 4.2.0, para obtener una estimacin por intervalo de la media poblacional. Sin embargo, si la distribucin de la poblacin es muy sesgada o si hay observaciones atpicas, la mayora de los especialistas en estadstica recomiendan un tamao de muestra de 50 o ms. Si la poblacin no tiene una distribucin normal pero es ms o menos simtrica, ya con un tamao de muestra de 15 puede esperarse una buena aproximacin al intervalo de confianza. Con muestras ms pequeas la expresin 4.2.0 slo debe usarse si el analista cree, o est dispuesto a suponer, que la distribucin de la poblacin es por lo menos aproximadamente normal. Mostremos un ejemplo con una muestra pequea. Industrias Cheer esta considerando un nuevo programa asistido por computadora con el fin de capacitar a los empleados de mantenimiento para realizar la reparacin de las mquinas. Con objeto de evaluar este programa, el director de manufactura solicita una estimacin de la media poblacional del tiempo requerido para que los empleados de mantenimiento completen la capacitacin asistida por computadora. Tabla 4.2.2 Duracin de la capacitacin, en das, en la muestra de 20 empleados de Cheer 59 44 55 44 45 50 54 62 46 54 42 60 62 43 42 48 55 57 56

Considere una muestra de 20 empleados que siguen el programa de capacitacin. En la tabla 4.2.2 se muestran los datos del tiempo, en das, que necesit cada una de los empleados para el programa de capacitacin. En la figura 4.2 aparece un histograma de los datos. De acuerdo al histograma qu se puede decir de la distribucin de los datos? Primero, de acuerdo con los datos mustrales de sesgo o de observaciones atpicas. Por lo que se concluye que una estimacin por intervalos basada en la distribucin t parece ser aceptable para esta muestra de 20 empleados.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 55

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

x=xin=103020=51.5 das s=xi-x2n-1=88920-1=6.84 das

Para dar un intervalo de confianza del apndice A y 19 grados de


51.52.0936.8420=51.53.2

95%, se usa la tabla 2 del libertad y se obtiene

La estimacin puntual de la media poblacional es 51.5 das. El margen de error es de 3.2 das y el intervalo de confianza de 95% va de 48.3 das a 54.7 das. Usar un histograma de los datos mustrales para tener informacin acerca de la distribucin de la poblacin no es siempre concluyente, pero en muchos casos es la nica informacin disponible. El histograma, junto con la opinin del analista, suele usarse para decidir si es adecuado usar la expresin 4.2.0 para obtener una estimacin por intervalo.
1.2.2 Distribucin muestral de la diferencia entre dos medias con

varianza conocida y desconocida.

1.2.3 Distribucin muestral de la proporcin. Una distribucin de este tipo indica cun probable es un conjunto particular de proporciones mustrales, dados el tamao de la muestra y la proporcin de la poblacin. Cuando el tamao de la muestra es de 0 o menos, las probabilidades para los diferentes resultados posibles se pueden obtener directamente de una tala de probabilidad binomiales simplemente convirtiendo el nmero de xitos a porcentajes. Por ejemplo 3 ocurrencias en 10 observaciones sera el 30%, en tanto que 5 ocurrencias en 20 observaciones sera el 25%. Para tamaos mustrales mayores la aproximacin normal a la binomial producir valores bastantes aceptables. La media (proporcin promedio o porcentaje) de la distribucin de muestra siempre es igual a la proporcin de la poblacin. Es decir, la proporcin muestral p es el estimador puntual de la proporcin poblacional. La frmula para calcular la proporcin muestral es
p=p
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 56

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

en donde:
p=proporcion de la poblacin p=media de la distribucin de muestreo de proporciones

Cuando la poblacin es muy grande o infinita, la desviacin estndar de la distribucin de muestreo se calcula utilizando la frmula
p=p1-pn

La proporcin muestral p es una variable aleatoria y su distribucin de probabilidad se conoce como distribucin muestral de p. Ejemplo. Un detallista compra vasos de cristal en grandes cantidades directamente de la fbrica. Tales vasos son envueltos uno por uno. Algunas veces, el detallista inspecciona las remesas para determinar la proporcin de vasos rotos o defectuosos. Si un gran cargamento contiene el 10% de vasos rotos o defectuosos, Cul es la probabilidad de que el detallista obtenga una muestra aleatoria de 100 vasos que representan el 17% o ms de defectuosos? Solucin: El primer paso es calcular la desviacin estndar
p=p1-pn=(0.10)(0.9)100=0.310=0.3

Ahora esto se puede utilizar para determinar la variacin relativa:


17%-10%3%=2.33

El rea ms all de 2.33 es 0.0099 (que se obtuvo de la tabla para una distribucin normal z=2.33). La probabilidad de obtener ms de 17% de defectuosos de una muestra de 100 es de 0.9%.

1.3Teorema del limites Central La capacidad para utilizar muestras y obtener inferencias con respecto a parmetros de poblacin depende del conocimiento de la distribucin de muestreo. Se ha comentado como se determina la media y la desviacin
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 57

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

estndar pero, an se requiere cierta informacin adicional: la forma de la distribucin de muestreo. Anteriormente se explic que existe una tendencia a que las distribuciones de medias y proporciones sean normales. En el caso de los calores medios mustrales se puede demostrar matemticamente que si una poblacin est distribuida de modo normal. La distribucin de los valores medios de la poblacin que se obtienen de esa poblacin tambin lo estarn respecto a cualquier tamao de la muestra. Adems, an so la poblacin no es normal, la distribucin de los valores medios de la muestra sern aproximadamente normales si el tamao de la muestra es grande. Esta es una suerte, ya que indica que no es necesario saber cul es la distribucin de la poblacin para estar en condiciones de obtener inferencias con respecto a la poblacin a partir de datos mustrales. La nica restriccin es que el tamao de la muestra sea grande. Una regla que generalmente se utiliza establece que las muestras deben incluir 30 0 ms observaciones. Estos resultados se conocen como el Teorema del Lmite Central, y quiz constituyan el concepto ms importante de inferencia estadstica. EL TEOREMA DEL LIMITE CENTRAL 1. Si la poblacin muestreada est distribuida de manera normal, la distribucin de los valores medios de la muestra estar normalmente distribuidos respecto a todos los tamaos mustrales. 2. Si la poblacin no es normal, la distribucin de los valores medios de la muestra ser aproximadamente normal respecto a un tamao muestral grande. Nota: el Teorema del Lmite Central se aplica solamente a valores medios de la muestra. Sin embargo, se puede destacar que, excepto para valores muy pequeos o muy grandes de p. El teorema del Lmite Central se indica grficamente en la figura 4.3.1 Veamos la aplicacin del Teorema del Lmite Central con un ejemplo. Ejemplo. Una poblacin muy grande tiene una media de 20 y una desviacin estndar de 1.4 si se toma una muestra de 49 observaciones, conteste las siguientes preguntas. a) Cul es la media de la distribucin de muestreo?
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 58

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

b) Cul es la desviacin estndar de la distribucin de muestreo? c) Qu porcentaje de posibles valores medios de la muestra diferirn de la media de la poblacin por ms de 0.2? Solucin. Como n>30, es posible suponer que la distribucin normal. de muestreo es

a) La media de la distribucin de muestreo siempre es igual a la media de la poblacin. Por tanto x=20

b) La desviacin estndar de la distribucin de muestreo es


x=n=1.449=0.2

c) El porcentaje de valores medios de la muestra que diferirn por ms de 0.2 de la media de la poblacin (ver figura 4.3.2) es
20+0.2-200.2=+x proporcin :0.1587 20-0.2-200.2=-x proporcin: 0.1587

Total:0.3174

1.2Tipo de estimaciones y caractersticas. En especfico, usaremos datos mustrales para hacer estimados de parmetros de poblacin. Por ejemplo, el problema de este tema se refiere a los resultados de una encuesta de que aplic a 829 adultos de Puebla, el 51% de los cuales se manifestaron en contra del uso de las cmaras para expedir multas de trnsito. Con base en el estadstico muestral de 51%, estimaremos el porcentaje de adultos en la poblacin de Puebla que se oponen a la legislacin de la cmara vigilante.

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 59

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Las dos aplicaciones principales de la estadstica inferencial implican el uso de los datos para:
1. Estimar el valor de un parmetro de la poblacin.

2. Probar alguna aseveracin (o hiptesis) acerca de una poblacin. Los principales tipos de estimaciones para muestras son: a) Media b) Desviacin estndar c) Proporcin Resuelta interesante que cada uno de estos estadsticos mustrales son los estimadores puntuales de sus correspondientes parmetros poblacionales. Sin embargo, antes de usar un estadstico muestral como estimador puntual, se verifica si el estimador puntual tiene ciertas propiedades que corresponden a un buen estimador puntual. Las propiedades que deben tener los buenos estimadores puntuales: insesgadez, eficiencia y consistencia. Como hay distintos estadsticos mustrales que se estimadores puntuales de sus correspondientes poblacionales, utilizaremos la notacin general siguiente.
=el paramtro poblacional de inters =el estadstico o estimador puntual de

usan como parmetros

En esta notacin es la letra griega theta y la notacin se lee theta sombrero. En general, representa cualquier parmetro poblacional como, por ejemplo, la media poblacional, la desviacin estndar poblacional, la proporcin poblacional, etc.; representa el correspondiente estadstico muestral, por ejemplo, la media muestral, la desviacin estndar muestral y la proporcin muestral. Mostremos la comparacin en la tabla 4.4.1, expresando ah mismo el clculo para cada uno de los estimadores y sus caractersticas.

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 60

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

Parmetro poblacional
=media

Estimador

Formula Caracters equival ticas. ente


x=xin

x=media muestral

Son ms sencillos de determina r Son ms sencillos de determina r Son ms sencillos de determina r

=desviacin estandar

s=desviacin estandar muestral

s=R4

p=proporcin

p=proporcin muestral

p=xn

1.2Determinacin del tamao de la muestra de una poblacin. El tamao de una muestra es importante para obtener una buena aproximacin a los intervalos de confianza (que se analizaran en la siguiente seccin) en los casos en que la poblacin no tiene una distribucin normal, ahora enfocaremos la atencin a otro aspecto relacionado con el tamao de la muestra. Se describe cmo elegir un tamao de muestra suficientemente grande para obtener un margen de error deseado. Para explicar esto, se vuelve al caso en que se tena una conocida. El intervalo de estimacin est dado por xz2n la cantidad z2n es el margen de error. De manera que, como se ve, z2, la desviacin estndar poblacional , y el tamao de la muestra n se combinan para determinar el margen de error. Una vez que se selecciona el coeficiente de confianza 1-, se determina , z2. Por tanto, si se tiene el
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 61

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

valor de , es posible encontrar el tamao de muestra n necesario para proporcionar cualquier margen de error deseado. A continuacin se presenta la deduccin de la frmula que se usa para calcular el tamao n de muestra deseado. Sea E=el margen de error deseado
E=z2n

Despejando n se tiene.

TAMAO DE LA MUESTRA PARA UNA ESTIMACIN POR INTERVALO DE LA MEDIA POBLACIONAL


n=z22E2 4.5

Este tamao de muestra proporciona el margen de error deseado al nivel de confianza elegido. En la ecuacin 4.5 E es el margen de error que el usuario est dispuesto a aceptar, y el valor z2 es consecuencia directa del nivel de confianza que se va usar para calcular la estimacin por intervalo. A reserva de la decisin del usuario, 95% de confianza es el valor ms usado z0.025=1.96 Por ltimo, para usar la ecuacin 4.5 es necesario contar con el valor de la deviacin estndar poblacional . Sin embargo, aun cuando este valor no se conozca, puede usarse la ecuacin 4.5 siempre que se tanga un valor preliminar o un valor planeado de . En la prctica, se suele usar alguno de los procedimientos siguientes para obtener este valor planeado de .
1. Usar como valor planeado de una estimacin de la desviacin

estndar poblacional calculada a partir de datos de estudios anteriores. 2. Emplear un estudio piloto seleccionando una muestra preliminar. La desviacin estndar muestral obtenida de la muestra preliminar puede usarse como valor planeado de . 3. Use su juicio para el valor de . Por ejemplo, se puede empezar por estimar el mayor y el menor valor en los datos de la poblacin. Esta diferencia entre el mayor y el menor valor proporciona una estimacin del rango de los datos. Por ltimo, este valor dividido
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 62

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

entre 4 suele considerarse como una aproximacin burda a la desviacin estndar y tomarse como un valor planeado aceptable de . Ejemplo. En un estudio previo para investigar el costo de la renta de automviles en Mxico se encontr que el costo medio de la renta de un auto mediano era aproximadamente $55 por da. Suponga que la organizacin que realizo dicho estudio quiere realizar un nuevo estudio para estimar la media poblacional de las rentas por da de automviles medianos en Mxico. Antes de iniciar, especific que la media poblacional de las rentas por da debe estimarse con un margen de error de $2 y que se desea un nivel de 95% de confianza. Solucin. El margen de error especificado es de E=2, el nivel de 95% de confianza indica que z0.025=1.96. , por tanto solo falta un valor planeado de la desviacin estndar poblacional para calcular el tamao de muestra deseado. El analista determino que la desviacin estndar poblacional del costo de la renta diaria era de $9.65. usando %9.65 como valor planeado de , se tiene
n=z2E2=1.9629.65222=89.43

De esta manera el tamao de la muestra para obtener un margen de error de $2 debe ser de por lo menos 89.43 rentas de automviles medianos. En casos como ste, en que el valor de n no es un nmero entero, se redondea al siguiente valor entero, as que el tamao de muestra que se aconseja es 90 rentas de automviles medianos. Tamao de la muestra para una estimacin por intervalo de la proporcin poblacional.
n=z22p*1-p*E2

En la practica el valor planeado p* se determina mediante algunos de los mtodos siguientes: 1. Utilizar la proporcin poblacin de una muestra previa de las mismas unidades o de unidades similares. 2. Utilizar un estudio piloto y elegir una muestra preliminar. La proporcin muestral de esta muestra se usa como valor planeado de p*. 3. Proponer una mejor aproximacin para el valor de p*.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 63

MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA

4. Si no aplica ninguna de las alternativas anteriores, emplear como valor planeado p*=0.50.

Suponga que una empresa desea llevara a cabo un estudio con mujeres golfistas que estn satisfechas con la disponibilidad de horarios de salida. De qu tamao deber ser la muestra si se desea que en la estimacin de la proporcin poblacional el margen de error sea de 0.025 a 95% de confianza?. Como E=0.025 y z2=1.96, se necesita un valor planeado p*para responder esta pregunta sobre el tamao de la muestra. Utilizando como valor planeado p*, el resultado del estudio que se conoca, que es de p=0.44, entonces tenemos que el tamao de la muestra deseado es de:
n=z22p*1-p*E2=1.9620.441-0.44*0.0252=1514.5

Golfistas para tener el margen de error requerido. 1.2Intervalos de confianza para la media, con el uso de la distribucin.

INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Pgina 64