Академический Документы
Профессиональный Документы
Культура Документы
CAPTULO I
CONCEPTOS BSICOS
Divisin de la Estadstica
Ejemplo 1
Se desea hacer un estudio sobre el consumo de drogas en el distrito de Comas. Con esta
finalidad se extrae una muestra aleatoria de 240 adolescentes del distrito de Comas en
el 2013 y se les aplica la encuesta respectiva.
Distribucin de la frecuencia de
consumo de droga
20,0 16,7
Diario 40 16,7 10,0
8,3
1
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 1. El rea de marketing del supermercado ABC, desea hacer un estudio sobre
la satisfaccin de los clientes que realizaron sus compras en el ltimo trimestre. Para el
estudio se obtuvo una muestra aleatoria de 420 clientes. Defina poblacin, unidad
elemental y muestra.
2
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
4) Variable. Son las caractersticas que toman diferentes valores cuando son evaluadas
en las unidades elementales de una poblacin o muestra. Se representan por las
ltimas letras maysculas del alfabeto, por ejemplo: X, Y, Z, W, P, T, X1, X2, Y1, etc.
Tipos de Variables
Variable Cuantitativa Continua. Son aquellas que pueden tomar cualquier valor
numrico dentro de un intervalo continuo. Se utiliza un instrumento de medicin para
generar sus valores: balanza, termmetros, test, escalas, cronmetros, winchas, etc.
Ejemplo 5
1. Peso del langostino de ro (en gr)
2. Tiempo para encontrar estacionamiento en un centro comercial (minutos)
3. Gasto mensual familiar en atencin mdica (nuevos soles)
Variable Cuantitativa Discreta. Son aquellas que cumplen con la condicin de que
entre un valor cualesquiera y su consecutivo no es posible que existan valores
intermedios. Generalmente son representados por el conjunto de nmeros enteros.
Las observaciones cuantitativas discretas se registran por conteo.
Ejemplo 6
1. Nmero de artculos defectuosos en un lote de 20
2. Nmero de clientes atendidos cada 20 minutos en una ventanilla
3. Nmero de predios que posee un agricultor de un valle
Variable Cualitativa. Son aquellas que permiten que una unidad elemental pueda ser
clasificada como poseedora o no de cierta cualidad, propiedad o atributo. No tiene sentido
realizar operaciones matemticas con ellas. Son aquellas cuyos valores posibles son
atributos o categoras.
3
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 7
1. Sexo de los estudiantes (Masculino o Femenino)
2. Estado civil de una persona (Soltero, Casado, Divorciado, Viudo o Conviviente)
3. Marca de una computadora (A, B, C o D)
4. Marca de Automvil (Toyota, Chevrolet, Mercedes Benz, etc)
Ejemplo 8
1. Nivel de instruccin (Sin instruccin, Primaria, Secundaria o Superior)
2. Nivel socioeconmico de un cliente (Alto, Medio o Bajo)
3. Calificacin de un servicio (Bueno, Regular o Malo)
4. Rango Militar (Cabo, Sargento, Coronel)
5) Observacin. Es el valor posible que toma una variable. A las observaciones se les
suele representar con las letras minsculas subindicadas, como por ejemplo x i , yi
, zi
Ejemplo 9
4
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 4. Para evaluar un programa productivo cuyos beneficiarios son los agricultores
de una comunidad campesina, se ha aplicado la siguiente encuesta.
Ejemplo 10
1. Suponga que el nmero promedio de cocinas vendidas en todos los meses de venta
es 15.4 ( = 15.4).
2. El Censo Nacional 2007: XI de Poblacin y VI de Vivienda indica que en el grupo edad
de 20 a 29 aos, el 1.4% de los hombres no sabe leer y escribir mientras que el 3.1%
de las mujeres no sabe leer y escribir (1 = 0.014 y 2 = 0.031).
3. Suponga que en todo Brea la proporcin del nivel de instruccin result:
5
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 11
1. En una muestra de 30 meses de venta se encontr que el nmero promedio de
cocinas vendidas fue de 14.9 ( x 14 .9) .
2. En la encuesta nacional de hogares (ENAHO) indica que el 1.1% de los hombres no
sabe leer y ni escribir ( p 0.011) .
2. Suponga que en distrito de Brea se ha seleccionado una muestra de 500 personas
encontrndose los siguientes resultados:
Ejemplo 12
En el siguiente ejercicio, identificar: la poblacin, la muestra, unidad elemental, la
variable, tipo de variable, observacin, parmetro y valor del estadstico.
La Oficina de Servicios Generales de la UNALM desea conocer los medios en los cuales
con mayor frecuencia se transportan los alumnos de la UNALM. Para ello, realiza una
encuesta a 50 alumnos de pregrado en el semestre 2013-II y encuentra los siguientes
resultados:
a) El 70% de los encuestados usa el transporte pblico y un 20% usa el transporte de
la universidad.
b) El 20% de los encuestados consideran que el estado de las unidades de transporte de
la UNALM es bueno, el 35% que es regular y el 45% que es malo.
c) El nmero promedio de unidades que toma para llegar a la universidad es de 1.5.
d) El tiempo promedio de traslado de su casa a la universidad es de 39.70 minutos.
Solucin
Poblacin:
Todos los alumnos de la UNALM La Molina de pregrado del semestre 2013-II
Unidad elemental:
Cada alumno de la UNALM La Molina de pregrado del semestre 2013-II
Muestra:
50 alumnos de la UNALM La Molina de pregrado del semestre 2013-II
6
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Valor del
Tipo de
Variable Observacin Estadstico Parmetro
Variable
(estimacin)
a) X= Medio de transporte Cualitativa x22 pblico p p 0.70 La proporcin de
usado para llegar a la nominal alumnos segn el
UNALM. pu 0.20 medio de transporte
po 0.10 usado para llegar a la
UNALM.
Ejemplo 13
Se presentaron algunos resultados del informe gerencial de marketing Perfil del adulto
joven elaborado por Apoyo Opinin y Mercado. (www.apoyo.com). El informe fue
elaborado a partir de los resultados de una encuesta realizada el 25 Abril del 2010 a una
muestra aleatoria conformada por 2000 jvenes de Lima Metropolitana de todos los
niveles socioeconmicos y cuyas edades fluctan entre los 21 y 35 aos de edad.
El ingreso medio mensual es de 1320 nuevos soles.
El 5% tiene estudios de postgrado, el 17% universitaria completa, el 33% universitaria
incompleta, el 35% secundaria completa y el resto secundaria incompleta.
El 42% de jvenes trabaja en empresas estatales.
Solucin
Poblacin.
Todos los jvenes de Lima Metropolitana de todos los niveles socioeconmicos y cuyas
edades fluctan entre los 21 y 35 aos.
Muestra.
2000 jvenes de Lima Metropolitana de todos los niveles socioeconmicos y cuyas edades
fluctan entre los 21 y 35 aos.
Unidad Elemental.
Un joven de Lima Metropolitana de cualquier nivel socioeconmicos y cuya edad flucta
entre los 21 y 35 aos.
7
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Valor estadstico
El ingreso medio mensual es de 1320 nuevos soles.
El 17% universitaria completa
El 42% de jvenes trabaja en empresas estatales.
Parmetros
El ingreso promedio mensual
Porcentaje de jvenes que tienen cierto grado de instruccin.
Porcentaje de jvenes que trabajan en cierto tipo de empresa.
Ejemplo 14
Con la finalidad de efectuar mejoras con los servicios al turista, se seleccionaron 200
turistas franceses al azar que arribaron a nuestro pas el 2013 y se les aplic una encuesta
en la que se pregunt por:
Solucin:
Poblacin:
Todos los turistas franceses que arribaron a nuestro pas el 2013
Muestra:
200 turistas franceses que arribaron a nuestro pas el 2013
Unidad elemental:
Un turista francs que arrib a nuestro pas el 2013
Valor estadstico:
Nmero promedio de das de permanencia en el pas ( x 8 das )
Porcentaje del medio de transporte para trasladarse en avin ( p 20 .0%)
Monto gastado promedio durante el tiempo de estada ( x S / .4560.6)
Porcentaje que opinaron sobre el servicio de alimentacin excelente ( p 30 .0%)
Parmetros:
Nmero promedio de das de permanencia en el pas
Porcentaje del medio de transporte para trasladarse
Monto gastado promedio durante el tiempo de estada
Porcentaje que opinaron sobre el servicio de alimentacin
Ejercicio 5. La Direccin de Salud (DISA) de una zona rural desea realizar un estudio
para evaluar la calidad de servicio de las postas de salud. Con esta finalidad se extrae
aleatoriamente 30 postas de la DISA con lo cual se obtiene la siguiente informacin:
El 60% de las postas de salud registraron como enfermedad principal las respiratorias.
El nmero promedio de nios menores de 6 aos atendidos fue de 120.5
Slo el 25% de las postas tienen como turno de atencin maana y tarde.
8
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 6. Una empresa distribuidora desea evaluar su eficiencia para atender los
pedidos de sus clientes. Selecciona aleatoriamente 30 servicios de reparto realizados en
el 2013 y registra los siguientes datos: Tiempo que se tarda para atender el pedido, nivel
de satisfaccin del cliente (Completamente satisfecho, satisfecho, poco satisfecho, nada
satisfecho) y el distrito en el que se encuentra el cliente. Algunos resultados fueron: El
tiempo promedio de atencin es de 52 minutos, el 40% est completamente satisfecho y
el 30% de los pedidos son del distrito de Ate.
Identificar la poblacin, unidad elemental, muestra, variables, tipos de variables,
observacin, parmetros y valor estadstico.
9
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
EJERCICIOS PROPUESTOS
1. Indique el tipo de variable que sea la ms apropiada para cada una de las siguientes
variables:
Edad
Tamao de bebida (pequeo, mediano, grande)
Ventas anuales
Nmero de camiseta de un jugador
Placa del automvil.
Nmero de DNI
Forma de pago ( efectivo, cheque, tarjeta de crdito)
Tipo de medalla( Oro, Plata, Bronce)
Puesto de llegada en una competencia.
Nmero de celular.
Nmero de personas a favor del aborto.
Nmero de hermanos.
3. Con el fin de realizar una modificacin en el Impuesto al Valor del Patrimonio Predial
del Municipio de La Molina, se hace un estudio socioeconmico sobre una muestra
aleatoria de 300 familias residentes en el distrito. Del presente estudio se encontraron
los siguientes resultados:
El ingreso familiar promedio es de S/ 2500.00 nuevos soles.
El tipo de material predominante usado en la construccin de la vivienda, 24 de
ellos dijeron que era de material noble.
El 40% de ellos afirmaron que el estado de conservacin de su vivienda era
excelente, 20% muy buena, 20% buena, 10% regular y 10% en psimas
condiciones.
Identificar la poblacin, unidad elemental, muestra, variables, tipos de variables,
observacin, parmetros y valor estadstico.
4. En un estudio de preferencia de bebidas gaseosas realizado en una muestra de 100
alumnos de la universidad peruana de las Amricas en el semestre 2011-II se han
obtenido los siguientes resultados:
El 52% de los encuestados fueron de sexo masculino
El 47% de los encuestados prefieren la gaseosa en presentacin de plstico
El 40% de los encuestados prefiere la marca Inca Kola y el 30% prefiere Coca Cola.
La edad promedio de los encuestados es de 20.47 aos
El nmero promedio de gaseosas tamao mediano consumidas por alumno
semanalmente es de 3.4
10
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
7. Con la finalidad de efectuar mejoras con los servicios al turista, se seleccionaron 200
turistas al azar y se les aplic una encuesta en la que se pregunt por:
Nmero de das que permanecieron en el pas, obtenindose un promedio de 8
das.
Medio de transporte que utilizaron para viajar, a lo que el 20% respondi que viaj
en avin, el 30% en tren y el 50% en bus.
Dinero gastado durante el tiempo de estada, de lo que se obtuvo un promedio de
1253.6 nuevos soles por encuestado.
En cuanto al servicio de alimentacin el 30% lo calific de excelente, el 20% muy
bueno y el 50% bueno.
8. El Departamento de Estadstica e Informtica de la Universidad Nacional Agraria La
Molina con la finalidad de contar con mayor informacin sobre los alumnos
matriculados en el curso de Estadstica General, aplic una encuesta a dichos alumnos
en la que se pregunt por:
Facultad a la que pertenece, a lo que el 35% respondi pertenecer a Agronoma.
Nmero de veces que ha llevado el curso.
Promedio ponderado, obtenindose un promedio para todos los alumnos de 12.10.
Expectativa sobre la dificultad del curso (muy fcil, fcil, difcil, muy difcil).
11
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Preguntas de Autoevaluacin
1. Las medidas estadsticas calculadas con los datos de una poblacin se llaman
___________________ y las calculadas con los datos de una muestra
___________________________.
2. La parte de la estadstica que permite la estimacin y prueba de hiptesis de los
parmetros se llama ____________________ y el clculo de medidas estadstica se
denomina ___________________.
3. El valor posible que toma una variable de denomina _____________________.
4. Una ONG que brinda asistencia tcnica a productores de truchas en el valle de
Huancayo ha aplicado una encuesta para establecer una lnea de base en tres zonas
(A, B y C). Los resultados obtenidos indicaron que la edad promedio de los productores
es de 35.8 aos; el peso promedio de las truchas en la zona A, B y C son 1.2, 1.8 y
1.6 kgrs. respectivamente. Entonces las variables son
_______________________________________________________________.
5. Si el ganadero Juan Prez, desea registrado el nmero diario de litros de leche
producidas, entonces la unidad elemental es ____________________.
6. Si se han definido cuatro rangos de las edades de una muestra de 100 agricultores:
de 18 a 25, de 26 a 40, de 41 a 60 y de 61 a ms aos, entonces la variable rango
de edades es del tipo ______________________________________.
7. Para un estudio sobre la contaminacin de un reservorio de agua, se extraen 400
muestras de dos litros de agua y se hall que el nmero promedio de bacterias fue
de 10.5. Entonces:
Poblacin: __________________________________________.
Unidad elemental: ____________________________________.
Variable: ___________________________________________.
8. En la ENAHO (Encuesta Nacional de Hogares) del 2011, respecto al material
predominante en las viviendas, el 65% es de material noble, el 20% de calamina, el
10% de esteras y 5% otros. La variable en estudio es de tipo _________________.
9. Si un establecimiento de salud del MINSA registra trimestralmente el nmero de nios
atendidos menores a 5 aos, entonces la unidad elemental es __________ y la
variable es del tipo _______________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
12
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
CAPTULO II
ORGANIZACIN DE DATOS
Tabla de frecuencias
1 Atributo 1 f1 fr1 p1
2 Atributo 2 f2 fr2 p2
.
.
.
K Atributo k fk frk pk
Total n 1 100
Donde:
k= Nmero de clases
n= Nmero de observaciones o unidades elementales
Tipo de grficos
Se pueden usar las frecuencias absolutas (fi) o relativas (fri) para elaborar dos tipos de
grficos
Grfico de barras vertical u horizontal
Grfico circular
13
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 1
Se hizo una encuesta a una muestra de 45 clientes del Banco Comercial y se obtuvo los
siguientes resultados:
Tarjeta
Ingreso N de Monto de
de Lugar de uso de
Caso Edad Mensual viajes deuda Sexo
crdito tarjeta de crdito
(miles de S/.) (mensual) (miles de S/.)
usada
1 29 3.00 3 Ta1 centros comerciales 1.80 F
2 34 1.99 3 Ta2 discotecas 1.10 F
3 61 2.90 2 Ta3 restaurantes 0.60 M
4 28 4.70 0 Ta2 grifos 2.70 M
5 41 3.00 1 Ta4 centros comerciales 1.30 F
6 57 5.80 2 Ta1 otros 0.80 F
7 30 4.50 4 Ta4 grifos 0.64 M
8 43 7.09 0 Ta3 centro de estudios 0.90 F
9 45 4.40 1 Ta5 centros comerciales 1.40 M
10 35 6.82 0 Ta2 grifos 2.46 F
11 42 5.30 3 Ta1 restaurantes 1.10 F
12 28 5.80 2 Ta4 discotecas 0.20 M
13 28 5.70 1 Ta2 grifos 0.80 F
14 24 4.70 4 Ta4 restaurantes 0.50 M
15 35 6.60 1 Ta5 discotecas 0.40 F
16 42 6.60 2 Ta4 restaurantes 3.46 F
17 48 5.74 1 Ta1 discotecas 1.20 M
18 34 4.23 0 Ta5 centros comerciales 1.90 F
19 66 5.50 3 Ta1 restaurantes 2.35 M
20 36 6.60 1 Ta4 centros comerciales 1.90 F
21 59 3.85 1 Ta4 restaurantes 0.30 M
22 37 6.70 3 Ta6 centros comerciales 0.70 F
23 53 3.50 0 Ta5 restaurantes 0.67 F
24 35 8.80 1 Ta1 discotecas 0.50 F
25 63 10.00 4 Ta5 restaurantes 1.50 M
26 28 10.10 2 Ta1 centro de estudios 0.70 F
27 43 13.40 2 Ta2 discotecas 1.50 F
28 60 3.90 0 Ta5 otros 1.99 M
29 59 5.84 1 Ta5 restaurantes 0.60 M
30 63 3.50 1 Ta4 grifos 1.50 M
31 55 4.40 2 Ta2 centro de estudios 0.40 M
32 42 3.70 0 Ta5 centros comerciales 1.80 F
33 51 4.50 1 Ta1 otros 0.70 M
34 39 5.63 1 Ta1 otros 0.80 M
35 55 4.60 4 Ta1 discotecas 1.25 M
36 35 5.79 0 Ta5 discotecas 1.60 M
37 42 2.93 3 Ta5 grifos 0.20 M
14
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Tarjeta
Ingreso N de Monto de
de Lugar de uso de
Caso Edad Mensual viajes deuda Sexo
crdito tarjeta de crdito
(miles de S/.) (mensual) (miles de S/.)
usada
38 36 6.60 1 Ta3 grifos 4.37 F
39 49 4.60 0 Ta3 centros comerciales 2.00 M
40 27 6.60 0 Ta4 grifos 0.90 F
41 36 2.90 4 Ta1 discotecas 0.47 M
42 42 4.69 2 Ta2 centros comerciales 0.80 F
43 25 3.99 1 Ta4 restaurantes 4.32 F
44 32 6.70 2 Ta1 centros comerciales 0.60 M
45 28 2.58 1 Ta4 otros 1.70 M
f3 = 4 indica que 4 de los clientes del Banco Comercial utilizan la tarjeta de crdito
Ta3
fr1 = 0.2667 indica la proporcin de clientes del Banco Comercial que utilizan la tarjeta
de crdito Ta1.
p2 = 15.56 indica que el 15.56% de clientes del Banco Comercial utilizan la tarjeta de
crdito Ta2.
Grfico de Barras
25
20
%
15
10
0
Ta1 Ta2 Ta3 Ta4 Ta5 Ta6
Tarjeta de crdito
Grfico Circular
Ta2
Ta4 7, 15.6%
11, 24.4%
Ta3
4, 8.9%
16
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Tabulaciones cruzadas
Edad
Sexo De 15 a De 21 a De 26 a De 31 a De 36 a Ms de Total
20 aos 25 aos 30 aos 35 aos 40 aos 40 aos
Masculino 126214 169306 60006 21465 10651 12503 400145
Femenino 150859 159091 42243 15313 7333 7986 382825
Total 277073 328397 102249 36778 17984 20489 782970
Fuente: PER, II Censo Nacional Universitario 2010
17
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Tabla de frecuencias
N de clase Valor de la (fi) (fri) (pi)
variable
1 x1 f1 fr1 p1
2 x2 f2 fr2 p2
.
.
.
k xk fk frk pk
Total n 1 100
Tipo de grfico. Se elabora el grfico de bastones o varas con las frecuencias absolutas,
relativas o porcentual.
Interprete:
f2 = 15 Existen 15 clientes del Banco Comercial que hacen un viaje al mes.
p1 = 22.22 El 22.22% de los clientes no han realizado viajes.
Viajes al mes
35
30
25
20
%
15
10
0
0 1 2 3 4
Viajes
1 3 3 5 6 6 9 9 10 10
1 3 5 5 6 3 9 10 3 1
10 3 5 5 6 5 9 10 1 1
3 3 5 6 6 5 9 5 3 1
b. Interprete f3 y p3
El conjunto de datos es agrupado por intervalos de clase que conforman las clases o
categoras de la tabla de frecuencias.
Tabla de frecuencias
N de Intervalos Marca Frec. Frec. Frec. Frec. Frec. Frec.
clases de clase de Absoluta Relativa Porc. Acumulada Acumulada Acum.
clase Absoluta Relativa Porc.
[LI-LS> xi' fi fri pi Fi Fri Pi
19
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Donde:
2
de clase
Fi
fj i
Fri
n
j 1
n
j 1
f rj
t
Propiedad: Frt Frh fr
ih1
i , h t
Frecuencia Acumulada Porcentual (Pi). Indica el porcentaje de observaciones o
unidades elementales que hay desde la primera clase hasta la clase i.
t
Propiedad: Pt Ph p
ih1
i , h< t
20
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Paso 5. Realizar el conteo del conjunto de datos, como el resultado de asignar cada
observacin a alguno de los intervalos de clase. Luego completar la tabla hallando xi , fi ,
fri , Fi , Fri .
Tipos de grficos
Histograma. Se usan las frecuencias absolutas o relativas en el eje vertical y los
intervalos de clase en el eje horizontal.
Polgono. Se usan las frecuencias absolutas o relativas en el eje vertical y las
marcas de clase en el eje horizontal.
Organicemos las observaciones de la variable ingreso mensual de los clientes (en miles
de nuevos soles).
TIC 1.90167
21
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Marca Frec
Frec. Frec. Frec. Frec. Frec.
Ingreso de .
Rel. Porc. Acum. Acum. Acum.
N de mensual clase Abs.
Abs. Rel. Porc.
clases [LI-LS>
xi' fi
fri pi Fi Fri Pi
1 [1.99 - 3.90> 2.945 11 0.2444 24.44 11 0.2444 24.44
2 [3.90 - 5.81> 4.855 20 0.4444 44.44 31 0.6888 68.88
3 [5.81 - 7.72> 6.765 10 0.2222 22.22 41 0.9110 91.10
4 [7.72 - 9.63> 8.675 1 0.0222 2.22 42 0.9332 93.32
5 [9.63 -11.54> 10.585 2 0.0444 4.44 44 0.9776 97.76
6 [11.54-13.45] 12.495 1 0.0222 2.22 45 1.000 100
45 1.0000 100
Fuente: Elaboracin propia
Interprete:
a. f2 = 20; 20 de los clientes tienen un ingreso mensual de por lo menos S/. 3900
pero menos de S/. 5810.
c. p5 = 4.44; 4.44% de los clientes ganan por lo menos S/. 9630 pero menos de
S/. 11540.
3
d. F3 fi f1 f 2 f3 11 20 10 41 41 de los clientes ganan mensualmente por
i 1
e. F5 F2 = 44 31 =13
5
F5 F2 = f
i 3
i f3 f 4 f5 10 1 2 13 13 de los clientes ganan por lo menos
3
h. P3 pi p1 p2 p3 24.44 44.44 22.22 91.10 , indica que el 91.10% de los
i 1
clientes tienen ingresos mensuales de por lo menos S/.1990 pero menos de S/.7720
22
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
j. x3' 6.765 es el valor representativo de los clientes que ganan por lo menos S/.5810
pero menos de S/.7720. Las diez observaciones (f3 = 10) que hay en la clase 3 son
representadas por el valor S/. 6765.
Histograma de frecuencias
Ingreso Mensual
50
40
30
%
20
10
0
1.99 3.90 5.81 7.72 9.63 11.54 13.45
Ingreso
Polgono de frecuencias
Ingreso Mensual
Series1, 4.855, 20
Series1,
Series1, 8.675, 10.585, 2
1 Series1,
Series1, 1.035, 0 Series1, 12.495,
14.405, 1
0
Fuente: Elaboracin propia
En el polgono de frecuencias se observa que son pocos los clientes con ingresos
mensuales altos.
23
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
24
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
25
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
d. Interprete f4 , F4 , 100-P2
26
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
8 12
8 12 10
8 12 8
9 16 6
9 16 4
9 16 2
12 16 0
12 17 amarilla negra blanca tomasa serrana
12 17 Serie1 3 5 9 2 1
12 18
Variedad de papa
Fuente: Estudio Experimental.
27
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Prctica Dirigida N 1
28
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
29
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
30
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
31
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
EJERCICIOS PROPUESTOS
32
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
2. La siguiente informacin se tom de los registros del Hospital Centro de Salud Materno
Infantil San Bartolom. Seccin Maternidad entre el 18 y el 22 de Mayo del 2012.
Madre Hijo
Caso Edad Estado Civil No de partos Peso Sexo
1 25 conv 2 2.90 F
2 22 conv 2 2.90 F
3 32 conv 4 4.04 M
4 22 conv 1 4.35 F
5 18 casada 1 3.60 M
6 21 casada 3 3.50 M
7 20 soltera 2 3.20 M
8 19 casada 1 3.00 F
9 23 casada 3 3.60 M
10 26 casada 2 2.80 M
11 36 casada 5 3.00 M
12 30 conv 5 3.30 F
13 23 soltera 3 3.10 F
14 29 conv 4 3.30 F
15 22 conv 2 3.30 F
16 23 casada 1 3.50 F
17 27 conv 2 3.62 M
18 28 conv 3 3.30 F
19 19 conv 1 2.65 F
20 32 casada 2 2.86 F
21 17 conv 1 2.62 M
22 21 conv 2 3.56 F
23 18 casada 2 3.10 M
24 27 conv 3 3.62 F
25 21 casada 1 3.18 M
26 19 casada 1 2.95 M
27 19 conv 2 3.90 M
28 31 casada 3 3.00 F
29 32 casada 4 4.00 F
30 21 conv 2 3.85 M
31 23 casada 2 2.75 F
32 19 casada 1 3.18 F
33 19 conv 1 3.14 F
34 26 conv 3 3.08 F
35 18 casada 1 2.80 F
36 24 casada 2 3.40 M
37 30 casada 3 3.00 F
38 26 casada 3 3.05 F
39 19 casada 1 2.90 F
40 34 casada 3 3.10 F
33
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Madre Hijo
Caso Edad Estado Civil No de partos Peso Sexo
41 28 casada 3 3.40 M
42 24 casada 2 2.97 F
43 26 casada 2 2.94 F
44 22 casada 2 3.80 M
45 34 casada 5 4.65 F
34
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
5. Los siguientes datos corresponden a la longitud de la cabeza del feto a los 45 das de
gestacin de un total de 60 ovejas que produjeron un solo feto y de las cuales el da
de apareamiento es conocido. Las medidas estn en mm y fueron obtenidas con
imgenes de ultrasonido:
19.4 20.4 21.0 21.6 21.9 21.9 22.0 22.1 22.1 22.2 22.3 22.3
22.6 22.7 22.7 22.7 22.8 22.9 23.0 23.1 23.2 23.2 23.4 23.6
23.6 23.6 23.7 24.0 24.0 24.0 24.0 24.0 24.1 24.1 24.3 24.4
24.5 24.6 24.7 24.7 24.8 24.8 25.0 25.0 25.0 25.2 25.3 25.3
25.5 25.5 25.5 25.6 25.6 25.6 25.8 25.9 26.0 26.4 26.9 27.5
105 105 107 108 108 108 109 109 110 111 111 111
113 114 114 117 118 119 121 121 123 125 126 126
126 126 128 129 130 131 134 134 137 145 145 150
150 152 153 154 157 157 158 164 170 171 179 183
7. Se ha llevado a cabo un estudio para evaluar los volmenes de venta (miles de soles
por da) de los establecimientos comerciales de un distrito de Lima. Para ello se
eligieron al azar 36 establecimientos encontrndose los siguientes resultados:
1.5 2.1 2.5 3.2 3.7 4.4 4.5 4.6 4.6 4.6 4.7 5.2 5.3 5.4 5.7 5.7 5.8 6.1
6.4 6.7 6.7 7.2 7.4 7.4 7.7 7.8 8.4 8.4 8.5 8.7 9.1 9.8 10.1 11.7 12.1 15.4
8. En una fbrica de pernos se desea estimar el nmero de pernos defectuosos por caja
para verificar si estos valores estn dentro de los lmites permisibles. Se selecciona
una muestra de 40 cajas y se obtienen los siguientes resultados:
1 1 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4
4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 7 7
10. Un Ing. Pesquero est realizando un estudio sobre el salmn plateado con la finalidad
de introducirlo al pas. Una de las variables de inters es la longitud (en centmetros).
El resultado luego de la evaluacin a 45 peces elegidos al azar de esta especie se
presenta a continuacin:
36
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Preguntas de Autoevaluacin
4.051
12.106
35.09
9. El nmero de decimales del Tamao de Intervalo de Clase (TIC), debe ser siempre
igual a _________________________________
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
37
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
CAPTULO III
MEDIDAS ESTADSTICAS
Las medidas estadsticas pueden ser calculadas con los datos provenientes de una
poblacin (N: Tamao de la poblacin) o muestra (n: Tamao de la muestra) para evaluar
diferentes variables (cuantitativas y cualitativas), cuya finalidad es resumir y representar
el conjunto de datos.
Observaciones
Las medidas estadsticas asumen las mismas unidades de medida de la variable en
estudio, con la excepcin de ciertas medidas estadsticas relativas.
Para las variables cuantitativas, se pueden calcular medidas estadsticas como:
media, mediana, moda, rango, rango intercuartlico, varianza, desviacin estndar,
coeficiente de variabilidad, y otras. En el caso de las variables cualitativas, slo es
posible calcular las medidas como la moda y la proporcin.
La media aritmtica
La media ponderada
La mediana
La moda
N
1 1 n
Media poblacional:
N
Xj
j 1
Media muestral: X Xj
n j 1
Ejemplo 1
Suponga que se tiene los datos de las ventas semanales (en dlares) de una muestra de
8 vendedores. Calcule la venta promedio semanal.
Solucin
1 8 150 120 300 280 350 250 160 280 1,890
X
8 i 1
xi
8
8
236.3
38
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 1. Los siguientes datos corresponden a una muestra de 12 auditores sobre los
gastos de viticos (nuevos soles) realizados en un mes. Halle e interprete la media.
250.5 420.0 345.5 560.4 458.2 268.5 380.1 510.2 630.4 580.3 610.3 720.1
Propiedades:
1. La media est afectada por valores extremos (altos o pequeos). Es una desventaja
de la media.
2. La media aritmtica localiza la parte central de un conjunto de observaciones.
3. Para un conjunto de observaciones la media es nica.
4. Si la media sustituye a cada observacin, la suma total no cambia.
5. La suma de las desviaciones de las observaciones con respecto al promedio es igual
X
n n
a cero. j X Xj n X n X n X 0
j 1 j 1
6. La suma de los cuadrados de las desviaciones de las observaciones con respecto a la
X X c , donde c R
n 2 n
2
media es mnima: j X j
j 1 j 1
Ejemplo 2
Los siguientes datos corresponden a los ingresos mensuales de dos grupos de empleados:
Grupo Ingreso x
A 520 525 518 523 545 580 510 500 527.625
B 530 545 520 8000 580 590 560 600 1490.625
1 8 4221
Propiedad 1. Para A : X
8 i 1
Xi
8
527.625
1 8 11925
Para B : X X i 8 1490.625
8 i 1
En el grupo A el promedio es similar a los 8 valores (promedio representativo), mientras
que en el grupo B eso no ocurre (el valor 8000 es un dato extremo alto).
8 8
Propiedad 5. Para A : (X i 1
i X ) X i n X 4221 8 x527.625 0
i 1
8 8
Para B : (X i 1
i X ) X i n X 11925 8 x1490.625 0
i 1
8 8
39
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
x
j 1
j wj
x1 w1 x2 w2 xk wk
xp
k
w1 w2 wk
w j 1
j
La media ponderada se usa en aquellos casos donde las observaciones tienen diferente
importancia dentro de una poblacin o muestra.
Casos particulares:
k k
Cuando los datos se encuentran en una tabla de
frecuencias correspondiente a una variable f
j 1
j xj f
j 1
j xj
cuantitativa discreta. La media se calcula por: xp k
f
n
j
j 1
Si x1 , x 2 ,..., x k son las medias de k grupos y cada
k
grupo tiene tamao n1 , n2 ,..., nk n
j 1
j xj
respectivamente, entonces la media de todos xp k
los datos n n1 n2 ... nk se calcula por:
n
j 1
j
Ejemplo 3
Un empresario que vende ropa para Caballeros, posee dos tiendas, administradas por
Gerentes contratados, los ternos vendidos por estas tiendas son comprados a un
proveedor a un costo de 150 nuevos soles
La tienda A vendi 95 ternos al precio original de 400 nuevos soles, luego de esto
en una oferta vendi 126 ternos a 280 nuevos soles. y por cierre de temporada
vendi los 79 ternos restantes a 200 nuevos soles.
La Tienda B, ha vendido el 30% de sus ternos a 400 nuevos soles, el 40% a 300
nuevos soles y el resto al precio de costo.
40
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
41
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
La mediana
n 1
100 50 Entero E me x E
Si
n 1 50 Decimal E.d me x 0.d x
100
E E 1 x E
n impar me X n 1
( )
2
Otra forma:
Si X n X n
( ) ( 1)
n par me 2 2
Ejemplo 4
Los siguientes datos corresponden a los pesos (en Kg.) de 10 personas: 50, 77, 53, 76,
63, 64, 75, 54, 52, 80. Calcule la mediana
Datos ordenados: 50, 52, 53, 54, 63, 64, 75, 76, 77, 80
10 1
Posicin : 50 5.5 me x5 0.5 x6 x5 63 0.5 64 63 63.5 Kg.
100
Interpretacin. Un 50% de personas pesan menos de 63.5 Kg. y el otro 50% pesa ms
de 63.5 Kg.
Ejercicio 4. En un estudio del medio ambiente para evaluar la calidad de aire, se registr
el nmero de microgramos de partculas en suspensin por mt2 de aire para muestras
evaluadas en dos zonas.
Zona A 38 32 45 30 24 45 42 18 28
Zona B 25 28 25 32 26 35 54 38
42
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Propiedades:
1. La mediana divide las n observaciones en dos partes iguales. El 50% con valores
menores a la mediana y el otro 50% con valores mayores a la mediana.
2. La suma de las desviaciones absolutas de las observaciones con respecto a la mediana
n n
es un valor mnimo. j 1
X j me X j c , donde c R
j 1
3. La mediana no est influenciada por valores extremos.
Ejemplo 5
Los siguientes datos corresponden a los ingresos mensuales de dos grupos de empleados:
Grupo Ingreso me
A 520 525 518 523 545 580 510 523
B 530 545 520 8000 580 590 560 560
Solucin
Se observa que la mediana no est afectada por el valor extremo 8000, como es la media.
La moda
La moda de un conjunto de datos es el valor que ocurre con mayor frecuencia. La moda
poblaciones se representa por Mo y la moda muestral por mo.
Propiedades:
1. La moda puede no existir o puede haber ms de una moda en un conjunto de datos.
2. La moda no est afectada por valores extremos.
3. Se aplica tanto para informacin cualitativa como cuantitativa.
Ejemplo 6
1. Se tiene las longitudes de peces de ro (cm) de la zona A: 4.0, 4.1, 4.2, 4.3, 4.5, 4.7,
4.8. No hay moda.
2. Las siguientes longitudes sonde la zona B: 4.0, 4.1, 4.1, 4.1, 4.2, 4.2, 4.5, 4.2.
Se distinguen dos modas mo1 = 4.1 y mo2 = 4.2 (distribucin bimodal).
Ejercicio 5. Se tiene una muestra de los niveles de ozono alrededor de una ciudad (220
partes por billn). Halle e interprete la moda.
160 124 156 164 178 163 163 178 164 185 196 164 170 145 164
43
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
X i fi
Use la expresin: X i
, donde k es el nmero de clases y n el tamao de la
n
muestra.
44
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Propiedades de transformacin
Para una nueva variable transformada: Yi a bX,i donde a y b son constantes reales.
Entonces, sus medidas estadsticas son calculadas:
Medida estadstica Yi a bX i
Media Y a bX
Mediana meY a bmeX
Moda moY a bmoX
Ejemplo 7
En un parque de atracciones la media de los gastos por visitante un da especial es de
S/.40, sabiendo que los adultos gastaron una media de S/.43 y los nios S/.35.
a. Calcule el nmero de adultos y nios que visitaron el parque, si en total fueron 400
personas.
n Adultos * x Adultos nNios * x Nios n Adultos * 43 nNios * 35
xp 40
Se tiene: n Adultos nNios 400
n Adultos nNios 400
Entonces: n Adultos 150 y n Nios 250
b. Si los gastos por asistir al parque de atracciones se incrementaron en un 10% en el
caso de los adultos y en un 5% en el caso de los nios. Cul ser ahora el promedio
de los gastos por visitante?
y Adultos 1.1* x Adultos 1.1* 43 47.3 150 * 47.3 250 * 36.75
yp 40.76
y Nios 1.05 * x Nios 1.05 * 35 36.75 400
45
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 8
Se cuenta con los datos de los tiempos (en minutos) de tardanza de los trabajadores de
una compaa de seguro. Halle e interprete el percentil 45.
15 12 18 22 24 10 9 13 25 18 6 14
Datos ordenados: 6, 9, 10, 12, 13, 14, 15, 18, 18, 22, 24, 25
12 1
Posicin 45 5.85 P45 x5 0.85 x6 x5 13 0.85 14 13 13.85 min utos
100
1 2 3 5 6 7 9 9 12 18
1 3 5 5 6 7 9 11 12 18
1 3 5 5 6 8 9 11 15 19
2 3 5 6 6 8 9 11 18 23
46
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
b. Cul debe ser el valor mnimo de insectos para que una parcela sea considerada
dentro del 18% de las parcelas con mayores nmeros de insectos?
c. Cul debe ser el valor mximo de insectos para que una parcela sea considerada
dentro del 22% de las parcelas con menores nmeros de insectos?
Ejercicio 10. Se tiene las notas de los promedio ponderados de los estudiantes
graduados en el ltimo ciclo. Halle el promedio ponderado mnimo para que un alumno
sea considerado dentro del quinto superior.
10.5 10.9 11.2 11.3 11.5 11.5 11.7 12.8 12.9 13.6 13.7 13.9 14.0 15.6
47
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Cuartiles
Son percentiles que dividen el conjunto de datos en 4 partes iguales (25% cada una).
Son conocidos tambin como Q1=P25, Q2=P50 y Q3=P75.
Ejemplo 9
Los siguientes datos corresponden a los pesos, en Kg. de 10 personas: 50, 52, 53, 54,
63, 64, 75, 76, 77, 80.
b. Halle el percentil 75
P75 x 101 x8.25 x8 0.25 x9 x8 76 0.25 77 76 76.25 Kg
75
100
Interpretacin: Un 75% de personas pesa menos de 76.25 Kg. y el otro 25% pesa
ms de 76.25 Kg.
Ejemplo 10
Se ha desarrollado un experimento para evaluar el efecto de alimentos balanceados en
la ganancia de pesos de pollos. Una muestra aleatoria de 30 pollos que recibieron el
alimento balanceado fue seleccionada. Al cabo de 10 das se registraron las ganancias de
pesos (en gr)
93 98 100 102 107 109 110 110 111 111 113 114 115 116 118
118 119 119 120 120 120 124 125 128 129 129 130 135 138 141
a. Halle e interprete las medidas de tendencia central para la ganancia de peso.
b. Cul es el peso mnimo de un pollo que fue alimentado con el alimento balanceado
para estar en el 10% superior de los que pesan ms?
c. Cul es peso mximo del 60% de pollos que pesan menos con el alimento
balanceado?
Solucin:
a)
N Media StDev CoefVar Minimo Q1 Mediana Q3 Maximo
30 117,40 11,57 9,85 93,00 110,00 118,00 125,75 141,00
48
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Paso 1. Cada dato se divide en dos: la primera se llama tallo y la segunda hoja.
Paso 2. Cada tallo se forma con uno o ms dgitos iniciales de cada dato y las hojas se
forman con los dgitos restantes (generalmente de un solo dgito).
Paso 3. Los tallos se presentan en una columna ordenada de menor a mayor
Paso 4. Las hojas se muestran en filas ordenadas y listadas a la derecha de su respectivo
tallo.
Nota.-
En caso de datos decimales, al construir el diagrama de tallos y hojas el punto decimal
se pierde, por tal razn se acostumbra indicar unidades que los datos del tallo
representan. Por ejemplo para un dato: 4.12 Unidad=0.01
Es necesario pone todos los tallos consecutivos. Si no existe el dato, se pone el valor
del tallo y en la fila de hoja se deja en blanco.
Si es necesario se divide en dos hojas cada tallo, segn los rango: (0 4) y (5 9).
Ejemplo 11
Los siguientes datos corresponden a la estatura de una muestra de 30 alumnos
universitarios.
158, 159, 161, 161, 163, 163, 164, 166, 166, 167, 168, 168, 168, 169, 170, 170, 170,
171, 171, 171, 172, 173, 174, 174, 174, 174, 174, 177, 182, 191
2 15 89
7 16 11334 Hojas
14 16 6678889
(13) 17 0001112344444
3 17 7
2 18 2
1 18
1 19 1
El diagrama de tallos y hojas representa la estatura de 30 alumnos. Existen tres partes
en el grfico.
La primera columna representa la profundidad
La segunda columna representa los tallos
La ltima columna representa las hojas.
Cada dgito de las hojas representa una observacin.
El diagrama de tallos y hojas muestra 8 tallos con sus respectivas hojas. El primer tallo
es 15 y la primera hoja es 8. La observacin correspondiente es 158 que se obtuvo
juntando los dgitos del tallo y de la hoja y se multiplica por la unidad de hoja
(158*1.0=158).
La primera columna (la profundidad) indica cuantas observaciones hay en esa lnea o
antes. El nmero 14 en la tercera lnea indica que hay 14 observaciones en esa lnea y
en las lneas anteriores (14 observaciones menores o iguales a 169). Hay una lnea
49
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
especial, la lnea que contiene la mediana. El valor que muestra es encerrado entre
parntesis e indica cuantas observaciones hay en esa lnea. A partir de la siguiente lnea
que contiene la mediana, la columna de profundidad indica cuantas observaciones hay
en esa lnea y en las lneas posteriores. El nmero 3 en la quinta lnea indica que hay 3
observaciones en esa lnea y en las lneas posteriores (3 observaciones mayores o iguales
a 177).
2 10 58
3 11 2
4 11 9
7 12 033
7 12 6
6 13 03
4 13 6
3 14 2
2 14 5
1 15
1 15 6
a. Si se desconocen los datos originales, calcule la media, mediana, moda y P28 a partir
del diagrama de tallos y hojas.
50
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
2.1, 2.5, 2.8, 3.5, 3.6, 3.8, 3.8, 4.6, 5.2, 5.4, 5.6, 5.9, 6.2, 6.5, 6.5
1 2 1
3 2 58
3 3
7 3 5688
7 4
(1) 4 6
7 5 24
5 5 69
3 6 2
2 6 55
a. A partir del diagrama de tallos y hojas calcule e interprete la media, mediana y moda.
51
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Prctica Dirigida N 2
b) Se desea clasificar a los individuos tres grupos segn sus niveles de ecdisona
(Bajo, Medio y Alto), de tal manera que contengan al 42%, 38% y 20% de
individuos respectivamente. Calcule los niveles de ecdisoma que permitan
identificar los lmites de cada grupo.
52
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
c) A fin de mejorar el proceso de muda de los crustceos, se han ensayado dos tipos
de dosis (A y B). Con el tipo A, se espera que el nivel de ecdisoma se incremente
en un 12.5% pero con un reduccin de 5.6 ml por cada individuo, mientras que
con la dosis B, los niveles de ecdisoma disminuirn en un 4.5% pero ms 8.5 ml
por cada individuo. Cul de las dos dosis proporcionara los mayores niveles
promedios de ecdisoma en los crustceos?. Justifique su respuesta.
1 4 2
61 6 7 4
6 5 223344
10 5 5566
(12) 6 112233444444
9 6 8999
4 7 344
1 7 9
53
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
EJERCICIOS PROPUESTOS
1 4 3 1 2 6
4 4 678 3 3 01
(4) 5 2244 3 4
5 5 5 5 5 08
4 6 4 5 6
3 6 99 7 7 14
1 7 4 7 8 5
6 9 069
3 10 1
2 11 45
54
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
4. Una fbrica tiene una mquina que trabaja las 24 horas del da en tres turnos de 8
horas (maana, tarde y noche). Los costos de produccin por hora (en soles) y los
tiempos de produccin por artculo que dependen del turno. Los datos se presentan a
continuacin:
5. Del ejercicio anterior. Suponga que un trabajador que labora con la mquina en la
maana cobra 36 soles, un trabajador que labora en la tarde cobra 40 soles, y un
trabajador que labora en la noche cobra 50 soles diarios. Cul es el costo promedio
por hora que tiene la fbrica considerando la labor del trabajador y el costo de
produccin de energa elctrica?
X 0 1 2 3 4
fi 50 12 8 7 3
Si la produccin por hora es de 40 camisas y cada camisa buena genera una utilidad
de 120 soles adems cada camisa defectuosa da lugar a una prdida de 40 soles.
Calcule la utilidad neta promedio por da (Considere 6 horas de trabajo efectivo por
da).
6 7 7 7 7 8 8 8 8 8
9 9 9 9 9 9 10 10 10 11
2 19 3 3 19 3 9 3 9 9 3 5 2 5 5 1 5 1 1 5
5 6 6 18 18 6 6 18 6 11 11 11 11 7 7 7 8 12 8 12
3 5 3 4 1 2 3 2 4 5 7 1 3 4 2
2 1 5 2 2 4 6 7 4 7 6 4 6 4 3
10. Parra evaluar la efectividad de sus empleados, una empresa dedicada a la venta de
telfonos celulares ha recopilado la siguiente informacin sobre el nmero de
telfonos vendidos en la ltima semana por sus 64 empleados:
Nmero de empleados 13 15 16 8 5 4 3
Nmero de ventas 5 6 7 8 9 10 11
Calcule las medidas de tendencia central para estos datos. Interpretar: Media,
Mediana y Moda.
Variedades
Variedad Kent Variedad Haden
N de N de
Rend. Rend. Tallo y Hoja de Haden N = 22
Ha Ha
1 9.0 12 13.1 Unidad de Hoja = 0.10
2 11.9 13 13.2 8 10 22388999
(6) 11 266888
3 12.6 14 13.5
8 12 2233
4 12.6 15 13.5 4 13 344
5 12.6 16 13.7 1 14
6 12.8 17 13.8 1 15
7 12.8 18 13.8 1 16 5
8 12.8 19 14.1
9 12.9 20 14.1
10 12.9 21 14.3
56
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Preguntas de Autoevaluacin
1. Las medidas de tendencia central que no estn influenciadas por valores atpicos son
_______________________________________.
2. ___________________ es una medida de tendencia central que est afectada por los
valores extremos.
3. __________________ es una medida de tendencia central utilizada para resumir
datos provenientes de un variable tipo cualitativa.
4. En una muestra de 80 estudiantes, el 60% ha perdido un celular, el 20% dos celulares,
el 15% tres celulares y el resto ningn celular en los ltimos dos aos. Entonces el
percentil 56 es igual a ____________________________.
5. La suma de las desviaciones de las observaciones respecto a la media aritmtica, es
igual a _____________________.
6. La suma de las desviaciones absolutas de las observaciones con respecto a la
________________________ es un valor mnimo.
7. Los resultados de una encuesta sobre el porcentaje de satisfaccin de sus clientes
para dos empresas de seguro (A y B) se muestran en el siguiente cuadro:
Para comparar donde hay mayor satisfaccin de los clientes en las empresas A y B,
la medida de tendencia central usada es ____________________ y cuyos valores
usados son __________________________ respectivamente.
8. Una empresa aseguradora de autos ofrece a sus clientes cuatro planes de seguros (A,
B, C y D), siendo el costo anual de 650, 520, 450 y 380 (nuevos soles)
respectivamente. Si el 45% de sus clientes tienen el plan de seguro A, el 35% el B,
el 15% el C y el resto el plan D. El costo promedio de los cuatro planes de seguro
para la empresa aseguradora es igual a _____________________________
n
i 1
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
57
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
CAPTULO IV
1. La amplitud o rango
2. El rango intercuartil
3. La variancia y la desviacin estndar
4. El coeficiente de variabilidad
Ejemplo 1
Suponga que las notas de la primera prctica de tres grupos del curso de Estadstica
General fueron:
Grupo Notas x
A 14 14 14 14 14 14 14 14 14 14 14
B 14 13 15 14 12 15 16 13 12 16 14
C 19 8 19 11 16 18 6 13 10 20 14
Solucin
Del cuadro se observa que:
a. Los grupos A, B y C tienen la misma media pero diferente dispersin en torno a la
media.
b. Respecto a la variabilidad o dispersin: A < B < C
c. Respecto a la homogeneidad : A > B > C
d. Respecto a la confiabilidad de la media: A > B > C
El rango
R = Xmax - Xmin
Desventajas:
58
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 2
El rango de la nota para el grupo B es: RB = 16 12 = 4 puntos.
Esto indica que la amplitud de la nota de la primera prctica del grupo B fue de 4 puntos.
El rango intercuartil
Ejemplo 3
Para el grupo C: P75 = 19 y P25 = 9.5, entonces el rango intercuartil: RI = 19 9.5 =
9.5 puntos.
Esto indica que la amplitud del 50% central de las notas de la primera prctica para el
grupo C fue 9.5.
1 k 1 k
( fi X i2 nX )
2
Para una tabla de frecuencias: S2 f ( X X ) 2
n 1 i 1 n 1 i 1
i i
Se observa que la variancia est dada en las mismas unidades que la variable en estudio
al cuadrado. Por ejemplo si las unidades de las observaciones son Kg. entonces la
variancia se expresa en Kg2.
Ejemplo 4
Halle la variancia y desviacin estndar muestral de las notas para cada uno de los
grupos.
10
Grupo Notas x x
i 1
2
i
A 14 14 14 14 14 14 14 14 14 14 14 1960
B 14 13 15 14 12 15 16 13 12 16 14 1980
C 19 8 19 11 16 18 6 13 10 20 14 2192
Solucin
1 10 2 2
Grupo A: S A2 xi n x
n 1 i1
1
1960 10 x142 0 y SA 0
10 1
1 10 2 2
Grupo B: S B2 xi n x
n 1 i1
1
1980 10 x142 2.22 y S B 2.22 1.49
10 1
59
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
1 10 2 2
Grupo C: S
2
xi n x
n 1 i1
1
2192 10 x142 25.78 y SC 25.78 5.08
10 1
C
Se observa que a mayor variabilidad entre las observaciones, la variancia es mayor. Esta
comparacin se cumple siempre cuando los promedios sean similares.
Se observa que la variabilidad promedio de las notas de la primera prctica del grupo B
es 1.49 puntos.
Coeficiente de variabilidad
Ejemplo 5
Halle el coeficiente de variabilidad de las notas de la primera prctica para cada grupo.
SA 0
Grupo A: cvA
x100 x100 0
xA 14
S 1.49
Grupo B: cvB B x100 x100 10.6%
xB 14
S 5.08
Grupo C: cvC C x100 x100 36.3%
xC 14
Esto indica, que la variabilidad de la nota de la primera prctica del grupo C es 36.3% y
por lo tanto es el ms heterogneo por tener mayor cv en comparacin con el grupo A y
B.
Ejemplo 6
Los siguientes datos corresponden al tiempo (en minutos), al cabo del cual se duermen
las ratas despus de haber recibido un tipo de tranquilizante (A o B).
Tipo A Tipo B
n 18 ratas 20 ratas
x 9.94 min 15.2 min
s 2.81 min 2.84 min
60
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 1. Los siguientes datos corresponden a las mediciones de la emisin diaria (en
toneladas) de xido de azufre de una planta industrial.
15.8 26.4 17.3 11.2 23.9 24.5 13.9 9.4 22.7 18.5
15.2 11.0 7.7 20.0 16.2
Calcule e interprete las medidas de variabilidad (Rango, Rango intercuartil, Varianza,
Desviacin estndar y Coeficiente de variacin).
Comparacin de la variabilidad
El cuadro indica que cuando se compara la variabilidad de dos conjuntos de datos, si las
variables tienen unidades de medidas diferentes; se debe usar los coeficientes de
variacin; mientras si las variables tienen unidades de medida iguales, se debe observar
si las medias son similares para usar la desviacin estndar y en caso que las medias
sean diferentes usar el coeficiente de variacin.
61
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Desviacin Coeficiente de
Promedio estndar variabilidad
a. Las ventas de la zona A son menos variables que las de la zona B. Justifique.
c. Para la zona A, las ventas son ms variables que el tiempo extra. Justifique.
Transformacin de datos
SY2 b 2 S X2
SY bS X
Ejemplo 7
En una empresa industrial desea mejorar la productividad de los obreros, para tal efecto
se escogi uno de los productos de la empresa para hacer el anlisis, y se tom el tiempo
que demoran 20 trabajadores del primer turno en ensamblar el producto, obtenindose
los tiempos siguientes (en minutos):
62
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
b. Inspeccionando el cronmetro con que se registr los tiempos se encontr que ste
estaba excediendo la medicin en 0.1 minutos. Cules seran entonces las reales
medidas halladas en a)?
Media = 3.525-0.1=3.425
Mediana = 3.25-0.1=3.15
S= 1.723
CV = 1.723/3.425*100 = 50.3%
Ejercicio 3. Considere los datos del ejercicio 2. Suponga que la empresa decide hacer
un pago adicional por las horas extras. A los vendedores de la zona A, se les pagar S/
10.0 por cada hora extra ms S/. 50 por movilidad. A los de la zona B, se les pagar S/
15.0 por cada hora extra.
Calcule la desviacin estndar y coeficiente de variabilidad para estos pagos adicionales
Ejercicio 4. Los sueldos de 100 empleados de una empresa tienen una media de $300 y
una desviacin estndar de $50. Se proponen dos alternativas de aumento A: $75 a cada
uno B: 15% del sueldo ms $20 a cada uno. Cul alternativa es la ms conveniente?.
Justifique su respuesta.
63
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
EJERCICIOS PROPUESTOS
1. En el mes de Julio el sueldo promedio de los trabajadores del Sector Educacin fue de
$200 dlares. Para el mes de Agosto se considera un aumento del 37% con respecto
al sueldo del mes anterior ms un adicional de $35 dlares. Si se obtuvo una
desviacin estndar igual a $ 3.15 en el mes de Julio. Se puede afirmar que la
distribucin de sueldos en Julio fue ms homognea?
2. En una industria el jornal diario de sus obreros tiene una media de $10 y una
desviacin estndar de $2. Si se hace un incremento del 20% en cada jornal y una
bonificacin adicional de $3. En qu porcentaje cambio el coeficiente de variacin de
los jornales?
3. Los sueldos de 100 empleados de una empresa tienen una media de $300 y una
desviacin estndar de $50. Se proponen dos alternativas de aumento i) $75 a cada
uno ii) 15% del sueldo ms $20 a cada uno Cul alternativa es la ms conveniente?
a) Si la empresa dispone solo de $37000 para pagar sueldos.
b) S la empresa quiere homogeneizar los sueldos
6. Se tiene una muestra aleatoria de tamao 20 con media 5 y variancia igual a 0.36,
si a cada observacin se le incrementa un 20% de su valor ms una cantidad de 4
unidades:
7. El sueldo promedio de los empleados de una empresa para el mes de Julio fue de S/.
1500 y un coeficiente de variabilidad de 30%. Si la gerencia decide dar un aumento
del 8% ms un monto por viticos de S/. 200 cada mes. Calcular el coeficiente de
variabilidad para el nuevo sueldo.
8. Para evaluar la efectividad de sus empleados, una empresa dedicada a la venta de
telfonos celulares ha recopilado la siguiente informacin sobre el nmero de
telfonos vendidos en la ltima semana por sus 64 empleados:
Nmero de empleados 13 15 16 8 5 4 3
Nmero de ventas 5 6 7 8 9 10 11
a. Calcule e intrprete las medidas de variabilidad.
b. La empresa le paga a sus empleados 100 soles semanales ms una comisin de
40 soles por celular vendido y sobre estos ingresos los empleados deben aportar
el 15% a su AFP. Calcule el promedio y la desviacin estndar para el ingreso neto
promedio semanal por empleado.
64
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
1 4 3 1 2 6
4 4 678 3 3 01
(4) 5 2244 3 4
5 5 5 5 5 08
4 6 4 5 6
3 6 99 7 7 14
1 7 4 7 8 5
6 9 069
3 10 1
2 11 45
a) Calcule e interprete las medidas de variabilidad para la sucursal de La Molina.
b) Qu conjunto de datos presenta mayor variabilidad?
c) Para la sucursal de los Olivos el inters que cobra el banco corresponde al 5% del
monto otorgado como prstamos ms 20 nuevos soles por gastos administrativos.
Mientras que para la sucursal de la Molina, se cobra 4.5% del monto otorgado. Se
puede decir que el inters que cobra la sucursal La Molina es menos variables que
el que cobra los Olivos.
11. En el mes de Marzo el sueldo promedio de los trabajadores del Sector Educacin fue
de $180 dlares. Para el mes de Abril se considera un aumento del 25% con respecto
al sueldo del mes anterior ms un adicional de $40 dlares. Si el coeficiente de
variacin del mes de Marzo fue de 0.15. Se puede afirmar que la distribucin de
sueldos en Marzo fue ms homognea?
12. Los sueldos de 150 trabajadores de una empresa tienen un coeficiente de variacin
del 5% en el mes de agosto. Para el mes de septiembre hay un aumento a cada
trabajador del 20% de su sueldo ms una bonificacin de $60 y el coeficiente de
variacin baja a 4%.
a) Calcule la media y la desviacin estndar de los sueldos del mes de agosto.
b) Cunto dinero adicional necesita la empresa para pagar todos los sueldos del
mes de septiembre?
65
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Preguntas de Autoevaluacin
1. La medida de variabilidad que mide la amplitud del 50% central de los datos, se
denomina ___________________________________________.
66
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
CAPTULO V
MEDIDAS DE ASIMETRA
Objetivo. Al finalizar este captulo el lector debe ser capaz de cuantificar e interpretar la
simetra o asimetra de una distribucin.
Ejemplo 1
Los siguientes grficos corresponden a la distribucin de los ingresos mensuales (miles
S/.) de muestras al azar de los clientes de tres sucursales (A,B y C) de una caja rural.
X me X me X me
Distribucin simtrica Distribucin asimtrica positiva Distribucin asimtrica negativa
o haca la derecha o haca la izquierda
Poblacional: As
3 Me
Muestral: as
3 X me
s
Propiedades
Un mayor (menor) valor del coeficiente de asimetra de Pearson indica un mayor (menor)
grado de asimetra de la distribucin de los datos.
67
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 2
Recordemos los datos de los ingresos mensuales del Banco Comercial que se trabajaron
en la parte de organizacin de datos. Con esa informacin se tienen los siguientes
valores: x 5.350 , me 4.700 , s 2.181 .
3 5.350 4.700
Por lo tanto as 0.8941 0 , entonces la distribucin de los ingresos
2.181
mensuales tiene una asimtrica positiva.
Ejercicio 1. Se desea realizar un estudio sobre la utilizacin del agua en tres zonas
rurales (A, B y C). Con esta finalidad se ha seleccionado al azar 8 casas de la zona A, 6
de la zona B y 10 de la zona C. Luego se registr el nmero de litros de agua consumidos
por un da, los cuales se presenta en el siguiente cuadro:
Estadsticas Descriptivas
68
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
El diagrama de cajas (Box plot) es una tcnica grfica que nos permite determinar:
1. Los valores extremos (outliers), valores atpicos o datos discordantes.
2. La asimetra de la distribucin que corresponde al 50% central de los datos.
3. La variabilidad del 50% central de dos o ms conjuntos de datos.
Valor Outlier
El bigote superior
se extiende al valor
ms alto que
* pertenece al
intervalo de
seguridad superior
Tercer
Cuartil (Q3)
Mediana
El bigote inferior se
extiende al valor s
Primer bajo que pertenece
Cuartil (Q1) al intervalo de
seguridad inferior
La caja contiene informacin del 50% de los datos ya que la lnea inferior de la caja
es el primer cuartil (Q1 = P25), y la lnea superior de la caja es el tercer cuartil (Q3 =
P75).
La lnea que divide a la caja es la mediana y su posicin dentro de ella nos brindar
informacin sobre la asimetra de la distribucin del 50% central de datos.
Los bigotes son las lneas que se extienden de la parte inferior y superior de la caja
hasta la observacin ms alta o ms baja dentro de los intervalos de seguridad.
3. Respecto a datos outliers. Son observaciones fuera de los lmites inferior y/o
superior y que se representan con asteriscos (*).
69
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 3
Se tienen los pesos de 10 personas del aula A: 50, 52, 53, 54, 63, 64, 75, 76, 85, 120.
Con estos datos se obtiene P25 = 52.75, P50 = me = 63.5, P75 = 78.25, RI = Q3-Q1 =
25.5
Luego se calculan los intervalos de seguridad inferior y superior.
ISI = P25 1.5 RI = 52.75 1.5 (25.5) = 14.5
ISS= P75 + 1.5 RI = 78.25 + 1.5 (25.5) = 116.5
120
110
100
90
Peso A
80
70
60
50
Se aprecia que hay un outlier o valor extremo superior (120 Kg. 116.5) que se
representa con un asterisco (*). En el caso inferior no existe ningn valor menor al lmite
inferior (14.5).
El lmite superior es 116.5. El bigote superior llega hasta el valor adyacente ms alto
dentro del lmite superior (78.25 a 116.5). En nuestro ejemplo el bigote superior llega
hasta 85.
El lmite inferior es 14.5. El bigote inferior llega hasta el valor adyacente ms bajo dentro
del lmite inferior (14.5 a 52.75). En nuestro ejemplo el bigote inferior llega hasta 50.
Ejemplo 4
Si se tienen los pesos de 10 personas del aula B: 54, 54, 54, 55, 55, 55, 55, 56, 56, 56.
Entonces P25 = 54, P50 = 55, P75 = 56, RI = 2, ISI = 51, ISS = 59.
120
110
100
90
80
70
60
50
Peso A Peso B
Peso A representa la caja del ejemplo anterior y Peso B la caja del ejemplo que se est
presentando. Se observa que en Peso B no hay valores extremos y que una caja ms
grande representa a datos ms variables (Peso A es ms variable que Peso B). Peso
B es simtrica (se verifica que me x 55 Kg )
70
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Clculos:
71
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Alimento A
93 98 100 102 107 109 110 110 111 111 113 114 115 116 118
118 119 119 120 120 120 124 125 128 129 129 130 135 138 181
Alimento B
Tallo y Hojas de Alimento B N = 60
Unidad de Hoja = 1,0
2 12 34
11 12 566788999
24 13 0000000011133
(12) 13 566678889999
24 14 001123
18 14 5669
14 15 0122
10 15 788899
4 16 0123
72
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
c. Construya un diagrama de cajas para las ganancias de peso de los pollos alimentados
con A y B. Interprete y compare los diagramas de cajas. (respecto a la simetra en
el 50% central de los datos, la variabilidad en el 50% de los datos y la presencia de
datos outliers).
73
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Prctica Dirigida N 3
Indice de rentabilidad
Minera Pesquera
6.0 16.8 Stem-and-Leaf Display:
7.2 18.2 Stem-and-leaf of x2 N = 15
7.9 Leaf Unit = 0.10
10.2 5 10 23899
(4) 11 2688
10.8
6 12 233
12.2
3 13 34
12.8
1 14
13.8
1 15
14.0
1 16 5
14.0
a) Cul debe ser el ndice de rentabilidad como mximo para que una empresa
minera este dentro del 35% de las de menor rentabilidad?.
74
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
a) Cul es la forma de la distribucin de los tiempos extras para cada uno de los
turnos?. Justifique su respuesta.
b) Si la empresa decide hacer un pago (en soles) de 12 a los trabajadores del turno
de maana por cada hora extra semanal ms 50 por movilidad y a los del turno
noche 7.5 por cada hora extra semanal. Cul de los turnos mostrar mayor
variabilidad respecto a los pagos por horas extras semanal?. Justifique su
respuesta.
75
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
c) Considere que los datos del tiempo extra semanal de los trabajadores de los
turnos maana y noche son los que se muestran en la siguiente tabla:
Maana 12.5 10.6 9.8 20.5 18.4 8.5 14.6 12.5 22.3 45.6 14.5 16.8 4.5
Noche 8.9 12.3 24.5 35.8 14.6 16.8 12.0 10.3 16.8 20.2 18.7 13.4 38.5
ss
ss
76
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
EJERCICIOS PROPUESTOS
7000
6000
5000
4000
3000
2000
1000
Medio-Alto Medio-Bajo
2. Una empresa que posee tres fbricas, ha observado el nmero de piezas diarias
producidas por cada una de ellas durante diez das elegidos al azar, obtenindose los
siguientes resultados:
10
x
i 1
2
i
Fabrica A 103 106 105 102 108 109 101 110 105 107 111590
Fabrica B 115 112 99 98 107 113 108 114 96 94 112100
Fabrica C 92 97 103 89 106 108 116 87 128 130 113610
77
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
ANDINA INTI
Tallo y Hojas de Andina 0.68 0.94
Unidad de Hoja = 0.010
0.89 0.95
1 8 3 0.89 0.99
3 8 58
7 9 1234 0.89 0.99
(5) 9 56679
3 10 1 0.89 1.04
2 10 5 0.89 1.09
1 11
1 11 5 0.89 1.11
0.90 1.11
1.1
Peso (en kg.)
1.0
0.9
0.8
0.7
Andina Inti
c) Utilice el grfico anterior para comparar la variabilidad y asimetra de las dos razas
en estudio.
2 0 68
(6) 1 022223
4 1 569
1 2
1 2 6
78
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Variedades
Variedad Kent Variedad Haden
N de N de
Rend. Rend.
Ha Ha Tallo y Hojas de Haden N = 22
1 9.0 12 13.1 Unidad de Hoja = 0.10
2 11.9 13 13.2
8 10 22388999
3 12.6 14 13.5
(6) 11 266888
4 12.6 15 13.5 8 12 2233
5 12.6 16 13.7 4 13 344
6 12.8 17 13.8 1 14
7 12.8 18 13.8 1 15
8 12.8 19 14.1 1 16 5
9 12.9 20 14.1
10 12.9 21 14.3
11 13.1 22 15.1
74 89 82 83 67 81 68 85 81 72
71 74 50 64 72 44 66 84 69 81
69 66 93 53 98 70 95 82 81 80
88 80 85 85 72 81 90 89 80 97
79
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Preguntas de Autoevaluacin
80
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
CAPTULO VI
PROBABILIDAD
Objetivo. Conocer los conceptos bsicos de las probabilidades; las reglas o axiomas que
la sustentan, as como, sus aplicaciones como medida de cuantificacin de la
incertidumbre.
Supngase que un conjunto est formado por grupos ordenados de n elementos (n-upla)
y que hay n1 posibles opciones para el primer elemento; por cada opcin del primer
elemento hay n2 posibles opciones del segundo elemento;...; por cada posible opcin de
los primeros n 1 elementos hay nk opciones del elemento n.
Ejemplo 1
El propietario de una casa desea efectuar algunas remodelaciones y requiere los servicios
de un distribuidor de utensilios de cocina, de un contratista plomero y de un contratista
electricista. Si, en la zona, hay 8 distribuidores de utensilios de cocina, 10 contratistas
plomeros y 5 contratistas electricistas. De cuntas formas se pueden seleccionar estos
tres servicios?
81
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
La regla de la adicin
Si un experimento 1 ocurre de n1 formas, 2 de n2, .., k de nk formas; entonces el
experimento que consiste en realizar 1 2 .. k (los experimentos no pueden
realizarse juntos) ocurre de n1 + n2 + + nk formas.
Permutaciones
PnN N N 1 N 2N n 2 N n 1
N!
Utilizando factoriales se obtiene: Pn
N
N n !
Ejemplo 2
En un campeonato de ftbol participan 12 equipos De cuntas maneras se pueden
ocupar los tres primeros puestos?
Sea el evento A = {Nmero de maneras que puede ocupar los 3 primeros puestos}
Total de equipos : N = 12
Seleccionar 3 equipos: n= 3
N (A) = P3
12
12 11 10 1320
Ejercicio 3. Un club social est formado por 10 personas. De cuntas maneras se puede
formar una comisin integrada por un presidente, un secretario y un vocal?
Casos especiales:
Ejemplo 3
Se tiene un grupo de 5 caballos para alquiler. Si llegan 5 personas para alquilar un caballo
cada una de ellas De cuntas maneras se puede hacer el alquiler?
82
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 4
En la casa comercial El Palco hay 4 sinfonas N 9 de Beethoven, 5 Sinfonas N 100 de
Haydn y 6 Sinfonas N 36 de Mozart. Suponga que se seleccionan con restitucin y
considerando el orden de extraccin 8 de estas obras maestras.
8!
n A 45 53 P5,3
8
45 53 7168000
5! 3!
b. De cuntas maneras sern seleccionadas 2 sinfonas de Beethoven, 2 de Haydn y 4
de Mozart?
8!
n A 42 52 64 P2,2,4
8
42 52 64 217728000
2! 2! 4!
Combinaciones
N N!
n n ! N n !
N N PnN N!
PnN n!
n n n! n ! N n !
Ejemplo 5
Al poco tiempo de ser puestos en servicio, algunos autobuses fabricados por cierta
compaa presentan grietas en la parte inferior del bastidor principal. Suponga que una
ciudad tiene 18 de estos autobuses, y que han aparecido grietas en 5 de ellos.
a. De cuntas formas se puede seleccionar sin restitucin y sin considerar el orden una
muestra de 7 autobuses de los 18 para una inspeccin completa?
18
n
18 !
Sea el espacio muestral entonces 31824
7 7 ! 11 !
5 13
n A 7150
3 4
83
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 4. Un club de Karate tiene 10 deportistas de los cuales 4 son cinturones negros
Ejemplo 6
Suponga los siguientes experimentos aleatorios:
E1 : Observar el nmero de la cara superior cuando se lanza un dado
E2 : Registrar el sexo del recin nacido
E3 : Observar el nmero de artculos defectuosos de un lote de 8.
E4 : Anotar el nmero de clientes que llegan a un supermercado en una semana
E5 : Observar el tiempo de duracin de un foco de luz (horas)
Espacio muestral ()
El espacio muestral es el conjunto de todos los posibles resultados (llamados puntos
muestrales) de un experimento aleatorio. Se considera a es el conjunto universal.
La cardinalidad de (nmero de elementos de un conjunto) se denota n().
Ejemplo 7
Los espacios muestrales asociados a los anteriores experimentos aleatorios son:
E1: 1 = {1,2,3,4,5,6} n(1)=6 Finito
E2: 2 = {Hombre, Mujer} n(2)=2 Finito
E3: 3 = {0,1,2,3,4,5,6,7,8} n(3)=9 Finito
E4: 4 = {0,1,2,. . . .} n(4)= Infinito numerable
E5: 5 = {T/ 0 t < } n(5)= Infinito no numerable
84
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 8
Si se observan los sexos de tres nios recin nacidos, el espacio muestral asociado ser:
= {MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF}
Ejemplo 9
Considere dos fbricas tales que en cada una hay 6 mquinas que fabrican un producto.
Sea el experimento aleatorio que consiste en determinar el nmero de mquinas que
estn en uso en un da particular. Un resultado experimental indica cuntas mquinas
estn en uso en la primera fbrica y cuantas estn en uso en la segunda (asuma que los
resultados son igualmente posibles). El espacio muestral ser igual a:
Segunda fbrica
0 1 2 3 4 5 6
0 (0, 0) (0, 1) (0, 2) (0, 3) (0, 4) (0, 5) (0, 6)
1 (1, 0) (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
Primera 2 (2, 0) (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
fbrica 3 (3, 0) (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 0) (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 0) (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 0) (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Eventos
Un evento es cualquier subconjunto de un espacio muestral. Se dice que un evento es
simple si est formado exactamente por un resultado y compuesto si consta de ms de
un resultado.
Ejemplo 10
Si se observan los sexos de tres nios recin nacidos, el espacio muestral asociado ser:
= {MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF}. Hay 8 eventos simples.
Ejemplo 11
Con relacin al ejemplo 9, hay 49 eventos simples. Ejemplos de eventos compuestos
son:
E = {(0, 0), (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} = {el nmero de mquinas en
uso es el mismo para ambas fbricas}
F = {(0, 3), (3, 0), (1, 2), (2, 1)} = {el nmero total de mquinas en uso es tres}
G = {(0, 0), (0, 1), (1, 0), (1, 1)} = {a lo sumo una mquina est en uso en cada fbrica}
Ejemplo 12
En el Ejemplo 11 los eventos E y F son mutuamente excluyentes en cambio los eventos
E y G no son mutuamente excluyentes.
85
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 13
En el Ejemplo 10 los eventos C y D no son colectivamente exhaustivos.
Evento complementario
Para un evento A definido sobre un espacio muestral , el evento complemento de A,
denotado por Ac est compuesto por todos los elementos que no pertenecen al evento de
A. Es decir, todo lo que le falta al evento A para ser el espacio muestral . Se cumple:
Ac A y Ac A
Ejemplo 14
En el ejemplo 5, para el evento C = {MFF, FMF, FFM} su complemento es C c = {MMM,
MMF, MFM, FMM, FFF}
86
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Se dice que es a priori por que antes de realizarse el experimento se puede determinar
cul es la probabilidad de que ocurra A.
Ejercicio 6. Una urna contiene 6 bolas blancas y 5 bolas negras. Si se extraen al azar y
sin reemplazo 4 bolas de la urna. Cul es la probabilidad de que una bola sea de color
blanco?
87
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
P A estimada frA
nA
frecuencia relativa del evento; es decir, . Tericamente la
n
P A lim frA lim
nA
probabilidad de A es: .
n n n
Ejemplo 15
La siguiente tabla de frecuencias corresponde a las temperaturas promedio de 24 horas
(C) registrados en cierto observatorio, en el mes de enero de cierto ao:
Ejemplo 16
Se tienen 4 cuyes de tipo I, 6 de tipo II y 7 de tipo III. Cinco cuyes son seleccionados al
azar.
1. Cul es la probabilidad de que 2 de los cuyes seleccionados sean de tipo I y los otros
3 de otro tipo si la seleccin es sin restitucin y sin considerar el orden de extraccin?
Solucin
4 I
6 II
7 III
N = 17, n = 5
88
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Solucin
Definicin axiomtica
Propiedades de probabilidad
89
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
A B
A Bc A B Ac B
Ac B c
P A B P A P B P A B
P A B c P A P A B
P A c
B P B P A B
P A c
B 1 P A B
c
P A c
B 1 P A B
c
Ejemplo 17
Los registros de una planta industrial indican que el 12% de todos los obreros lesionados
ingresan a un hospital para recibir tratamiento, el 16% regresa al trabajo al da siguiente
y el 2% ingresan a un hospital pero vuelven al trabajo al da siguiente. Si un obrero se
lesiona:
Sean los eventos: H = {un obrero lesionado ingresa a un hospital para tratarse}
T = {un obrero lesionado regresa al trabajo al da siguiente}
90
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 18
Se ha realizado una encuesta para determinar la adiccin de alguna droga en diferentes
profesionales. La encuesta se aplic a 900 profesionales a los que se les pregunt si
consumen alguna droga, los resultados se muestran en la siguiente tabla:
P A C P( A) P(C ) P( A C )
250 250
0 0.5556
900 900
b. Sea mdico y si consuma droga
PM S
20
0.0222
900
c. No sea ingeniero y si consuma droga
40 60 20
P I c S PS PI S
170 50
900 900
900
0.1333
d. No consuma droga o sea abogado
P S c A P S c P( A) P S c A 730 250 210
900 900 900
0.8556
Ejemplo 19
Se encuest a 500 alumnos universitarios sobre cultura musical. 474 no identifican el
Concierto para piano y Orquesta de Grieg, 471 no identifican la Sinfona N 7 de
Beethoven y 450 no identifican ninguna de estas obras.
P A B P Ac B c 1 P A B 1
495
0.01
c
500
91
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
P A B c P A P A B
474 450 24
0.048
500 500 500
92
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 11. La unidad de rentas de un distrito de Lima, afirma que el 60% de los
contribuyentes han pagado el predial, el 20% arbitrios y el 8% ambos impuestos. Si se
selecciona un contribuyente al azar:
93
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
P A B
P A B
P B
Ejemplo 20
Qu es ms probable? Que una persona cualquiera tenga cncer pulmonar o que una
persona que fuma tenga cncer pulmonar. Segn los especialistas la probabilidad de que
tenga cncer pulmonar una persona que fuma es mayor.
Ejemplo 21
La probabilidad que la construccin de un edificio termine a tiempo es 17/20, la
probabilidad que no haya huelga es 3/4 y la probabilidad que la construccin se termine
a tiempo dado que no hubo huelga es 14/15; la probabilidad que haya huelga y no se
termine la construccin a tiempo es 1/10. Cul es la probabilidad que
Solucin:
Definimos los eventos:
A = La construccin se termina a tiempo.
B = No haya huelga.
Tenemos:
17 3 14 1
P( A) P( B) P( A / B) P( Ac B c )
20 4 15 10
14 3
a) P( A B) P( A / B) * P( B) * 0.7
15 4
7
P( A B)
b) P ( B / A) 10 0.8235
P( A) 17
20
1
c P( Ac B c ) 10 4 0.4
c) P( A c ) c
B P( B ) 3 10
1
4
d)
c P( Ac B) P( B) P( A B) P( A B) 14
P( A ) 1 1 P( A / B) 1 0.0667
B P( B) P( B) P( B) 15
94
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 22
En una universidad el 70% de los estudiantes, son de Ciencias y el 30% de Letras; de
los estudiantes de Ciencias, el 60% son varones y los de Letras son varones el 40%. Si
se elige aleatoriamente un estudiante.
P( A B) 0.42
P( A / B) 0.778
P( B) 0.54
Ejercicio 12. Una empresa de turismo vende tres planes de viajes para la ciudad del
Cusco y para la ciudad de Arequipa. En una encuesta realizada por internet, result la
siguiente tabla de los porcentajes de clientes con las preferencias de los planes y las
ciudades.
95
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
a. Cul es la probabilidad de que desee viajar al Cusco y que no tenga preferencia por
el Plan 1?
Ejercicio 13. Durante el mes de diciembre del ao pasado, el 50% de los clientes del
centro comercial PLAZUELA compraron el producto W, el 40% compraron el producto
V, y de los que compraron el producto V, el 20 % compraron el producto W.
a. Si se elige un cliente al azar, encuentre la probabilidad de que no haya comprado
estos productos.
96
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
P A B P A B
Se sabe que: P A B y PB A , de estas expresiones se
P B P A
P A B PB P A B
establece que:
P APB A
97
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 23
Si se eligen al azar 2 artculos de un cargamento de 250, de los cuales, 20 estn
defectuosos. Halle la probabilidad de que ambos estn defectuosos si:
Ejemplo 24
Si se eligen al azar 3 artculos de un cargamento de 250, de los cuales, 20 estn
defectuosos.
k k
entonces: P Aj PAj . Luego, para cualquier otro evento B:
j 1 j 1
PB P( A1 B) P( A2 B) ... P( Ak B) PA j B .
k
j 1
P( A1 ) P( B / A1 ) P( A2 ) P( B / A2 ) ... P( Ak ) P( B / Ak ) PA j PB A j
k
j 1
98
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 25
Suponga que una caja C1 contiene 4 esferas blancas y 2 azules y que otra caja C2 contiene
4 esferas blancas y 6 azules. La probabilidad de elegir la caja C1 es el doble de
probabilidad de elegir la caja C2. Si se elige al azar una caja y de ella se elige al azar una
esfera, halle la probabilidad que:
Solucin
ul 2/6 = P(A/C1)
Az
1 2/3=P(C1)
ja
Ca Blan 4/6 = P(B/C1)
la ca
ir
eg
El
P(A/C2) =6/10
P(C2 A) 6 / 30
P(C2 / A) 3/8
P( A) 8 / 15
99
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 26
Los ingenieros de ventas 1, 2 y 3 estiman los costos de 30%, 20% y 50%,
respectivamente, de todos los trabajos licitados por una compaa. Las probabilidades de
cometer error grave, al estimar el costo, de los ingenieros son 0.01, 0.03 y 0.02
respectivamente.
Sean los eventos: Ai = {el ing. i estima los costos de una licitacin}, i = 1, 2, 3
E = {Se comete error grave al estimar el costo}
P A2 PE A2 0.2 0.03
P A2 E 0.3157
P E 0.019
Ejercicio 15. Una empresa manufacturera tiene dos mquinas (M1 y M2) para producir
un producto. El rea de control de calidad a determinado que la mquina M1 produce el
60% de la produccin total y la mquina M2 el restante. El 2% de las unidades producidas
por la mquina M1 son defectuosos, mientras que la mquina M2 tiene una tasa de
defectuosos del 4%. Si se selecciona un producto al azar:
100
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
b. Cul es la probabilidad de que haya sido producido por la mquina M1, si se sabe
que es defectuoso?
101
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Si el agricultor Juan Prez acaba de realizar una compra por un monto de $180, cul es
lo ms probable: qu haya pagado la compra, en efectivo, al crdito o con cheque?
Los eventos A y B son independientes si cuando ocurre uno de ellos esto no afecta la
probabilidad de ocurrencia del otro, o sea:
P A B P A
P B A P B
Entonces se cumple:
P A B c P A P ( B c )
P Ac B P Ac P( B)
P Ac B c P Ac P( B c )
P A B P A P ( B ) P A P ( B )
103
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 27
La probabilidad de que se presente determinada enfermedad es 1/500 y un test para
detectarla es 99% confiable (esto quiere decir que si una persona tiene la enfermedad la
probabilidad de que el test de positivo es 0.99 y si una persona no tiene la enfermedad
la probabilidad de que el test de negativo es 0.99).
P( A / B) 0.99
Confiable en este contexto significa:
P( A / B ) 0.99
c c
1
P B P A B 0.99
P B A 500 0.1655
P B P A B P Bc P A Bc 1
0.99
499
0.01
500 500
Solucin
Independencia de k eventos
P A1 A2 Ak P A1 P A2 P Ak
104
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
c. Si se sabe que el artculo es defectuoso, halle la probabilidad de que este slo tenga
un tipo de defecto.
Ejemplo 28
En cierta poblacin la probabilidad de que una chica mida ms de 1.75 m es 0.08; de
que tenga el cabello lacio es 0.22 y de que tenga un buen conocimiento de Estadstica es
0.18. Si estas cualidades son independientes.
a. Halle la probabilidad de que una chica, que va a ser seleccionada al azar, tenga las
tres cualidades.
Solucin
Sean los eventos: M = {la chica mide ms de 1.75}
L = {la chica tiene cabello lacio}
E = {la chica tiene un buen conocimiento de estadstica}
T = {la chica tiene las tres cualidades}
b. Halle la probabilidad de que una chica, que va a ser seleccionada al azar, tenga slo
2 de estas cualidades. (queda como ejercicio)
105
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Prctica Dirigida N 4
106
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
2. Una compaa de seguro ha observado que el 65% de sus clientes han adquirido una
pliza de vida, el 35% para su casa y el 15% de vida y casa. Si se selecciona a un
cliente al azar.
107
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
108
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
EJERCICIOS PROPUESTOS
109
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
b) Si P(Ac Bc) = 0.3, P(Ac Bc) = 0.9 y P(slo el primer libro est prestado)=0.4.
Calcular P(A) y P(B)
10. Una planta armadora recibe microcircuitos provenientes de tres distintos fabricantes
(A, B y C). El 52% del total de microcircuitos se compra de A, el 28% de B y el 20%
de C. El porcentaje de microcircuitos defectuosos para A, B y C son 4%, 8% y 10%
respectivamente. Si los microcircuitos se almacenan en la planta sin importar quin
fue el proveedor:
a) Diga, cul es la probabilidad que la planta no reciba microcircuitos del fabricante
B?
b) Si un circuito no est defectuoso, cul es la probabilidad de que no haya sido
vendido por el proveedor C?
11. Suponga que una empresa dedicada a realizar revisiones tcnicas tiene dos talleres A
y B. Cada propietario o conductor elige al azar un taller para pasar por dos exmenes
1 y 2. Un vehculo aprueba la revisin tcnicas si aprueba los dos exmenes. Para un
vehculo que pasa por el taller A, la probabilidad que apruebe los dos exmenes es
0.85 mientras que para un vehculo que pasa por el taller B la probabilidad
correspondiente es 0.9. Considerando que la eleccin del taller A es igual de probable
que la eleccin del taller B.
a) Halle la probabilidad que un vehculo apruebe la revisin tcnica
b) Si se sabe que el vehculo desaprob la revisin tcnica, cul es la probabilidad
que haya escogido el taller B?
12. Un investigador afirma que, en cierta poblacin, el 60% son hombres; el 70% de los
hombres y el 45% de las mujeres tienen un coeficiente intelectual menor que el
promedio. Si una persona de esa poblacin tiene un coeficiente intelectual de por lo
menos el promedio Cul es la probabilidad de que sea hombre?
13. Una fbrica confecciona en un da determinado 400 prendas para varones y 600 para
mujeres. La probabilidad de que una prenda de mujer tenga falla es de 0.01 y la
probabilidad de que una prenda de varn tenga falla es 0.02. Se elige de la produccin
del da una prenda al azar
a) Cul es la probabilidad de que la prenda tenga falla?
b) Si la prenda elegida no tiene falla, cul es la probabilidad de que no sea de mujer?
c) Se eligen cuatro prendas, cul es la probabilidad de que por lo menos una prenda
tenga fallas?
15. Un estudio acerca de los trabajadores de dos plantas de una empresa manufacturera
incluye la pregunta: cun efectiva es la gerencia para responder a las legtimas
quejas de los trabajadores?. En la planta 1, 48 de 192 trabajadores contestaron
poco efectiva, una respuesta desfavorable; en la planta 2, 80 de 248 trabajadores
respondieron poco efectiva. Se va a seleccionar aleatoriamente a un empleado de
la empresa manufacturera. Sea A el evento el trabajador procede de la planta 1 y
B el evento la respuesta es desfavorable.
a) Encuentre P(A), P(B) y P(AB)
b) son independientes los eventos A y B?
c) Encuentre P(B/A) y P(B/Ac), son iguales?
16. Un cazador dispara 7 balas a un len enfurecido. Si la probabilidad de que una bala
mate es 0.6. Cul es la probabilidad de que el cazador est todava vivo?
110
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
17. En cierta poblacin de perros: el 40% son de raza Bxer, 57% son machos y 32%
tienen ms de dos aos. Asuma que estas tres cualidades son independientes. Si un
perro va a ser seleccionado al azar calcule la probabilidad de que tenga slo una de
estas cualidades.
18. En un club hay 10 hombres y 12 mujeres. 4 de los hombres y 5 de las mujeres tienen
Maestra. Si seleccionan al azar y sin restitucin a 3 personas calcule la probabilidad
de que las tres personas sean hombres o que tengan Maestra.
20. Un lote consta de 10 artculos buenos, 4 con pequeos defectos y 2 con defectos
graves. Se elige un artculo al azar. Encontrar la probabilidad de que:
a) No tenga defectos.
b) Tenga un defecto grave.
c) Que sea bueno o que tenga un defecto grave.
Si se escogen 2 artculos en vez de uno, calcule la probabilidad de que:
d) Ambos sean buenos.
e) A lo menos uno sea bueno.
f) A lo ms uno sea bueno.
g) Ninguno tenga defectos graves.
22. En un saln de clases hay 40 personas. 15 son hombres y 26 estn en segundo ciclo
de los cuales 18 son mujeres. Si se escoge un estudiante al azar:
a) Cul es la probabilidad de que sea hombre y no est en segundo ciclo?
b) Si se selecciona un estudiante y se observa que est en segundo ciclo, cul es la
probabilidad de que sea mujer?
23. Dos mquinas, A y B, producen el 35% y el 65% de las tuercas de una fbrica. Se
sabe que el 10% y el 15% de las tuercas de cada mquina son defectuosas.
a) Si en el mercado se encontr una tuerca defectuosa Cul es la probabilidad de
que haya sido producida por la mquina A?
b) Si en el mercado se seleccionaron independientemente dos tuercas y resultaron
defectuosas Cul es la probabilidad de que hayan sido producidas por la mquina
A?
24. Para evaluar el resultado de una capacitacin, un participante est rindiendo un test
de 5 preguntas, donde cada una vale 2 puntos. Ya ha respondido dos correctamente
y decide elegir al azar las tres respuestas que le faltan.
a) Defina el espacio muestral.
b) Si la calificacin mnima aprobatoria es 6, Cul es la probabilidad de que apruebe
el test?
111
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Velocidad de De 6 a 20 De 21 a De 31 a Ms de 40
Internet aos 30 aos 40 aos aos
1 Mbps 150 80 50 50 330
2 Mbps 55 30 20 20 125
3 Mbps 25 10 5 5 45
Total 230 120 75 75 500
26. En la Gerencia de CRM del Supermercado Desco trabajan diez Analistas. Seis de
ellos son informticos y los otros cuatro son Industriales. Para implementar una
campaa comercial, se debe formar un equipo de cuatro miembros. Cul es la
probabilidad que hayan dos informticos en este equipo de cuatro?
112
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Preguntas de Autoevaluacin
5. Si A y B son dos eventos independientes de , entonces P ( A B ) / A
c c c
es igual a
_________________ siendo P( A ) 0 .
c
113
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
CAPTULO VII
VARIABLES ALEATORIAS
Una variable aleatoria es cualquier funcin que tiene como dominio a los elementos que
constituyen el espacio muestral de un experimento aleatorio y como rango a un
subconjunto de los reales.
Ejemplo 1
Sea el experimento aleatorio registrar los sexos de los prximos tres nios que van a
nacer. Si se define la v.a.d. Y como el nmero de nios de sexo femenino que nacern.
Halle el dominio y el rango de Y.
Solucin:
={ MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF }
Y(MMM) =0
Y(MMF) = Y(MFM) = Y(FMM) =1
Y(MFF) = Y(FMF) = Y(FFM) =2
Y(FFF) =3
Entonces RY = {0, 1, 2, 3}
114
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
MMM 0 RY
MMF
MFM 1
FMM
Y
MFF
FMF 2
FFM
FFF 3
Ejemplo 2
Se va a registrar la variable aleatoria X definida como el nmero de autos que llegan por
cada hora a una playa de estacionamiento entonces el dominio de X ser el conjunto de
todas las horas en estudio y el rango RX = {0, 1, 2, }
Ejemplo 3
Se desea determinar el pH de un compuesto qumico seleccionado al azar, entonces la
variable aleatoria X definida como el pH del compuesto es una variable aleatoria continua
con rango 0,14
Ejemplo 4
Con relacin al Ejemplo 1, halle la funcin de probabilidad de la v.a.d Y definida como el
nmero de nios de sexo femenino que nacern, asumiendo que los eventos simples son
igualmente probables (o que P(M)=P(F)=1/2 y que M y F son eventos independientes).
Solucin:
f 0 P Y 0 P MMM
1
8
f 1 P Y 1 P MMF , MFM , FMM
3
8
f 2 P Y 2 P MFF , FMF , FFM
3
8
f 3 P Y 3 P FFF
1
8
La funcin de probabilidad tambin se puede representar de la siguiente manera:
Y 0 1 2 3
f y PY y 1/8 3/8 3/8 1/8
Ejemplo 5
115
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
El nmero de unidades vendidas por da del artculo Z es una variable aleatoria tiene la
siguiente funcin de probabilidad:
c, x 1, 2
1
, x 3, 4
f x P X x 8
2c, x 5, 6
0, otros valores de x
Determine el valor de c.
Solucin
Por propiedad:
f x 1 f 1 f 2 f 3 f 4 f 5 f 6 c c 8 8 2c 2c 1
1 1
xR X
1
resolviendo la ecuacin resulta c .
8
Ejemplo 6
Se tienen 6 impresoras, de las cuales 2 estn defectuosas. Si se seleccionan 3 de ellas,
sin reemplazo, determine la funcin de probabilidad de la variable aleatoria definida como
el nmero de impresoras defectuosas seleccionadas.
Solucin
Sean los eventos: D0 = {obtener 0 impresoras defectuosas y 3 no defectuosas}
D1 = {obtener 1 impresora defectuosa y 2 no defectuosas}
D2 = {obtener 2 impresoras defectuosas y 1 no defectuosa}
116
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 1. Una muestra aleatoria con reposicin de tamao n=2 se selecciona del
conjunto {1, 2, 3} obtenindose un espacio muestral:
Ejercicio 2. Un dispositivo est compuesto por tres elementos (A, B y C) que trabajan
independientemente. La probabilidad de falla de cada elemento en una prueba es 0.1.
117
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 3. En un distrito de Lima el nmero de hijos por familia es una variable aleatoria
con la siguiente funcin de probabilidad:
0.5k x 0;1
k x 2;3
P X x
2.0k x4
0 otra manera
b. Si se escoge al azar una familia, cul es la probabilidad de que tenga por lo menos
dos hijos?
X n 1 bn 1 a n 1
b b
a X dx n 1
n
En general:
a n 1
118
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 7
Suponga que el tiempo, en horas, que necesita un tcnico para reparar cierta avera de
un artefacto elctrico es una variable aleatoria que tiene la siguiente funcin de densidad:
k 6 x , 1 x 3
f x
0 , para otros valores de x
1
6 x , 1 x 3
Entonces la funcin de densidad: f x 8
0 , para otros valores de x
b. Calcule la probabilidad de que un tcnico demore por lo menos 1.8 horas pero menos
de 2 horas en reparar esa avera.
2 2
1
A x 1.8 x 2 P A P 1.8 X 2 f x dx 8 6 x dx 0.1025
1.8 1.8
c. Cul es el tiempo mximo que necesita un tcnico para reparar cierta avera de un
artefacto elctrico para estar dentro del 18% de los que usan menor tiempo?
1 8 6 x dx 0.18
1 k
P( X k )
k 1.26 horas
Ejercicio 4. Sea la V.A. X: Peso de un artculo (Kg), cuya funcin de densidad est dada
por:
2
x, 1 x 2
f ( x) 3
0 Otro caso
119
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
La media de una v.a X, que tiene como funcin de probabilidad f x , est dada por:
, es decir:
X2 Var X E X X 2 E ( X 2 ) ( E ( X )) 2 E ( X 2 ) 2
120
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Propiedades de la variancia
La variancia es un nmero real positivo que cumple con las siguientes propiedades:
1.
Var X E X 2 X2
Demostracin
Var X E X X E X 2 X2 2 X E ( X ) E X 2 X2
2
3. Consecuencias de la propiedad 2:
a. Var d 0
b. Var X d Var X
c. Var c X c 2 Var X
Ejemplo 8
Suponga que una librera compra 6 ejemplares de un libro y el nmero de ejemplares
vendidos en tres meses, tiene la siguiente funcin de probabilidad:
X 1 2 3 4 5 6
f x 1/8 1/8 1/8 1/8 2/8 2/8
X EX x f x 1 8 2 8 3 8 4 8 5 8 6 8 4 unidades
1 1 1 1 2 2
xR X
X E X 2 x 2 f x 12 22 32 42 52 62 19
1 1 1 1 2 2
2
xR X 8 8 8 8 8 8
entonces:
Var X E X 2 X2 = 19 42 = 3 unidades2
X 3
CVX 100 100 43.3 %
X 4
121
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
d. Suponga que la librera compra 6 ejemplares de un libro a $10.00 cada uno, para
venderlos a $20.00 teniendo en cuenta que al terminar el periodo de 3 meses,
cualquier ejemplar no vendido se vender a $7.00. Calcule la media, la variancia y
el coeficiente de variacin de la utilidad neta.
507
CVU = 100 66.2 %
34
PU 34 P13 X 18 34 P X 4 P X 5 P X 6
2 2
0.5
8 8
122
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
d. Si la empresa estima que la perdida por cada artculo defectuoso por da es de $25.0
y un gasto de reenvi de $4.5. Halle la prdida media y el coeficiente de variabilidad.
Ejemplo 9
La v.a. continua X definida como la proporcin de accidentes fatales por mes que ocurren
en determinada ciudad tiene como funcin de densidad:
2 x , para 0 x 1
f x
0 , para otros valores de x
a. Calcule la probabilidad de que la proporcin de accidentes por mes sea menor que 0.4
0.4
0.4 0.4
x2
P X 0.4 P 0 X 0.4 f x dx 2 x dx 2 x 2 0.16
0.4
2 0
0
0 0
0.4
P 0 X 0.4 P 0 X 0.4 P 0 X 0.4 P 0 X 0.4 f x dx 0.16
0
b. Encuentre la proporcin media de accidentes fatales por mes en esa ciudad.
1 1
2 3 1 2
X E X x f x dx x 2 x dx 2 x 2 dx x
0 0
3 0 3
123
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
c. Halle la variancia de X.
1 1
EX x f x dx x 2x dx 2x 2 4 1 1
2 2 2 3
dx x
0 0
4 0 2
2
1 2
X2 E X 2 E X
2 1
2 3 18
E(Y)=E(0.8X-0.02)=0.8E(X)-0.02= 0.5133
1
Var(Y)=Var(0.8X-0.02)= 0.8
2
Var X 0.82 0.0356
18
e. Halle la P Y 0.3
P Y 0.3 = P 0.8 X 0.02 0.3 P X 0.4 0.16
124
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
EJERCICIOS PROPUESTOS
X 0 1 2 3 Otros valores
f(x) 0.28 0.35 0.22 0.15 0
a) Hallar la media, la variancia y coeficiente de variacin de X.
b) Si en una semana se sabe que ocurri al menos un accidente, cul es la
probabilidad de que en dicha semana haya ocurrido exactamente uno?
c) Si la empresa incurre en una prdida semanal Y (soles) segn el nmero de
accidentes dada por: Y = 10 + 8X. Hallar la prdida esperada semanal.
k x 1 , para 1 x 3
f x
0 , para otros valores de x
a) Halle el valor de k.
b) Calcule la probabilidad de que una parcela tenga una produccin de por lo menos
1500 Kilos pero menos de 2000 Kilos.
125
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
x 8
, para 8 x 10
f ( x) 2
0 , de otro modo
a) Calcule E(X) y Var(X).
b) Si el precio de venta es de 2 u.m. y el costo es de 1 u.m, garantizando un reintegro
cuando el peso es menor de 8.25 Kg. Halle la utilidad esperada por artculo.
6. Suponga que el nmero de accidentes por semana que ocurren en una empresa es
una variable aleatoria X con funcin de distribucin de probabilidades dada por:
X 0 1 2 3 Otros valores
f(x) 0.28 0.35 0.22 0.15 0
a) Hallar la media y la variancia de X.
b) La empresa incurre en una prdida semanal Y segn el nmero de accidentes dada
por Y = 10 + 8X. Hallar la prdida esperada semanal.
c) Determinar la funcin de distribucin acumulada.
d) Si en una semana se sabe que ocurri al menos un accidente, cul es la
probabilidad de que haya ocurrido exactamente uno?
7. Juan Quispe planea gastar su gratificacin en comprar un Blue Ray en Jims Video
Service a un precio de US$300. Ahora tiene la opcin de comprar una pliza de
servicio extendido que ofrece cinco aos de cobertura por US$100. Despus de
conversar con sus amigos y leer los informes, Juan cree que puede incurrir en los
siguientes gastos de mantenimiento durante los prximos cinco aos:
xi p(xi)
0 a/9
1 2a/9
2 5a/9
3 a/9
a) Hallar a.
b) Hallar E(x) y V(X).
c) Hallar: E(Y) y V(Y), donde Y= 3X+4.
d) Calcular P(Y>1)
126
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Preguntas de Autoevaluacin
a) b)
X 2 4 6 8 10 X -1 0 1 2
f(x) 0.2 0.2 0.2 0.2 0.2 f(x) 0.25 0.25 0.25 0.25
c) d)
X 10 20 30 40 X 0 1
f(x) 0.2 0.2 0.2 0.2 f(x) -0.5 0.5
________________________________________________________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
127
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
CAPTULO VIII
Objetivo. Identificar y aplicar una variable aleatoria discreta, asociada alguna de las
principales distribuciones discretas estudiadas.
Experimento Binomial
Ejemplo 1
En una tienda la llegada de un cliente y determinar si compra o no es un experimento de
Bernoulli donde xito: E = {un cliente compra} y fracaso: F = {un cliente no compra}.
Se sabe que el 75% de los clientes que llegan hacen una compra, entonces P E =
0.75.
Si a la tienda llegan 20 clientes, este sera un experimento binomial donde n=20 y =
0.75
n x
1
n x
x 0, 1, 2, , n
f x P X x x
0 de otro mod o
Notacin: X ~ Binomial n ,
128
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
La Media y la Variancia de X
Ejemplo 2
Un examen consta de n = 25 preguntas, cada una de las cuales tiene 5 alternativas de
las cuales slo una es correcta, si una persona est adivinando al responder y se desea
saber el nmero de respuestas correctamente respondidas.
P E
1
fracaso: F={la respuesta no es correcta} y siendo: .
5
Sea la v.a. X=El nmero de respuestas correctas en las 25 preguntas,
X Binomial (25,0.2)
Ejemplo 3
Siguiendo con el Ejemplo 1.
xito: E={un cliente compra} y fracaso: F ={un cliente no compra}. Se sabe que el 75%
de los clientes que llegan hacen una compra, entonces P E = 0.75.
Si a la tienda llegan 20 clientes, este sera un experimento Binomial con n=20 y = 0.75.
Solucin.
Sea v.a. X=El nmero de clientes que hacen una compra. La distribucin de
20
probabilidades se define: f x 0.75x 0.2520 x x 0,1, 2, ...,2 0
x
La probabilidad de que el nmero de clientes que hacen una compra sea mayor que 18
sera:
20 20
P( X 18) 0.75190.251 0.75200.250 0.0211 0.0032 0.0243
19 20
Ejemplo 4
Una compaa vendedora de equipos electrnicos verifica que de todas las mquinas por
ella instaladas, el 40 % exigen nuevos ajustes despus de su instalacin. Si 5 mquinas
fueron seleccionadas al azar:
129
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
5
f x 0.4 x 0.65 x x 0,1, 2, 3, 4, 5
x
5
5
P X 3 f 3 f 4 f 5 0.4 x 0.65 x 0.2304 0.0768 0.0102 0.3174
x 3 x
Solucin.-
Sea la v.a. Y definida como el costo de las mquinas que necesitan ajuste en un
grupo de 5.
Y = 100 X y como:
X ~ Bin n , , entonces E X n 5 0.4 2 por lo tanto:
Ejemplo 5
El gimnasio El Rpido ha comprobado que el 20% de sus alumnos se dan de baja
durante el primer mes y el 80% restante permanecen todo el ao. Suponga que este ao
se inscribieron 20 alumnos.
P(Y=12) = 0.02216088
c. Al hacer la inscripcin se realiza un nico pago anual de $ 600. Si cada alumno que
permanece todo el ao genera un gasto anual para el gimnasio de $ 150, cul es el
beneficio anual esperado para el gimnasio?
130
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 1. Se conoce por experiencias anteriores que el 20% de las plantas de limonero
son atacadas por cierta plaga. Si se desea llevar a cabo un experimento con 10 plantas.
Cul ser la probabilidad de que:
131
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 2. Una institucin educativa conmemora sus 100 aos de fundacin, con tal
motivo la junta directiva ha invitado a sus 25 profesores fundadores a la ceremonia
principal. Se cree que la probabilidad de que un profesor fundador asista a la ceremonia
es de 0.75.
a. Cul es la probabilidad de que al menos 96% de los profesores fundadores asistan?
c. La empresa que da servicios de buffet cobra por persona $35 ms $ 5 por servicio,
halle el costo esperado para la ceremonia.
Ejercicio 3. Cierta clnica cuenta con una poblacin de 20 enfermos, donde el 25%
padece de algn tipo de cncer. Se selecciona con reemplazo una muestra de 4 enfermos.
132
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
A N A
f x P X x
x n x
para x entero t.q mx0, n A N x min n, A
N
n
La Media y la Variancia de X
A A N n
EX n , 2 Var X n 1
A
Si X ~ Hiper N , n, A entonces:
N N N N 1
133
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 6
Un embarque de sustancias qumicas llega en 15 contenedores, 2 de los cuales no
cumplen con los requerimientos de pureza. Se eligen 3 contenedores al azar, sin
reemplazo, para hacer una inspeccin de la pureza del producto. Calcule la probabilidad
de que al menos uno de los contenedores que no cumplen los requerimientos est en la
muestra.
Ejemplo 7
Una estacin experimental se compone de 4 ingenieros agrnomos y 9 tcnicos agrcolas.
Si se elige al azar y sin reemplazo a 3 individuos para asignarlos a un trabajo de campo,
cul es la probabilidad que el grupo asignado al trabajo de campo incluya al menos 2
ingenieros agrnomos?
x ~ H 13,3, 4 N 13 , n 3 , A 4 , x=0,1,2,3
13 4 4 13 4 4
p x 2 p x 2 p x 3 3 0.189 0.014 0.203
3 2 2 3 3
13 13
3 3
Ejemplo 8
Un determinado antibitico es empacado en cajas de 20 botellas. Suponga que una caja,
la cual es enviada a una farmacia hay 5 botellas mal envasadas. El dueo de la farmacia
sospecha que la cantidad de antibitico en algunos de frascos es insuficiente por lo
selecciona al azar y sin reemplazo una muestra de tres frascos y decide que si encuentra
la mitad o ms de frascos mal envasados en esa muestra cambiar de distribuidor. Cul
es la probabilidad de que el dueo de la farmacia no cambie de distribuidor?
Solucin.-
N 20 n 3 A=5 N-A = 15 x 0,1,2,3
5 15 5 15
P( x 2) P( x 0) P( x 1) =0.859
0 3 1 2
20
3
134
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 5. Un lote contiene 15 semillas de cierto cultivo, de los cuales 8 estn daadas.
Sea X la variable aleatoria el nmero de semillas daadas. Del lote se toma una muestra
aleatoria sin reemplazo de 5 semillas.
b. El usuario regresa las defectuosas para su reparacin. Se sabe que cuesta 50 u.m.
reparar cada impresora. Calcule el promedio y la variancia del costo total de
reparacin.
135
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 7. Un ingeniero zootecnista sabe que en cierta regin hay 8 individuos de una
especie de mamfero, de los cuales cinco son machos y el resto son hembras. Si selecciona
al azar a cuatro individuos y observa el nmero de machos seleccionados.
a. Qu valores posibles podra tomar la variable mencionada?
136
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Proceso de Poisson
Notacin: X ~ Pois vt
e x
Tambin se puede expresar: f x P X x x 0,1, 2,
x!
Donde vt , X ~ Pois
La Media y la Variancia de X
Ejemplo 9
Los mensajes que llegan a una computadora, utilizada como servidor, lo hacen de acuerdo
con una distribucin Poisson con una tasa promedio de 10 mensajes por hora.
137
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
e 20 20 y
f y P Y y y 0, 1, 2,
y !
e 20 207
P Y 7 0.00052
7 !
e 10 k 10k
z
f z PZ z z 0, 1, 2,
z !
e 10 k 10k
0
Ejemplo 10
Se cree que el nmero promedio de individuos por cada 2 km 2 de cierta especie de
mamfero que habita en las alturas de cierta regin es de 1.2.
138
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 8. A cierta fbrica de laminados de madera llegan por trmino medio 3 clientes
cada 2 horas. Suponiendo que las llegadas se distribuyen de acuerdo a una distribucin
de Poisson, calcule:
a) La probabilidad de que en una maana de trabajo (de 9:30 a 13:30 horas) lleguen
ms de 2 clientes.
139
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 9. El nmero de barcos que llegan a un puerto cada semana es una variable
aleatoria que tiene distribucin de Poisson con media igual a 9 barcos.
d. Un aduanero sabe que el costo de mantenimiento del puerto por semana est en
funcin del nmero de barcos que arriban, si no llegan barcos el costo es de 2 mil
soles si llega un barco el costo es de 3 mil soles y si llegan dos o ms barcos el costo
es de 5 mil soles. Halle la distribucin del costo y el costo esperado por
mantenimiento del puerto por semana.
140
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Prctica Dirigida N 5
f(x) 0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
0 2 4 6 8 10
Nmero de reclamos
141
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
3. Se sabe que en un embarcadero de un Club de yates, el pago anual (en miles nuevos
soles) por yate que realiza los socios, es una variable aleatoria que tiene la siguiente
funcin de densidad.
x
2 x8
f ( x) 30
0 otro caso
142
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
143
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
144
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
e. Si el costo por persona para asistir al curso es $350 ms $50 por movilidad. Cul
es el costo esperado que pagar la entidad estatal para que asistan al curso los
ingenieros agrcolas?.
b. Calcule la probabilidad de que llegue como mximo tres mensaje en una hora.
145
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
EJERCICIOS PROPUESTOS
2. El nmero de rayos gamma emitidos por segundo, por cierto sustancia radioactiva
es una variable aleatoria que tiene una distribucin de Poisson con parmetro igual
a 5.6. Si un instrumento de medida se daa cuando recibe por lo menos 3 radiaciones
por segundo. Cul es la probabilidad que este instrumento se dae?
4. Juan es un dentista que atiende todos los das a sus clientes de 9:00 am a 4:00pm y
se ha registrado el nmero de clientes atendidos cada tres das, en una muestra de
tamao 5 obtenindose: 18, 21, 19, 20 y 17. Se sabe que el nmero de clientes que
van a consultar sigue una distribucin de Poisson.
5. En una poblacin de drosphila, que ataca a cierta variedad de fruta, se sabe que el
25% ha desarrollado mutacin en las alas. Si se escogen aleatoriamente 6 moscas de
esta poblacin:
a. Cul es la probabilidad de que 2 de estas moscas presenten mutacin de alas?
b. Cul es la probabilidad que ms de tres presenten mutacin de alas?
c. Cul es la probabilidad que a lo ms una mosca presente mutacin de alas?
d. Si se sabe que ms de una presenta mutacin de alas, Cul es la probabilidad
que como mximo 4 presenten mutacin de alas?
6. La probabilidad que la llanta trasera derecha de un auto tipo Tico reviente al entrar
a una curva es de 0.05. Encontrar la probabilidad que de 16 autos tipo Tico que
pasan por la curva:
a. Se revienten la llanta trasera derecha de a lo ms 3 autos
b. Se revienten la llanta trasera derecha de dos o ms autos.
9. Dos cpsulas se seleccionan sin reemplazo de un frasco que contiene tres aspirinas,
dos sedantes y cuatro cpsulas laxantes. Cul es la probabilidad de no seleccionar
aspirinas?
146
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
10. Se sabe que en el centro de Lima ocurre en promedio un asalto cada dos minutos
entre las 6:00 p.m. y las 8:00 p.m. Mara sale de su trabajo a las 6:30 p.m. y debe
caminar desde la Plaza San Martn hasta la Av. Tacna con direccin hacia el paradero.
Si el trayecto le toma 4 minutos. Cul es la probabilidad que Mara llegue a su
paradero sin que haya ocurrido algn asalto?
13. Segn una encuesta hecha a un grupo de 10 personas, seis de ellas prefieren la
gaseosa Inca Kola y 4 de ellas Coca Cola. Si se seleccionan a 3 personas de ese grupo.
Cul es la probabilidad de que hayan 2 que les guste Inca Kola?
14. Se sabe, por experiencia, que el 42% de todas las personas que reciben un ejemplar
gratuito de una revista se suscriben a ella, calcule la probabilidad de que, a lo ms 3
de las 6 personas seleccionadas al azar que reciben un ejemplar gratuito de una
revista se suscriben a la revista.
15. Si el nmero de solicitudes de informacin sobre cruceros que recibe una agencia de
viajes por da es una variable que tiene una distribucin de Poisson con variancia 2.4.
Halle la probabilidad de que:
16. Se cree que el nmero promedio de individuos por cada 2 km2 de cierta especie de
mamfero que habita en las alturas de cierta regin es de 1.2. Adems se conoce que
el nmero de individuos por rea de esa regin tiene una distribucin de Poisson.
a. En una zona de 2.8 km2, cuntos individuos esperaramos en promedio encontrar.
b. Si se observa un rea de 3 km2 en dicha regin, cul es la probabilidad que se
encuentren ms de 3 individuos de esta especie?
c. Si se selecciona dos reas independientemente de 3km 2 cada una. Cul es la
probabilidad que en cada una de estas reas no haya ms de 2 individuos?
147
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
19. Los agricultores de una regin estn preocupados por la calidad de sus cosechas, ya
que se ha detectado en ciertas reas la existencia de sustancias contaminantes en el
suelo. Para analizarla, se segmenta la tierra en parcelas de 100 m 2, y se concluye
que hay una probabilidad de 0.6 de encontrar estos contaminantes en una
determinada parcela. Se pide:
a) Si un agricultor posee 15 de estas parcelas. Qu probabilidad hay de que tenga
alguna parcela contaminada?
b) Una comunidad posee 100 parcelas del tipo anterior. Qu probabilidad hay de
que tenga entre 10 y 15 parcelas contaminadas?
c) Si por cada parcela contaminada la cooperativa sufre una prdida de 1000 nuevos
soles, cul es la prdida que la comunidad espera tener?.
20. El gerente de una empresa dedicada realizar copias de CD sabe por informacin
histrica el 93% de los CD que provee la compaa Lotus international son no
defectuosos. Si selecciona al azar 5 CD, cul es la probabilidad que 3 sean no
defectuosos, si se sabe que al menos uno es no defectuoso?
21. Por factores internacionales el precio del petrleo ha sufrido ciertas variaciones en
los ltimos meses. REPLUSA ha determinado que la probabilidad de que vare el
precio del petrleo es de 0.60. Si se va a realizar 10 compras de petrleo:
Cul es la probabilidad que el nmero compras de petrleo donde el precio tiene
variacin sea menor que su esperado?
22. Los camiones que reparten el combustible a los diferentes grifos de la capital llegan
a las instalaciones de la refinera a un promedio de tres cada 20 minutos. Si las
instalaciones slo tienen capacidad para recibir 10 camiones por hora, cul es la
probabilidad de que una hora los camiones tengan que regresar en otro momento?
148
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Preguntas de Autoevaluacin
5. Si en una poza de crianza hay 200 truchas, de las cuales el 45% son hembras. Si se
toma una muestra aleatoria con reemplazo de 20 truchas, la variable aleatoria nmero
de truchas hembras tiene una distribucin _________________________.
8. El rango de una variable aleatoria que se distribuye como una Binomial es un conjunto
_____________________, para una Hipergeomtrica es un conjunto
_________________________ y para una Poisson ________________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
149
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
CAPTULO IX
DISTRIBUCIONES CONTINUAS
Objetivo. Al finalizar este captulo el lector conocer los conceptos y aplicaciones de las
principales distribuciones continuas.
La variable aleatoria continua X tiene distribucin exponencial con parmetro con media
igual a E(X)= y variancia V(X) = 2, si su funcin de densidad es:
1 x /
e para x 0; 0
f ( x)
0
para cualquier otro caso
Su notacin: X ~ E()
Grficamente se representa:
1 e x / para x 0; 0
F ( x) P( X x) <
0 para x < 0
P( X < k ) p k Ln(1 p)
Para hallar percentiles:
P( X > k ) p k Ln( p)
150
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 1
El tiempo de demora en entregar una pizza tiene distribucin exponencial con media igual
a 25 minutos. Si la pizzera ofrece su producto con la promocin si recibe su pizza
despus de 30 minutos usted no paga nada. Calcule:
Solucin:
a) Sea X: tiempo de demora en entregar una pizza
X~ E(25)
30 30
P(pizza gratis) = P(X>30) = 1- P(X30) = 1 (1 e 25
)e 25
0.3012
151
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
c. Cul debe ser el tiempo como mnimo para ser considerado un proceso de
congelamiento, dentro del 20% de mayores tiempos?
La Distribucin Normal fue hallada por primera vez en 1733, por A. De Moivre. Pero el
descubrimiento de De Moivre al parecer pas inadvertido y fue redescubierta por C.F
Gauss en 1809 y P.S Laplace en 1780 hizo trabajos preliminares que profundiz en 1812.
2
1 x
1
f x e 2
, x > 0
2
Notacin: X N( , 2)
152
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
En el grfico anterior se aprecia dos distribuciones normales con igual promedio pero
diferente desviacin estndar (a menor desviacin estndar los datos estn ms cerca de
la media)
1 12 z 2
f z e , z
2
Prueba
X X EX
E Z E E 0
X X Var X
2
Var Z Var Var 1
2 2
Esta prueba es incompleta porque slo demuestra que la media y la variancia de Z son 0
y 1 respectivamente pero no demuestra que Z tiene distribucin normal (esto es tema de
un libro de Estadstica Matemtica).
153
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 2
La estatura de los estudiantes universitarios de cierto pas est normalmente distribuida
con una media de 167.85 cm y desviacin estndar 10.37 cm.
X 152 167.85
P X 152 P P Z 1.53 1 P Z 1.53 1 0.0630 0.9370
10.37
c. Si se est buscando estudiantes universitarios que midan entre 165 y 195 cm para
un casting de TV Qu porcentaje de estudiantes cumplen con esa condicin?
154
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
e. Cul es la altura mnima que debe tener un bus de transporte para que el 97.06% de
los estudiantes viaje de pie sin dificultad?
Ejercicio 2. Las notas del examen final del curso de Informtica se distribuyen
normalmente con media 12 puntos y variancia 4 puntos2. Si se elige un alumno al azar:
155
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 3. El dimetro del punto producido por una impresora tiene una distribucin
normal con media igual a 0.002 pulgadas y desviacin estndar de 0.0004 pulgadas.
a. Cul es la probabilidad de que el dimetro del punto sea mayor que 0.0026 pulgadas?
b. Cul es la probabilidad de que el dimetro del punto est entre 0.0014 y 0.0026
pulgadas?
Definicin de Estadstico
Ejemplo 3
La media muestral X , es un estadstico, (variable aleatoria) y x , es el valor calculado
del estadstico. La variancia muestral S2, es un estadstico, (variable aleatoria) y s2 es el
valor calculado del estadstico.
Sea X1, , X n una muestra de una distribucin con media y desviacin estndar
.Entonces:
156
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Si el muestreo es con reemplazo de una poblacin finita o con o sin reemplazo de una
poblacin infinita:
2
b. Var X 2
X
y X
n n
Este teorema fundamental de la Estadstica fue enunciado por primera vez por P.S Laplace
en 1812 luego en 1901 A. Liapounoff hizo una demostracin rigurosa en condiciones
bastante generales.
Ejemplo 4
El tiempo que demora una rata de cierta subespecie seleccionada al azar, para que se
duerma despus de aplicrsele un somnfero experimental, es una variable aleatoria
distribuida con 1.5 min y 0.35 min. Suponga que se seleccionan n ratas y denote
por X1, , X n sus tiempos hasta dormirse.
a. Si el tiempo que demora una rata tiene distribucin normal y X1, , X 5 es una muestra
aleatoria de tamao 5 de esa poblacin. Calcule la probabilidad de que la media de
la muestra sea a lo ms 2 min.
Solucin:
E X X 1.5
0.35
2
2
Var X 2
X
n
5
0.0245 y X
n
0.1565
X X 2 1.5
P X 2 P
0.1565
P Z 3.19 0.9993
X
157
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
b. Si el tiempo que demora una rata tiene distribucin desconocida y X1, , X 40 es una
muestra aleatoria de tamao 40 de esa poblacin. Calcule la probabilidad aproximada
de que el tiempo de demora promedio est entre 1.35 y 1.60 min.
Solucin:
Por el teorema del lmite central el tiempo promedio de la muestra tiene,
aproximadamente, distribucin normal con
0.35
2
2
E X X 1.5
Var X 2
X
n
40
0.0030625 .
Ejercicio 4. Sea la variable aleatoria X la cantidad de radiacin que puede ser absorbida
por un individuo antes que le sobrevenga la muerte. Suponga que X es normal con media
de 500 roentgen y una desviacin estndar de 150 roentgen.
158
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
X -1 0 1 2
f (x) 0.3 0.4 0.2 0.1
b) Si se sabe que el promedio muestral es menor que 0.34, cul es la probabilidad que
el promedio muestral sea mayor o igual a 0.26?
Suponga que X1, ,Xn es una muestra aleatoria de n alumnas universitarias de Lima y
se estudia si una alumna mide ms de 1.75 m. Por lo tanto X i Binomial(1,) i=1,,n;
es decir Xi=1 si la alumna mide ms de 1.75 y Xi=0 de otro modo. La proporcin muestral
n
X i
de alumnas que miden ms de 1.75 mt. es p i 1
que como se observa es un
n
promedio muestral pero que se basa en una muestra aleatoria de una distribucin
Binomial(1,). Por lo tanto, si n es grande y utilizando el teorema del lmite central se
puede asegurar que p tiene una distribucin aproximadamente normal con media =
2 (1 )
y variancia y por lo tanto se puede estandarizar de la siguiente manera
n n
159
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
p
Z . La expresin anterior tiene una distribucin normal con media cero y
(1 )
n
variancia uno. A continuacin se presentan los casos de la distribucin p con muestras
aleatorias y con muestras aleatorias simples.
Ejemplo 5
En un proceso de produccin el porcentaje de unidades defectuosas producidas es 3%.
Para controlar el proceso, se revisan peridicamente los artculos producidos.
Si el proceso de produccin se para al encontrar al menos 5% de unidades defectuosas
producidas al revisar una muestra aleatoria de 200 artculos cada vez. Halle la
probabilidad aproximada de que el proceso contine.
Solucin
La proporcin muestral tiene una distribucin aproximadamente normal. Esto se puede
afirmar por el Teorema del Lmite Central (n grande).
1
p Normal , 2
Aprox. n
p 0.05 0.03
P p 0.05 P P Z 1.65 0.9505
1 0.0121
n
Ejemplo 6
El contenido de slidos solubles (en grados Brix B) en muestras de chirimoya tiene
distribucin normal siendo su esperanza matemtica es 7.78 B y su desviacin estndar
2.54 B. Un especialista selecciona una muestra aleatoria de 80 muestras de chirimoya.
Calcule la probabilidad de que la proporcin muestral de esas muestras de chirimoya con
un contenido de slidos solubles menor de 9.88 B sea menor de 0.72.
Solucin
Sea X el contenido de sustancias solubles en B.
X Normal 7.78, 2 2.542
La probabilidad de que una muestra de chirimoya tenga un contenido menor de 9.88 B
es:
X 9.88 7.78
P X 9.88 P P Z 0.83 0.7967
2.54
160
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 6. De una empresa se escoge una muestra aleatoria de 300 empleados para
una encuesta sobre condiciones laborales. Halle la probabilidad aproximada de que la
proporcin muestral a favor de las condiciones laborales est comprendido en el intervalo
0.76 y 0.84, si se estima en 80% del total de empleados el porcentaje a favor de las
condiciones laborales.
Ejercicio 7. El diez por ciento de las personas de cierta comunidad tiene sangre tipo B.
Si se selecciona una muestra aleatoria de 900 personas de esa comunidad. Cul es la
probabilidad de que la proporcin muestral de personas con sangre tipo B?
b) Sea a lo ms 10.5%
161
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Si las muestras son aleatorias (con o sin reemplazo) de poblaciones normales o se cumple
con el teorema del lmite central con otro tipo de distribucin.
2 2
X 1X 2
1 2 y 2X 1 X 2 1 2
n
1 n2
Ejemplo 7
El tiempo que lleva efectuar un procedimiento de montaje para el mtodo 1 tiene
distribucin con media 35 seg. y variancia 20 seg2 mientras que con un mtodo 2 tiene
distribucin con media 31 seg. y variancia 17 seg 2. Si se selecciona una muestra de 40
empleados entrenados con el mtodo 1 y 50 entrenados con el mtodo 2.
12 22 20 17
X 1 X 2 N 1 2 , N 35 31, N 4, 0.84
n1 n2 40 50
X 1 X 2 X X 54
P X1 X 2 5 P X1X 2
1 2
P Z 1.09 0.1379
0.84
162
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
1 1 1 2 1 2
2p p
1 2
n1 n2
Ejemplo 8
Si para elaborar un artculo se usan, independientemente, las mquinas I y II, y se sabe
que la probabilidad de producir un artculo defectuoso con la mquina I es 0.15 y 0.08
con la mquina II. Si se eligen al azar 80 artculos producidos por I y 100 producidos por
II, halle la probabilidad de que la proporcin de defectuosos de la muestra de I supere a
la de II en ms de 0.06, si las muestras son aleatorias.
163
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Solucin
0.15 0.85 0.08 0.92
p1 p2
aprox N 1 2 , 2p1 p2 aprox N 0.15 0.08,
80
100
aprox N 0.07, 0.00233
0.06 0.07
P p1 p2 0.06 P Z P Z 0.21 0.5832
0.04827
Ejercicio 10. Se sabe que van a la universidad en movilidad propia el 40% de los
estudiantes de la Universidad L y el 30% de la Universidad S. Si se toman al azar
muestras de 80 y 90 estudiantes respectivamente, halle la probabilidad de que la
proporcin de la muestra de la Universidad L supere a la de S en ms de 9%.
Ejercicio 11. Dos mquinas A y B producen el mismo artculo. Se sabe que la proporcin
de artculos defectuosos producidos por A es de 0.06 y por B es de 0.04. Si se obtiene
una muestra aleatoria de 50 artculos para cada una de las mquinas, halle la probabilidad
que la proporcin de defectuosos de la muestra A sea superior a la proporcin de
defectuosos de la muestra de la mquina B en ms de 0.01.
164
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Prctica Dirigida N 6
b. Cunto tiempo como mnimo debe tener un artculo para ser considerado dentro
del 28.5% de los mayor tiempo de ensamblaje?.
c. Halle el RI.
165
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
b. Cul debe ser el nmero de horas como mximo, para que una persona sea
considerada dentro del 22% con menos horas de prcticasde manejo?
166
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
167
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
EJERCICIOS PROPUESTOS
2. Suponga que la duracin en minutos de las llamadas telefnicas que llegan en forma
independiente a una central telefnica es una variable aleatoria con distribucin
exponencial, con media de 2 minutos por llamada. Cul es la probabilidad que una
llamada dure entre 1 y 4 minutos?
4. Suponga que se estima que el 70% de los jvenes de Lima y el 63% de los jvenes
de Arequipa considera que escuchar msica clsica es un buen hbito. Si se toman
muestras de tamao 50 de jvenes de Lima y 60 de jvenes de Arequipa, halle la
probabilidad de que la proporcin de la muestra de Lima supere a la de Arequipa en
menos de 0.05, si Las muestras son aleatorias simples (sin reemplazo), habindose
elegido la primera muestra de 900 jvenes limeos y la segunda de 1400 jvenes
arequipeos.
6. En una poblacin, el 20% de las familias estn suscritas al diario El Comercio, cul
es la probabilidad de que al seleccionar una muestra de 225 familias, la proporcin
de familias suscritas a dicho diario sea menor al 16%?
8. El tiempo que necesita un alumno para terminar el examen final de Qumica General
se distribuye normalmente con una media de 110 minutos y una desviacin estndar
de 8 minutos; mientras que el tiempo que necesita un alumno para terminar el
examen final de Fsica General se distribuye normalmente con una media de 115
minutos y una variancia de 49 minutos2.
a. Si un alumno termina el examen de Fsica General en menos de una hora y media
se puede suponer que domina el curso. Si se selecciona un alumno al azar, cul
es la probabilidad de que domine el curso?
b. Si se seleccionan al azar 5 alumnos de Fsica General, cul es la probabilidad de
que al menos dos alumnos dominen el curso?
168
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
9. El nmero de clientes que llegan a una agencia bancaria cada 5 minutos tiene una
distribucin Poisson con media 3.2. Se selecciona una muestra aleatoria de tamao
40 de esta distribucin. Calcule la probabilidad de que la media muestral sea mayor
que 2.8.
10. Se sabe que el 52% de adolescentes de cierto distrito fuman. Si se selecciona una
muestra aleatoria de 50 adolescentes de ese distrito, halle la probabilidad de que la
proporcin muestral de fumadores sea mayor que 0.40 pero menor que 0.62
11. Una Empresa Arrocera se tienen dos mquinas agrcolas A y B; las cuales presentan
tiempos de duracin que cumplen la funcin de cosechar arroz en forma independiente
tienen una distribucin normal con un tiempo de vida medio de 12 y 15 aos y con
desviaciones estndar de 1.5 aos y 3 aos respectivamente.
12. La vida til de una batera se distribuye como una exponencial con una media de 10
aos. El fabricante ofrece una garanta de un ao. Si la batera falla en ese perodo se
reemplaza por otra, a lo ms una vez. Cul debe ser el tiempo de garanta que el
fabricante debe ofrecer para que solo se devuelva el 2% de las bateras producidas?
13. Una mquina fabrica un determinado producto cuya longitud, en centmetros, tiene
un promedio de 6 cm. y una desviacin estndar de 1.2 cm.
14. Un fabricante de electrodomsticos sabe que la vida til de stos sigue una
distribucin normal con media de 100 meses y desviacin estndar de 20 meses.
Determine el tamao mnimo muestral que garantiza, con una probabilidad de 0.98
que la vida til media de los electrodomsticos en dicha muestra se encuentra
entre 90 y 110 meses.
15. Se sabe que la vida de bombillas elctricas es una variable aleatoria distribuida
normalmente con media desconocida y = 200 horas. El precio de un lote de
1
bombillas es dlares. Un posible comprador propone tomar una muestra aleatoria
5
1
de n bombillas y pagar al productor X dlares por el lote de bombillas. Cul debe
5
ser el valor de n, para que la probabilidad de que comprador no sobre pague ni
subpague al productor con ms de 20 dlares, sea 0.95?
169
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
La distribucin Ji-cuadrado fue encontrada por primera vez por F.R Helmert en 1876.
Esta distribucin toma el nombre de la letra griega elevada al cuadrado. Esta letra en
castellano se llama Ji y en ingls Chi.
1
m
1 x
m x 2
e 2 si x 0
f x 2 m 2
2
0 si x0
Notacin: X 2m
Ejemplo 9
X X
2
Si X N , 2
, entonces Z N 0,1 Z
2
21
170
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Distribucin de la v.a.
n 1 S 2
2
Sea X1, , X n una muestra aleatoria de una distribucin normal con media y
n
n 1 S 2
(Xi X ) 2
Ejemplo 10
Si J 219 , determine el valor de:
a. P J 11.651
Solucin
P J 11.651 = 0.1 Notacin: 11.651 20.1,19
b. P J 15.352
Solucin
P J 15.352 1 P J 15.352 1 0.3 0.7
c. P 15.352 J 30.144
Solucin
P 15.352 J 30.144 P J 30.144 P J 15.352 0.95 0.3 0.65
Ejemplo 11
Si L 225 , halle p1 y p2 tales que: P p1 L p2 0.7 y P L p2 0.1 .
Solucin
P L p1 0.2 p1 20.2,25 18.940
P L p2 0.9 p2 20.9,25 34.382
Una v.a X tiene distribucin t con m grados de libertad si su funcin de probabilidad es:
m 1
f x 2 , x
m 1
m x
2 2
m 1
2 2
Notacin: ~()
171
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Caractersticas de la distribucin t
Teorema
Z
Si las v.as Z N 0,1 y V 2m son independientes, entonces la v.a X t m .
V
m
Sea X1, , X n una muestra de una distribucin normal con media y desviacin
X
estndar , entonces la v.a t n 1 , siendo:
SX
S2
S X2 , si el muestreo es con reemplazo (muestra aleatoria)
n
Teorema
Si de dos poblaciones normales independientes distribuidas con medias 1 , 2 y
variancias
2
1
2
2
2
, se extraen muestras aleatorias de tamaos n1 y n2 ,
siendo: S 2
n1 1 S12 n2 1 S22
n1 n2 2
p
172
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 12
Si R t8 , calcule:
a. P R 2.306
b. P R 2.896
P R 2.896 1 P R 2.896 1 0.99 0.01
c. P 3.355 R 0.889
P 3.355 R 0.889 P R 0.889 P R 3.355 0.200 0.005 0.195
d. El valor de c si P R c 0.3
9.7 Distribucin F
173
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Caractersticas de la distribucin F
Teorema
Si U 2n y V 2m , son v.a. independientes, entonces la variable aleatoria
U
U m
X n F n, m
V V n
m
Notacin Si X F n, m y P X k k F ,n ,m
1
F ,n ,m
Propiedad recproca
F1 ,m,n
Si W F 8, 21 , halle:
a. P W 2.42
b. P W 3.51
P W 3.51 1 P W 3.51 1 0.99 0.01
c. P 2.42 W 3.51
P 2.42 W 3.51 P W 3.51 P W 2.42 0.99 0.95 0.04
1 1
k F 0.01,8,21 0.1873
F 0.99,21,8 5.34
Ntese que se utiliz la propiedad recproca.
174
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
EJERCICIOS PROPUESTOS
W ~ 2 Z ~ t ( 20) Y ~ F(8,10)
4. Sea (5)
, , . Usando tablas estadsticas hallar las siguientes
probabilidades:
a) P(W 3)
b)
P(W 11.07 )
c)
P( Z 0.860 )
d)
P( Z 1.325 )
e) P(1.325 Z 1.725)
f) P (Y 3.07)
g) P (Y 5.06)
h) P (3.07 Y 5.06)
175
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Preguntas de Autoevaluacin
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
176
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
CAPTULO X
INFERENCIA ESTADSTICA
X i
Para la media poblacional (): X i 1
n
n
(X i X )2
Para la variancia poblacional (2): 2 S 2 i 1
n 1
Nmero de xitos
Para la proporcin poblacional (): p
n
Ejemplo 1
De una poblacin de tallas (mt) en madres adolescentes con media y varianza , 2se
extrae una muestra aleatoria 8 madres adolescentes, cuyos valores observados son:
1.50, 1.60, 1.58, 1.45, 1.52, 1.68, 1.62, 1.55. Halle un estimador puntual para la media,
la varianza y la desviacin estndar poblacionales.
8
X i
12.5
Entonces se tiene: X i 1
1.56 mt. , ser una estimacin puntual de .
8 8
8
Clculo de la suma de cuadrados: X
i 1
i
2
19.569
Para la varianza, el estimador puntual ser:
n n
Xi
2
n
X i
2
i 1
n
X i
2
nX
19.569 (12.5) 2 19.569 8 x1.562
S
2 i
i
0.0053
n 1 n 1 7 7
Sea X1, , X n una muestra aleatoria de tamao n de una poblacin con parmetro ,
cuyos valores observados o datos respectivos son x1 , , xn . Sea adems, la v.a
h X ,
, X n un valor estadstico, con funcin de probabilidad conocida, que estima
1
Interpretacin
Si X1, , X n es una muestra aleatoria de una poblacin normal con media y variancia
2
desconocida. Para cualquier tamao de muestra se tiene que la variable aleatoria la
X
v.a. t ~ t n -1 , entonces para definir el intervalo de confianza del 1 100 %
S
n
se cumple:
P t1 ; n 1 t1 n t1 ; n 1 P t1 ; n 1
X
t1 ; n 1 1 .
2 2 2 S 2
n
Entonces despejando la expresin anterior, el intervalo con un nivel de confianza del
1 100 % para la media ( ) ser hallado por:
s S
X t 1 ;n 1 X t 1 ;n 1
2 n
2 n
a b
178
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
donde a y b son valores numricos que representan el Lmite inferior y Lmite superior
del intervalo.
s
Lmite inferior: LI ( ) X t 1
2;n 1 n
s
Lmite superior: LS ( ) X t 1 ;n 1
2 n
p
Se usa la v.a. ~ N(0,1) y n>30, entonces para determinar el intervalo de
(1 )
n
confianza del 1 100 % para la proporcin se cumple:
p
P Z Z Z P Z
Z 1
1 1 1 (1 ) 1
2 2
2 2
n
p 1 p p 1 p
p Z p Z
1 n 1 n
2 2
a b
donde a y b son valores numricos que representan el Lmite inferior y Lmite superior
del intervalo.
Sea X1, , X n una muestra aleatoria de una poblacin normal con variancia 2 ,
(n 1) S 2 (X i X )2
desconocida. Se usa ~ 2n -1 , entonces para determinar el
2
2
P 2 2,n1 2n1 21 2,n1 1
2
P 2,n1
n 1 S 2
1
2
2 1 2,n1
179
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
n 1 s 2 2 n 1 s 2
2
2
1 , n 1 , n 1
2 2
a b
Si se desea obtener los lmites de confianza para la desviacin estndar se obtiene la raz
cuadrada en la expresin anterior obtenindose:
n 1 s 2
n 1 s 2
2
2
1 , n 1 , n 1
2 2
a b
Ejemplo 2
En 2011, se tom una muestra de 35 casas en la Ciudad 1, y se hizo el estudio de las
siguientes variables: X= Peso total de basura producida en una casa durante un da (Kg),
Y= Peso de residuos orgnicos producidos (Kg) en una casa durante un da y Z= Hbito
de reciclaje, obtenindose los siguientes resultados:
3.160 1.997
x
s 0.884 0.818
n 35 35
a. Halle e interprete un intervalo de confianza del 95% para el peso total promedio de
basura producida en una casa durante un da.
Solucin:
1 0.95 0.05 1 0.975 . t 0.975,34 2.032
2
0.884 0.884
3.160 2.032 3.160 2.032 2.856 3.464
35 35
Solucin:
6
1 0.95 0.05 1 0.975 . Z 0.975 1.96 y p
0.1714
2 35
0.1714 x(1 0.1714) 0.1714 x(1 0.1714)
0.1714 1.96 0.1714 1.96
35 35
0.0465 0.2963
181
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Solucin:
1 0.95 0.05 1 0.975 20.975,34 51.966 y 20.025,34 19.806
2
Interpretacin: Se tiene una confianza de 95% que la verdadera varianza estndar del
peso de los residuos orgnico se encuentra en el intervalo 0.438, 1.149 Kgs . 2
Ejemplo 3
Los siguientes datos corresponden a los pesos de destete (X 1) y peso de nacimiento (X2),
en gramos, de una muestra aleatoria de 10 cuyes.
X1 210 174 310 127 174 172 296 362 306 352
X2 140 142 140 90 92 84 156 200 185 180
x 248.3 140.9
s 85.7 41.4
n 10 10
1 0.90 0.10 1 0.95 . t 0.95;9 1.833
2
s 85.7
x t1 2,n1 248.3 1.833 , de donde se obtiene: 198.624, 297.976
n 10
One-Sample T: PDestete
182
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
b. Halle un intervalo de confianza de 98% para la verdadera variancia del peso al nacer
de los cuyes.
Solucin:
1 0.95 0.02 1 0.99 20.99,9 21.666 y 20.01,9 2.088
2
Interpretacin: Se tiene una confianza de 98% que la verdadera variancia del peso al
nacer est en el intervalo 711.975, 7387.759 gr2.
Para hallar el intervalo de confianza para , se sacar la raz cuadrada en ambos
lmites: obtenindose: 26.683,85.952 gr.
a. Halle e interprete un intervalo de confianza del 95% para el peso promedio poblacional.
183
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
a. Con una confianza del 95%, halle el intervalo de confianza para la tensin de ruptura
media de las fibras sintticas. Interprete.
184
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Se sabe que:
p Z 2 1
Z
(1 )
, despejando se obtiene el tamao de muestra: n
e2
n
Donde:
e es el margen error permisible.
El valor de Z Z 1 depende del nivel de confianza requerido
2
Ejemplo 4
Una famosa cadena de hoteles desea desarrollar un intervalo de confianza del 99% para
estimar el nmero promedio de habitaciones ocupadas cada noche en sus sucursales de
toda la nacin. Cuntas noches deben incluirse en la muestra si se puede tolerar un
error de 10 habitaciones y una muestra piloto revela una desviacin estndar de 60
habitaciones?
Solucin:
t 2s2 2.582 x602
0.01 t 1 , t 0.995, 2.58 n 2 239.63 240 noches
2 e 102
185
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 5
Cuntos estudiantes debe tener una muestra, con el fin de estimar la proporcin de
estudiantes que tienen correo electrnico? En un estudio previo, se hall que de 150
estudiantes, 120 tenan correo electrnico. Se desea tener un nivel de confianza del 95%
y un error del 3% en las estimaciones.
Solucin:
Margen de error n
0,01 6146,560
0,02 1536,640
0,03 682,951
0,04 384,160
0,05 245,862
Se observa un incremento exponencial de tamao de muestra al disminuir el margen de
error.
Ejercicio 3. Cul debe ser el tamao de muestra para estimar el nivel medio del
consumo de protenas de los adultos de una zona minera, si se desea tener un margen
de error de 0.45 g/dl y un nivel de confianza del 95%?. De una muestra piloto se obtuvo
que el consumo de protenas tiene una desviacin estndar de 2.5 g/dl.
Ejercicio 4. El director comercial de cierta compaa que realiza ventas por correo
electrnico, desea precisar con mucho cuidado su poltica de crdito. Si el director desea
tener un intervalo de confianza del 99% para la proporcin de clientes que estn al da
en sus pagos. Qu tamao de muestra debe usar si se desea tener un margen de error
del 4.5%?. Suponga que en una muestra piloto de 35 clientes se hall que 8 clientes
estn al da en sus pagos.
186
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Una hiptesis estadstica, es cualquier afirmacin o suposicin que se hace acerca del tipo
de distribucin de probabilidad de la poblacin o al valor o valores de uno o ms
parmetros de la poblacin.
Ejemplo 6
Las siguientes son hiptesis estadsticas:
Hiptesis alterna (H1 o Ha). Es la hiptesis que se acepta en caso de que la hiptesis
nula sea rechazada. H1 es la suposicin contraria a H0.
La aceptacin de una hiptesis nula, significa que los datos de la muestra no proporcionan
evidencia suficiente para rebatirla. El rechazo significa que los datos de la muestra lo
rebaten.
H 0 : 0 contra H1 : 0
H 0 : 0 contra H1 : 0 , o
H 0 : 0 contra H1 : 0
H 0 : 0 contra H1 : 0 , o
H 0 : 0 contra H1 : 0
187
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Al tomarse una decisin respecto a una hiptesis nula (H 0), se puede presentar cuatro
posibles casos que determinan si la decisin tomada es correcta o incorrecta, esto se
presenta en la siguiente tabla:
Error tipo I, es el error que se comete cuando se rechaza una hiptesis nula que es
verdadera en la poblacin.
Error tipo II, es el error que se comete cuando se acepta una hiptesis nula que es falsa
en la poblacin.
188
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Para las diferentes pruebas de hiptesis se deben cumplir los siguientes supuestos:
a. La muestra es aleatoria.
b. La muestra proviene de una distribucin normal.
6. Conclusin
189
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
tc=
X 0
~ t n 1
t1= - t(1-,n-1)
t2= t(1-,n-1)
s
n
2
2n 1 S 2
2n1 12 2 , n 1
c 2
0
22 2 1 , n 1
p 0
Zc= ~ N(0,1)
0 (1 0 ) Z1= Z()
Z2 = Z(1-)
n
S12 22
/
2 2 Fc 2 2 F n1 1, n2 1 F1= F(, n1-1, n2-1)
2 1 S2 1 F1= F(1-, n1-1, n2-1)
a. 12 y 22 desconocidas pero
homogneas y poblaciones normales. S p2
n1 1 S12 n2 1 S22
X
X 2 1 2 0
n1 n2 2
t1 t 1 , n1 n2 2
1
tc t n1 n2 2
1 1
S p2 t2 t 1 , n1 n2 2
n1 n2
1 2
b. 12 y 22 desconocidas pero s12 s22
2
heterogneas y poblaciones
H 12 2 2
n n
normales.
s12 s22
X 1 X 2 1 2 0
tc t H n1 n2
s12 s22 n1 1 n2 1
n1 n2
t1 t 1 , H
t2 t 1 , H
a. Cuando 1 2 =0
n1 p1 n2 p2
p1 p2 1 2 0 p
Zc N 0,1 n1 n2
1 1
p 1 p
n1 n2
Z1= Z()
Z2 = Z(1-)
1 2
b. Cuando 1 2 0
p1 p2 1 2 0
Zc N 0,1 Z1= Z()
p1 1 p1 p2 1 p2 Z2 = Z(1-)
n1 n2
190
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 7
(En este ejemplo se usan los resultados del estudio durante 2011 de la ciudad 1 del
ejemplo 2 y datos ya calculados de la cuidad 2 para ese mismo ao). Se estudi el peso
total de basura producida por casa durante un da en dos ciudades, para lo cual se
tomaron dos muestras de tamaos 35 y 40 respectivamente obtenindose:
Ciudad 1 Ciudad 2
3.1600 3.7575
x
s 0.884 0.3809
n 35 40
Hay evidencias estadsticas para afirmar que el peso total promedio en la ciudad 1 es
3.22 Kg? Use =0.05
tc=
X 1 0 n1 ~t(n-1) Clculo: tc
3.16 3.22 35 0.402
s1 0.884
191
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 8
Despus de la ejecucin en el 2011 del estudio del peso de residuos orgnicos producidos
por casa durante un da en las ciudades 1 y 2; en el 2012 se volvi a recoger datos en
las mismas dos ciudades, para lo cual se tomaron dos muestras de tamaos 17 y 22
casas respectivamente obtenindose:
Ciudad 1 Ciudad 2
x 1.777 2.115
s 0.718 0.6549
n 17 22
a. Hay evidencias estadsticas para afirmar que el peso promedio de residuos orgnicos
en la ciudad 1 es menor de 2.5 Kg? Use =0.025
tc=
X 1 0 n1 ~ t(n-1) Clculo: tc
1.777 2.5 * 17 4.1518
s1 0.718
Regin de
Aceptacin
192
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
b. Hay evidencias muestrales para establecer que el promedio de los residuos orgnicos
de la ciudad 2 excede al de la ciudad 1 en ms de 1 Kg? Use =0.10
Solucin
22
H 0 : 12 22 1
12
22
H1 : 12 22 1
12
2. Elegir el nivel de significacin. =0.10
S12 22
Fc ~ F (n1 1, n2 1) ~ F (16,21).
S 22 12
0.7182
Clculo: Fc 1.2019
0.65492
12
193
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Segundo Paso
H o : 2 1 1
H1 : 2 1 1
2. Elegir el nivel de significacin. =0.10
( 2.115 1.777) 1
tc 3.002
1 1
0.46636( )
22 17
Ejemplo 9
Se hicieron 9 y 8 observaciones de pH en suelo superficial de cada una de dos diferentes
localidades, obtenindose:
Localidad 1 8.53 8.52 8.01 7.99 7.93 7.89 7.85 7.82 7.80
Localidad 2 7.85 7.73 7.58 7.40 7.35 7.30 7.27 7.27
194
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Solucin
Localidad 1 Localidad 2
x 8.04 7.47
s 0.285 0.224
n 9 8
tc=
X 1 0 n1 ~ t n 1 t8 Clculo: tc
8.04 8.08 9 0.42
s1 0.285
tc = -0.42 cae en la RA, entonces no hay evidencias estadsticas para rechazar la H0,
en otras palabras no se rechaza la afirmacin de que la media del pH es por lo menos
8.08 en la localidad 1.
One-Sample T: Local 1
Test of mu = 8.08 vs mu < 8.08
195
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Se rechazar H 0 si
X 1 0 n1 1.86
X 1 8.08
9 1.86 X 1 7.903
s1 0.285
Se rechazar H 0 si X 1 7.903 .
Solucin
Caso Prueba de hiptesis para 22 .
c2
n 1 S22 2 27 . Clculo: c2
8 1 0.2242 15.97
n 1
2 2 2
0.022
196
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
No se rechazar H 0 si:
2 n 1 S22 8 1 S22
12.017 S22 0.038
c
22
0.022
No se rechazar H 0 si: S 0.038 .
2
2
Solucin
22
Caso Prueba de hiptesis para 12 22 1
12
1. Formular la hiptesis nula y la hiptesis alternativa.
22
H 0 : 12 22 1
12
22
H1 : 12 22 1
12
2. Elegir el nivel de significacin. =0.10
S12 22 0.2852
Fc F n1 1, n2 1 F 8, 7 . Clculo: Fc 1.62
S22 12 0.2242
1 1 2
197
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
h. Sugiere la informacin que la verdadera media de valores de pH del suelo difiere para
las dos localidades? Use =0.05.
Solucin
Caso Prueba de hiptesis para 2 1 con 12 y 22 desconocidas y homogneas
Clculos: s 2p
n1 1 s12 n2 1 s22
8 0.2852 7 0.2242
0.067
n1 n2 2 15
tc
7.47 8.04 0 4.53
1 1
0.067
9 8
Regin de rechazo = RR = t15 2.131 t15 2.131
Regin de aceptacin = RA = 2.131 t 15
2.131
5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso
contrario, no rechazar la hiptesis nula.
198
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 10
La siguiente informacin es el resultado de un experimento para medir el porcentaje de
aumento de peso para ratones jvenes de laboratorio a los que se administr una dieta
estndar y ratones a los que se les dio 2000 partes por milln (ppm) de nitrato (fuerte
dosis) en el agua que bebieron.
Nitrato (1) 12.7 19.3 20.5 10.5 14.0 10.8 16.6 14.0 17.2
Control (2) 18.2 32.9 10.0 14.3 16.2 27.6 15.7
Suponiendo que el porcentaje de aumento de peso con nitrato y del control tienen
distribucin normal.
a. Son homogneas las variancias? Use =0.10.
Solucin
x 15.07 % 19.27 %
s 3.558 % 8.053 %
n 9 7
22
Caso Prueba de hiptesis para 2 1
2 2
1
12
22
H1 : 2 1
2 2
1
1
2
0.279 F 8, 6 4.15
1
Regin de rechazo = RR = F 8, 6
3.58
Regin de aceptacin = RA = 0.279 F 4.15
12
199
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
b. Determine con =0.01, si una fuerte dosis de nitrato retarda el verdadero promedio
de porcentaje de aumento de peso en ratones.
Solucin
tc
15.07 19.27 0 1.29
3.5582 8.0532
9 7
200
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 11
(En este ejemplo se usan los datos de la ciudad 1, del ejemplo 2). Hay evidencias
estadsticas para afirmar que la verdadera proporcin de casas que tienen hbito de
reciclaje es a lo ms 0.15? Use 0.025 .
Solucin
6
p 0.1714
35
Zc = 0.35 cae en la RA, entonces no hay evidencias estadsticas para rechazar la H0,
en otras palabras la proporcin de casas que tienen hbito de reciclaje es a lo ms
0.15.
Success = Si
201
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 12
En una biblioteca universitaria se hace un inventario completo de libros en estantes, una
vez al ao. El bibliotecario propone seleccionar 800 libros al azar de entre la coleccin
de la biblioteca e investigarlos de un modo semejante. Si la evidencia muestral indica
que la verdadera proporcin de libros mal colocados o extraviados es menor 0.02,
entonces el inventario se pospondr. Entre 800 libros buscados, 12 estaban mal
colocados o no se pudieron encontrar.
Solucin
12
p 0.015
800
Zc = -1.01 cae en la RA, entonces no hay evidencias estadsticas para rechazar la H0,
en otras palabras hay que sugerirle al bibliotecario que haga el inventario.
202
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Solucin
12 19
p1 0.015 p2 0.022
800 850
Zc
0.015 0.022 0 1.04
1 1
0.019 0.981
800 850
203
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Solucin
12 19
p1 0.015 p2 0.022
800 850
p1 p2 1 2
Zc N 0,1
p1 1 p1 p2 1 p2
n1 n2
0.015 0.022 0.005
Clculos: Z c 0.30
0.015 0.985 0.022 0.978
800 850
204
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejercicio 6. Se realiza un control a los conductores deteniendo los autos que circulan a
altas horas de la noche, midiendo a sus conductores el grado de alcohol consumido en
decigramos de alcohol por litro de sangre Se muestra a continuacin el resultado obtenido
en 12 conductores seleccionados aleatoriamente.
b. Probar la hiptesis que sostiene que la variancia del grado de alcohol consumido por
los conductores que circulan a altas horas de la noche es menor a 0.05 decigramos2
de alcohol por litro de sangre. Use = 0.05.
205
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Nivel 1 Nivel 2
n 21 23
x 14.4 18.6
s 2.277 2.450
Asuma que los tiempos observados en cada nivel tienen distribucin normal.
a. Hay evidencias estadsticas para afirmar que el verdadero tiempo medio en el nivel 1
es menor que 15.5 minutos? Use = 0.05.
206
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
d. Si el investigador afirma que la verdadera desviacin estndar del tiempo con el nivel
2 era 2.3, pero un especialista considera que ha aumentado Tiene razn el
especialista? Use =0.10.
e. Si 10 personas a los que se les aplic el primer nivel de ruido excedieron el tiempo
lmite para llevar a cabo la tarea especfica. Pruebe a un =0.05 si ms del 30% de
personas a los que se les aplica el primer nivel de ruido exceden el tiempo lmite para
llevar a cabo la tarea especfica.
207
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
f. Son similares los tiempos medios con ambos niveles de ruido?. Use =0.10.
g. Si 12 personas a los que se les aplic el primer nivel de ruido y 15 personas a lo que
se les aplic el segundo nivel de ruido excedieron el tiempo lmite para llevar a cabo
la tarea especfica. Pruebe a un =0.05 si la proporcin de personas que supera el
tiempo lmite en llevar a cabo la tarea especfica es mayor al aplicar el primer nivel de
ruido que el segundo nivel de ruido.
208
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
209
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Prctica Dirigida N 7
1. La siguiente tabla muestra datos sobre aumento de peso corporal (grs) para una
muestra de animales de control y una muestra de animales a los que se dio una dosis
de 1 mg/pastilla de cierto esteroide diluido (los animales de control son aquellos que
no recibieron el esteroide).
a) Halle e interprete con un nivel de confianza del 98% el aumento promedio de peso
corporal de los animales que se les dio el esteroide diluido.
c) Se puede concluir que la desviacin estndar del aumento de peso corporal de los
animales que tomaron esteroide es superior a 4.0 gr. Use = 0.05.
210
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
d) Con un nivel de significacin e 0.05, se puede afirmar que hubo una ganancia de
peso corporal de los animales que recibieron el esteroide con respecto a los que
no la recibieron.
211
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
212
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
213
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
214
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
EJERCICIOS PROPUESTOS
Tipo de
n x s
roca
I 14 3.06 0.14
II 18 2.85 0.12
III 22 3.02 0.29
a. Para el tipo de roca III, estime la densidad media con un intervalo de confianza
de 95%.
b. Es la densidad media de la roca tipo II igual a 3 gr/cm3? Use =0.0456.
c. Es la densidad media de la roca tipo III menor que la de tipo I? Use =0.0548.
3. Durante una semana, una tienda de grandes almacenes local registr que 8540 de
las 12810 personas que entraron en la tienda hicieron por lo menos una compra.
Tratando esto como una muestra ala azar de todos los clientes potenciales. Hallar un
intervalo de confianza del 90% para la proporcin real de personas que entran en la
tienda y que harn por lo menos una compra.
a. Hay evidencias estadsticas para establecer que las variancias difieren? Use
0.02 .
b. El contenido promedio de D.D.T en pelcanos jvenes supera al de pelcanos
polluelos en ms de 0.01 ppm? Use 0.02
7. Se sabe que el peso de ciertas bolsas de arroz, embolsadas por una mquina, tiene
distribucin normal. Se tom una muestra aleatoria de 22 bolsas obtenindose una
media de 1.990 Kg y una variancia de 0.0004 Kg 2 .
Autoritarismo n x s
10. Un partido poltico afirma que el 60% de los electores estn de acuerdo con l en
cierto problema. En una muestra aleatoria de 800 electores se encontr que 455
estn a favor.
a. Puede el partido sostener su afirmacin?. Use =0.05.
b. Determine e interprete un intervalo de confianza del 95% para la verdadera
proporcin de electores que estn de acuerdo con ese partido poltico.
216
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Greeck 20 86 9.8
Nico 25 81 10.4
13. Cul debe ser el tamao de muestra para estimar la proporcin de escolares de
quinto de secundaria, en cierto distrito, que saben nadar (asuma que en ese distrito
hay aproximadamente 5000 estudiantes de quinto de secundaria)?. Considere un
error de 3% en las estimaciones y que en un estudio previo con 100 estudiantes se
encontr que 75 saban nadar. Adems se desea tener un nivel de confianza de 95%.
14. El gerente de produccin desea estimar el tiempo promedio que demora cierto
proceso, como el tiempo se mide en minutos, este gerente desea tener un error
mximo de estimacin, del tiempo promedio real, de a lo ms 4 minutos, sabe, por
experiencias anteriores, que la desviacin estndar en los tiempos de procesamiento
es de 10 minutos, qu tamao de muestra debe tomar, si desea un nivel de confianza
del 95% para sus resultados?
15. El tiempo que tarda un proceso de ensamblaje tiene una distribucin normal con una
media de 20 minutos. Para hacer ms eficiente el sistema, se le pide a un ingeniero
que haga un anlisis y proponga algunas mejoras. Tras implementar los cambios
sugeridos, se toma una muestra de 9 artculos y se registran sus tiempos de
ensamblaje obtenindose un tiempo medio de 24.3 minutos con una desviacin
estndar de 6 minutos.
a) Se puede afirmar que los cambios implementados has disminuido el tiempo
promedio del sistema de ensamblaje? (Utilice un nivel de confianza del 95%)
b) Construya un intervalo del 90% de confianza para el tiempo medio de
ensamblaje
217
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
16. Se sabe que en una compaa de taxis el gasto diario promedio en combustible, por
unidad, es una variable con distribucin normal, cuyo promedio es de 187.6 galones,
y una desviacin estndar de 32.5 galones. El gerente de operaciones decide incluir
un aditivo especial al combustible que le permitir un ahorro en ese rubro. Despus
de incluir el aditivo toma una muestra de 6 unidades y encontr los siguientes gastos
en combustible expresado en galones por da:
180.3 179.6 185.7 170.5 158.3 180.6
17. Una compaa telefnica est tratando de determinar si algunas lneas en una
determinada comunidad deben instalarse subterrneas. Debido a que se har un
pequeo cargo adicional en las cuentas telefnicas para pagar los costos extras de la
instalacin, la compaa ha determinado hacer un estudio entre los clientes y proceder
con la instalacin subterrnea solo si el estudio indica que ms del 60% de todos los
clientes estn a favor de la instalacin.
a) Defina en forma clara el parmetro que utilizar en la prueba de hiptesis
respectiva.
b) Si 118 de 160 clientes entrevistados estn a favor de esta instalacin a pesar del
cargo adicional, qu debe hacer la compaa? Use un =0.01
c) Cules son las conclusiones al respecto?
d) Defina el error tipo I y error tipo II en trminos del problema
18. El Dpto. de Marketing de una compaa que produce el detergente ABC encontr en
una muestra de 200 amas de casa que el 20% utiliza esta marca de detergente.
Despus de una intensa campaa publicitaria, se tom otra muestra de 300 amas de
casa la que indic que el 27% favorece esta marca. Al 5% de significacin, puede
el jefe del Dpto. concluir, en base a los resultados de esta muestra, que la campaa
fue exitosa?
19. Al seor Juan Prez le han propuesto participar en una lista para el congreso, en
representacin de su provincia. Para aceptar la propuesta este seor quiere estar
seguro de que al menos el 25% de los votantes en la provincia que reside estn a
favor de su candidatura. Para determinar esto toma una muestra aleatoria de tamao
n = 450 personas encontrando que 90 estn a favor de su candidatura. Aceptar el
seor Juan Prez participar en la lista? Considere = 5%
218
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Preguntas de Autoevaluacin
3. Si se desea contrastar la venta media con el valor 100, entonces la hiptesis planteada
para una prueba unilateral con cola a la derecha, es __________________________
7. En una prueba unilateral para una media con cola a la izquierda, si el estadstico
tc=3.45, entonces la decisin estadstica ser _____________________________.
9. Para realizar una prueba de diferencia de medias, si las varianzas son desconocidas,
se debe realizar previamente _________________________________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
219
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
CAPTULO XI
El anlisis de regresin lineal simple, es una tcnica estadstica que permite estudiar la
relacin funcional entre dos variables, una de ellas es la variable dependiente Y (por
ejemplo ventas semanales) y la otra la variable independiente X (por ejemplo el gasto
semanal en publicidad).
Objetivo. Al finalizar este captulo el estudiante debe conocer los supuestos y estimacin
de parmetros en el anlisis de regresin lineal simple, probar si existe relacin lineal
entre dos variables y calcular el coeficiente de determinacin y el coeficiente de
correlacin.
220
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 1
8000
6000
Delitos
4000
2000
221
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Yi 0 1 X i i , i 1,2,3, , n (1)
Donde:
Los supuestos del anlisis de regresin lineal simple son los siguientes:
i es independiente de j para ij
i es independiente de X
En consecuencia:
Y . X E Yi E 0 1 X i i 0 1 X i E i 0 1 X i
Var Yi Var 0 1 X i i Var i 2
Notar que 1 mide el cambio en el promedio Y.X ante el cambio en una unidad de X.
i Yi 0 1 X i , por lo tanto:
n n
Q i2 Yi 0 1 X i
2
i 1 i 1
222
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
n n
n b0 b1 xi yi
i 1 i 1
n n n
b0 xi b1 xi2 xi yi
i 1 i 1 i 1
SP( XY )
b1 b0 y b1 x
SC ( X )
( xi ) 2
n
SC ( X ) ( xi x) 2 xi2
xi2 n x
2
Suma de cuadrados de X:
i 1 n
n ( xi )( yi )
Suma de productos X e Y: SP( XY ) ( xi x)( yi y ) xi yi xi yi n x y
i 1 n
Yi y b1 x b1 X i y b1 X i x Yi y b1 X i x , es el efecto de la regresin.
El error estimado es: ei Yi Yi y estima a i Yi Y . X
550
500
450
400
Precio
350
300
Yi
250 ei
200
150 Yi
100
0 5 10
Captura
223
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
yi y Yi y yi Yi De donde se obtiene:
y y Y y y Y
i i i i
y y Y y y Y
n 2 n 2 n 2
i i i i
i 1 i 1 i 1
SCR Yi y
2
b12 xi x 2
b1 SP( XY ) b12 SC ( X )
( yi ) 2
SCT SC (Y ) y yi2 n y
2 2
i
n
SCE SCT SCR
Con la informacin anterior se construye el siguiente cuadro del ANVA.
Prueba de hiptesis
224
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Prueba Estadstica
SC( R) / 2 2 1
CM ( R)
Fc 1 2 1 F 1 , n 2
SCE / 2
n 2 CME
n2 n2
FTab F1 ;1, n 2
Decisin estadstica
SCR ( SP( XY )) 2
r
2
x100 x100 , 0 r 2 100%
SCT SC ( X ) xSC(Y )
( )( )
=
( 2 ) ( )2 ( 2 ) ( )2
SP XY
r , 1 r 1
SC X SC Y
Si r > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de
la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a +1. Por
ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.
Si r < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye
el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a
-1. Por ejemplo: peso y velocidad: los alumnos con ms peso suelen correr menos.
Si r = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro
tipo de correlacin (cuadrtica, exponencial, etc.)
225
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Ejemplo 1
Y 190 160 134 129 172 197 167 239 542 372 245 376 454
X 7.23 8.53 9.82 10.26 8.96 12.27 10.28 4.45 1.78 4.00 3.30 4.30 0.80
600
500
400
Precio
300
200
100
0 2 4 6 8 10 12
Captura
Clculos previos
13 13 13 13 13
x
i 1
i 85.98, x 732.2376, y
i 1
2
i
i 1
i 3377, y
i 1
2
i 1089365 x
i 1
i yi 17357.8
SC X x 2
x 163.5791
i
2
i
n
SC Y yi2
y i 2 212124.3077
n
SP XY xi yi
x y i i
4977.1585
n
SP XY
b1 30.4266
SC X
13
13
i y
xi
b0 y b1 x i 1
b1 i 1 461.0062
13 13
226
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Prueba de hiptesis
H p : 1 0 (No hay relacin lineal entre X e Y)
H a : 1 0 (Si hay relacin lineal entre X e Y)
c) Estime el precio promedio de harina de pescado (en dlares por tonelada) para una
captura de 5 millones de toneladas mtricas de anchoas.
Por la tanto, como Xi=5, se tiene: Y 461 .0062 30 .4266 * 5 308 .8732
Coeficiente de determinacin
SC R SP XY 0.7139 71.39%
2
r
2
SC Y SC X SC Y
Coeficiente de correlacin
SP XY
r 0.84
SC X SC Y
Se puede afirmar que hay una alta asociacin negativa entre X e Y en otras palabras
cuando aumenta una de ellas disminuye la otra.
227
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Analysis of Variance
Source DF SS MS F P
Regression 1 151438 151438 27.45 0.000
Residual Error 11 60686 5517
Total 12 212124
228
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
3
Ejercicio 1. Se desea estudiar la tasa de flujo Y (en m / min ) de un dispositivo para
medir la calidad del aire en funcin de la cada de presin X (en mm de agua) a travs
del filtro del dispositivo. Se tom una muestra de 10 mediciones encontrndose los
siguientes datos:
Y 0.6 0.7 0.8 1.0 1.1 1.2 1.4 1.8 2.2 2.6
X 127 178 229 254 330 381 406 432 457 507
229
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
d) Estime la tasa de flujo promedio para una cada de presin de 400 mm de agua.
230
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Prctica Dirigida N 8
Tiempo (minutos x) 27 45 41 19 35 39 19 49 15 31
Eficiencia (% Y) 47 84 80 46 62 72 52 87 37 68
n 10 x i 320 x 2
i 11490 y i 635 y 2
i 43075 x y
i i 22095
a) Determine la ecuacin de la regresin entre la eficiencia y el tiempo de extraccin.
Interprete el coeficiente de regresin estimado.
b) Pruebe si existe una relacin lineal entre las variables. Use un nivel de significacin
del 5%.
231
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
232
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
EJERCICIOS PROPUESTOS
X 8.3 8.3 12.1 12.1 17.0 17.0 17.0 24.3 24.3 24.3 33.6
Y 227 312 362 521 640 539 728 945 738 759 1263
4. En un centro de salud se han tomado los datos de las edades y la Presin Sistlica
de 12 pacientes, bajo la sospecha de que la edad y la presin estaban relacionadas
de alguna manera. Los datos que se tomaron son los siguientes.
Edad (X) 56 42 72 36 63 47 55 49 38 42 68 60
Presin sistlica (Y) 147 125 160 118 149 128 150 145 115 140 152 155
233
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
7. El banco Prstamo estudia la relacin entre las variables Ingresos (X) y ahorros
(Y) mensuales de sus clientes. Una muestra aleatoria de de sus clientes revelo los
siguientes datos.
Nmero de 28 17 32 48 6 14 19 24 34 22 20 46
documentos (miles
documentos)
Costo de la auditora 50 35 65 98 12 24 38 45 65 45 36 85
(miles $)
Humedad en el 42 35 50 43 48 62 31 36 44 39 55 48
almacenamiento (%)
Humedad en la 12 8 14 9 11 16 7 9 12 10 13 11
materia prima (%)
234
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Activo total 22 18 14 8 26 10 16 19 20 7
(millones $)
Rentabilidad 29.3 17.6 16.0 9.5 22.6 12.4 18.5 21.4 18.2 12.5
(%)
11. El gerente de ventas permite que los agentes vendedores que tiene a su cargo reciban
charlas para motivarlos, dichas charlas se dan en diferentes horarios y los agentes
tienen absoluta libertad para elegir el horario que crean conveniente. El gerente cree
que dichas charlas influyen en la eficiencia de las ventas. Para verificar esto toma una
muestra de 10 vendedores y determin el tiempo acumulado de horas en las que estuvo
presente en una o ms charlas durante el ltimo trimestre y la eficiencia de sus ventas,
los datos encontrados fueron:
a)Es posible afirmar que existe una relacin lineal entre el nmero de horas de charla
y la eficiencia en las ventas?. Use un =0.05.
b) Interprete adecuadamente el coeficiente de regresin.
c) El Gerente de ventas afirma que cuando un agente vendedor recibe charlas esto
permite un mejor desempeo en sus nivel de ventas y cree adems que por cada
hora adicional de charla su rendimiento se incrementa en ms de un punto
porcentual. Utilizando un nivel de significacin del 5% Qu puede concluir con
respecto a la afirmacin que hace el gerente de ventas?.
235
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
12. En ocasiones es conveniente comprar la mayor cantidad posible de ciertos artculos. Por
lo general el precio unitario es menor al adquirir grandes cantidades. Para contrastar
esta teora se obtuvieron los siguientes datos:
13. Un banco quiere determinar la relacin entre las variables Ingresos mensuales
(variable independiente) y Ahorros mensuales (variable dependiente) de sus
clientes. Para esto, selecciona una muestra aleatoria de seis clientes y obtiene los
siguientes resultados:
Y: Ahorros
X: Ingresos mensuales mensuales
1.0 0,20
1,2 0,22
1,5 0,25
0,8 0,18
1,8 0,30
2.0 0,35
236
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Preguntas de Autoevaluacin
1. El grfico que permite visualizar la existencia de una posible relacin lineal entre la
variable X e Y, se conoce como _______________________________________ .
5. Para probar si existe una relacin lineal entre las variables X e Y en un anlisis de
regresin, la hiptesis nula formulada es ____________________________ .
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
237
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Bibliografa
238
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Anexo N 1
Laboratorio de Cmputo N1
Se mostrar el procedimiento para realizar cada uno de los anlisis que se han visto en
el curso y extraer informacin sobre este conjunto de datos.
I. Estadstica Descriptiva
Para poder obtener medidas descriptivas como las medidas de tendencia central o de
dispersin seguiremos la siguiente secuencia en el men:
239
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Hemos elegido media, coeficiente de variacin, mediana, mnimo y mximo. Solo queda
darle click a Aceptar a esta ventana y a la siguiente y habremos obtenido estas medidas
requeridas.
Ejercicios:
1. Obtenga el coeficiente de variabilidad de la variable Edad: _________________
2. Obtenga la desviacin estndar de la variable Nota: ______________________
3. Obtenga la mediana de la variable Nota de acuerdo al Sexo de los estudiantes:
________________________________________________________________
240
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
II. Grficos
Desde esta opcin podemos elegir entre los grficos ms conocidos haciendo click sobre
el que deseemos obtener:
Grfico de barras
Luego elegiremos la variable que queremos graficar, existen otras opciones que se
pueden personalizar, como Escala, Etiquetas, etc.
241
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Grfica de Especialidad
25
23.2
22
20 19.2 19.2
16.4
Porcentaje
15
10
0
Contabilidad Derecho Industrial Psicologa Sistemas
Especialidad
Porcentaje en todos los datos.
242
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Grfico circular
19.2%
22.0%
23.2%
243
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Histograma
244
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Desde esta opcin podemos editar los LI y LS del histograma, para esta variable el
mximo es 18.5 y el mnimo 8.5, el nmero de intervalos de clase es 9, teniendo as que
el TIC es de 1.2
Con esto hemos editado nuestro histograma de frecuencias y podemos obtener uno como
el que se ha trabajado en clases:
245
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Histograma de Promedio
60
50
40
Frecuencia
30
20
10
0
8.5 1 0.9 1 3.3 1 5.7 1 8.1
Promedio
Grfica de cajas
Podemos obtener un grfico de cajas Simple o Con grupos, elegiremos esta segunda
opcin pues resulta interesante comparar variables cuantitativas de acuerdo a
agrupaciones.
246
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
18
16
Nota
14
12
10
247
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Tallo y hojas
3 8 559
5 9 45
22 10 13334444556688889
58 11 000111113334444555555666667778899999
96 12 00000111123333333444555555577788999999
(42) 13 000111111111133344444444555555566789999999
112 14 0000001111233333333333444455555555555566667788889999
60 15 0000000111113334455566666777788888999
23 16 1113556666668999
7 17 01456
2 18 35
Ejercicios:
___________________________________________________________________
248
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Anexo N 2
Laboratorio de Cmputo N2
Nuevamente trabajaremos con el conjunto de datos alumnos.mtw que cuenta con cinco
variables: Especialidad, Sexo, Edad, Nota, Traslado.
Al elegir esta opcin de prueba t para una muestra obtendremos la siguiente ventana:
249
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Desde esa ventana podremos elegir la variable con la que queremos trabajar. Podemos
especificar el valor de la media poblacional hipottica que este caso hemos definido con
el valor de 17 aos. Tambin debemos marcar la casilla para realizar la prueba de
hiptesis de la media (de lo contrario solo se obtendr el intervalo de confianza). Hacemos
click en Aceptar y obtendremos el siguiente resultado:
Prueba de = 17 vs. 17
Error
estndar
de la
Variable N Media Desv.Est. media IC de 95% T P
Edad 250 18.284 1.668 0.105 (18.076, 18.492) 12.17 0.000
Puede ser de inters realizar pruebas de hiptesis para una proporcin. Podramos querer
probar si el valor de la proporcin de estudiantes de Contabilidad es superior al 15%,
teniendo en cuenta que 41 de los 250 son de esa especialidad. Para ello tendramos que
ingresar a las pruebas de 1 proporcin y definir estos valores:
250
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Habiendo definido estas opciones hacemos click en Aceptar y obtenemos los siguientes
resultados:
Lmite
inferior
Muestra X N Muestra p de 95% Valor Z Valor p
1 41 250 0.164000 0.125480 0.62 0.268
De esa manera contamos con los valores de los intervalos de confianza y el Valor Z
calculado.
Si se quiere comparar si las medias de las Edad de acuerdo al Sexo son distintas, primero
debemos realizar la prueba de Hiptesis para determinar si las varianzas son o no
homogneas.
251
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Mtodo
252
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Estadsticas
IC de 90%
para
Sexo N Desv.Est. Varianza varianzas
Femenino 116 1.711 2.926 (2.551, 3.453)
Masculino 134 1.627 2.648 (2.324, 3.094)
IC para IC para
relacin de relacin de
Mtodo Desv.Est. varianza
Bonett (0.948, 1.168) (0.899, 1.364)
Levene (0.906, 1.214) (0.821, 1.475)
Pruebas
Estadstica
Mtodo GL1 GL2 de prueba Valor p
Bonett 0.422
Levene 1 248 0.28 0.600
253
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
254
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Error
estndar
de la
Sexo N Media Desv.Est. media
Femenino 116 18.15 1.71 0.16
Masculino 134 18.40 1.63 0.14
Podemos observar los valores de la media y la varianza de las edades para cada uno de
los grupos por Sexo. El clculo del intervalo de confianza al 95% y el valor T calculado
obtenido.
Ejercicios:
255
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General
Anexo N 3
TABLAS ESTADSTICAS
256