Вы находитесь на странице: 1из 256

UNA La Molina - Dpto.

de Estadstica e Informtica Estadstica General

CAPTULO I
CONCEPTOS BSICOS

La Estadstica proporciona una serie de mtodos y tcnicas que permiten analizar


informacin de las diferentes especialidades como Agronoma, Industrias Alimentarias,
Zootecnia, Economa, etc. con la finalidad de analizarla y tomar decisiones.

Objetivo. Entender conceptos bsicos y los alcances de la estadstica, que servirn de


base para la comprensin y desarrollo de los captulos posteriores.

1.1 Definicin de Estadstica

La Estadstica es la ciencia del aprendizaje a partir de los datos y de medicin, control y


comunicacin de la incertidumbre, proporcionando los medios esenciales para el avance
cientfico y social.
Los estadsticos proporcionan una gua crucial para determinar qu informacin es fiable
y que predicciones son confiables. Ayudan a la bsqueda de pistas sobre la solucin de
un misterio cientfico y, a veces a evitar que los investigadores sean engaados por falsas
impresiones.
Fuente: Davidian, M. and Louis, T. Whats is Statistics?. Consultado el 24 de Julio de
2014, pgina web de la American Statistical Association.
http://www.amstat.org/careers/whatisstatistics.cfm

Divisin de la Estadstica

La Estadstica puede ser dividida en:

La Estadstica Descriptiva. Parte de la estadstica que se ocupa de la clasificacin,


descripcin, simplificacin y presentacin de los datos. Comprende el uso de tablas
de frecuencias, grficos y el clculo de medidas estadsticas.

La Estadstica Inferencial. Parte de la estadstica que se ocupa de la estimacin y


prueba de hiptesis de los parmetros de una poblacin, a partir de una muestra
aleatoria extrada de dicha poblacin.

Ejemplo 1
Se desea hacer un estudio sobre el consumo de drogas en el distrito de Comas. Con esta
finalidad se extrae una muestra aleatoria de 240 adolescentes del distrito de Comas en
el 2013 y se les aplica la encuesta respectiva.

Se aplica la Estadstica Descriptiva para recopilar, clasificar, organizar y presentar en una


tabla de frecuencias y en forma grfica los datos recogidos de una encuesta.

Distribucin de la frecuencia de
consumo de droga

Frecuencia Frecuencia consumo de droga

de consumo Nmero Porcentaje 50,0


41,7
No 100 41,7 40,0 33,3

Interdiario 80 33,3 30,0


%

20,0 16,7
Diario 40 16,7 10,0
8,3

A veces 20 8,3 0,0


No Interdiario Diario A veces
Total 240 100,0
Frecuencia
Fuente: Elaboracin propia
Fuente: Elaboracin propia

1
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Tambin se calcula medidas estadsticas. La edad promedio de la muestra de los


adolescentes que consumen droga es 20.5 aos.

Se aplica la Estadstica Inferencial para estimar la proporcin de adolescentes que


consumen drogas diariamente del distrito de Comas, cuya estimacin fue de 65%. Para
probar la hiptesis si esta proporcin es mayor al 68%.

1.2. Conceptos bsicos

1) Poblacin. Es el conjunto de unidades elementales con caractersticas similares. El


estudio de toda la poblacin constituye un censo.
Ejemplo 2
1. El conjunto de todos los estudiantes de una institucin educativa.
2. El conjunto de todos los meses de venta en una casa comercial entre el 2007-
2011.
3. El conjunto de personas que viven en el Distrito de Brea.

2) Unidad Elemental. Es un elemento particular de la poblacin o muestra.


Ejemplo 3
1. Un estudiante de la institucin educativa.
2. Cada mes de venta en una casa comercial entre el 2007-2011.
3. Cada persona que viven en el Distrito de Brea.

3) Muestra. Es un subconjunto de la poblacin. Al proceso de obtencin de una muestra


se le llama muestreo. Para que una muestra sea representativa debe cumplir con
las siguientes condiciones:
a) Debe haber sido obtenida al azar.
b) Su tamao y sus elementos deben haber sido seleccionados aplicando un mtodo
de muestreo.
Ejemplo 4
1. 120 estudiantes de la institucin educativa.
2. 45 meses de venta en una casa comercial entre el 2007-2011.
3. 80 personas que viven en el Distrito de Brea.

Ejercicio 1. El rea de marketing del supermercado ABC, desea hacer un estudio sobre
la satisfaccin de los clientes que realizaron sus compras en el ltimo trimestre. Para el
estudio se obtuvo una muestra aleatoria de 420 clientes. Defina poblacin, unidad
elemental y muestra.

2
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 2. El instituto Nacional Agraria e Innovacin (INAI), va realizar un estudio de


reforestacin en la Selva Central del Per. Para el estudio se desea evaluar una muestra
de 450 rboles que tengan ms de 10 aos de edad. Defina poblacin, unidad elemental
y muestra.

4) Variable. Son las caractersticas que toman diferentes valores cuando son evaluadas
en las unidades elementales de una poblacin o muestra. Se representan por las
ltimas letras maysculas del alfabeto, por ejemplo: X, Y, Z, W, P, T, X1, X2, Y1, etc.

Tipos de Variables

Variables Cuantitativas. Son aquellas que se expresan en forma numrica y tiene


sentido realizar operaciones matemticas con ellas. Pueden ser del tipo:

Variable Cuantitativa Continua. Son aquellas que pueden tomar cualquier valor
numrico dentro de un intervalo continuo. Se utiliza un instrumento de medicin para
generar sus valores: balanza, termmetros, test, escalas, cronmetros, winchas, etc.

Ejemplo 5
1. Peso del langostino de ro (en gr)
2. Tiempo para encontrar estacionamiento en un centro comercial (minutos)
3. Gasto mensual familiar en atencin mdica (nuevos soles)

Variable Cuantitativa Discreta. Son aquellas que cumplen con la condicin de que
entre un valor cualesquiera y su consecutivo no es posible que existan valores
intermedios. Generalmente son representados por el conjunto de nmeros enteros.
Las observaciones cuantitativas discretas se registran por conteo.

Ejemplo 6
1. Nmero de artculos defectuosos en un lote de 20
2. Nmero de clientes atendidos cada 20 minutos en una ventanilla
3. Nmero de predios que posee un agricultor de un valle

Variable Cualitativa. Son aquellas que permiten que una unidad elemental pueda ser
clasificada como poseedora o no de cierta cualidad, propiedad o atributo. No tiene sentido
realizar operaciones matemticas con ellas. Son aquellas cuyos valores posibles son
atributos o categoras.

Variable Cualitativa Nominal. Son aquellas cuyos valores (cualidades, propiedades


o atributos) no son factibles de ser clasificados a travs de un criterio de orden o
jerarqua. Sus valores posibles no tienen un orden de importancia.

3
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 7
1. Sexo de los estudiantes (Masculino o Femenino)
2. Estado civil de una persona (Soltero, Casado, Divorciado, Viudo o Conviviente)
3. Marca de una computadora (A, B, C o D)
4. Marca de Automvil (Toyota, Chevrolet, Mercedes Benz, etc)

Variable Cualitativa Jerrquica u Ordinal. Son aquellas donde s se puede


establecer un criterio de orden o jerarqua entre sus atributos de la variable.

Ejemplo 8
1. Nivel de instruccin (Sin instruccin, Primaria, Secundaria o Superior)
2. Nivel socioeconmico de un cliente (Alto, Medio o Bajo)
3. Calificacin de un servicio (Bueno, Regular o Malo)
4. Rango Militar (Cabo, Sargento, Coronel)

5) Observacin. Es el valor posible que toma una variable. A las observaciones se les
suele representar con las letras minsculas subindicadas, como por ejemplo x i , yi
, zi
Ejemplo 9

1. X = Peso del langostino de ro (en gr). Observaciones:


x1 2.5, x2 3.0,.., x10 3.2
2. Y = Calificacin de un servicio. Observaciones: y1 Bueno, y2 Re gular, y3 Malo

Ejercicio 3. Considerando que para el ejercicio 1 se aplic la siguiente encuesta.

Supermercado ABC: Encuesta de opinin


1. Edad
2. Cul es el tipo de pago?
1=Contado 2=Tarjeta de crdito 3=Crdito ABC
3. Cmo encuentra el estado de los productos?
1=Muy bueno 2=Bueno 3=Regular 4=Malo
4. Con qu frecuencia encuentra sus productos?
1=Siempre 2=Casi siempre 3=Raramente 4=Nunca
5. Nmero de veces que viene al supermercado semanalmente
6. El gasto semanal en sus compras

Complete el siguiente cuadro:

Variable Tipo de variable Observacin


Edad
Tipo de pago
Estado de los productos

Frecuencia que encuentra


los productos
Nmero de veces que viene
al supermercado
semanalmente
Gasto semanal

4
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 4. Para evaluar un programa productivo cuyos beneficiarios son los agricultores
de una comunidad campesina, se ha aplicado la siguiente encuesta.

Encuesta para evaluacin del programa productivo


1. Nivel tecnolgico usado
1=Alto 2=Medio 3=Bajo
2. Usa fungicidas
1=Si 2=No
3. Usa insecticidas
1=Si 2=No
4. Nmero de meses que est en el programa
5. Tamao de su predio (has)
6. Ingreso mensual (en soles)

Complete el siguiente cuadro:

Variable Tipo de variable Observacin


Nivel tecnolgico usado
Usa fungicidas
Usa insecticidas
Nmero de meses que est en el programa

Tamao del predio


Ingreso mensual

6) Parmetro. Es una medida estadstica para describir el comportamiento de una


variable en la poblacin. Son calculadas con los datos de toda la poblacin. Es un
valor constante. Se representan con letras griegas.

Ejemplo 10
1. Suponga que el nmero promedio de cocinas vendidas en todos los meses de venta
es 15.4 ( = 15.4).
2. El Censo Nacional 2007: XI de Poblacin y VI de Vivienda indica que en el grupo edad
de 20 a 29 aos, el 1.4% de los hombres no sabe leer y escribir mientras que el 3.1%
de las mujeres no sabe leer y escribir (1 = 0.014 y 2 = 0.031).
3. Suponga que en todo Brea la proporcin del nivel de instruccin result:

Instruccin Proporcin (i)


Primaria 0.455
Secundaria 0.445
Superior 0.100
TOTAL 1.000

7) Valor estadstico o Estadgrafo. Es una medida para describir el comportamiento


de una variable en la muestra. Se calculan con los datos obtenidos de una muestra.
Son valores variables (varan de muestra a muestra). Los estadsticos sirven para
estimar a los parmetros. Se representan con letras latinas.

5
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 11
1. En una muestra de 30 meses de venta se encontr que el nmero promedio de
cocinas vendidas fue de 14.9 ( x 14 .9) .
2. En la encuesta nacional de hogares (ENAHO) indica que el 1.1% de los hombres no
sabe leer y ni escribir ( p 0.011) .
2. Suponga que en distrito de Brea se ha seleccionado una muestra de 500 personas
encontrndose los siguientes resultados:

Instruccin Proporcin (pi)


Primaria 0.460
Secundaria 0.430
Superior 0.110
TOTAL 1.000

Notacin de los principales parmetros y estadsticos


Medidas estadsticas En una poblacin En una muestra
(parmetro) (estadstico)
Media X
Mediana ME me
Moda MO mo
Proporcin p
Variancia o Varianza 2 S2
Desviacin Estndar S
Coeficiente de Variabilidad CV cv

Ejemplo 12
En el siguiente ejercicio, identificar: la poblacin, la muestra, unidad elemental, la
variable, tipo de variable, observacin, parmetro y valor del estadstico.

La Oficina de Servicios Generales de la UNALM desea conocer los medios en los cuales
con mayor frecuencia se transportan los alumnos de la UNALM. Para ello, realiza una
encuesta a 50 alumnos de pregrado en el semestre 2013-II y encuentra los siguientes
resultados:
a) El 70% de los encuestados usa el transporte pblico y un 20% usa el transporte de
la universidad.
b) El 20% de los encuestados consideran que el estado de las unidades de transporte de
la UNALM es bueno, el 35% que es regular y el 45% que es malo.
c) El nmero promedio de unidades que toma para llegar a la universidad es de 1.5.
d) El tiempo promedio de traslado de su casa a la universidad es de 39.70 minutos.

Solucin

Poblacin:
Todos los alumnos de la UNALM La Molina de pregrado del semestre 2013-II

Unidad elemental:
Cada alumno de la UNALM La Molina de pregrado del semestre 2013-II

Muestra:
50 alumnos de la UNALM La Molina de pregrado del semestre 2013-II

6
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Valor del
Tipo de
Variable Observacin Estadstico Parmetro
Variable
(estimacin)
a) X= Medio de transporte Cualitativa x22 pblico p p 0.70 La proporcin de
usado para llegar a la nominal alumnos segn el
UNALM. pu 0.20 medio de transporte
po 0.10 usado para llegar a la
UNALM.

b) Y= Opinin sobre el estado Cualitativa y40 bueno pb 0.20 La proporcin de


de las unidades de jerrquica alumnos segn la
transporte de la pr 0.35 opinin sobre el
UNALM. pm 0.45 estado de las
unidades de
transporte de la
UNALM.

c) Z= Nmero de unidades de Cuantitativa z4 1 z 1.45 El nmero promedio


transporte que toma discreta de unidades de
para llegar a la UNALM. transporte que toma
para llegar a la
UNALM
d) V= Tiempo de traslado de Cuantitativa v48 55 v 39.70 El tiempo promedio
la universidad a su continua de traslado de la
casa. universidad a su casa

Ejemplo 13
Se presentaron algunos resultados del informe gerencial de marketing Perfil del adulto
joven elaborado por Apoyo Opinin y Mercado. (www.apoyo.com). El informe fue
elaborado a partir de los resultados de una encuesta realizada el 25 Abril del 2010 a una
muestra aleatoria conformada por 2000 jvenes de Lima Metropolitana de todos los
niveles socioeconmicos y cuyas edades fluctan entre los 21 y 35 aos de edad.
El ingreso medio mensual es de 1320 nuevos soles.
El 5% tiene estudios de postgrado, el 17% universitaria completa, el 33% universitaria
incompleta, el 35% secundaria completa y el resto secundaria incompleta.
El 42% de jvenes trabaja en empresas estatales.

Solucin

Poblacin.
Todos los jvenes de Lima Metropolitana de todos los niveles socioeconmicos y cuyas
edades fluctan entre los 21 y 35 aos.

Muestra.
2000 jvenes de Lima Metropolitana de todos los niveles socioeconmicos y cuyas edades
fluctan entre los 21 y 35 aos.

Unidad Elemental.
Un joven de Lima Metropolitana de cualquier nivel socioeconmicos y cuya edad flucta
entre los 21 y 35 aos.

Variables Tipo de variable Observacin


Ingreso mensual de los jvenes Variable cuantitativa continua 1000
Grado de instruccin Variable cualitativa jerrquica Superior
Tipo de empresa que trabaja Variable cualitativa nominal Estatal

7
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Valor estadstico
El ingreso medio mensual es de 1320 nuevos soles.
El 17% universitaria completa
El 42% de jvenes trabaja en empresas estatales.
Parmetros
El ingreso promedio mensual
Porcentaje de jvenes que tienen cierto grado de instruccin.
Porcentaje de jvenes que trabajan en cierto tipo de empresa.

Ejemplo 14
Con la finalidad de efectuar mejoras con los servicios al turista, se seleccionaron 200
turistas franceses al azar que arribaron a nuestro pas el 2013 y se les aplic una encuesta
en la que se pregunt por:

Nmero de das que permanecieron en el pas, obtenindose un promedio de 8 das.


Medio de transporte que utilizaron para viajar, a lo que el 20% respondi que viaj en
avin, el 30% en tren y el 50% en bus.
Monto gastado durante el tiempo de estada, de lo que se obtuvo un promedio de
4560.6 soles por encuestado.
En cuanto al servicio de alimentacin el 30% lo calific de excelente, el 20% muy
bueno y el 50% bueno.

Solucin:

Poblacin:
Todos los turistas franceses que arribaron a nuestro pas el 2013
Muestra:
200 turistas franceses que arribaron a nuestro pas el 2013
Unidad elemental:
Un turista francs que arrib a nuestro pas el 2013

Variables: Tipo de variables: Observacin:


X1: Nmero de das de permanencia en el pas Cuantitativa discreta 10 das
X2: Medio de transporte para trasladarse Cualitativa nominal Avin
X3: Monto gastado durante el tiempo de estada Cuantitativa continua S/. 3520
X4: Opinin sobre el servicio de alimentacin Cualitativa jerrquica Excelente

Valor estadstico:
Nmero promedio de das de permanencia en el pas ( x 8 das )
Porcentaje del medio de transporte para trasladarse en avin ( p 20 .0%)
Monto gastado promedio durante el tiempo de estada ( x S / .4560.6)
Porcentaje que opinaron sobre el servicio de alimentacin excelente ( p 30 .0%)

Parmetros:
Nmero promedio de das de permanencia en el pas
Porcentaje del medio de transporte para trasladarse
Monto gastado promedio durante el tiempo de estada
Porcentaje que opinaron sobre el servicio de alimentacin

Ejercicio 5. La Direccin de Salud (DISA) de una zona rural desea realizar un estudio
para evaluar la calidad de servicio de las postas de salud. Con esta finalidad se extrae
aleatoriamente 30 postas de la DISA con lo cual se obtiene la siguiente informacin:
El 60% de las postas de salud registraron como enfermedad principal las respiratorias.
El nmero promedio de nios menores de 6 aos atendidos fue de 120.5
Slo el 25% de las postas tienen como turno de atencin maana y tarde.

8
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Identificar la poblacin, unidad elemental, muestra, variables, tipos de variables,


observacin, parmetros y valor estadstico.

Variable Tipo de Observacin Valor del Parmetro


Variable Estadstico

Ejercicio 6. Una empresa distribuidora desea evaluar su eficiencia para atender los
pedidos de sus clientes. Selecciona aleatoriamente 30 servicios de reparto realizados en
el 2013 y registra los siguientes datos: Tiempo que se tarda para atender el pedido, nivel
de satisfaccin del cliente (Completamente satisfecho, satisfecho, poco satisfecho, nada
satisfecho) y el distrito en el que se encuentra el cliente. Algunos resultados fueron: El
tiempo promedio de atencin es de 52 minutos, el 40% est completamente satisfecho y
el 30% de los pedidos son del distrito de Ate.
Identificar la poblacin, unidad elemental, muestra, variables, tipos de variables,
observacin, parmetros y valor estadstico.

Variable Tipo de Observacin Valor del Parmetro


Variable Estadstico

9
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

EJERCICIOS PROPUESTOS

1. Indique el tipo de variable que sea la ms apropiada para cada una de las siguientes
variables:
Edad
Tamao de bebida (pequeo, mediano, grande)
Ventas anuales
Nmero de camiseta de un jugador
Placa del automvil.
Nmero de DNI
Forma de pago ( efectivo, cheque, tarjeta de crdito)
Tipo de medalla( Oro, Plata, Bronce)
Puesto de llegada en una competencia.
Nmero de celular.
Nmero de personas a favor del aborto.
Nmero de hermanos.

Para cada ejercicio, identificar: la poblacin, la muestra, unidad elemental, la


variable, tipo de variable, observacin, parmetro y valor del estadstico.

2. Se presentaron algunos resultados del informe gerencial de marketing Perfil del


adulto joven elaborado por Apoyo Opinin y Mercado. (www.apoyo.com). El informe
fue elaborado a partir de los resultados de una encuesta realizada el 14 Julio del 2011
a una muestra aleatoria conformada por 2000 jvenes de Lima Metropolitana, de
todos los niveles socioeconmicos y cuyas edades fluctan entre los 21 y 35 aos de
edad.
El ingreso medio mensual es de 850 nuevos soles.
El 1% tiene estudios de postgrado, el 12% educacin universitaria completa, el 15%
educacin universitaria incompleta y el 2% educacin primaria incompleta.
El 42% de jvenes trabaja en empresas estatales.

3. Con el fin de realizar una modificacin en el Impuesto al Valor del Patrimonio Predial
del Municipio de La Molina, se hace un estudio socioeconmico sobre una muestra
aleatoria de 300 familias residentes en el distrito. Del presente estudio se encontraron
los siguientes resultados:
El ingreso familiar promedio es de S/ 2500.00 nuevos soles.
El tipo de material predominante usado en la construccin de la vivienda, 24 de
ellos dijeron que era de material noble.
El 40% de ellos afirmaron que el estado de conservacin de su vivienda era
excelente, 20% muy buena, 20% buena, 10% regular y 10% en psimas
condiciones.
Identificar la poblacin, unidad elemental, muestra, variables, tipos de variables,
observacin, parmetros y valor estadstico.
4. En un estudio de preferencia de bebidas gaseosas realizado en una muestra de 100
alumnos de la universidad peruana de las Amricas en el semestre 2011-II se han
obtenido los siguientes resultados:
El 52% de los encuestados fueron de sexo masculino
El 47% de los encuestados prefieren la gaseosa en presentacin de plstico
El 40% de los encuestados prefiere la marca Inca Kola y el 30% prefiere Coca Cola.
La edad promedio de los encuestados es de 20.47 aos
El nmero promedio de gaseosas tamao mediano consumidas por alumno
semanalmente es de 3.4

10
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

5. Estudios realizados sobre la contaminacin ambiental coinciden en que los principales


causantes de la contaminacin del aire son la combustin en los vehculos con motores
diesel y la falta de un mantenimiento tcnico. Para tener informacin cuantitativa de
lo mencionado anteriormente, se ha tomado una encuesta a una muestra de 30
choferes de la ruta Portada del Sol-Santa Anita (Lnea P) encontrndose los siguientes
resultados:
El nmero promedio de veces que los choferes realizan una revisin tcnica a sus
vehculos es 1.36 veces al ao.
La ganancia promedio por da es de 97.73 nuevos soles
20 choferes poseen un grado de instruccin secundario, 5 choferes poseen primaria
completa, 5 choferes poseen nivel universitario.

6. La microempresa Milglen, fabrica yogurt y va a lanzar al mercado un nuevo sabor


de yogurt; como desea conocer la necesidad de los consumidores realiza una encuesta
a 90 consumidores de yogurt que acuden al supermercado Metro de La Molina,
encontrndose los siguientes resultados:
El 75% de los encuestados consume yogurt por costumbre, frente a un 20% que
lo hace por gusto y un 5% que lo hace por dieta.
El 33% consume la marca Gloria.
El precio promedio que estaran dispuestos a pagar por un yogurt de 1 litro es de
4.50 nuevos soles.
El 95% prefiere el yogurt con fruta frente a un 5% que lo prefiere natural.

7. Con la finalidad de efectuar mejoras con los servicios al turista, se seleccionaron 200
turistas al azar y se les aplic una encuesta en la que se pregunt por:
Nmero de das que permanecieron en el pas, obtenindose un promedio de 8
das.
Medio de transporte que utilizaron para viajar, a lo que el 20% respondi que viaj
en avin, el 30% en tren y el 50% en bus.
Dinero gastado durante el tiempo de estada, de lo que se obtuvo un promedio de
1253.6 nuevos soles por encuestado.
En cuanto al servicio de alimentacin el 30% lo calific de excelente, el 20% muy
bueno y el 50% bueno.
8. El Departamento de Estadstica e Informtica de la Universidad Nacional Agraria La
Molina con la finalidad de contar con mayor informacin sobre los alumnos
matriculados en el curso de Estadstica General, aplic una encuesta a dichos alumnos
en la que se pregunt por:
Facultad a la que pertenece, a lo que el 35% respondi pertenecer a Agronoma.
Nmero de veces que ha llevado el curso.
Promedio ponderado, obtenindose un promedio para todos los alumnos de 12.10.
Expectativa sobre la dificultad del curso (muy fcil, fcil, difcil, muy difcil).

11
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Preguntas de Autoevaluacin

1. Las medidas estadsticas calculadas con los datos de una poblacin se llaman
___________________ y las calculadas con los datos de una muestra
___________________________.
2. La parte de la estadstica que permite la estimacin y prueba de hiptesis de los
parmetros se llama ____________________ y el clculo de medidas estadstica se
denomina ___________________.
3. El valor posible que toma una variable de denomina _____________________.
4. Una ONG que brinda asistencia tcnica a productores de truchas en el valle de
Huancayo ha aplicado una encuesta para establecer una lnea de base en tres zonas
(A, B y C). Los resultados obtenidos indicaron que la edad promedio de los productores
es de 35.8 aos; el peso promedio de las truchas en la zona A, B y C son 1.2, 1.8 y
1.6 kgrs. respectivamente. Entonces las variables son
_______________________________________________________________.
5. Si el ganadero Juan Prez, desea registrado el nmero diario de litros de leche
producidas, entonces la unidad elemental es ____________________.
6. Si se han definido cuatro rangos de las edades de una muestra de 100 agricultores:
de 18 a 25, de 26 a 40, de 41 a 60 y de 61 a ms aos, entonces la variable rango
de edades es del tipo ______________________________________.
7. Para un estudio sobre la contaminacin de un reservorio de agua, se extraen 400
muestras de dos litros de agua y se hall que el nmero promedio de bacterias fue
de 10.5. Entonces:
Poblacin: __________________________________________.
Unidad elemental: ____________________________________.
Variable: ___________________________________________.
8. En la ENAHO (Encuesta Nacional de Hogares) del 2011, respecto al material
predominante en las viviendas, el 65% es de material noble, el 20% de calamina, el
10% de esteras y 5% otros. La variable en estudio es de tipo _________________.
9. Si un establecimiento de salud del MINSA registra trimestralmente el nmero de nios
atendidos menores a 5 aos, entonces la unidad elemental es __________ y la
variable es del tipo _______________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:

Item Enunciado V/F


a. La poblacin y una muestra extrada de ella pueden tener diferentes
unidades elementales
b. Las medidas estadsticas que se pueden calcular con los datos de un
censo son parmetros y valores estadsticos.
c. Las medidas estadsticas calculadas para el estado civil de una muestra
de 120 personas pueden ser la mediana y la moda
d. Una condicin para que una muestra sea representativa de una
poblacin es que sea aleatoria.
e. Los valores de las variables slo pueden ser obtenidos de las unidades
elementales de una poblacin.

12
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

CAPTULO II

ORGANIZACIN DE DATOS

La organizacin de datos consiste en la elaboracin de tablas de frecuencias y grficos


con la finalidad de clasificar, agrupar y presentar la informacin en forma resumida,
facilitando el anlisis descriptivo de los conjuntos de datos. La elaboracin de una tabla
de frecuencia y su grfico respectivo depender del tipo de variable definida.

Objetivo. Aplicar en forma adecuada los procedimientos de la estadstica descriptiva


para tabular, clasificar, analizar, graficar y presentar informacin segn sea la variable
cualitativa o cuantitativa.

2.1 Organizacin para variables cualitativas (nominal o jerrquica)

La tabla de frecuencia es organizada por clases o categoras que corresponden a los


distintos valores (atributos) que toma la variable cualitativa

Tabla de frecuencias

N de clase Clase o categora (fi) (fri) (pi)

1 Atributo 1 f1 fr1 p1
2 Atributo 2 f2 fr2 p2
.
.
.
K Atributo k fk frk pk
Total n 1 100

Donde:
k= Nmero de clases
n= Nmero de observaciones o unidades elementales

Frecuencia absoluta (fi). Es el nmero de observaciones que existen en la clase o


categora i.
k
Se cumple: f
i 1
i n

Frecuencia relativa (fri). Es la proporcin o porcentaje de observaciones con respecto


fi
al total (n) que existen en la clase o categora i. Se tiene: fri .
n
k
Se cumple: fr 1
i 1
i

Frecuencia porcentual (pi). Es el porcentaje de observaciones con respecto al total (n)


que existen en la clase o categora i. Se tiene: pi fri 100 .
k
Se cumple: p
i 1
i 100%

Tipo de grficos

Se pueden usar las frecuencias absolutas (fi) o relativas (fri) para elaborar dos tipos de
grficos
Grfico de barras vertical u horizontal
Grfico circular

13
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 1
Se hizo una encuesta a una muestra de 45 clientes del Banco Comercial y se obtuvo los
siguientes resultados:

Tarjeta
Ingreso N de Monto de
de Lugar de uso de
Caso Edad Mensual viajes deuda Sexo
crdito tarjeta de crdito
(miles de S/.) (mensual) (miles de S/.)
usada
1 29 3.00 3 Ta1 centros comerciales 1.80 F
2 34 1.99 3 Ta2 discotecas 1.10 F
3 61 2.90 2 Ta3 restaurantes 0.60 M
4 28 4.70 0 Ta2 grifos 2.70 M
5 41 3.00 1 Ta4 centros comerciales 1.30 F
6 57 5.80 2 Ta1 otros 0.80 F
7 30 4.50 4 Ta4 grifos 0.64 M
8 43 7.09 0 Ta3 centro de estudios 0.90 F
9 45 4.40 1 Ta5 centros comerciales 1.40 M
10 35 6.82 0 Ta2 grifos 2.46 F
11 42 5.30 3 Ta1 restaurantes 1.10 F
12 28 5.80 2 Ta4 discotecas 0.20 M
13 28 5.70 1 Ta2 grifos 0.80 F
14 24 4.70 4 Ta4 restaurantes 0.50 M
15 35 6.60 1 Ta5 discotecas 0.40 F
16 42 6.60 2 Ta4 restaurantes 3.46 F
17 48 5.74 1 Ta1 discotecas 1.20 M
18 34 4.23 0 Ta5 centros comerciales 1.90 F
19 66 5.50 3 Ta1 restaurantes 2.35 M
20 36 6.60 1 Ta4 centros comerciales 1.90 F
21 59 3.85 1 Ta4 restaurantes 0.30 M
22 37 6.70 3 Ta6 centros comerciales 0.70 F
23 53 3.50 0 Ta5 restaurantes 0.67 F
24 35 8.80 1 Ta1 discotecas 0.50 F
25 63 10.00 4 Ta5 restaurantes 1.50 M
26 28 10.10 2 Ta1 centro de estudios 0.70 F
27 43 13.40 2 Ta2 discotecas 1.50 F
28 60 3.90 0 Ta5 otros 1.99 M
29 59 5.84 1 Ta5 restaurantes 0.60 M
30 63 3.50 1 Ta4 grifos 1.50 M
31 55 4.40 2 Ta2 centro de estudios 0.40 M
32 42 3.70 0 Ta5 centros comerciales 1.80 F
33 51 4.50 1 Ta1 otros 0.70 M
34 39 5.63 1 Ta1 otros 0.80 M
35 55 4.60 4 Ta1 discotecas 1.25 M
36 35 5.79 0 Ta5 discotecas 1.60 M
37 42 2.93 3 Ta5 grifos 0.20 M

14
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Tarjeta
Ingreso N de Monto de
de Lugar de uso de
Caso Edad Mensual viajes deuda Sexo
crdito tarjeta de crdito
(miles de S/.) (mensual) (miles de S/.)
usada
38 36 6.60 1 Ta3 grifos 4.37 F
39 49 4.60 0 Ta3 centros comerciales 2.00 M
40 27 6.60 0 Ta4 grifos 0.90 F
41 36 2.90 4 Ta1 discotecas 0.47 M
42 42 4.69 2 Ta2 centros comerciales 0.80 F
43 25 3.99 1 Ta4 restaurantes 4.32 F
44 32 6.70 2 Ta1 centros comerciales 0.60 M
45 28 2.58 1 Ta4 otros 1.70 M

Organizacin de datos cualitativos

Organicemos las observaciones de la variable tarjeta de crdito usada.


Tabla de frecuencias del tipo de tarjeta de crdito usada
Frecuencia Frecuencia Frecuencia
Tarjeta de
N de clase Absoluta Relativa Porcentual
crdito usada
fi fri pi
1 Ta1 12 0.2667 26.67
2 Ta2 7 0.1556 15.56
3 Ta3 4 0.0889 8.89
4 Ta4 11 0.2444 24.44
5 Ta5 10 0.2222 22.22
6 Ta6 1 0.0222 2.22
Total 45 1.0000 100.00
Fuente: Elaboracin propia

f3 = 4 indica que 4 de los clientes del Banco Comercial utilizan la tarjeta de crdito
Ta3
fr1 = 0.2667 indica la proporcin de clientes del Banco Comercial que utilizan la tarjeta
de crdito Ta1.
p2 = 15.56 indica que el 15.56% de clientes del Banco Comercial utilizan la tarjeta de
crdito Ta2.

Grfico de Barras

Tarjetas de crdito usada


30

25

20
%

15

10

0
Ta1 Ta2 Ta3 Ta4 Ta5 Ta6
Tarjeta de crdito

Fuente: Elaboracin propia

En el grfico de barras, se aprecia que la tarjeta Ta1 es la de uso ms frecuente.


15
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Grfico Circular

Tarjetas de crdito usada


C ategory
Ta6 Ta1
1, 2.2% Ta2
Ta3
Ta5 Ta1 Ta4
10, 22.2% 12, 26.7% Ta5
Ta6

Ta2
Ta4 7, 15.6%
11, 24.4%

Ta3
4, 8.9%

Fuente: Elaboracin propia

En el grfico circular, se aprecia que la tarjeta de crdito Ta6 es la de uso menos


frecuente.

Ejercicio 1. Se ha realizado una encuesta para evaluar el grado de satisfaccin de cuatro


planes de seguro familiar (A, B, C y D). Los resultados para una muestra de 40 clientes
que adquirieron el seguro familiar en los dos ltimos aos se muestra en la siguiente
tabla.

A Bueno A Regular A Malo D Regular C Bueno


A Malo A Malo A Malo C Malo B Bueno
B Regular D Regular D Regular B Regular D Regular
C Regular C Bueno B Regular C Malo C Bueno
B Malo B Bueno C Malo B Regular C Malo
D Malo C Malo B Regular D Bueno A Bueno
A Regular B Regular D Bueno A Bueno C Malo
D Regular B Malo B Bueno D Malo B Regular

a. Elabore una tabla de frecuencias y un grfico de barras de frecuencias absolutas para


la variable plan de seguro familiar.

16
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Elabore una tabla de frecuencias y un grfico circular frecuencias relativas para la


variable grado de satisfaccin del plan de seguro familiar.

Tabulaciones cruzadas

Tambin llamadas tablas de contingencia o de doble entrada.


Se usan para resumir de manera simultnea los datos para dos variables
cualitativas.

Ejercicio 2. En el 2010 el Instituto Nacional de Estadstica e Informtica (INEI) en


convenio con la Asamblea Nacional de Rectores (ANR) realiz el II Censo Nacional
Universitario. A continuacin se presentan los resultados de dos caractersticas generales.

Distribucin de los alumnos de pre-grado segn el sexo y edad

Edad
Sexo De 15 a De 21 a De 26 a De 31 a De 36 a Ms de Total
20 aos 25 aos 30 aos 35 aos 40 aos 40 aos
Masculino 126214 169306 60006 21465 10651 12503 400145
Femenino 150859 159091 42243 15313 7333 7986 382825
Total 277073 328397 102249 36778 17984 20489 782970
Fuente: PER, II Censo Nacional Universitario 2010

Las variables utilizadas en la realizacin de esta tabla de contingencia son:


___________________________________________________________________
El total de alumnos de pre-grado del sexo masculino es ______________________
El total de alumnos de pre-grado de 31 a 35 aos es _________________________
El % de los alumnos de pre-grado del sexo masculino que tienen 26 a 30 aos es
________
El % de alumnos de pre-grado de 21 a 25 aos que son del sexo femenino es
________
El % de alumnos de pre-grado de 26 a 30 aos y que son del sexo femenino es
_________

17
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

2.2 Organizacin para variables cuantitativas discretas

La tabla de frecuencia es organizada por clases o categoras que corresponden a los


distintos valores (nmeros) que toma la variable cuantitativa discreta. Se usa cuando el
conjunto de valores posible de la variable cuantitativa discreta es pequeo.

Tabla de frecuencias
N de clase Valor de la (fi) (fri) (pi)
variable
1 x1 f1 fr1 p1
2 x2 f2 fr2 p2
.
.
.
k xk fk frk pk
Total n 1 100

Tipo de grfico. Se elabora el grfico de bastones o varas con las frecuencias absolutas,
relativas o porcentual.

Ejemplo 2. Organizacin de datos cuantitativos discretos


Organicemos las observaciones de la variable nmero de viajes al mes de los clientes.

Tabla de frecuencias del nmero de viajes al mes


Frecuencia
Frecuencia Frecuencia
N de viajes al Absoluta
Relativa Porcentual
mes No de clientes
fri pi
fi
0 10 0.2222 22.22
1 15 0.3333 33.33
2 9 0.2000 20.00
3 6 0.1333 13.33
4 5 0.1111 11.11
Total 45 1.0000* 100.00*
Fuente: Elaboracin propia

Interprete:
f2 = 15 Existen 15 clientes del Banco Comercial que hacen un viaje al mes.
p1 = 22.22 El 22.22% de los clientes no han realizado viajes.

Grfico de bastones o varas

Viajes al mes
35

30

25

20
%

15

10

0
0 1 2 3 4
Viajes

Fuente: Elaboracin propia

En el grfico de varas, se aprecia que en la variable nmero de viajes al mes, el nmero


1 (un viaje al mes) es el ms frecuente.
18
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 3. En una estacin experimental se ha determinado el nmero de larvas de


insectos encontrados en 40 parcelas, en un cultivo de frijol. Los datos se muestran a
continuacin:

1 3 3 5 6 6 9 9 10 10
1 3 5 5 6 3 9 10 3 1
10 3 5 5 6 5 9 10 1 1
3 3 5 6 6 5 9 5 3 1

a. Elabore una tabla de frecuencias y su respectivo grfico de bastones.

b. Interprete f3 y p3

c. Qu nmero y porcentaje de parcelas muestran al menos 6 larvas?

2.3 Organizacin para variables cuantitativas continuas

El conjunto de datos es agrupado por intervalos de clase que conforman las clases o
categoras de la tabla de frecuencias.

Tabla de frecuencias
N de Intervalos Marca Frec. Frec. Frec. Frec. Frec. Frec.
clases de clase de Absoluta Relativa Porc. Acumulada Acumulada Acum.
clase Absoluta Relativa Porc.
[LI-LS> xi' fi fri pi Fi Fri Pi

1 [LI1-LS1> x1 f1 fr1 p1 F1 Fr1 P1


2 [LI2-LS2> x2 f2 fr2 p2 F2 Fr2 P2
.
.
.
k [LIk-LSk] xk fK frK pk FK FrK Pk
Total N 1 100 1 100

19
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Donde:

LIi = Lmite inferior de la clase i (Lmite cerrado)


LSi= Lmite superior de la clase i (Lmite abierto, salvo la ltima clase que es cerrado)

Marcas de Clase ( X i ). Es el punto medio del intervalo de clase. Se considerada como


'

el valor representativo de los valores que pertenecen al intervalo de clase.


LI i LS i
Se calcula: X i o X i' X i'1 TIC , donde TIC es el tamao del intervalo
'

2
de clase

Frecuencia Porcentual (pi). Indica el porcentaje de observaciones o unidades


k
elementales que hay en la clase i. Se cumple: p
i 1
i 100%

Frecuencia Acumulada Absoluta (Fi). Indica el nmero de observaciones o unidades


elementales que hay desde la primera clase hasta la clase i. Se calcula por:
k
Fk fi f1 f 2 ... f k .
i 1
t
Propiedad: Ft Fh f
ih1
i , ht

Frecuencia Acumulada Relativa (Fri). Indica la proporcin de observaciones o


unidades elementales que hay desde la primera clase hasta la clase i. Se calcula por:
i

Fi
fj i
Fri
n
j 1

n

j 1
f rj
t
Propiedad: Frt Frh fr
ih1
i , h t
Frecuencia Acumulada Porcentual (Pi). Indica el porcentaje de observaciones o
unidades elementales que hay desde la primera clase hasta la clase i.
t
Propiedad: Pt Ph p
ih1
i , h< t

Pasos para la construccin de una tabla de frecuencias:

Paso 1. Hallar el rango o amplitud (r). r Mximo Mnimo

Paso 2. Hallar el nmero de intervalos de clase (k). Se aplica la regla de Sturges:


k 1 3.3 log( n) . Eligiendo un valor: 3 k 15

Se aplica el redondeo normal a entero.


Si el primer dgito decimal: es 5, se redondea al entero inmediato superior
y si es < 5, se considera el entero obtenido.
r
Paso 3. Hallar el tamao de Intervalo de Clase (TIC). TIC
k
El nmero de decimales debe ser igual al de las observaciones.
Se aplica el redondeo por exceso. Si la posicin del decimal es 1, se
redondea al valor inmediato superior, de lo contrario no se redondea.

20
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Paso 4. Hallar los lmites inferiores y superiores de cada intervalo de clase.

LI1 = Mnimo LS1= LI1 + TIC


LI2 = LI1 + TIC = LS1 LS2= LI2 + TIC
LI3 = LI2 + TIC = LS2 LS3= LI3 + TIC
...
LIk = LIk-1 + TIC = LSk-1 LSk= LIk + TIC

Paso 5. Realizar el conteo del conjunto de datos, como el resultado de asignar cada
observacin a alguno de los intervalos de clase. Luego completar la tabla hallando xi , fi ,
fri , Fi , Fri .

Tipos de grficos
Histograma. Se usan las frecuencias absolutas o relativas en el eje vertical y los
intervalos de clase en el eje horizontal.
Polgono. Se usan las frecuencias absolutas o relativas en el eje vertical y las
marcas de clase en el eje horizontal.

Ejemplo 3. Organizacin de datos cuantitativos continuos

Organicemos las observaciones de la variable ingreso mensual de los clientes (en miles
de nuevos soles).

Paso 1. Calcule el rango ( R ). R= xmax - xmin


En el ejemplo R = 13.40 1.99 = 11.41

Paso 2. Determine el nmero de intervalos de clase ( k ). Utilice la regla de Sturges


k = 1 + 3.3 log n = 1 + 3.3 log 45 = 6.4556

Redondeo estadstico: Se toma en consideracin el primer valor decimal, si es:

5 se redondea al entero inmediato superior


< 5 se considera el entero obtenido

En nuestro ejemplo, k = 6.4556, estamos en el segundo caso, por lo que el nmero


de clases que se debe considerar es k = 6.

Paso 3. Halle el tamao de los intervalos de clase (TIC)


R 11.41
TIC 1.90167
k 6

Redondeo por exceso: se toma en consideracin el nmero mayor de decimales que


tienen las observaciones. Considerando la posicin de este decimal, se presentan 2 casos:

Si existe alguna cifra significativa a la derecha de este valor, se redondea al valor


inmediato superior
Si no existe ninguna cifra significativa a la derecha de este valor, entonces no se
realiza ningn redondeo

TIC 1.90167

Como las observaciones tienen 2 decimales en el TIC tambin se considerar con 2


decimales y como hay al menos un valor diferente de cero a la derecha de las centsimas
se incrementa en una centsima quedando TIC = 1.91

21
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Paso 4. Construya la tabla de frecuencias.


Tener en cuenta que en la ltima clase el intervalo es cerrado en el lado derecho.
Tabla de frecuencias del ingreso mensual

Marca Frec
Frec. Frec. Frec. Frec. Frec.
Ingreso de .
Rel. Porc. Acum. Acum. Acum.
N de mensual clase Abs.
Abs. Rel. Porc.
clases [LI-LS>
xi' fi
fri pi Fi Fri Pi
1 [1.99 - 3.90> 2.945 11 0.2444 24.44 11 0.2444 24.44
2 [3.90 - 5.81> 4.855 20 0.4444 44.44 31 0.6888 68.88
3 [5.81 - 7.72> 6.765 10 0.2222 22.22 41 0.9110 91.10
4 [7.72 - 9.63> 8.675 1 0.0222 2.22 42 0.9332 93.32
5 [9.63 -11.54> 10.585 2 0.0444 4.44 44 0.9776 97.76
6 [11.54-13.45] 12.495 1 0.0222 2.22 45 1.000 100
45 1.0000 100
Fuente: Elaboracin propia

Interprete:
a. f2 = 20; 20 de los clientes tienen un ingreso mensual de por lo menos S/. 3900
pero menos de S/. 5810.

b. fr4 = 0.0222; 0.0222 es la proporcin de clientes que ganan por lo menos


S/. 7720 pero menos de S/. 9630

c. p5 = 4.44; 4.44% de los clientes ganan por lo menos S/. 9630 pero menos de
S/. 11540.

3
d. F3 fi f1 f 2 f3 11 20 10 41 41 de los clientes ganan mensualmente por
i 1

lo menos S/. 1990 pero menos de S/. 7720

e. F5 F2 = 44 31 =13
5
F5 F2 = f
i 3
i f3 f 4 f5 10 1 2 13 13 de los clientes ganan por lo menos

S/. 5810 pero menos de S/. 11540


4
f. Fr4 fri fr1 fr2 fr3 fr4 0.2444 0.4444 0.2222 0.0222 0.9332 , indica que
i 1
0.9332 es la proporcin de clientes que ganan por lo menos S/. 1990 pero menos de
S/. 9630.

g. Fr5 Fr3 = 0.9776 0.9110 = 0.0666


5
Fr5 Fr3 = fr fr
i 4
i 4 fr5 0.0222 0.0444 0.0666 , indica que 0.0666 es la
proporcin de los clientes que ganan por lo menos S/.7720 pero menos de S/.11540.

3
h. P3 pi p1 p2 p3 24.44 44.44 22.22 91.10 , indica que el 91.10% de los
i 1
clientes tienen ingresos mensuales de por lo menos S/.1990 pero menos de S/.7720

22
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

i. P5 P2 = 97.76 68.88 = 28.88


5
P5 P2 = p
i 3
i p3 p4 p5 22.22 2.22 4.44 28.88 , indica que el 28.88% de
los clientes de ese banco tienen ingresos mensuales por lo menos S/. 5810 pero
menos de S/. 11540.

j. x3' 6.765 es el valor representativo de los clientes que ganan por lo menos S/.5810
pero menos de S/.7720. Las diez observaciones (f3 = 10) que hay en la clase 3 son
representadas por el valor S/. 6765.

Histograma de frecuencias

Ingreso Mensual
50

40

30
%

20

10

0
1.99 3.90 5.81 7.72 9.63 11.54 13.45
Ingreso

Fuente: Elaboracin propia

En el histograma se puede apreciar que la clase ms frecuente es la segunda esto indica


que los ingresos ms frecuentes son de por lo menos S/. 3900 pero menores a S/. 5810.

Polgono de frecuencias
Ingreso Mensual

Series1, 4.855, 20

Series1, 2.945, 11 Series1, 6.765, 10

Series1,
Series1, 8.675, 10.585, 2
1 Series1,
Series1, 1.035, 0 Series1, 12.495,
14.405, 1
0
Fuente: Elaboracin propia

En el polgono de frecuencias se observa que son pocos los clientes con ingresos
mensuales altos.

23
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 4. Con la finalidad de evaluar la viabilidad de un proyecto de reforestacin de


una zona sometida a estrs turstico, para el que se ha solicitado una subvencin pblica,
se ha tomado muestras sobre la composicin en mg/cm3 de desechos orgnicos en el
suelo. Los datos obtenidos fueron:

Composicin de desechos orgnicos (mg/cm3)


8.2 12.9 15.3 18.8 20.8
9.2 12.9 15.8 19.7 21.0
9.4 14.0 15.9 20.3 21.4
10.8 14.2 16.9 20.3 22.2
10.8 14.4 18.2 20.3 22.5
11.1 15.1 18.4 20.2 23.2
11.2 15.1 18.6 20.7 25.8
a. Construir la tabla de frecuencias usando la regla de Sturges.

b. A partir de la tabla de frecuencias interprete: fr3 , F4 , P4 y 1-Fr2

c. Entre qu niveles de composicin se encuentra aproximadamente el 51.4% de las


observaciones con menores niveles registrados?

24
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 5. La gerencia de marketing del Supermercado ABC desea realizar un estudio


con la finalidad de evaluar la satisfaccin de sus clientes. Para el estudio se selecciona
aleatoriamente a 40 clientes que acudieron al supermercado en un da y se registr los
siguientes datos.

N Tipo Estado de Nmero de Monto N Tipo Estado de Nmero de Monto


pago los compras (nuevos pago los compras (nuevos
productos semanal soles) productos semanal soles)
1 1 2 2 200.5 21 3 4 2 350.5
2 2 2 4 200.3 22 3 2 4 250.3
3 2 1 1 136.0 23 3 4 5 180.4
4 2 2 2 150.2 24 2 3 1 320.8
5 2 2 3 300.6 25 2 1 2 150.6
6 1 1 2 320.8 26 3 4 3 190.8
7 3 2 2 310.8 27 1 3 2 240.5
8 3 1 4 229.2 28 2 1 3 275.8
9 1 2 3 180.5 29 3 2 3 130.8
10 2 3 5 110.6 30 3 3 1 180.2
11 3 1 1 140.8 31 2 4 4 315.4
12 1 3 3 368.6 32 1 2 2 290.6
13 2 2 2 160.2 33 2 3 2 265.8
14 3 1 3 180.9 34 3 4 1 360.8
15 3 2 1 190.5 35 1 1 3 260.2
16 2 3 2 210.4 36 2 2 3 140.5
17 3 2 3 89.4 37 1 3 2 180.2
18 1 3 3 110.6 38 3 4 3 220.5
19 2 1 4 100.5 39 3 1 2 345.8
20 1 1 1 120.3 40 3 2 3 95.4
Considerar: Tipo de pago: 1=Contado 2=Tarjeta de crdito 3=Crdito ABC
Estado de los productos: 1=Muy bueno 2=Bueno 3=Regular 4=Malo
a. Elabore una tabla de frecuencias y un grfico de barras de frecuencia relativa de la
variable tipo de pago.

25
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Elabore la tabla de frecuencias para la variable nmero de compras semanal. Elabore


el respectivo grfico de varas.

c. Elabore la tabla de frecuencias usando la regla de Sturges para la variable monto


semanal.

d. Interprete f4 , F4 , 100-P2

26
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

e. Elabore el respectivo histograma y polgono de frecuencias.

Ejercicio 6. Se ha recolectado informacin de 20 sacos de papa tomados al azar,


cosechados para un trabajo experimental. Se muestra a continuacin el nmero de papas
que estn comenzando descomponerse por saco y las variedades de papas cosechadas.
Nmero de papas
descomponindose Variedades de papa cosechadas

8 12
8 12 10
8 12 8
9 16 6
9 16 4
9 16 2
12 16 0
12 17 amarilla negra blanca tomasa serrana
12 17 Serie1 3 5 9 2 1
12 18
Variedad de papa
Fuente: Estudio Experimental.

a. Elabore una tabla de frecuencias para la variable cuantitativa.

b. Elabore un cuadro que resuma la informacin de la variable cualitativa.

27
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Prctica Dirigida N 1

1. La agencia agropecuaria del MINAG desea evaluar su programa de asistencia tcnica


dirigido a los agricultores Regin de Cajamarca. Los resultados obtenidos de una
muestra de 350 agricultores que asistieron al programa fueron los siguientes:

El tamao promedio del predio por agricultor es de 3.5 has.


El ingreso promedio agropecuario fue de S/. 1250.0
El 65.5% de los agricultores usan fungicidas.
En cuanto al uso de semillas, el 45% usa certificada, el 35% mejorada y el resto
su propia semilla.
El nmero promedio de visitas fue de 4.8

a) De acuerdo al enunciado identifique la poblacin de estudio, unidad elemental y


muestra.

b) Identifique las variables, tipos, observacin, estadstico o parmetro.

Variable Tipo de Observacin Estadstico Parmetro


Variable

28
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

2. La empresa de turismo El Viajero que ofrece paquetes tursticos a nivel nacional,


desea evaluar su nuevo sistema de ventas por internet. Para el anlisis seleccion
una muestra aleatoria de 30 clientes que hicieron su reserva por internet, y se
registra el tiempo de demora (en minutos) en hacer la reserva, el tipo y nmero de
das de estada del paquete turstico. Los datos se presentan en la siguiente tabla:

Tiempo de Tipo de Nmero de Tiempo de Tipo de Nmero de


demora paquete das demora paquete das
10.0 Clsico 2 19.8 Clsico 3
12.7 Todo incluido 3 20.0 Clsico 2
13.0 Premium 3 20.3 Clsico 2
13.8 Clsico 3 20.6 Clsico 4
14.0 Todo incluido 2 22.8 Todo incluido 5
14.4 Todo incluido 4 23.0 Premium 6
14.6 Clsico 5 24.1 Clsico 5
15.9 Todo incluido 6 24.5 Todo incluido 4
16.9 Clsico 3 24.8 Premium 3
16.1 Premium 4 25.6 Todo incluido 4
16.2 Premium 5 26.0 Clsico 3
17.8 Clsico 5 26.4 Todo incluido 2
18.0 Todo incluido 6 28.0 Premiun 6
18.4 Clsico 3 30.0 Clsico 5
18.5 Todo incluido 3 32.0 Todo incluido 5
19.6 Premiun 2 34.0 Premium 4

a) Con respecto a la informacin proporcionada, identifique la poblacin, unidad


elemental y muestra.

b) Elabore una tabla de frecuencias sobre el tipo de paquete y un grfico de barras


de frecuencias porcentuales.

29
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c) Elabore la tabla de frecuencias para la variable tiempo que demora en hacer la


reservacin por internet. Use la regla de Sturges.

d) Interprete f4, p4, F5, y 100-P5.

30
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

e) Elabore el respectivo histograma de frecuencias porcentuales.

f) Elabore la tabla de frecuencias para la variable nmero de das de estada y su


grfico respectivo.

31
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

EJERCICIOS PROPUESTOS

1. En Marzo del 2009 la empresa de investigacin de mercados CONTHEOS, fue


contratada por el banco Nuevo Horizonte para que realice un estudio sobre la
aceptacin de los crditos anuales que ofrecen a sus clientes en sus sucursales de los
distritos de La Molina y Surco. La empresa CONTHEOS despus de hacer un estudio
de las caractersticas de los clientes activos del banco, seleccion una muestra de 36
clientes de la sucursal de La Molina, y recolect de ellas informacin para un conjunto
de variables seleccionadas para tal fin. Los resultados se muestran a continuacin:

N Tipo de N de Monto de crdito. Tipo de


Cliente crdito solicitudes (miles de soles) cliente
1 1 1 30.0 2
2 2 2 35.3 3
3 3 1 48.4 2
4 1 2 50.1 2
5 2 1 55.3 3
6 4 2 57.2 2
7 5 1 58.1 1
8 3 1 60.4 3
9 5 2 65.3 3
10 4 1 66.0 2
11 3 3 68.0 2
12 4 1 69.1 2
13 2 3 70.2 3
14 5 3 72.5 2
15 4 1 73.1 3
16 2 4 75.3 3
17 3 4 77.2 3
18 4 1 79.1 3
19 4 3 82.7 2
20 5 7 84.3 3
21 3 1 86.0 1
22 4 5 90.3 1
23 1 6 95.2 2
24 3 1 100.1 3
25 4 2 101.2 3
26 1 4 102.2 1
27 3 1 102.2 3
28 4 2 104.3 2
29 1 4 110.1 2
30 3 1 115.3 3
31 4 3 118.4 2
32 1 2 119.1 1
33 3 1 125.1 3
34 1 3 128.0 2
35 1 1 130.2 2
36 2 2 140.0 3

Tipo de Crdito: (1) Inversin en negocio, (2) Compra de inmuebles,


(3) Compra de maquinarias, (4) Inversin en bolsa de valores
(5) Compra de autos.
Tipo de cliente: (1) Casado (a), (2) Soltero (a), (3) Divorciado(a)

32
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

a) Elabore una grfica adecuada para la variable cualitativa.


b) Haciendo uso de la regla de Sturges construya un cuadro de distribucin de
frecuencias para la variable Monto de crdito (miles de soles).
c) Interprete segn enunciado los valores de f2, p3, F4, P5 y (p5+p6).
d) Construya el polgono de frecuencias para la variable Monto de crdito.
e) Construya un cuadro de distribucin de frecuencias para la variable cuantitativa
discreta.

2. La siguiente informacin se tom de los registros del Hospital Centro de Salud Materno
Infantil San Bartolom. Seccin Maternidad entre el 18 y el 22 de Mayo del 2012.

Madre Hijo
Caso Edad Estado Civil No de partos Peso Sexo
1 25 conv 2 2.90 F
2 22 conv 2 2.90 F
3 32 conv 4 4.04 M
4 22 conv 1 4.35 F
5 18 casada 1 3.60 M
6 21 casada 3 3.50 M
7 20 soltera 2 3.20 M
8 19 casada 1 3.00 F
9 23 casada 3 3.60 M
10 26 casada 2 2.80 M
11 36 casada 5 3.00 M
12 30 conv 5 3.30 F
13 23 soltera 3 3.10 F
14 29 conv 4 3.30 F
15 22 conv 2 3.30 F
16 23 casada 1 3.50 F
17 27 conv 2 3.62 M
18 28 conv 3 3.30 F
19 19 conv 1 2.65 F
20 32 casada 2 2.86 F
21 17 conv 1 2.62 M
22 21 conv 2 3.56 F
23 18 casada 2 3.10 M
24 27 conv 3 3.62 F
25 21 casada 1 3.18 M
26 19 casada 1 2.95 M
27 19 conv 2 3.90 M
28 31 casada 3 3.00 F
29 32 casada 4 4.00 F
30 21 conv 2 3.85 M
31 23 casada 2 2.75 F
32 19 casada 1 3.18 F
33 19 conv 1 3.14 F
34 26 conv 3 3.08 F
35 18 casada 1 2.80 F
36 24 casada 2 3.40 M
37 30 casada 3 3.00 F
38 26 casada 3 3.05 F
39 19 casada 1 2.90 F
40 34 casada 3 3.10 F

33
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Madre Hijo
Caso Edad Estado Civil No de partos Peso Sexo
41 28 casada 3 3.40 M
42 24 casada 2 2.97 F
43 26 casada 2 2.94 F
44 22 casada 2 3.80 M
45 34 casada 5 4.65 F

a) Elabore una tabla y grafica adecuada para la variable ESTADO CIVIL.


b) Haciendo uso de la regla de Sturges construya un cuadro de distribucin de
frecuencias para la variable PESO DEL RECIEN NACIDO.
c) Interprete segn enunciado los valores de f2, fr4, p5, F3, P3 y (P5-P2) del cuadro de
distribucin de frecuencias anterior.
d) Construya el polgono de frecuencias para la variable PESO DEL RECIEN NACIDO.
e) Construya un cuadro de distribucin de frecuencias para la variable N DE
PARTOS.

3. Con el objeto de determinar el nmero de horas diarias que los alumnos de la


facultad de ciencias se dedican a estudiar en la biblioteca de la UNALM, se llev a cabo
una encuesta a 49 de ellos, obtenindose los siguientes resultados expresados en
horas:

1.2 1.8 2.3 2.6 3.0 3.1 3.6


1.2 1.8 2.3 2.7 3.0 3.1 3.6
1.3 2.3 2.3 2.7 3.0 3.1 3.6
1.3 2.3 2.4 2.8 3.0 3.4 4.0
1.5 2.3 2.4 2.8 3.1 3.4 4.1
1.8 2.3 2.6 2.8 3.1 3.4 4.5
1.8 2.3 2.6 2.9 3.1 3.4 4.5

a) Construya una tabla de frecuencia completa, usando la regla de Sturges.


b) Interpretar la marca de clase del tercer intervalo de clase.
c) Interpretar la frecuencia relativa del tercer intervalo de clase.

4. Tomando como base la informacin tomada en la pregunta 3, se encuest tambin


a 35 alumnos de la facultad de Agronoma obtenindose los siguientes resultados en
horas:

2 2 2.1 2.1 2.2 2.5 2.6


2.6 2.7 2.7 3 3 3.1 3.2
3.3 3.4 3.4 3.5 3.6 3.6 3.6
3.8 4 4 4 4.1 4.3 4.3
4.4 4.5 4.5 4.6 4.7 4.7 4.7

Construya la tabla de frecuencias comparativa entre las dos facultades. Mencionar


tres conclusiones importantes en trminos del enunciado.

34
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

5. Los siguientes datos corresponden a la longitud de la cabeza del feto a los 45 das de
gestacin de un total de 60 ovejas que produjeron un solo feto y de las cuales el da
de apareamiento es conocido. Las medidas estn en mm y fueron obtenidas con
imgenes de ultrasonido:

19.4 20.4 21.0 21.6 21.9 21.9 22.0 22.1 22.1 22.2 22.3 22.3
22.6 22.7 22.7 22.7 22.8 22.9 23.0 23.1 23.2 23.2 23.4 23.6
23.6 23.6 23.7 24.0 24.0 24.0 24.0 24.0 24.1 24.1 24.3 24.4
24.5 24.6 24.7 24.7 24.8 24.8 25.0 25.0 25.0 25.2 25.3 25.3
25.5 25.5 25.5 25.6 25.6 25.6 25.8 25.9 26.0 26.4 26.9 27.5

a) Defina variable y unidad elemental.


b) Construya la tabla de frecuencias. Utilice la regla de Sturges para determinar el
nmero de intervalos. Presente 3 decimales para sus frecuencias relativas.
c) Interprete fr3, Fr5, F5 F2.
d) Grafique el histograma de frecuencias y el polgono de frecuencias.

6. Una compaa manufacturera tiene a prueba a 48 nuevos trabajadores. Para evaluar


su rendimiento, se les asign una tarea rutinaria y se midi el tiempo que tardaron
en realizarla. Los tiempos en minutos son los siguientes:

105 105 107 108 108 108 109 109 110 111 111 111
113 114 114 117 118 119 121 121 123 125 126 126
126 126 128 129 130 131 134 134 137 145 145 150
150 152 153 154 157 157 158 164 170 171 179 183

a) Construya la tabla de frecuencias. Use la regla de Sturges para determinar el


nmero de intervalos. Presente 3 decimales para sus frecuencias relativas.
b) Interprete F5 - F2, 1 - Fr4, fr5+fr6.

7. Se ha llevado a cabo un estudio para evaluar los volmenes de venta (miles de soles
por da) de los establecimientos comerciales de un distrito de Lima. Para ello se
eligieron al azar 36 establecimientos encontrndose los siguientes resultados:

1.5 2.1 2.5 3.2 3.7 4.4 4.5 4.6 4.6 4.6 4.7 5.2 5.3 5.4 5.7 5.7 5.8 6.1
6.4 6.7 6.7 7.2 7.4 7.4 7.7 7.8 8.4 8.4 8.5 8.7 9.1 9.8 10.1 11.7 12.1 15.4

a) Construya la tabla de frecuencias. Use la regla de Sturges para determinar el


nmero de intervalos.

b) Interprete f4, F3, p5


c) Graficar el histograma y el polgono de frecuencias.

8. En una fbrica de pernos se desea estimar el nmero de pernos defectuosos por caja
para verificar si estos valores estn dentro de los lmites permisibles. Se selecciona
una muestra de 40 cajas y se obtienen los siguientes resultados:

1 1 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4
4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 7 7

a) Construya la tabla de frecuencias. Use la regla de Sturges para determinar el


nmero de intervalos.
b) Interprete f2, p4
35
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

9. Un profesor decide registrar el mes de nacimiento de cada uno de los 40 estudiantes


de su clase.

junio julio noviembre abril enero febrero septiembre


julio agosto septiembre diciembre julio junio noviembre
mayo abril febrero agosto junio mayo octubre
agosto noviembre enero junio abril septiembre diciembre
agosto junio julio marzo diciembre marzo junio
noviembre septiembre junio marzo noviembre
Construya la tabla de frecuencias, elabore e interprete el diagrama de barras.
Cul es el mes que presenta la mayor y cul la menor frecuencia de nacimientos?

10. Un Ing. Pesquero est realizando un estudio sobre el salmn plateado con la finalidad
de introducirlo al pas. Una de las variables de inters es la longitud (en centmetros).
El resultado luego de la evaluacin a 45 peces elegidos al azar de esta especie se
presenta a continuacin:

93.30 93.36 94.48 94.68 95.76 95.95 96.31 96.37 96.43


96.53 96.58 96.60 96.61 96.80 96.86 96.93 97.29 97.40
97.41 97.45 97.58 97.66 97.66 97.88 97.92 98.22 98.40
98.47 98.49 98.53 98.56 98.63 98.76 98.79 99.21 99.29
99.32 99.44 99.68 100.08 100.22 100.82 101.24 101.31 102.79

a) Construya la tabla de frecuencias usando la regla de Sturges.


b) Presente el polgono de frecuencias.

11. La empresa Nicronics S.A. se dedica a la venta de placas circulares plsticas de


policarbonato, que importa de Alemania, Holanda y Japn. Las cantidades
porcentuales que importa de cada pas son 16%, 64% y 20% respectivamente. Las
longitudes de los dimetros de dichas placas se expresan en pulgadas y los pesos de
los mismos varan de 480 a 920 gramos. En los ltimos tres meses, los clientes
nacionales, le han devuelto sus productos debido a la baja resistencia encontrada, por
ello, el rea de control de calidad ha seleccionado al azar 500 placas circulares (en
cantidades proporcionales a lo que importa de cada pas) y analizado en un
laboratorio, la resistencia a las ralladuras y a los impactos (en ambos casos la
resistencia puede ser alta, media o baja). Si la empresa encuentra que efectivamente
las placas no satisfacen las condiciones del cliente, se vern obligados a cambiar de
proveedores.

En base a la variable pas de importacin elabore un cuadro de frecuencias de la


muestra seleccionada y su respectivo grfico

36
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Preguntas de Autoevaluacin

1. Para graficar un polgono, en el eje de ordenadas se usa _________________ y en


el eje de abscisas _____________________.
2. Si en una tabla de frecuencias las marcas de clases: X1=25 y X6=75, entonces el
valor del TIC es ___________________ y el valor del LI1 es _________________.
3. El grfico asociado a una variable cuantitativa discreta se conoce como
______________________.
4. El valor representativo de un intervalo de clase se conoce como
_________________________
5. Para graficar un polgono, en el eje de ordenadas se usa ________________ y en el
eje de abscisas _____________________.

6. La frecuencia acumulada relativa Fr4 puede ser calculada en trminos de la frecuencia


relativa por ____________________ y en trminos de la frecuencia acumulada
absoluta por _________________________.
7. Los grficos que se pueden elaborar para la variable estado civil son llamados
__________________________________
8. Para los siguientes valores del TIC, halle el valor usando el redondeo por exceso para
los casos de un entero, un decimal y dos decimales.

TIC Entero Un decimal Dos decimales

4.051

12.106

35.09

9. El nmero de decimales del Tamao de Intervalo de Clase (TIC), debe ser siempre
igual a _________________________________

10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:

Item Enunciado V/F


a. Para hallar el nmero de intervalos de clase se aplica el redondeo por
exceso.
b. El nmero de decimales de la marca de clase es igual a la de las
observaciones.
c. Para una muestra de 55 clientes, la frecuencia absoluta acumulada de
la ltima clase es mayor a 55.
d. El grfico circular se elabora usando las frecuencias absolutas relativas
e. Es posible que el lmite superior de la ltima clase sea menor que el
mximo valor.

37
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

CAPTULO III

MEDIDAS ESTADSTICAS

Las medidas estadsticas pueden ser calculadas con los datos provenientes de una
poblacin (N: Tamao de la poblacin) o muestra (n: Tamao de la muestra) para evaluar
diferentes variables (cuantitativas y cualitativas), cuya finalidad es resumir y representar
el conjunto de datos.

Muestra (n) : X 1 , X 2 ,..., X n Valores Estadsti cos


Poblacion ( N ) : X 1 , X 2 ,..., X N Parmetros

Observaciones
Las medidas estadsticas asumen las mismas unidades de medida de la variable en
estudio, con la excepcin de ciertas medidas estadsticas relativas.
Para las variables cuantitativas, se pueden calcular medidas estadsticas como:
media, mediana, moda, rango, rango intercuartlico, varianza, desviacin estndar,
coeficiente de variabilidad, y otras. En el caso de las variables cualitativas, slo es
posible calcular las medidas como la moda y la proporcin.

Objetivo. Reconocer las caractersticas bsicas de una distribucin de datos a travs de


las principales medidas de tendencia central, de posicin y variabilidad.

3.1 Medidas de tendencia central


Son medidas estadsticas que se localizaran en la parte central de la distribucin de los
datos. Permiten resumir y representar en un slo valor el conjunto de datos. Las medidas
de tendencia central revisadas en este texto son las siguientes:

La media aritmtica
La media ponderada
La mediana
La moda

La media aritmtica o Promedio


La media aritmtica simple o promedio de un conjunto de datos provenientes de una
poblacin (N) o muestra (n), es igual al cociente entre la suma total de sus valores y el
nmero de observaciones.

N
1 1 n
Media poblacional:
N
Xj
j 1
Media muestral: X Xj
n j 1

Ejemplo 1
Suponga que se tiene los datos de las ventas semanales (en dlares) de una muestra de
8 vendedores. Calcule la venta promedio semanal.

150 120 300 280 350 250 160 280

Solucin
1 8 150 120 300 280 350 250 160 280 1,890
X
8 i 1
xi
8

8
236.3

La venta promedio semanal por vendedor fue de $ 236.3

38
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 1. Los siguientes datos corresponden a una muestra de 12 auditores sobre los
gastos de viticos (nuevos soles) realizados en un mes. Halle e interprete la media.

250.5 420.0 345.5 560.4 458.2 268.5 380.1 510.2 630.4 580.3 610.3 720.1

Propiedades:

1. La media est afectada por valores extremos (altos o pequeos). Es una desventaja
de la media.
2. La media aritmtica localiza la parte central de un conjunto de observaciones.
3. Para un conjunto de observaciones la media es nica.
4. Si la media sustituye a cada observacin, la suma total no cambia.
5. La suma de las desviaciones de las observaciones con respecto al promedio es igual

X
n n
a cero. j X Xj n X n X n X 0
j 1 j 1
6. La suma de los cuadrados de las desviaciones de las observaciones con respecto a la

X X c , donde c R
n 2 n
2
media es mnima: j X j
j 1 j 1

Ejemplo 2
Los siguientes datos corresponden a los ingresos mensuales de dos grupos de empleados:

Grupo Ingreso x
A 520 525 518 523 545 580 510 500 527.625
B 530 545 520 8000 580 590 560 600 1490.625
1 8 4221
Propiedad 1. Para A : X
8 i 1
Xi
8
527.625

1 8 11925
Para B : X X i 8 1490.625
8 i 1
En el grupo A el promedio es similar a los 8 valores (promedio representativo), mientras
que en el grupo B eso no ocurre (el valor 8000 es un dato extremo alto).
8 8

Propiedad 5. Para A : (X i 1
i X ) X i n X 4221 8 x527.625 0
i 1
8 8
Para B : (X i 1
i X ) X i n X 11925 8 x1490.625 0
i 1
8 8

(X X ) 2 X i2 n X 2231403 8 x527.6252 4297.875


2
Propiedad 6. Para A : i
i 1 i 1
8 8
c 510 : (Xi 1
i c) 2 X i2 nc 2 2231403 8 x5102 150603
i 1
8 8

(X X ) X n X 66206425 8 x1490.6252 48430721.88


2 2 2
Para B : i i
i 1 i 1
8 8
c 510 : (X
i 1
i c) 2 X i2 nc 2 66206425 8 x5102 64125625.00
i 1

39
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

La media aritmtica ponderada

La media ponderada de un conjunto de observaciones x1 , x2 , ... , xk con pesos o


ponderaciones w1 , w2 , , wk est dada por:
k

x
j 1
j wj
x1 w1 x2 w2 xk wk
xp
k
w1 w2 wk
w j 1
j

La media ponderada se usa en aquellos casos donde las observaciones tienen diferente
importancia dentro de una poblacin o muestra.

Casos particulares:

k k
Cuando los datos se encuentran en una tabla de
frecuencias correspondiente a una variable f
j 1
j xj f
j 1
j xj
cuantitativa discreta. La media se calcula por: xp k

f
n
j
j 1
Si x1 , x 2 ,..., x k son las medias de k grupos y cada
k
grupo tiene tamao n1 , n2 ,..., nk n
j 1
j xj
respectivamente, entonces la media de todos xp k
los datos n n1 n2 ... nk se calcula por:
n
j 1
j

Ejemplo 3
Un empresario que vende ropa para Caballeros, posee dos tiendas, administradas por
Gerentes contratados, los ternos vendidos por estas tiendas son comprados a un
proveedor a un costo de 150 nuevos soles

La tienda A vendi 95 ternos al precio original de 400 nuevos soles, luego de esto
en una oferta vendi 126 ternos a 280 nuevos soles. y por cierre de temporada
vendi los 79 ternos restantes a 200 nuevos soles.
La Tienda B, ha vendido el 30% de sus ternos a 400 nuevos soles, el 40% a 300
nuevos soles y el resto al precio de costo.

a. Cul ha sido el precio promedio por terno vendido en la tienda A?

Media de A: (95*400+126*280+79*200)/(95+126+79)= 296.9333

b. Considerando el precio promedio por terno vendido como indicador de buena


administracin, Cul de ellas ha sido mejor administrada?

Media de B: 0.3*400+0.4*300+0.3*150 = 285. La tienda A pues tiene un precio


promedio mayor que la de B

c. Si la tienda B recibi el doble de cantidad de ternos para vender que la tienda A.


Cul es el precio promedio por terno vendido considerando ambas tiendas?

Media de A y B: (300*296.933+600*285)/(900) = 288.98

40
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 2. En la siguiente tabla se presenta la distribucin de nmero de viajes


realizados en un mes para una muestra de auditores de una entidad financiera.

Nmero de viajes al mes Nmero de auditores


Xi fi
0 10
1 15
2 9
3 6
4 5
Total 45
Halle e interprete el nmero de viajes promedio mensual por cada auditor.

Ejercicio 3. Los tiempos promedios de tardanza (minutos) de muestras de 40, 25 y 15


empleados de los turnos de da, tarde y noche fueron 8.5, 12.0 y 15.5 respectivamente.
Hallar el tiempo promedio de tardanza de los trabajadores para los tres turnos.

41
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

La mediana

La mediana es el valor que ocupa la posicin central de un conjunto de datos, previamente


ordenados: X , X ,..., X
(1) ( 2) (n)

n 1
100 50 Entero E me x E

Si
n 1 50 Decimal E.d me x 0.d x

100
E E 1 x E

La mediana poblacional se representa por Me y la mediana muestral por me

n impar me X n 1
( )

2
Otra forma:
Si X n X n
( ) ( 1)

n par me 2 2

Ejemplo 4
Los siguientes datos corresponden a los pesos (en Kg.) de 10 personas: 50, 77, 53, 76,
63, 64, 75, 54, 52, 80. Calcule la mediana

Datos ordenados: 50, 52, 53, 54, 63, 64, 75, 76, 77, 80

10 1
Posicin : 50 5.5 me x5 0.5 x6 x5 63 0.5 64 63 63.5 Kg.
100

Interpretacin. Un 50% de personas pesan menos de 63.5 Kg. y el otro 50% pesa ms
de 63.5 Kg.

Ejercicio 4. En un estudio del medio ambiente para evaluar la calidad de aire, se registr
el nmero de microgramos de partculas en suspensin por mt2 de aire para muestras
evaluadas en dos zonas.

Zona A 38 32 45 30 24 45 42 18 28
Zona B 25 28 25 32 26 35 54 38

Halle e interprete la mediana del nmero de microgramos de partculas en suspensin


por mt2 de aire para cada zona.

42
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Propiedades:

1. La mediana divide las n observaciones en dos partes iguales. El 50% con valores
menores a la mediana y el otro 50% con valores mayores a la mediana.
2. La suma de las desviaciones absolutas de las observaciones con respecto a la mediana
n n
es un valor mnimo. j 1
X j me X j c , donde c R
j 1
3. La mediana no est influenciada por valores extremos.

Ejemplo 5
Los siguientes datos corresponden a los ingresos mensuales de dos grupos de empleados:

Grupo Ingreso me
A 520 525 518 523 545 580 510 523
B 530 545 520 8000 580 590 560 560

Comente las medianas de los dos grupos.

Solucin
Se observa que la mediana no est afectada por el valor extremo 8000, como es la media.

La moda

La moda de un conjunto de datos es el valor que ocurre con mayor frecuencia. La moda
poblaciones se representa por Mo y la moda muestral por mo.

Propiedades:
1. La moda puede no existir o puede haber ms de una moda en un conjunto de datos.
2. La moda no est afectada por valores extremos.
3. Se aplica tanto para informacin cualitativa como cuantitativa.

Ejemplo 6
1. Se tiene las longitudes de peces de ro (cm) de la zona A: 4.0, 4.1, 4.2, 4.3, 4.5, 4.7,
4.8. No hay moda.
2. Las siguientes longitudes sonde la zona B: 4.0, 4.1, 4.1, 4.1, 4.2, 4.2, 4.5, 4.2.
Se distinguen dos modas mo1 = 4.1 y mo2 = 4.2 (distribucin bimodal).

Ejercicio 5. Se tiene una muestra de los niveles de ozono alrededor de una ciudad (220
partes por billn). Halle e interprete la moda.

160 124 156 164 178 163 163 178 164 185 196 164 170 145 164

43
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 6. En una encuesta realizada a una muestra de estudiantes de una universidad,


se les pregunt por el club deportivo de su preferencia. Los datos se muestran en la
siguiente tabla de frecuencias. Halle e interprete la moda.

Club de preferencia Nmero de estudiantes


Alianza Lima 280
Universitario 240
Sporting Cristal 80
Sport Boys 45

Ejercicio 7. En la siguiente tabla se presenta el nmero de cursos matriculados en el


presente semestre para una muestra de 300 alumnos.

Nmero de cursos Nmero de


matriculados alumnos
2 20
3 40
4 100
5 80
6 60

Halle e interprete la media, mediana y moda.


Sugerencia:
k

X i fi
Use la expresin: X i
, donde k es el nmero de clases y n el tamao de la
n
muestra.

44
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Propiedades de transformacin

Para una nueva variable transformada: Yi a bX,i donde a y b son constantes reales.
Entonces, sus medidas estadsticas son calculadas:

Medida estadstica Yi a bX i

Media Y a bX
Mediana meY a bmeX
Moda moY a bmoX

Ejemplo 7
En un parque de atracciones la media de los gastos por visitante un da especial es de
S/.40, sabiendo que los adultos gastaron una media de S/.43 y los nios S/.35.

a. Calcule el nmero de adultos y nios que visitaron el parque, si en total fueron 400
personas.
n Adultos * x Adultos nNios * x Nios n Adultos * 43 nNios * 35
xp 40
Se tiene: n Adultos nNios 400
n Adultos nNios 400
Entonces: n Adultos 150 y n Nios 250
b. Si los gastos por asistir al parque de atracciones se incrementaron en un 10% en el
caso de los adultos y en un 5% en el caso de los nios. Cul ser ahora el promedio
de los gastos por visitante?
y Adultos 1.1* x Adultos 1.1* 43 47.3 150 * 47.3 250 * 36.75
yp 40.76
y Nios 1.05 * x Nios 1.05 * 35 36.75 400

Ejercicio 8. La gerencia de marketing ha decidido aumentar 10% los precios de los


ternos en la sucursal Sur pero restando 90 nuevos soles, mientras que en la sucursal
Norte disminuir en 4.5% los precios de los ternos y en la sucursal Centro aumentar 125
nuevos soles cada terno. A continuacin se presenta las medidas estadsticas de los
precios de las sucursales obtenidas con MINITAB. Halle las medidas estadsticas de los
nuevos precios de los ternos para la sucursal Sur, Norte y Centro
.
Estadsticas descriptivas: Sucursal Sur; Sucursal Norte; Sucursal Centro
N para
Variable N N* Media Mnimo Mediana Mximo Moda moda
Sucursal Sur 15 0 450,5 345,0 450,0 650,0 450 3
Sucursal Norte 15 0 582,3 320,0 580,0 910,0 600 2
Sucursal Centro15 0 500,3 310,0 550,0 810,0 550 3

45
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

3.2 Percentiles (Pq)

El percentil Pq divide a un conjunto ordenado de observaciones en un q% menores que


Pq y un (100 q)% mayores que Pq. El percentil Pq es un valor expresado en las mismas
unidades que la variable en estudio.

Clculo del Percentil


n 1
Posicin q ,
100
n 1
100 q Entero E Pq x E

Si
n 1 q Decimal E.d P x 0.d x
100 q E
E 1 x E

Ejemplo 8
Se cuenta con los datos de los tiempos (en minutos) de tardanza de los trabajadores de
una compaa de seguro. Halle e interprete el percentil 45.

15 12 18 22 24 10 9 13 25 18 6 14

Datos ordenados: 6, 9, 10, 12, 13, 14, 15, 18, 18, 22, 24, 25

12 1
Posicin 45 5.85 P45 x5 0.85 x6 x5 13 0.85 14 13 13.85 min utos
100

Interpretacin: El 45% de los trabajadores tienen un tiempo de tardanza menor 13.85


minutos y el otro 55% ms de 13.85 minutos.

Ejercicio 9. Suponga que se quiere evaluar el nmero de insectos encontrados en 40


parcelas, en un cultivo de maz. Los resultados fueron los siguientes:

1 2 3 5 6 7 9 9 12 18
1 3 5 5 6 7 9 11 12 18
1 3 5 5 6 8 9 11 15 19
2 3 5 6 6 8 9 11 18 23

46
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

a. Halle e interprete el percentil 35

b. Cul debe ser el valor mnimo de insectos para que una parcela sea considerada
dentro del 18% de las parcelas con mayores nmeros de insectos?

c. Cul debe ser el valor mximo de insectos para que una parcela sea considerada
dentro del 22% de las parcelas con menores nmeros de insectos?

d. Para qu valores del nmero de insectos se tendr el 80% central de parcelas?

Ejercicio 10. Se tiene las notas de los promedio ponderados de los estudiantes
graduados en el ltimo ciclo. Halle el promedio ponderado mnimo para que un alumno
sea considerado dentro del quinto superior.

10.5 10.9 11.2 11.3 11.5 11.5 11.7 12.8 12.9 13.6 13.7 13.9 14.0 15.6

47
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Cuartiles

Son percentiles que dividen el conjunto de datos en 4 partes iguales (25% cada una).
Son conocidos tambin como Q1=P25, Q2=P50 y Q3=P75.

Ejemplo 9
Los siguientes datos corresponden a los pesos, en Kg. de 10 personas: 50, 52, 53, 54,
63, 64, 75, 76, 77, 80.

a. Calcule e interprete el percentil 25


P25 x 101 x2.75 x2 0.75 x3 x2 52 0.75 53 52 52.75 Kg
25
100
Interpretacin: El 25% de las personas pesa menos de 52.75 Kg. y el otro 75% pesa
ms de 52.75 Kg.

b. Halle el percentil 75
P75 x 101 x8.25 x8 0.25 x9 x8 76 0.25 77 76 76.25 Kg
75
100
Interpretacin: Un 75% de personas pesa menos de 76.25 Kg. y el otro 25% pesa
ms de 76.25 Kg.

Ejemplo 10
Se ha desarrollado un experimento para evaluar el efecto de alimentos balanceados en
la ganancia de pesos de pollos. Una muestra aleatoria de 30 pollos que recibieron el
alimento balanceado fue seleccionada. Al cabo de 10 das se registraron las ganancias de
pesos (en gr)

93 98 100 102 107 109 110 110 111 111 113 114 115 116 118
118 119 119 120 120 120 124 125 128 129 129 130 135 138 141
a. Halle e interprete las medidas de tendencia central para la ganancia de peso.
b. Cul es el peso mnimo de un pollo que fue alimentado con el alimento balanceado
para estar en el 10% superior de los que pesan ms?
c. Cul es peso mximo del 60% de pollos que pesan menos con el alimento
balanceado?

Solucin:
a)
N Media StDev CoefVar Minimo Q1 Mediana Q3 Maximo
30 117,40 11,57 9,85 93,00 110,00 118,00 125,75 141,00

La ganancia de peso por pollo alimentado con A es de 117.4 gr.


El 50% de los pollos alimentados con A tuvieron ganancias de peso menores de 118
gr. y el restante 50% tuvieron ganancias de peso mayores a 118 gr.
El valor de la ganancia de peso ms frecuente es de 120gr.

b) P90 X 27.5 134.5 gr.


c) P60 X 18 119 gr.

48
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

3.3 Diagrama de Tallos y Hojas

Un diagrama de tallos y hojas es un ingenioso artificio que ofrece una representacin


parecida a un histograma. La ventaja de este diagrama es que no slo muestran las
frecuencias sino que contienen los valores reales. A diferencia de las tablas de frecuencias
con este procedimiento ningn dato se pierde.

Pasos para elaborar un diagrama de tallos y hojas

Paso 1. Cada dato se divide en dos: la primera se llama tallo y la segunda hoja.
Paso 2. Cada tallo se forma con uno o ms dgitos iniciales de cada dato y las hojas se
forman con los dgitos restantes (generalmente de un solo dgito).
Paso 3. Los tallos se presentan en una columna ordenada de menor a mayor
Paso 4. Las hojas se muestran en filas ordenadas y listadas a la derecha de su respectivo
tallo.

Nota.-
En caso de datos decimales, al construir el diagrama de tallos y hojas el punto decimal
se pierde, por tal razn se acostumbra indicar unidades que los datos del tallo
representan. Por ejemplo para un dato: 4.12 Unidad=0.01
Es necesario pone todos los tallos consecutivos. Si no existe el dato, se pone el valor
del tallo y en la fila de hoja se deja en blanco.
Si es necesario se divide en dos hojas cada tallo, segn los rango: (0 4) y (5 9).

Ejemplo 11
Los siguientes datos corresponden a la estatura de una muestra de 30 alumnos
universitarios.

158, 159, 161, 161, 163, 163, 164, 166, 166, 167, 168, 168, 168, 169, 170, 170, 170,
171, 171, 171, 172, 173, 174, 174, 174, 174, 174, 177, 182, 191

Diseo de Tallo y Hoja: Estatura

Tallo y Hoja de Estatura n = 30 Profundidad


Unidad de hoja = 1.0
Tallos

2 15 89
7 16 11334 Hojas
14 16 6678889
(13) 17 0001112344444
3 17 7
2 18 2
1 18
1 19 1
El diagrama de tallos y hojas representa la estatura de 30 alumnos. Existen tres partes
en el grfico.
La primera columna representa la profundidad
La segunda columna representa los tallos
La ltima columna representa las hojas.
Cada dgito de las hojas representa una observacin.
El diagrama de tallos y hojas muestra 8 tallos con sus respectivas hojas. El primer tallo
es 15 y la primera hoja es 8. La observacin correspondiente es 158 que se obtuvo
juntando los dgitos del tallo y de la hoja y se multiplica por la unidad de hoja
(158*1.0=158).

La primera columna (la profundidad) indica cuantas observaciones hay en esa lnea o
antes. El nmero 14 en la tercera lnea indica que hay 14 observaciones en esa lnea y
en las lneas anteriores (14 observaciones menores o iguales a 169). Hay una lnea
49
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

especial, la lnea que contiene la mediana. El valor que muestra es encerrado entre
parntesis e indica cuantas observaciones hay en esa lnea. A partir de la siguiente lnea
que contiene la mediana, la columna de profundidad indica cuantas observaciones hay
en esa lnea y en las lneas posteriores. El nmero 3 en la quinta lnea indica que hay 3
observaciones en esa lnea y en las lneas posteriores (3 observaciones mayores o iguales
a 177).

La sptima lnea muestra al tallo 18 (1 18 ); sin embargo no tiene ninguna hoja,


lo que significa que no hay ninguna observacin en ese tallo. (Un error muy frecuente es
considerar el tallo 18 y la hoja 0 y por consiguiente considerar la observacin 18.0 con lo
que se tendran 31 observaciones).

Ejercicio 11. Se tiene una muestra sobre el tiempo (minutos) de concentracin de un


medicamento: 105, 126, 120, 119, 133, 145, 123, 108, 136, 156, 142, 130, 112, 123. A
continuacin se presenta su respectivo diagrama de tallos y hojas.

Tallo y hoja de Tiempo N = 14


Unidad de hoja = 1.0

2 10 58
3 11 2
4 11 9
7 12 033
7 12 6
6 13 03
4 13 6
3 14 2
2 14 5
1 15
1 15 6

a. Si se desconocen los datos originales, calcule la media, mediana, moda y P28 a partir
del diagrama de tallos y hojas.

50
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 12. Se tienen datos de las concentraciones de lactato en la sangre


(milimoles/litros):

2.1, 2.5, 2.8, 3.5, 3.6, 3.8, 3.8, 4.6, 5.2, 5.4, 5.6, 5.9, 6.2, 6.5, 6.5

A continuacin se presenta su respectivo diagrama de tallos y hojas.

Tallo y hoja de Concentracion N = 15


Unidad de hoja = 0.10

1 2 1
3 2 58
3 3
7 3 5688
7 4
(1) 4 6
7 5 24
5 5 69
3 6 2
2 6 55

a. A partir del diagrama de tallos y hojas calcule e interprete la media, mediana y moda.

51
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Prctica Dirigida N 2

1. Se desea analizar la cantidad de hormona llamada ecdisona que se obtiene a partir


de una conversin qumica del colesterol que presentan los crustceos. Esta hormona
es la encargada de llevar a cabo el proceso de muda en los crustceos. Para el estudio
se utiliza 20 individuos de la especie Cyclograpsus cinereus. Los resultados del nivel
de ecdisoma (en ml) son los siguientes:

Nivel de ecdisona (ml)


31.4 56.7 77.73 89.8 95.8
39.4 58.2 85.5 93.6 97.4
47.6 65.3 68.8 94.7 99.3
50.5 66.5 88.2 95.5 99.5

a) Calcule e interprete la media, mediana y moda del nivel de ecdisona.

b) Se desea clasificar a los individuos tres grupos segn sus niveles de ecdisona
(Bajo, Medio y Alto), de tal manera que contengan al 42%, 38% y 20% de
individuos respectivamente. Calcule los niveles de ecdisoma que permitan
identificar los lmites de cada grupo.

52
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c) A fin de mejorar el proceso de muda de los crustceos, se han ensayado dos tipos
de dosis (A y B). Con el tipo A, se espera que el nivel de ecdisoma se incremente
en un 12.5% pero con un reduccin de 5.6 ml por cada individuo, mientras que
con la dosis B, los niveles de ecdisoma disminuirn en un 4.5% pero ms 8.5 ml
por cada individuo. Cul de las dos dosis proporcionara los mayores niveles
promedios de ecdisoma en los crustceos?. Justifique su respuesta.

2. En un reservorio en la zona agrcola de Huachipa se realiza la crianza de peces Tilapia,


los cuales son vendidas diariamente a los pobladores de alrededor. Se muestra a
continuacin en un diagrama de tallos y hojas el peso en Kg. de venta de esta especie
de pez durante un mes.

SemandLeaf Display: peso de tilapias


Sten-and-leaf de peso N = 31
Leaf Unit = 0.10

1 4 2
61 6 7 4
6 5 223344
10 5 5566
(12) 6 112233444444
9 6 8999
4 7 344
1 7 9

Halle e interprete la media, median, moda y el percentil 32.5

53
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

EJERCICIOS PROPUESTOS

1. En una empresa, el jefe de Recursos Humanos est interesado en analizar el impacto


en los empleados al suprimir las horas extras de trabajo pagadas. Con este fin se
extrae una muestra aleatoria de 60 empleados tomando los datos de un da al azar.
A continuacin se muestran las horas de trabajo por da de cada empleado.

Horas diarias trabajadas


7.6 7.7 8.0 8.0 8.0 8.1 8.1 8.2 8.2 8.2 8.2 8.2 8.2 8.3 8.3
8.3 8.4 8.4 8.4 8.4 8.5 8.5 8.5 8.6 8.6 8.7 8.7 8.7 8.8 8.8
8.9 8.9 8.9 9.0 9.1 9.1 9.3 9.4 9.6 9.7 9.7 9.8 9.9 9.9 10.0
10.0 10.3 10.5 10.5 10.6 10.8 11.0 11.2 11.6 11.7 12.2 12.5 12.9 13.3 14.5

a) Construya el diagrama de tallos y hojas, considere como unidad de hoja 0.10


b) Calcule e interprete la media mediana y moda
c) Calcule el nmero mnimo de horas trabajadas para que un empleado se encuentre
en el 17% de los empleados que ms horas trabajan.

2. El banco Nuevo Continente cuenta con sucursales en La Molina y Los Olivos. El


gerente de crdito selecciona al azar algunas solicitudes de prstamo que han sido
aceptadas en cada una de las sucursales y resume de manera independiente la
informacin correspondiente al monto de prstamo otorgado (en miles de nuevos
soles) en los siguientes diagramas de tallos y hojas:

Tallo y Hojas de La Molina N = 13 Tallo y Hojas de Los Olivos N = 14


Unidad de Hoja = 0.10 Unidad de Hoja = 0.10

1 4 3 1 2 6
4 4 678 3 3 01
(4) 5 2244 3 4
5 5 5 5 5 08
4 6 4 5 6
3 6 99 7 7 14
1 7 4 7 8 5
6 9 069
3 10 1
2 11 45

a) Calcule e interprete las medidas de tendencia centra para la sucursal de La Molina.


b) Entre qu valores se encuentra el 60% central de las observaciones
correspondientes a la sucursal de Los Olivos?
c) El Inters que cobra el banco corresponde al 5% del monto otorgado como
prstamos ms 20 nuevos soles por gastos administrativos. Halle el inters medio
que percibir el banco debido a los prstamos otorgados

3. Si 80 artculos tienen un peso promedio de 2.54 Kg y se sabe que el instrumento de


medicin utilizado no estaba calibrado ocasionando que el peso de los artculos tengan
un 25% ms de su peso verdadero. Halle el verdadero peso promedio. (aplique
propiedades en la solucin)

54
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

4. Una fbrica tiene una mquina que trabaja las 24 horas del da en tres turnos de 8
horas (maana, tarde y noche). Los costos de produccin por hora (en soles) y los
tiempos de produccin por artculo que dependen del turno. Los datos se presentan a
continuacin:

Turno Costo de produccin Tiempo por hora de


por hora (S/.) consumo
Maana 40 0.50
Tarde 50 0.40
Noche 20 0.32

a) Calcule el costo promedio de produccin por hora.


b) Calcule el tiempo promedio de produccin por artculo al da

5. Del ejercicio anterior. Suponga que un trabajador que labora con la mquina en la
maana cobra 36 soles, un trabajador que labora en la tarde cobra 40 soles, y un
trabajador que labora en la noche cobra 50 soles diarios. Cul es el costo promedio
por hora que tiene la fbrica considerando la labor del trabajador y el costo de
produccin de energa elctrica?

6. En una fbrica de camisas se estudi la variable definida como el nmero de camisas


defectuosas que se produce cada hora. Fue seleccionada una muestra de 80 horas,
encontrndose la siguiente informacin:

X 0 1 2 3 4
fi 50 12 8 7 3

Si la produccin por hora es de 40 camisas y cada camisa buena genera una utilidad
de 120 soles adems cada camisa defectuosa da lugar a una prdida de 40 soles.
Calcule la utilidad neta promedio por da (Considere 6 horas de trabajo efectivo por
da).

7. Una empresa dedicada a la fabricacin de electrodomsticos desea evaluar el nmero


de un determinado componente elctrico que sus trabajadores pueden ensamblar en
un da. Con tal fin se registra el nmero de componentes elctricos ensamblados por
20 trabajadores del turno de la maana. Los resultados son los siguientes:

6 7 7 7 7 8 8 8 8 8
9 9 9 9 9 9 10 10 10 11

a) Calcule e intrprete las medidas de tendencia central.


b) La empresa le paga al trabajador 4 soles por componente si este ensambl 8 o
menos y 5 soles si ensambl 9 o ms. Calcule el ingreso promedio en ese da para
los dos grupos de trabajadores. Calcule el ingreso promedio en ese da para el
total de trabajadores.

8. Suponga que se quiere evaluar el nmero de insectos encontrados en 40 parcelas,


en un cultivo de frijol. Los resultados fueron los siguientes:

2 19 3 3 19 3 9 3 9 9 3 5 2 5 5 1 5 1 1 5
5 6 6 18 18 6 6 18 6 11 11 11 11 7 7 7 8 12 8 12

a) Halle e intrprete: Media, Mediana y Moda


b) Si se considera que el costo por eliminacin de un insecto es de aproximadamente
2 soles adems del alquiler del equipo que es una cantidad fija de 50 soles, hallar
el costo promedio para la eliminacin de los insectos.
55
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

9. La siguiente informacin corresponde al nmero de emergencias que atendi el


cuerpo de bomberos en los ltimos 30 das:

3 5 3 4 1 2 3 2 4 5 7 1 3 4 2
2 1 5 2 2 4 6 7 4 7 6 4 6 4 3

a) Calcule e intrprete las medidas de tendencia central.


b) El cuerpo de bomberos gasta en combustible 18 soles por emergencia atendida y
recibe un presupuesto de 120 soles diarios. Es este presupuesto suficiente? Si
as fuera, cunto dinero sobra diariamente en promedio?. En caso contrario,
cunto dinero falta diariamente en promedio?

10. Parra evaluar la efectividad de sus empleados, una empresa dedicada a la venta de
telfonos celulares ha recopilado la siguiente informacin sobre el nmero de
telfonos vendidos en la ltima semana por sus 64 empleados:

Nmero de empleados 13 15 16 8 5 4 3
Nmero de ventas 5 6 7 8 9 10 11

a) Calcule e intrprete las medidas de tendencia central.


b) La empresa le paga a sus empleados 100 soles semanales ms una comisin de
40 soles por celular vendido y sobre estos ingresos los empleados deben aportar
el 15% a su AFP. Calcule el promedio para el ingreso neto promedio semanal por
empleado.

11. Se encuest a 84 congresistas de cierto pas para averiguar el nmero de viajes


internacionales que realizan por ao, obtenindose los siguientes resultados:

Tallo y Hojas de Viajes N = 84


Unidad de Hoja = 1.0
(46) 0 6666666666666677777777777777788888889999999999
38 1 000000011111112222233344
14 1 55566667789
3 2 034

Calcule las medidas de tendencia central para estos datos. Interpretar: Media,
Mediana y Moda.

12. Se realiz un estudio en la provincia de Tambo Grande (Piura), luego de la aplicacin


de un nuevo abono en el cultivo de dos variedades de mango: Kent y Haden. Los
rendimientos en la produccin obtenidos luego de la cosecha en Kg/Ha fueron los
siguientes:

Variedades
Variedad Kent Variedad Haden
N de N de
Rend. Rend. Tallo y Hoja de Haden N = 22
Ha Ha
1 9.0 12 13.1 Unidad de Hoja = 0.10
2 11.9 13 13.2 8 10 22388999
(6) 11 266888
3 12.6 14 13.5
8 12 2233
4 12.6 15 13.5 4 13 344
5 12.6 16 13.7 1 14
6 12.8 17 13.8 1 15
7 12.8 18 13.8 1 16 5
8 12.8 19 14.1
9 12.9 20 14.1
10 12.9 21 14.3

Calcule e interpretar las medidas de tendencia central para estos datos.

56
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Preguntas de Autoevaluacin

1. Las medidas de tendencia central que no estn influenciadas por valores atpicos son
_______________________________________.
2. ___________________ es una medida de tendencia central que est afectada por los
valores extremos.
3. __________________ es una medida de tendencia central utilizada para resumir
datos provenientes de un variable tipo cualitativa.
4. En una muestra de 80 estudiantes, el 60% ha perdido un celular, el 20% dos celulares,
el 15% tres celulares y el resto ningn celular en los ltimos dos aos. Entonces el
percentil 56 es igual a ____________________________.
5. La suma de las desviaciones de las observaciones respecto a la media aritmtica, es
igual a _____________________.
6. La suma de las desviaciones absolutas de las observaciones con respecto a la
________________________ es un valor mnimo.
7. Los resultados de una encuesta sobre el porcentaje de satisfaccin de sus clientes
para dos empresas de seguro (A y B) se muestran en el siguiente cuadro:

Satisfaccin Empresa A Empresa B


Alta 30% 40%
Media 40% 35%
Baja 20% 15%
Muy baja 10% 10%

Para comparar donde hay mayor satisfaccin de los clientes en las empresas A y B,
la medida de tendencia central usada es ____________________ y cuyos valores
usados son __________________________ respectivamente.
8. Una empresa aseguradora de autos ofrece a sus clientes cuatro planes de seguros (A,
B, C y D), siendo el costo anual de 650, 520, 450 y 380 (nuevos soles)
respectivamente. Si el 45% de sus clientes tienen el plan de seguro A, el 35% el B,
el 15% el C y el resto el plan D. El costo promedio de los cuatro planes de seguro
para la empresa aseguradora es igual a _____________________________
n

9. Si X 10.5, entonces : ( X i 10.5) , es un valor _______________________.


2

i 1
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:

Item Enunciado V/F


a. Las medidas de tendencia central, asumen como unidad de medida la
misma que la variable en estudio.
b. Los percentiles estn afectados por valores extremos
c. La mediana y el percentil 50 no siempre son iguales
d. La media puede tomar un valor negativo
e. Las medidas de tendencia central son calculadas slo con los datos de
una muestra.

57
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

CAPTULO IV

MEDIDAS DE VARIABILIDAD O DE DISPERSIN

Son medidas estadsticas que permiten conocer el grado de dispersin o variabilidad


(homogeneidad o heterogeneidad) dentro de un conjunto de datos. Se usan para
comparar la variabilidad entre dos o ms conjuntos de datos. Cuando los datos presentan
baja variabilidad, se dice que son homogneos y cuando presentan alta variabilidad se
dice que son heterogneos.

Objetivos. Calcular e interpretar las principales medidas de variabilidad para describir


las caractersticas (variables) cuantitativas de las unidades elementales en trminos de
su dispersin.

Las principales medidas de variabilidad son las siguientes:

1. La amplitud o rango
2. El rango intercuartil
3. La variancia y la desviacin estndar
4. El coeficiente de variabilidad

Ejemplo 1
Suponga que las notas de la primera prctica de tres grupos del curso de Estadstica
General fueron:

Grupo Notas x
A 14 14 14 14 14 14 14 14 14 14 14
B 14 13 15 14 12 15 16 13 12 16 14
C 19 8 19 11 16 18 6 13 10 20 14

Analice las notas promedios de los tres grupos de Estadstica general.

Solucin
Del cuadro se observa que:
a. Los grupos A, B y C tienen la misma media pero diferente dispersin en torno a la
media.
b. Respecto a la variabilidad o dispersin: A < B < C
c. Respecto a la homogeneidad : A > B > C
d. Respecto a la confiabilidad de la media: A > B > C

4.1 Principales medidas de variabilidad

El rango

El rango o amplitud de un conjunto de observaciones es igual a la diferencia entre el valor


mximo y el valor mnimo.

R = Xmax - Xmin
Desventajas:

a. Queda afectada por valores extremos


b. No mide la variabilidad de los datos intermedios

58
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 2
El rango de la nota para el grupo B es: RB = 16 12 = 4 puntos.

Esto indica que la amplitud de la nota de la primera prctica del grupo B fue de 4 puntos.

El rango intercuartil

El rango intercuartil, se define como la diferencia entre el percentil 75 (P 75 = Q3) y el


percentil 25 (P25 = Q1).
RI = P75 - P25
El RI excluye el 25% ms alto y el 25% ms bajo, dando un rango dentro del cual se
encuentra el 50% central de los datos.
Un RI pequeo indica alta homogeneidad o pequea variabilidad dentro del 50%
central de los datos.

Ejemplo 3
Para el grupo C: P75 = 19 y P25 = 9.5, entonces el rango intercuartil: RI = 19 9.5 =
9.5 puntos.

Esto indica que la amplitud del 50% central de las notas de la primera prctica para el
grupo C fue 9.5.

La variancia y la desviacin estndar


1 N 2 2
1 N
X j N
2
Variancia poblacional: 2 X j
N j 1 N j 1
1 n 2 2
1 n
X j n X
2
Variancia muestral: S2 Xj X
n 1 j 1 n 1 j 1
Desviacin estndar muestral: S S 2

1 k 1 k
( fi X i2 nX )
2
Para una tabla de frecuencias: S2 f ( X X ) 2

n 1 i 1 n 1 i 1
i i

Se observa que la variancia est dada en las mismas unidades que la variable en estudio
al cuadrado. Por ejemplo si las unidades de las observaciones son Kg. entonces la
variancia se expresa en Kg2.

Ejemplo 4
Halle la variancia y desviacin estndar muestral de las notas para cada uno de los
grupos.

10
Grupo Notas x x
i 1
2
i

A 14 14 14 14 14 14 14 14 14 14 14 1960
B 14 13 15 14 12 15 16 13 12 16 14 1980
C 19 8 19 11 16 18 6 13 10 20 14 2192

Solucin
1 10 2 2
Grupo A: S A2 xi n x
n 1 i1
1


1960 10 x142 0 y SA 0
10 1
1 10 2 2
Grupo B: S B2 xi n x
n 1 i1
1


1980 10 x142 2.22 y S B 2.22 1.49
10 1

59
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

1 10 2 2
Grupo C: S
2
xi n x
n 1 i1
1

2192 10 x142 25.78 y SC 25.78 5.08
10 1
C

Se observa que a mayor variabilidad entre las observaciones, la variancia es mayor. Esta
comparacin se cumple siempre cuando los promedios sean similares.
Se observa que la variabilidad promedio de las notas de la primera prctica del grupo B
es 1.49 puntos.

Coeficiente de variabilidad

El coeficiente de variabilidad es una medida de dispersin relativa (no tiene unidades) y


se define como la razn entre la desviacin estndar y la media aritmtica de un conjunto
de observaciones.

Coeficiente de variabilidad poblacional: CV 100

s
Coeficiente de variabilidad muestral: cv 100
x

Ejemplo 5
Halle el coeficiente de variabilidad de las notas de la primera prctica para cada grupo.
SA 0
Grupo A: cvA
x100 x100 0
xA 14
S 1.49
Grupo B: cvB B x100 x100 10.6%
xB 14
S 5.08
Grupo C: cvC C x100 x100 36.3%
xC 14

Esto indica, que la variabilidad de la nota de la primera prctica del grupo C es 36.3% y
por lo tanto es el ms heterogneo por tener mayor cv en comparacin con el grupo A y
B.

Ejemplo 6
Los siguientes datos corresponden al tiempo (en minutos), al cabo del cual se duermen
las ratas despus de haber recibido un tipo de tranquilizante (A o B).

Tipo A Tipo B
n 18 ratas 20 ratas
x 9.94 min 15.2 min
s 2.81 min 2.84 min

Con qu tranquilizante el tiempo es ms homogneo?


2.81 2.84
cv A 100 28.27 % cvB 18.68 %
9.94 15.2

Se concluye que con el tranquilizante B se obtienen observaciones ms homogneas que


con el tranquilizante A.

60
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 1. Los siguientes datos corresponden a las mediciones de la emisin diaria (en
toneladas) de xido de azufre de una planta industrial.

15.8 26.4 17.3 11.2 23.9 24.5 13.9 9.4 22.7 18.5
15.2 11.0 7.7 20.0 16.2
Calcule e interprete las medidas de variabilidad (Rango, Rango intercuartil, Varianza,
Desviacin estndar y Coeficiente de variacin).

Comparacin de la variabilidad

Para comparar la variabilidad entre dos o ms conjuntos de datos, se debe considerar:

Unidades de medidas Unidades de medidas iguales


diferentes
Medias similares Medias diferentes

cv1 con cv2 S1 con S2 cv1 con cv2

El cuadro indica que cuando se compara la variabilidad de dos conjuntos de datos, si las
variables tienen unidades de medidas diferentes; se debe usar los coeficientes de
variacin; mientras si las variables tienen unidades de medida iguales, se debe observar
si las medias son similares para usar la desviacin estndar y en caso que las medias
sean diferentes usar el coeficiente de variacin.

61
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 2. En el siguiente cuadro se muestra las medidas estadsticas de las ventas


(soles) y tiempo extra (horas) de los vendedores de dos zonas (A y B).

Desviacin Coeficiente de
Promedio estndar variabilidad

Zona Ventas Tiempo Ventas Tiempo Ventas Tiempo

A 236.3 3.5 82.6 1.5 35.0 42.9


B 450.5 3.6 98.5 2.8 21.9 77.7

a. Las ventas de la zona A son menos variables que las de la zona B. Justifique.

b. El tiempo extra de la zona B muestra ms variabilidad que la zona A. Justifique.

c. Para la zona A, las ventas son ms variables que el tiempo extra. Justifique.

Transformacin de datos

Sea la variable Y, entonces se cumple: Y a bX

SY2 b 2 S X2
SY bS X
Ejemplo 7
En una empresa industrial desea mejorar la productividad de los obreros, para tal efecto
se escogi uno de los productos de la empresa para hacer el anlisis, y se tom el tiempo
que demoran 20 trabajadores del primer turno en ensamblar el producto, obtenindose
los tiempos siguientes (en minutos):

Variable Media StDev Varianza CoefVar Q1 Mediana Q3


C1 3.525 1.723 2.967 48.87 1.975 3.250 5.125

a. El Gerente de Produccin, considera que la muestra de obreros es muy pequea, por


lo tanto dispone se incremente con 5 trabajadores ms, los cuales demoran 2.5, 2.8,
4.3, 5.1, 5.5 (en minutos) para ensamblar el producto, encuentre e interprete la
media, la mediana y la moda de los tiempos de los 25 trabajadores juntos.

Media con 20 trabajadores : 3.525


Media de 5 trabajadores : (2.5+2.8+4.3+5.1+5.5)/5= 4.04
Media con 25 trabajadores : (20*3.525+5*4.04)/25= 3.628

62
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Inspeccionando el cronmetro con que se registr los tiempos se encontr que ste
estaba excediendo la medicin en 0.1 minutos. Cules seran entonces las reales
medidas halladas en a)?

Media = 3.525-0.1=3.425
Mediana = 3.25-0.1=3.15
S= 1.723
CV = 1.723/3.425*100 = 50.3%

Ejercicio 3. Considere los datos del ejercicio 2. Suponga que la empresa decide hacer
un pago adicional por las horas extras. A los vendedores de la zona A, se les pagar S/
10.0 por cada hora extra ms S/. 50 por movilidad. A los de la zona B, se les pagar S/
15.0 por cada hora extra.
Calcule la desviacin estndar y coeficiente de variabilidad para estos pagos adicionales

Ejercicio 4. Los sueldos de 100 empleados de una empresa tienen una media de $300 y
una desviacin estndar de $50. Se proponen dos alternativas de aumento A: $75 a cada
uno B: 15% del sueldo ms $20 a cada uno. Cul alternativa es la ms conveniente?.
Justifique su respuesta.

a. Si la empresa dispone solo de $37000 para pagar sueldos

b. Si la empresa quiere homogeneizar los sueldos.

63
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

EJERCICIOS PROPUESTOS

1. En el mes de Julio el sueldo promedio de los trabajadores del Sector Educacin fue de
$200 dlares. Para el mes de Agosto se considera un aumento del 37% con respecto
al sueldo del mes anterior ms un adicional de $35 dlares. Si se obtuvo una
desviacin estndar igual a $ 3.15 en el mes de Julio. Se puede afirmar que la
distribucin de sueldos en Julio fue ms homognea?

2. En una industria el jornal diario de sus obreros tiene una media de $10 y una
desviacin estndar de $2. Si se hace un incremento del 20% en cada jornal y una
bonificacin adicional de $3. En qu porcentaje cambio el coeficiente de variacin de
los jornales?

3. Los sueldos de 100 empleados de una empresa tienen una media de $300 y una
desviacin estndar de $50. Se proponen dos alternativas de aumento i) $75 a cada
uno ii) 15% del sueldo ms $20 a cada uno Cul alternativa es la ms conveniente?
a) Si la empresa dispone solo de $37000 para pagar sueldos.
b) S la empresa quiere homogeneizar los sueldos

4. Si 80 artculos tienen un variancia de 4.2 Kg2 y un P40 = 43.4 Kg y se sabe que el


instrumento de medicin utilizado no estaba calibrado y pes a los artculos con un
25% ms de su peso. Halle la verdadera variancia y el verdadero P40.

5. En un estudio sobre garbanzo se consider la variable altura de planta y en una


muestra de 14 plantas se tiene: 55.7, 57.6, 58.5, 58.7, 58.8, 59.3, 59.4, 59.6, 60.0,
59.8, 60.1, 60.2, 60.3, 63.1. Calcule e interprete la variancia muestral y P 75. Si a
cada observacin se le multiplica por 1.8 y a cada resultado se le resta 3 halle la
nueva variancia muestral y el nuevo P75.

6. Se tiene una muestra aleatoria de tamao 20 con media 5 y variancia igual a 0.36,
si a cada observacin se le incrementa un 20% de su valor ms una cantidad de 4
unidades:

1. Calcule el coeficiente de variacin de los datos transformados.


2. De la pregunta anterior, qu conjunto de datos presenta mayor variabilidad, los
datos transformados o los datos iniciales?

7. El sueldo promedio de los empleados de una empresa para el mes de Julio fue de S/.
1500 y un coeficiente de variabilidad de 30%. Si la gerencia decide dar un aumento
del 8% ms un monto por viticos de S/. 200 cada mes. Calcular el coeficiente de
variabilidad para el nuevo sueldo.
8. Para evaluar la efectividad de sus empleados, una empresa dedicada a la venta de
telfonos celulares ha recopilado la siguiente informacin sobre el nmero de
telfonos vendidos en la ltima semana por sus 64 empleados:

Nmero de empleados 13 15 16 8 5 4 3
Nmero de ventas 5 6 7 8 9 10 11
a. Calcule e intrprete las medidas de variabilidad.
b. La empresa le paga a sus empleados 100 soles semanales ms una comisin de
40 soles por celular vendido y sobre estos ingresos los empleados deben aportar
el 15% a su AFP. Calcule el promedio y la desviacin estndar para el ingreso neto
promedio semanal por empleado.

64
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

9. Los sueldos de 150 trabajadores de una empresa tienen un coeficiente de variacin


del 5% en el mes de agosto. Para el mes de septiembre hay un aumento a cada
trabajador del 20% de sus sueldos ms una bonificacin de $60 y el coeficiente de
variacin baja a 4%.
a) Calcule la media y la desviacin estndar de los sueldos del mes de agosto.
b) Cunto dinero adicional necesita la empresa para pagar todos los sueldos del
mes de septiembre?
.
10. El banco Nuevo Continente cuenta con sucursales en LA Molina y Los Olivos. El
gerente de crdito selecciona al azar algunas solicitudes de prstamo que han sido
aceptadas en cada una de las sucursales y resume de manera independiente la
informacin correspondiente al monto de prstamo otorgado (en miles de nuevos
soles) en los siguientes diagramas de tallos y hojas:

Tallo y Hojas de La Molina N = 13 Tallo y Hojas de Los Olivos N = 14


Unidad de la Hoja = 0.10 Unidad de la Hoja = 0.10

1 4 3 1 2 6
4 4 678 3 3 01
(4) 5 2244 3 4
5 5 5 5 5 08
4 6 4 5 6
3 6 99 7 7 14
1 7 4 7 8 5
6 9 069
3 10 1
2 11 45
a) Calcule e interprete las medidas de variabilidad para la sucursal de La Molina.
b) Qu conjunto de datos presenta mayor variabilidad?
c) Para la sucursal de los Olivos el inters que cobra el banco corresponde al 5% del
monto otorgado como prstamos ms 20 nuevos soles por gastos administrativos.
Mientras que para la sucursal de la Molina, se cobra 4.5% del monto otorgado. Se
puede decir que el inters que cobra la sucursal La Molina es menos variables que
el que cobra los Olivos.

11. En el mes de Marzo el sueldo promedio de los trabajadores del Sector Educacin fue
de $180 dlares. Para el mes de Abril se considera un aumento del 25% con respecto
al sueldo del mes anterior ms un adicional de $40 dlares. Si el coeficiente de
variacin del mes de Marzo fue de 0.15. Se puede afirmar que la distribucin de
sueldos en Marzo fue ms homognea?

12. Los sueldos de 150 trabajadores de una empresa tienen un coeficiente de variacin
del 5% en el mes de agosto. Para el mes de septiembre hay un aumento a cada
trabajador del 20% de su sueldo ms una bonificacin de $60 y el coeficiente de
variacin baja a 4%.
a) Calcule la media y la desviacin estndar de los sueldos del mes de agosto.
b) Cunto dinero adicional necesita la empresa para pagar todos los sueldos del
mes de septiembre?

65
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Preguntas de Autoevaluacin

1. La medida de variabilidad que mide la amplitud del 50% central de los datos, se
denomina ___________________________________________.

2. La medida de variabilidad para medir el grado de homogeneidad del peso y talla de


una muestra de 100 estudiantes es _____________________________
3. ________________ es una medida de variabilidad que es afectada por valores
extremos.

4. Si el cv=30% y el promedio es 2, entonces para Y=5-2X, su cv es igual a


________________________
5. Se sabe que en una muestra de 50 familias de una zona rural, 25 tienen 6 hijos, 15
tienen 5 hijos, 8 tienen 4 hijos y el resto 3 hijos. Entonces el coeficiente de variacin
del nmero de hijos es igual a ___________________________.
6. Se tiene que el sueldo de los 120 trabajadores de una empresa tiene un coeficiente
de variabilidad del 8% en el mes de julio. Para el mes de agosto hay un aumento para
cada trabajador del 25% de su sueldo ms una bonificacin de $40, lo cual hace que
el coeficiente de variabilidad sea del 4%. La media y la desviacin estndar de los
sueldos del mes de agosto son ____________ y ______________.
7. Si las variables X e Y son independientes y para a y b constantes, entonces la Var(aX
+ bY) es igual a __________________________
8. En una distribucin simtrica la mediana es 4 y el coeficiente de variabilidad es 20%.
El valor de la desviacin estndar es ______________________.
9. Si se sabe que en una plantacin foresta, el 25% de los rboles tienen un dimetro
menor a 0.85 cm y el 25% mayores a 0.92 cm. Entonces, la amplitud del 50% central
de los dimetros es igual a _________________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:

Item Enunciado V/F


a. Si a cada valor de una variable se le multiplica por una constante (k),
entonces el coeficiente de variacin resulta multiplicado por k.
b. El coeficiente de variabilidad es una medida de dispersin relativa y
siempre es positivo.
c. La desviacin estndar es una medida que permite comparar dos
conjuntos de datos que presentan diferentes unidades.
d. La unidad de medida de la variancia siempre est al cuadrado.
e. La desviacin estndar est afectada por las unidades de medida.

66
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

CAPTULO V

MEDIDAS DE ASIMETRA

Las medidas de asimetra permiten determinar la forma de una distribucin para un


conjunto de datos en lo que se refiere a su simetra o asimetra.

Objetivo. Al finalizar este captulo el lector debe ser capaz de cuantificar e interpretar la
simetra o asimetra de una distribucin.

5.1 Formas de una Distribucin

Distribucin simtrica. Un conjunto de datos muestra una distribucin simtrica, si


su curva guarda simetra con respecto al centro de los datos. Si la distribucin es
simtrica entonces Me .
Distribucin asimtrica positiva. Si un conjunto de datos muestra una distribucin
asimtrica positiva o con cola a la derecha, entonces: Me .
Distribucin asimtrica negativa. Si un conjunto de datos muestra una
distribucin asimtrica negativa o con cola a la izquierda, entonces: Me .

Ejemplo 1
Los siguientes grficos corresponden a la distribucin de los ingresos mensuales (miles
S/.) de muestras al azar de los clientes de tres sucursales (A,B y C) de una caja rural.

Sucursal A Sucursal B Sucursal C

X me X me X me
Distribucin simtrica Distribucin asimtrica positiva Distribucin asimtrica negativa
o haca la derecha o haca la izquierda

Las relaciones entre la media y la mediana descritas anteriormente, se cumplen con


distribuciones unimodales (una sola moda).

5.2 Coeficiente de asimetra de Pearson

Poblacional: As
3 Me
Muestral: as

3 X me
s
Propiedades

1. Si as = 0 entonces la distribucin es simtrica.


2. Si as < 0 entonces la distribucin es asimtrica negativa o a la izquierda.
3. Si as > 0 entonces la distribucin es asimtrica positiva o a la derecha.

Un mayor (menor) valor del coeficiente de asimetra de Pearson indica un mayor (menor)
grado de asimetra de la distribucin de los datos.

67
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 2
Recordemos los datos de los ingresos mensuales del Banco Comercial que se trabajaron
en la parte de organizacin de datos. Con esa informacin se tienen los siguientes
valores: x 5.350 , me 4.700 , s 2.181 .
3 5.350 4.700
Por lo tanto as 0.8941 0 , entonces la distribucin de los ingresos
2.181
mensuales tiene una asimtrica positiva.

Ejercicio 1. Se desea realizar un estudio sobre la utilizacin del agua en tres zonas
rurales (A, B y C). Con esta finalidad se ha seleccionado al azar 8 casas de la zona A, 6
de la zona B y 10 de la zona C. Luego se registr el nmero de litros de agua consumidos
por un da, los cuales se presenta en el siguiente cuadro:

Zonas Nmero de litros de agua consumidos por da


A 150 135 120 110 160 180 155 165
B 135 110 105 125 750 140
C 100 110 115 280 130 140 175 120 130 145

Clculo de medidas estadsticas con el MINITAB

Estadsticas Descriptivas

Variable N Media Mediana StDev


Zona A 8 146.88 152.50 23.59
Zona B 6 228 130 256
Zona C 10 144.5 130.0 52.0

Variable Minimo Maximo Q1 Q3


Zona A 110.00 180.00 123.75 163.75
Zona B 105 750 109 293
Zona C 100.0 280.0 113.8 152.5

Calcule e interprete el coeficiente de asimetra de Pearson para el nmero de litros de


agua consumidas para cada zona

68
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

5.3 Diagrama de cajas (Box plot)

El diagrama de cajas (Box plot) es una tcnica grfica que nos permite determinar:
1. Los valores extremos (outliers), valores atpicos o datos discordantes.
2. La asimetra de la distribucin que corresponde al 50% central de los datos.
3. La variabilidad del 50% central de dos o ms conjuntos de datos.

Valor Outlier
El bigote superior
se extiende al valor
ms alto que
* pertenece al
intervalo de
seguridad superior
Tercer
Cuartil (Q3)
Mediana

El bigote inferior se
extiende al valor s
Primer bajo que pertenece
Cuartil (Q1) al intervalo de
seguridad inferior

La caja contiene informacin del 50% de los datos ya que la lnea inferior de la caja
es el primer cuartil (Q1 = P25), y la lnea superior de la caja es el tercer cuartil (Q3 =
P75).
La lnea que divide a la caja es la mediana y su posicin dentro de ella nos brindar
informacin sobre la asimetra de la distribucin del 50% central de datos.
Los bigotes son las lneas que se extienden de la parte inferior y superior de la caja
hasta la observacin ms alta o ms baja dentro de los intervalos de seguridad.

Interpretacin del diagrama de cajas:

1. Respecto a la Simetra o Asimetra. Para evaluar la asimetra en el 50% central


de los datos se observa la posicin de Q2 = P50

Si Q2 est prximo a Q1, entonces la distribucin de los datos presentan una


asimetra positiva o haca la derecha.
Si Q2 est prximo a Q3, entonces la distribucin de los datos presentan una
asimetra negativa o haca la izquierda.
Si Q2 est en medio de Q1 y Q3, entonces la distribucin de los datos presentan
una simetra.

2. Respecto a la variabilidad. En el punto referido a la variabilidad slo es aplicable


al caso cuando se comparan dos o ms distribuciones a travs de la longitud (largo)
de sus respectivas cajas. Presenta mayor variabilidad la distribucin que tenga mayor
longitud de caja, sin embargo, se debe advertir que este criterio para evaluar la
variabilidad alcanza nicamente a la distribucin del 50% central de datos.

3. Respecto a datos outliers. Son observaciones fuera de los lmites inferior y/o
superior y que se representan con asteriscos (*).

Intervalo de seguridad inferior ISI = Q1 1.5 (Q3 - Q1) = Q1 1.5 RIC


Intervalo de seguridad superior ISS = Q3 + 1.5 (Q3 - Q1) = Q3 + 1.5 RIC

Si Xi < ISI, entonces Xi es un dato atpico pequeo u outliers pequeo.


Si Xi > ISS, entonces Xi es un dato atpico alto u outliers alto.

69
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 3
Se tienen los pesos de 10 personas del aula A: 50, 52, 53, 54, 63, 64, 75, 76, 85, 120.
Con estos datos se obtiene P25 = 52.75, P50 = me = 63.5, P75 = 78.25, RI = Q3-Q1 =
25.5
Luego se calculan los intervalos de seguridad inferior y superior.
ISI = P25 1.5 RI = 52.75 1.5 (25.5) = 14.5
ISS= P75 + 1.5 RI = 78.25 + 1.5 (25.5) = 116.5

Un valor es extremo si es menor que 14.5 o mayor que 116.5

120

110

100

90
Peso A

80

70

60

50

Se aprecia que hay un outlier o valor extremo superior (120 Kg. 116.5) que se
representa con un asterisco (*). En el caso inferior no existe ningn valor menor al lmite
inferior (14.5).

El lmite superior es 116.5. El bigote superior llega hasta el valor adyacente ms alto
dentro del lmite superior (78.25 a 116.5). En nuestro ejemplo el bigote superior llega
hasta 85.

El lmite inferior es 14.5. El bigote inferior llega hasta el valor adyacente ms bajo dentro
del lmite inferior (14.5 a 52.75). En nuestro ejemplo el bigote inferior llega hasta 50.

La asimetra del 50% central de los datos es positiva.

Ejemplo 4
Si se tienen los pesos de 10 personas del aula B: 54, 54, 54, 55, 55, 55, 55, 56, 56, 56.
Entonces P25 = 54, P50 = 55, P75 = 56, RI = 2, ISI = 51, ISS = 59.

120

110

100

90

80

70

60

50

Peso A Peso B

Peso A representa la caja del ejemplo anterior y Peso B la caja del ejemplo que se est
presentando. Se observa que en Peso B no hay valores extremos y que una caja ms
grande representa a datos ms variables (Peso A es ms variable que Peso B). Peso
B es simtrica (se verifica que me x 55 Kg )

70
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 2. Se sabe que un determinado contaminante industrial vertido sobre un


ecosistema fluvial genera en las truchas anticuerpos. Se cree que el nmero de
anticuerpos por cada unidad de sangre, puede ser distinta entre truchas hembras y
machos, por lo que se ha seleccionado de un criadero de truchas, ubicado cerca de una
industria que vierte el contaminante, una muestra de 70 truchas de las cuales 40 son
hembras y 30 machos. Los datos obtenidos se resumen a continuacin, segn el grupo
de hembras o machos.

Grfico de tallo y hojas para: Estadsticas descriptivas para:


Hembras N = 40 Machos
Unidad de hoja: 10
3 2 223 Mean SE Mean StDev Minimo
6 3 568 673.0 45.2 247.8 290.4
12 4 236899
19 5 0112249 Q1 Median Q3 Maximo N
(10) 6 0034456788 476.6 689.2 833.3 1200 30
11 7 33779
6 8 9
5 9 08
3 10 00
1 11
1 12
1 13 4

a. Complete el siguiente diagrama de cajas.

Clculos:

71
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Realice una comparacin acerca de la posicin, variabilidad, simetra para el 50%


central y outliers de ambos sexos.

Ejercicio 3. Se ha desarrollado un experimento para evaluar el efecto de alimentos


balanceados en la ganancia de pesos de pollos. Una muestra de 30 recibi el alimento A
y otra muestra de 60 pollos el alimento B. Al cabo de 10 das se registraron la ganancia
de pesos (en gr)

Alimento A
93 98 100 102 107 109 110 110 111 111 113 114 115 116 118
118 119 119 120 120 120 124 125 128 129 129 130 135 138 181

Alimento B
Tallo y Hojas de Alimento B N = 60
Unidad de Hoja = 1,0
2 12 34
11 12 566788999
24 13 0000000011133
(12) 13 566678889999
24 14 001123
18 14 5669
14 15 0122
10 15 788899
4 16 0123

Variable N Media StDev CoefVar Minimo Q1 Mediana Q3 Maximo


A 30 117,40 11,57 9,85 93,00 110,00 118,00 125,75 181,00
B 60 139,60 11,46 8,21 123,00 130,00 138,00 148,25 163,00

a. Cul de los dos tipos de alimentos es menos variable? (Considerando el 100% de


los datos)

72
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Calcule e interprete el coeficiente de asimetra de Pearson para las ganancias de


peso de los pollos alimentados con A y B.

c. Construya un diagrama de cajas para las ganancias de peso de los pollos alimentados
con A y B. Interprete y compare los diagramas de cajas. (respecto a la simetra en
el 50% central de los datos, la variabilidad en el 50% de los datos y la presencia de
datos outliers).

73
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Prctica Dirigida N 3

1. El gerente de una empresa financiera desea analizar el comportamiento de la


rentabilidad de las acciones de las empresas mineras y pesqueras. Con esta finalidad
se registra los ndices de rentabilidad de una muestra de 12 y 15 empresas minera y
pesquera respectivamente. Los datos se muestran a continuacin:

Indice de rentabilidad
Minera Pesquera
6.0 16.8 Stem-and-Leaf Display:
7.2 18.2 Stem-and-leaf of x2 N = 15
7.9 Leaf Unit = 0.10
10.2 5 10 23899
(4) 11 2688
10.8
6 12 233
12.2
3 13 34
12.8
1 14
13.8
1 15
14.0
1 16 5
14.0

a) Cul debe ser el ndice de rentabilidad como mximo para que una empresa
minera este dentro del 35% de las de menor rentabilidad?.

b) Qu tipo de empresa se debe escoger, si se desea tener ndices de rentabilidad


ms homogneos?. Justifique su respuesta.

74
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

2. La siguiente salida de MINITAB corresponde al tiempo extra semanal (en horas) de


los trabajadores de una empresa agroindustrial de los turnos maana y noche.

Variable N Mean StDev Minimum Q1 Median Q3 Maximum


Maana 13 16.24 10.11 4.5 10.2 14.5 19.45 45.6
Noche 13 18.68 9.24 8.9 12.15 16.8 22.35 38,5

a) Cul es la forma de la distribucin de los tiempos extras para cada uno de los
turnos?. Justifique su respuesta.

b) Si la empresa decide hacer un pago (en soles) de 12 a los trabajadores del turno
de maana por cada hora extra semanal ms 50 por movilidad y a los del turno
noche 7.5 por cada hora extra semanal. Cul de los turnos mostrar mayor
variabilidad respecto a los pagos por horas extras semanal?. Justifique su
respuesta.

75
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c) Considere que los datos del tiempo extra semanal de los trabajadores de los
turnos maana y noche son los que se muestran en la siguiente tabla:

Maana 12.5 10.6 9.8 20.5 18.4 8.5 14.6 12.5 22.3 45.6 14.5 16.8 4.5
Noche 8.9 12.3 24.5 35.8 14.6 16.8 12.0 10.3 16.8 20.2 18.7 13.4 38.5

Complete e interprete el siguiente diagrama de cajas (variabilidad, datos atpicos y


asimetra).

ss

ss

76
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

EJERCICIOS PROPUESTOS

1. El siguiente grfico (BoxPlot) muestra la informacin sobre el nivel de ventas durante


el ltimo mes (en cientos de dlares) del detergente Blanquito en 18 tiendas
seleccionadas al azar. Las tiendas fueron clasificadas de acuerdo a los niveles
socioeconmicos Medio-Alto y Medio-Bajo a la cual pertenece.

7000

6000

5000

4000

3000

2000

1000

Medio-Alto Medio-Bajo

a) Seale en cul de los dos estratos socioeconmicos se presenta una mayor


variabilidad.
b) Seale el tipo de asimetra que presentan las tiendas de cada uno de los estratos
socioeconmicos.

2. Una empresa que posee tres fbricas, ha observado el nmero de piezas diarias
producidas por cada una de ellas durante diez das elegidos al azar, obtenindose los
siguientes resultados:

10

x
i 1
2
i

Fabrica A 103 106 105 102 108 109 101 110 105 107 111590
Fabrica B 115 112 99 98 107 113 108 114 96 94 112100
Fabrica C 92 97 103 89 106 108 116 87 128 130 113610

a) Calcule e interprete la media y la mediana para el nmero de piezas diarias


producidas por las fbricas A y C.
b) La empresa recibe un pedido de 2111 piezas que debe ser entregado en un plazo
de 20 das. A cul de las tres fbricas es ms aconsejable encargarle el pedido?
c) Qu se puede afirmar acerca de la simetra de las piezas diarias producidas por
la fbrica B?
d) Elabore e interprete el diagrama de cajas para el nmero de piezas diarias
producidas por las tres fbricas.

77
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

3. En la granja de la UNALM, se realiz un estudio con la finalidad de comparar el peso


en Kg. (a los dos meses de nacido), de dos razas de cuyes: Inti y Andina. Para llevarlo
a cabo, se seleccionaron al azar muestras de cada una de las razas, obtenindose los
siguientes resultados:

ANDINA INTI
Tallo y Hojas de Andina 0.68 0.94
Unidad de Hoja = 0.010
0.89 0.95
1 8 3 0.89 0.99
3 8 58
7 9 1234 0.89 0.99
(5) 9 56679
3 10 1 0.89 1.04
2 10 5 0.89 1.09
1 11
1 11 5 0.89 1.11
0.90 1.11

a) Halle e interprete la media y la moda para la raza Andina


b) Construya el Diagrama de Cajas para la raza Andina, calcule sus componentes e
indquelo en el grfico.
Diagrama de Cajas del Peso
1.2

1.1
Peso (en kg.)

1.0

0.9

0.8

0.7

Andina Inti

c) Utilice el grfico anterior para comparar la variabilidad y asimetra de las dos razas
en estudio.

4. Para determinar la efectividad de un programa de seguridad industrial se recogieron


los siguientes datos (horas hombres - perdidas por mes) empleando dos programas
distintos (A y B) durante 12 meses tomados al azar.

Tallo y Hojas de Prog A N = 12


Unidad de Hoja = 1.0

2 0 68
(6) 1 022223
4 1 569
1 2
1 2 6

Variable N Media StDev Minimo Q1 Mediana Q3 Maximo


Prog B 12 7.750 2.491 2.000 6.000 9.000 9.750 10.000

a) Cul es la prdida mnima de horashombres que debe tener el programa A para


estar incluido en el 15% de lo que ms horas-hombre pierden?
b) Encontrar el rango intercuartlico del programa A.

78
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

5. Se realiz un estudio en la provincia de Tambo Grande (Piura), luego de la aplicacin


de un nuevo abono en el cultivo de dos variedades de mango: Kent y Haden. Los
rendimientos en la produccin obtenidos luego de la cosecha en Kg/Ha fueron los
siguientes:

Variedades
Variedad Kent Variedad Haden
N de N de
Rend. Rend.
Ha Ha Tallo y Hojas de Haden N = 22
1 9.0 12 13.1 Unidad de Hoja = 0.10
2 11.9 13 13.2
8 10 22388999
3 12.6 14 13.5
(6) 11 266888
4 12.6 15 13.5 8 12 2233
5 12.6 16 13.7 4 13 344
6 12.8 17 13.8 1 14
7 12.8 18 13.8 1 15
8 12.8 19 14.1 1 16 5
9 12.9 20 14.1
10 12.9 21 14.3
11 13.1 22 15.1

Variable N Mediana StDev Minimo Maximo


Kent 22 13.100 1.164 9.00 15.10

Variable N Media StDev Minimo Maximo


Haden 22 11.836 1.422 10.20 16.50

Elabore un diagrama de cajas mltiple y presente sus conclusiones.

6. Lidercom es una institucin dedicada a otorgar certificaciones de calidad ISO 9001


a empresas de bienes y servicios. La Firme est en proceso de evaluacin por esta
institucin y una de las tareas es medir la satisfaccin del personal de la empresa
mediante una prueba con escala de 0 a 100 puntos.

De una muestra de 40 trabajadores que laboran en la sede principal se obtuvieron


las siguientes puntuaciones:

74 89 82 83 67 81 68 85 81 72
71 74 50 64 72 44 66 84 69 81
69 66 93 53 98 70 95 82 81 80
88 80 85 85 72 81 90 89 80 97

a) Halle el rango intercuartl (RI) de la distribucin de la puntuacin de los


trabajadores de la sede principal.

b) Usando el RI hallado en b, calcule el lmite inferior y superior e indique si un


valor es atpico (outlier) o no.

79
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Preguntas de Autoevaluacin

1. Si el coeficiente de asimetra de Pearson es 0.00001, se dice que los datos presentan


una distribucin _______________________________.
2. Si en un conjunto de datos la mediana es mayor que la media, entonces el coeficiente
de asimetra de Pearson es ________________ y el conjunto de datos tiene una
asimetra __________________________.
3. La diferencia de RI y el coeficiente de asimetra de Pearson, es que el RI mide la
asimetra considerando __________________________ mientras que el As
considera el _____________________ de los datos.
4. Si los cuartiles de los pesos (en kgrs.) de una muestra de 50 pollos son 1.9, 2.2 y 3.4
respectivamente, entonces se puede afirmar que la distribucin del 50% central de
los pesos tiene ____________________________________.
5. En un diagrama de cajas, para afirmar que la distribucin del 50% central de los datos
tiene una distribucin asimtrica negativa, entonces se debe de cumplir que
______________________________.
6. Si en un diagrama de cajas no existen datos atpicos, entonces el bigote inferior y
superior son ____________________________________ respectivamente.

7. Si en un conjunto de datos, la mediana es 34.5% mayor que la media y el coeficiente


de variacin es 45%, entonces el coeficiente de asimetra de Pearson es igual a
_____________________________
8. Para mejorar los tiempos de atencin en un Centro Comercial, sea determinado que
los percentiles 25 y 75 de los tiempos de atencin en el rea de ropa femenina fue de
14.5 y 18.5 minutos y en rea de ropa masculina fue de 6.5 y 12.5 minutos, entonces
se puede decir que hay mayor variabilidad en el tiempo de atencin en el rea de
ropa ____________________ porque _________________________.
9. En una distribucin simtrica, la mediana es igual a 6 y la desviacin estndar es 18,
entonces el coeficiente de variacin es igual a ________________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:

Item Enunciado V/F


a. Los lmites de seguridad son dibujados en el diagrama de cajas
b. Si en un diagrama de cajas, Q2 est prximo a Q3, entonces la
distribucin de los datos presenta una asimetra negativa.
c. Es similar usar el diagrama de cajas y el coeficiente de Pearson para
medir la asimetra en un conjunto de datos.
d. Cuando un conjunto de datos presenta una asimetra positiva, indica
que los datos estn concentrados en la parte izquierda.
e. A partir de un diagrama de tallos y hojas se puede elaborar su
diagrama de cajas.

80
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

CAPTULO VI

PROBABILIDAD

La probabilidad se refiere al estudio de la aleatoriedad y la incertidumbre. En el mundo


cotidiano las personas continuamente van tomando decisiones desde las ms simples
hasta las ms complejas, generalmente en condiciones de incertidumbre. La teora de
probabilidad nos proporciona mtodos y tcnicas adecuadas para cuantificar la
incertidumbre por lo que es una herramienta importante en la toma de decisiones.

Es comn escuchar o leer expresiones como:

a. Es probable que el ndice inflacionario se mantenga durante los prximos dos


meses.
b. Hay un 50% de posibilidades de que el alcalde del distrito X busque reelegirse.
c. Probablemente el prximo ciclo se ofrecer por lo menos 7 grupos de ese curso.
d. Se espera que por lo menos se vendan 15000 boletos para el partido de ftbol.

Objetivo. Conocer los conceptos bsicos de las probabilidades; las reglas o axiomas que
la sustentan, as como, sus aplicaciones como medida de cuantificacin de la
incertidumbre.

6.1 Revisin de tcnicas de conteo

La regla del producto para n-uplas

Supngase que un conjunto est formado por grupos ordenados de n elementos (n-upla)
y que hay n1 posibles opciones para el primer elemento; por cada opcin del primer
elemento hay n2 posibles opciones del segundo elemento;...; por cada posible opcin de
los primeros n 1 elementos hay nk opciones del elemento n.

Entonces hay: n1 x n2 x ... x nk posibles n uplas.

Ejemplo 1
El propietario de una casa desea efectuar algunas remodelaciones y requiere los servicios
de un distribuidor de utensilios de cocina, de un contratista plomero y de un contratista
electricista. Si, en la zona, hay 8 distribuidores de utensilios de cocina, 10 contratistas
plomeros y 5 contratistas electricistas. De cuntas formas se pueden seleccionar estos
tres servicios?

Sea el evento A = {seleccionar los tres servicios}


n(A) = n1 n2 n3 = (8)(10)(5) = 400 3-uplas de la forma (Ui, Pj, Ek), as que hay 400
formas de seleccionar primero un distribuidor de utensilios de cocina, luego un plomero
y, finalmente un electricista.

Ejercicio 1. Un men consta de tres platos; una entrada, un segundo y un postre. Si en


la lista figuran 2 clases de entrada, 3 clases de segundo y 2 tipos de postre. De cuntas
formas se puede seleccionar los tres platos del men?

81
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

La regla de la adicin
Si un experimento 1 ocurre de n1 formas, 2 de n2, .., k de nk formas; entonces el
experimento que consiste en realizar 1 2 .. k (los experimentos no pueden
realizarse juntos) ocurre de n1 + n2 + + nk formas.

Ejercicio 2. Un producto se vende en 3 mercados. En el primer mercado se tienen


disponibles 5 tiendas, en el segundo 4 y en el tercer mercado, 6 tiendas. De cuntas
maneras puede venderse el producto?

Permutaciones

Cualquier secuencia ordenada de n objetos tomados de un conjunto de N objetos distintos


se llama permutacin de tamao n de los objetos. El nmero de permutaciones de
tamao n que puede construirse con los N objetos (donde s importa el orden) se
obtiene por la regla del producto de la siguiente manera:

PnN N N 1 N 2N n 2 N n 1
N!
Utilizando factoriales se obtiene: Pn
N

N n !
Ejemplo 2
En un campeonato de ftbol participan 12 equipos De cuntas maneras se pueden
ocupar los tres primeros puestos?

Sea el evento A = {Nmero de maneras que puede ocupar los 3 primeros puestos}
Total de equipos : N = 12
Seleccionar 3 equipos: n= 3

N (A) = P3
12
12 11 10 1320

Ejercicio 3. Un club social est formado por 10 personas. De cuntas maneras se puede
formar una comisin integrada por un presidente, un secretario y un vocal?

Casos especiales:

a) Permutaciones de N en N PNN N ! N ( N 1)( N 2)...1

Ejemplo 3
Se tiene un grupo de 5 caballos para alquiler. Si llegan 5 personas para alquilar un caballo
cada una de ellas De cuntas maneras se puede hacer el alquiler?

P55 5! 5(5 1)(5 2)...1 120 maneras

82
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b) Permutaciones con repeticin. El nmero de permutaciones de N elementos, de


los cuales son iguales entre si N1, N2, N3,..., Nk y donde N = N1+ N2 + N3 +...+ Nk,
N!
est dado por: PNN1, N2, ... Nk
N1 ! N 2 !...N k !

Ejemplo 4
En la casa comercial El Palco hay 4 sinfonas N 9 de Beethoven, 5 Sinfonas N 100 de
Haydn y 6 Sinfonas N 36 de Mozart. Suponga que se seleccionan con restitucin y
considerando el orden de extraccin 8 de estas obras maestras.

a. De cuntas maneras sern seleccionadas 5 sinfonas de Beethoven y 3 de Haydn?

8!
n A 45 53 P5,3
8
45 53 7168000
5! 3!
b. De cuntas maneras sern seleccionadas 2 sinfonas de Beethoven, 2 de Haydn y 4
de Mozart?
8!
n A 42 52 64 P2,2,4
8
42 52 64 217728000
2! 2! 4!

Combinaciones

Dado un conjunto de N objetos distintos, cualquier subconjunto no ordenado de tamao


n de los objetos se llama combinacin y se denota de la siguiente manera:

N N!

n n ! N n !

Cuando haya N objetos distintos, cualquier permutacin de tamao n se obtiene al


ordenar los n objetos no ordenados de una combinacin en una de n! formas (donde no
importa el orden), as:

N N PnN N!
PnN n!
n n n! n ! N n !

Ejemplo 5
Al poco tiempo de ser puestos en servicio, algunos autobuses fabricados por cierta
compaa presentan grietas en la parte inferior del bastidor principal. Suponga que una
ciudad tiene 18 de estos autobuses, y que han aparecido grietas en 5 de ellos.

a. De cuntas formas se puede seleccionar sin restitucin y sin considerar el orden una
muestra de 7 autobuses de los 18 para una inspeccin completa?
18
n
18 !
Sea el espacio muestral entonces 31824
7 7 ! 11 !

b. En cuntas formas puede una muestra de 7 autobuses contener exactamente 3 con


grietas visibles si la seleccin es hecha sin restitucin y sin considerar el orden de
extraccin?
Sea el evento A = {una muestra de 7 autobuses contiene exactamente 3 con grietas}

5 13
n A 7150
3 4

83
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 4. Un club de Karate tiene 10 deportistas de los cuales 4 son cinturones negros

a. De cuntas maneras puede escoger sin restitucin y sin considerar el orden de


extraccin a cinco karatecas para participar en un torneo?

b. De cuntas maneras puede escoger sin restitucin y sin considerar el orden de


extraccin a cinco karatecas de tal manera que hayan 2 cinturones negros?

6.2 Conceptos bsicos de probabilidad

Experimento aleatorio (E)

Un experimento aleatorio es todo proceso que consiste en la ejecucin de un acto (o


prueba) una o ms veces (en las mismas condiciones) y cuyo resultado en cada prueba
depende del azar (no se pueden predecir con certeza) pero que sin embargo, se pueden
definir (si se pueden describir).

Ejemplo 6
Suponga los siguientes experimentos aleatorios:
E1 : Observar el nmero de la cara superior cuando se lanza un dado
E2 : Registrar el sexo del recin nacido
E3 : Observar el nmero de artculos defectuosos de un lote de 8.
E4 : Anotar el nmero de clientes que llegan a un supermercado en una semana
E5 : Observar el tiempo de duracin de un foco de luz (horas)

Espacio muestral ()
El espacio muestral es el conjunto de todos los posibles resultados (llamados puntos
muestrales) de un experimento aleatorio. Se considera a es el conjunto universal.
La cardinalidad de (nmero de elementos de un conjunto) se denota n().

Ejemplo 7
Los espacios muestrales asociados a los anteriores experimentos aleatorios son:
E1: 1 = {1,2,3,4,5,6} n(1)=6 Finito
E2: 2 = {Hombre, Mujer} n(2)=2 Finito
E3: 3 = {0,1,2,3,4,5,6,7,8} n(3)=9 Finito
E4: 4 = {0,1,2,. . . .} n(4)= Infinito numerable
E5: 5 = {T/ 0 t < } n(5)= Infinito no numerable

84
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 8
Si se observan los sexos de tres nios recin nacidos, el espacio muestral asociado ser:
= {MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF}

Ejemplo 9
Considere dos fbricas tales que en cada una hay 6 mquinas que fabrican un producto.
Sea el experimento aleatorio que consiste en determinar el nmero de mquinas que
estn en uso en un da particular. Un resultado experimental indica cuntas mquinas
estn en uso en la primera fbrica y cuantas estn en uso en la segunda (asuma que los
resultados son igualmente posibles). El espacio muestral ser igual a:

Segunda fbrica
0 1 2 3 4 5 6
0 (0, 0) (0, 1) (0, 2) (0, 3) (0, 4) (0, 5) (0, 6)
1 (1, 0) (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
Primera 2 (2, 0) (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
fbrica 3 (3, 0) (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 0) (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 0) (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 0) (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

Eventos
Un evento es cualquier subconjunto de un espacio muestral. Se dice que un evento es
simple si est formado exactamente por un resultado y compuesto si consta de ms de
un resultado.

Ejemplo 10
Si se observan los sexos de tres nios recin nacidos, el espacio muestral asociado ser:
= {MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF}. Hay 8 eventos simples.

Posibles eventos simples: A={MMF} y B = {FMF}.


Eventos compuestos pueden ser:

C = {MFF, FMF, FFM} = {exactamente un bebe es de sexo masculino}


D = {MMM, FFF} = {los tres bebes son del mismo sexo}

Ejemplo 11
Con relacin al ejemplo 9, hay 49 eventos simples. Ejemplos de eventos compuestos
son:

E = {(0, 0), (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} = {el nmero de mquinas en
uso es el mismo para ambas fbricas}

F = {(0, 3), (3, 0), (1, 2), (2, 1)} = {el nmero total de mquinas en uso es tres}

G = {(0, 0), (0, 1), (1, 0), (1, 1)} = {a lo sumo una mquina est en uso en cada fbrica}

Eventos mutuamente excluyentes


Los eventos A y B son mutuamente excluyentes (o disjuntos) si no tienen resultados en
comn. O sea A B . Generalizando: Los eventos A1, A2,..., Ak son mutuamente
excluyentes si: Ai A j i j 1, 2, , k

Ejemplo 12
En el Ejemplo 11 los eventos E y F son mutuamente excluyentes en cambio los eventos
E y G no son mutuamente excluyentes.
85
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Eventos colectivamente exhaustivos


k
Los eventos A1, A2,..., Ak son colectivamente exhaustivos si A j A1 A2 Ak
j 1

Ejemplo 13
En el Ejemplo 10 los eventos C y D no son colectivamente exhaustivos.

Evento complementario
Para un evento A definido sobre un espacio muestral , el evento complemento de A,
denotado por Ac est compuesto por todos los elementos que no pertenecen al evento de
A. Es decir, todo lo que le falta al evento A para ser el espacio muestral . Se cumple:
Ac A y Ac A

Ejemplo 14
En el ejemplo 5, para el evento C = {MFF, FMF, FFM} su complemento es C c = {MMM,
MMF, MFM, FMM, FFF}

Ejercicio 5. Sea el experimento aleatorio observar el nmero de la cara superior cuando


se lanza un dado. El espacio muestral: = {1,2,3,4,5,6}

Sean los siguientes eventos definidos:


El nmero observado es impar: A1 = {1,3,5}
El nmero observado es par: A2 = {2,4,6}
El nmero observado mayor a 4: A3 = {5,6}

a. Defina eventos mutuamente excluyentes y no mutuamente excluyentes

b. Defina eventos colectivamente exhaustivos y no colectivamente exhaustivos

c. Defina eventos complementarios

86
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

6.3 Definiciones de probabilidad de un evento

Definicin clsica de probabilidad (a priori)

Si un experimento aleatorio tiene n resultados posibles y si n A de tales resultados


corresponden a un evento A, entonces, siempre que los eventos simples de sean
mutuamente excluyentes e igualmente posibles, la probabilidad de que ocurra A es:

n A Nmero de casos favorables


P A
n Nmero de casos posibles

Se dice que es a priori por que antes de realizarse el experimento se puede determinar
cul es la probabilidad de que ocurra A.

Ejercicio 6. Una urna contiene 6 bolas blancas y 5 bolas negras. Si se extraen al azar y
sin reemplazo 4 bolas de la urna. Cul es la probabilidad de que una bola sea de color
blanco?

Ejercicio 7. Si se considera igualmente probable el nacimiento de un nio o una nia,


en una familia que tiene tres hijos, Cul es la probabilidad de que

a. existan dos mujeres y un hombre?

b. existan por lo menos dos mujeres?

c. existan al menos un hombre?

87
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 8. Se tiene un grupo con 6 ingenieros, 4 economistas y 2 matemticos Cul


es la probabilidad de que al seleccionar sin restitucin 6 personas, existan 3 ingenieros,
2 economistas y 1 matemtico?

Definicin frecuencial de probabilidades (a posteriori)

Si un experimento aleatorio se repite n veces, bajo las mismas condiciones, y nA


resultados corresponden al evento A, la probabilidad estimada de A est dada por la

P A estimada frA
nA
frecuencia relativa del evento; es decir, . Tericamente la
n
P A lim frA lim
nA
probabilidad de A es: .
n n n

Se dice que es a posteriori por que la probabilidad estimada se determina despus de


realizarse el experimento.

Ejemplo 15
La siguiente tabla de frecuencias corresponde a las temperaturas promedio de 24 horas
(C) registrados en cierto observatorio, en el mes de enero de cierto ao:

Temperatura 20.2-20.9 20.9-21.6 21.6-22.3 22.3-23.0 23.0-23.7 23.7-24.4


Nmero das 1 3 12 13 1 1

La probabilidad estimada que en un da del mes de enero, la temperatura promedio sea


f 2 f3 f 4 3 12 13 28
por lo menos 20.9 C pero menor que 23.0 C es P A .
n 31 31
Note que esta probabilidad se obtiene despus de realizarse el experimento.

Ejemplo 16
Se tienen 4 cuyes de tipo I, 6 de tipo II y 7 de tipo III. Cinco cuyes son seleccionados al
azar.

1. Cul es la probabilidad de que 2 de los cuyes seleccionados sean de tipo I y los otros
3 de otro tipo si la seleccin es sin restitucin y sin considerar el orden de extraccin?

Solucin
4 I
6 II
7 III
N = 17, n = 5

88
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

El experimento aleatorio consiste en seleccionar, sin restitucin y sin considerar el


orden de extraccin, 5 cuyes de un total de 17. El espacio muestral asociado a este
N 17
experimento tendr n 6188 puntos muestrales.
n 5
Sea el evento R = {obtener 2 de tipo I y 3 de otro tipo}
4 13 nR 1716
nR 1716 entonces: P R 0.2773
2 3 n 6188

2. Calcule la probabilidad de seleccionar 2 cuyes de tipo I, 3 de tipo II y 4 de tipo III si


la seleccin es sin restitucin y sin considerar el orden de extraccin.

Solucin

Sea el evento R = {obtener 2 de tipo I, 3 de tipo II y 4 de tipo III}


467
n R 2 3 4
P R
n 17

9

Definicin axiomtica

Sea el espacio muestral asociado a un experimento aleatorio. La probabilidad de


cualquier evento A de , es el nmero real P(A) que satisface los siguientes axiomas:

1. P A 0 , para todo evento A.


2. P 1
3. Si los eventos A 1, A2,..., Ak son mutuamente excluyentes o sea si:
Ai Aj i j 1, 2, , k , entonces
k k
P Aj PAj P( A1 ) P( A2 ) ... P( Ak )
j 1 j 1

Propiedades de probabilidad

1. Para cualquier evento A, P(Ac) = 1- P(A) ,

2. La probabilidad del evento imposible es cero. P 0

3. Para dos eventos A y B cualesquiera


P Ac B P B P A B

4. Para dos eventos A y B cualesquiera P A B P A P B P A B

89
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Usando el Diagrama de Venn se tiene:

A B

A Bc A B Ac B

Ac B c
P A B P A P B P A B

P A B c P A P A B
P A c
B P B P A B
P A c
B 1 P A B
c

P A c
B 1 P A B
c

Ejemplo 17
Los registros de una planta industrial indican que el 12% de todos los obreros lesionados
ingresan a un hospital para recibir tratamiento, el 16% regresa al trabajo al da siguiente
y el 2% ingresan a un hospital pero vuelven al trabajo al da siguiente. Si un obrero se
lesiona:

a. Halle la probabilidad de que ingrese en un hospital para recibir tratamiento o que


regresar al da siguiente

Sean los eventos: H = {un obrero lesionado ingresa a un hospital para tratarse}
T = {un obrero lesionado regresa al trabajo al da siguiente}

Datos: P(H) = 0.12, P(T) = 0.16, P(HT) = 0.02

Se pide P(HT) y por la propiedad 4:

P(HT) = P(H) + P(T) - P(HT) = 0.12 + 0.16 0.02 = 0.26

En un diagrama de Venn tambin se apreciara lo anterior.

b. Calcule la probabilidad de que ingrese a un hospital pero no regrese al trabajo al da


siguiente.

Se pide P(HTc) y por la propiedad 3:

P(HTc) = P(H) - P(HT) = 0.12 0.02 = 0.1

c. Determine la probabilidad de que no ingrese a un hospital ni regrese al trabajo al da


siguiente.

Se pide P(HcTc) entonces por Morgan y por la propiedad 1:

P(HcTc) = P(HT)c = 1 - P(HT) = 1 0.26 = 0.74

90
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

d. Cul es la probabilidad de que ingrese a un hospital o no regrese al trabajo al da


siguiente?

Por las propiedades 3, 2 y 4:

P(HTc) = P(H) + P(Tc) - P(HTc) = P(H) + (1 P(T)) ( P(H) P(HT) ) =


= 1 - P(T) + P(HT) = 1 - 0.16 + 0.02 = 0.86

Ejemplo 18
Se ha realizado una encuesta para determinar la adiccin de alguna droga en diferentes
profesionales. La encuesta se aplic a 900 profesionales a los que se les pregunt si
consumen alguna droga, los resultados se muestran en la siguiente tabla:

Profesional Consume alguna droga Total


Si (S) No (Sc)
Abogado (A) 40 210 250
Contador (C) 60 190 250
Ingeniero (I) 50 200 250
Mdico (M) 20 130 150
Total 170 730 900

Si se selecciona al azar a un profesional, halle la probabilidad que el profesional


seleccionado:

a. Sea un contador o un abogado

P A C P( A) P(C ) P( A C )
250 250
0 0.5556
900 900
b. Sea mdico y si consuma droga

PM S
20
0.0222
900
c. No sea ingeniero y si consuma droga
40 60 20

P I c S PS PI S
170 50

900 900

900
0.1333
d. No consuma droga o sea abogado


P S c A P S c P( A) P S c A 730 250 210

900 900 900
0.8556

Ejemplo 19
Se encuest a 500 alumnos universitarios sobre cultura musical. 474 no identifican el
Concierto para piano y Orquesta de Grieg, 471 no identifican la Sinfona N 7 de
Beethoven y 450 no identifican ninguna de estas obras.

a. Calcule la probabilidad de que un estudiante universitario identifique las dos obras


maestras en mencin.

Sean los eventos: A = {Un estudiante no identifica la obra de Grieg}


B = { Un estudiante no identifica la obra de Beethoven}

Datos: P(A) = 474/500, P(B) = 471/500, P(AB) = 450/500

P(AB) = P(A) + P(B) - P(AB) = 495/500

P A B P Ac B c 1 P A B 1
495
0.01
c
500

91
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Cul es la probabilidad que un estudiante identifique la obra de Beethoven pero no


la de Grieg?

P A B c P A P A B
474 450 24
0.048
500 500 500

Ejercicio 9. Para un estudio sobre cultura general se encuest a 500 estudiantes


encontrndose que: 20 haban ledo Ficciones de Borges; 24 haban ledo El libro
de Arena de Borges y 464 no haban ledo estas dos obras geniales. Si se selecciona un
estudiante al azar:

a. Cul es la probabilidad que haya ledo ambos libros?

b. Cul es la probabilidad que haya ledo Ficciones pero no El Libro de Arena

Ejercicio 10. En una habitacin se encuentran 7 hombres mayores de 18 aos, 8


hombres menores de 18 aos, 10 mujeres mayores de 18 aos y 5 mujeres menores de
18 aos. Si se elige al azar una persona:

a. Cul es la probabilidad de que sea hombre?

b. Cul es la probabilidad de que sea menor de 18 aos o sea hombre?

92
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c. Cul es la probabilidad de que no sea mayor de 18 aos y sea mujer?

Ejercicio 11. La unidad de rentas de un distrito de Lima, afirma que el 60% de los
contribuyentes han pagado el predial, el 20% arbitrios y el 8% ambos impuestos. Si se
selecciona un contribuyente al azar:

a. Cul es la probabilidad que haya pagado el impuesto predial o el de arbitrios?

b. Cul es la probabilidad que haya pagado el impuesto predial y el de arbitrios?

c. Cul es la probabilidad que no haya pagado el impuesto predial y ni el de arbitrios?

d. Cul es la probabilidad que haya pagado el impuesto predial y no el de arbitrios?

e. Cul es la probabilidad que no haya pagado el impuesto predial o ni el de arbitrios?

93
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

6.4 Probabilidad condicional

Para dos eventos A y B de un espacio muestral, con P(B) 0, la probabilidad condicional


de ocurrencia del evento A dado que el evento B ha ocurrido, est definida por:

P A B
P A B
P B

Ejemplo 20
Qu es ms probable? Que una persona cualquiera tenga cncer pulmonar o que una
persona que fuma tenga cncer pulmonar. Segn los especialistas la probabilidad de que
tenga cncer pulmonar una persona que fuma es mayor.

Tenemos los eventos: A = {una persona tiene cncer pulmonar}


B = {una persona fuma}

De acuerdo a los especialistas P A B P A

Ejemplo 21
La probabilidad que la construccin de un edificio termine a tiempo es 17/20, la
probabilidad que no haya huelga es 3/4 y la probabilidad que la construccin se termine
a tiempo dado que no hubo huelga es 14/15; la probabilidad que haya huelga y no se
termine la construccin a tiempo es 1/10. Cul es la probabilidad que

a) la construccin se termine a tiempo y no haya huelga?


b) no haya huelga dado que la construccin se termin a tiempo?
c) la construccin no se termine a tiempo si hubo huelga?
d) la construccin no se termine a tiempo si no hubo huelga?

Solucin:
Definimos los eventos:
A = La construccin se termina a tiempo.
B = No haya huelga.

Tenemos:
17 3 14 1
P( A) P( B) P( A / B) P( Ac B c )
20 4 15 10
14 3
a) P( A B) P( A / B) * P( B) * 0.7
15 4
7
P( A B)
b) P ( B / A) 10 0.8235
P( A) 17
20
1
c P( Ac B c ) 10 4 0.4
c) P( A c ) c

B P( B ) 3 10
1
4
d)
c P( Ac B) P( B) P( A B) P( A B) 14
P( A ) 1 1 P( A / B) 1 0.0667
B P( B) P( B) P( B) 15

94
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 22
En una universidad el 70% de los estudiantes, son de Ciencias y el 30% de Letras; de
los estudiantes de Ciencias, el 60% son varones y los de Letras son varones el 40%. Si
se elige aleatoriamente un estudiante.

Varones Mujeres Total


Ciencias 42% 28% 70%
Letras 12% 18% 30%
Total 54% 46% 100%

A = El estudiante elegido es de Ciencias.


B = El estudiante elegido es varn.

Calcular la probabilidad que:

a) Sea un estudiante varn. P (B) = 0.54


b) Sea un estudiante varn, si es de Ciencias.
P( A B) 0.42
P( B / A) 0.6
P( A) 0.70
c) Sea un estudiante de Ciencias, si es varn.

P( A B) 0.42
P( A / B) 0.778
P( B) 0.54

Propiedades de probabilidad condicional

1. 0 P A / B 1 , para todo evento A y B


2. P / B 1
3. Si los eventos A1, A2, ... , Ak son mutuamente excluyentes o sea si:
k k
Ai Aj i j 1, 2, , k , entonces P Aj B P Aj / B
j 1 j 1
4. P(A/B) = 1- P(Ac /B)
5. P / B 0
6.
P Ac B / C PB / C P A B / C
7. P A B / C P A / C PB / C P A B / C

Ejercicio 12. Una empresa de turismo vende tres planes de viajes para la ciudad del
Cusco y para la ciudad de Arequipa. En una encuesta realizada por internet, result la
siguiente tabla de los porcentajes de clientes con las preferencias de los planes y las
ciudades.

Ciudad Plan 1 (P1) Plan 2 (P2) Plan 3 (P3) Total

Cusco (C) 0.05 0.10 0.05 0.20


Arequipa (A) 0.15 0.40 0.25 0.80
Total 0.20 0.50 0.30 1.00

Si se selecciona al azar a un cliente que ha sido encuestado por internet:

95
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

a. Cul es la probabilidad de que desee viajar al Cusco y que no tenga preferencia por
el Plan 1?

b. Si el cliente no prefiere el Plan 2, cul es la probabilidad de que prefiera el Plan 3?

c. Si el cliente no prefiere el Plan 1, cul es la probabilidad de que desee viajar a la


ciudad de Arequipa?

Ejercicio 13. Durante el mes de diciembre del ao pasado, el 50% de los clientes del
centro comercial PLAZUELA compraron el producto W, el 40% compraron el producto
V, y de los que compraron el producto V, el 20 % compraron el producto W.
a. Si se elige un cliente al azar, encuentre la probabilidad de que no haya comprado
estos productos.

b. Si del grupo de clientes que no compraron el producto W se selecciona al azar un


cliente, hallar la probabilidad de que haya comprado el producto V.

96
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 14. En la Facultad de Agronoma se ha determinado que el 10% de estudiantes


son aficionados al tenis y el 20% son aficionados al ftbol. Se sabe que, entre los
aficionados al ftbol el 75% no son aficionados el tenis. Si se selecciona un estudiante al
azar, hallar la probabilidad:

a. No sea aficionado al ftbol, pero le guste el tenis.

b. Que le guste slo un deporte

c. Le guste el tenis si se sabe que no es aficionado al ftbol.

6.5 La regla de la multiplicacin

P A B P A B
Se sabe que: P A B y PB A , de estas expresiones se
P B P A

P A B PB P A B
establece que:
P APB A

Generalizando: Sean los eventos A1, A2, ... , Ak entonces:


P A1 A2 A3 Ak P A1 P A2 A1 P A3 A1 A2 P Ak A1 A2 Ak 1

97
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 23
Si se eligen al azar 2 artculos de un cargamento de 250, de los cuales, 20 estn
defectuosos. Halle la probabilidad de que ambos estn defectuosos si:

a. La seleccin es sin reemplazo

Sean los eventos: Di = {el artculo seleccionado en el lugar i est defectuoso}


Dic = {el artculo seleccionado en el lugar i no est defectuoso}
20 19
PD1 D2 PD1 PD2 D1 0.0061
250 249

Otra manera de resolver este problema es con la definicin clsica de probabilidad y


utilizando las tcnicas de conteo

b. La seleccin es con reemplazo.(queda como ejercicio)

Ejemplo 24
Si se eligen al azar 3 artculos de un cargamento de 250, de los cuales, 20 estn
defectuosos.

1. Halle la probabilidad de que los 3 estn defectuosos si:

a. La seleccin es hecha sin reemplazo.


20 19 18
PD1 D2 D3 PD1 PD2 D1 PD3 D1 D2 0.0004
250 249 248
b. La seleccin es con reemplazo.(queda como ejercicio)

6.6 La ley de probabilidad total

Sean los eventos A1,A2,...,Ak mutuamente excluyentes, esto es:


k
Ai Aj i j 1, 2, , k , y colectivamente exhaustivos A j A1 A2 Ak
j 1

k k
entonces: P Aj PAj . Luego, para cualquier otro evento B:
j 1 j 1

PB P( A1 B) P( A2 B) ... P( Ak B) PA j B .
k

j 1

P( A1 ) P( B / A1 ) P( A2 ) P( B / A2 ) ... P( Ak ) P( B / Ak ) PA j PB A j
k

j 1

98
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

6.7 Teorema de Bayes

Sean los eventos A1, A2,..., Ak mutuamente excluyentes y colectivamente exhaustivos



con P A j 0 para j = 1, 2,..., k. Entonces para cualquier otro evento B para el que P(B)
0:
P Ah B P A PB Ah
P Ah B k h
P B
PAj PB Aj
j 1

Como puede notarse en la igualdad anterior, se usa en el numerador la regla de la


multiplicacin y en el denominador la ley de probabilidad total.

Ejemplo 25
Suponga que una caja C1 contiene 4 esferas blancas y 2 azules y que otra caja C2 contiene
4 esferas blancas y 6 azules. La probabilidad de elegir la caja C1 es el doble de
probabilidad de elegir la caja C2. Si se elige al azar una caja y de ella se elige al azar una
esfera, halle la probabilidad que:

a) se elija una esfera azul si se sabe que esta proviene de la caja C 2.


b) se elija la caja C2 y la esfera es azul.
c) se elija una esfera azul.
d) se haya elegido la caja C2 si la esfera elegida fue azul.

Solucin

ul 2/6 = P(A/C1)
Az
1 2/3=P(C1)
ja
Ca Blan 4/6 = P(B/C1)
la ca
ir
eg
El

Ele ul 6/10 = P(A/C2)


gir Az
la
Ca
ja 1/3 =P(C2)
2
Bla
nc 4/10 = P(B/C2)
a

a) Se elija una esfera azul si se sabe que esta proviene de la caja C 2

P(A/C2) =6/10

b) Se elija la caja C2 y la esfera es azul

P(C2 A) = P(C2)*P(A/C2)=1/3 * 6/10 = 6/30

c) Se elija una esfera azul

P(A)=P(C1 A)+P(C2 A)= 2/3 *2/6+1/3*6/10=8/15

d) Se haya elegido la caja C2 si la esfera elegida fue azul

P(C2 A) 6 / 30
P(C2 / A) 3/8
P( A) 8 / 15
99
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 26
Los ingenieros de ventas 1, 2 y 3 estiman los costos de 30%, 20% y 50%,
respectivamente, de todos los trabajos licitados por una compaa. Las probabilidades de
cometer error grave, al estimar el costo, de los ingenieros son 0.01, 0.03 y 0.02
respectivamente.

a. Halle la probabilidad de que se cometa error grave al estimar el costo en una


licitacin.

Sean los eventos: Ai = {el ing. i estima los costos de una licitacin}, i = 1, 2, 3
E = {Se comete error grave al estimar el costo}

Segn los datos se tiene:

P A1 0.3 P A2 0.2 P A3 0.5


PE A1 0.01 PE A2 0.03 PE A3 0.02

Aplicando la ley de probabilidad total:

PE P A1 PE A1 P A2 PE A2 P A3 PE A3 0.003 0.006 0.01 0.019

b. Si en una licitacin en particular se incurre en un error grave al estimar los costos


del trabajo. Cul es la probabilidad de que el ingeniero 2 haya cometido el error?

Aplicando el teorema de Bayes y usando el resultado de la subpregunta a:

P A2 PE A2 0.2 0.03
P A2 E 0.3157
P E 0.019

c. Si en una licitacin en particular no se incurre en un error grave al estimar los costos


del trabajo. Cul es la probabilidad de que el ingeniero 3 haya hecho el trabajo?
(se deja como ejercicio)

Ejercicio 15. Una empresa manufacturera tiene dos mquinas (M1 y M2) para producir
un producto. El rea de control de calidad a determinado que la mquina M1 produce el
60% de la produccin total y la mquina M2 el restante. El 2% de las unidades producidas
por la mquina M1 son defectuosos, mientras que la mquina M2 tiene una tasa de
defectuosos del 4%. Si se selecciona un producto al azar:

a. Cul es la probabilidad de que sea defectuoso?

100
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Cul es la probabilidad de que haya sido producido por la mquina M1, si se sabe
que es defectuoso?

c. Cul es la probabilidad de que no sea defectuoso?

Ejercicio 16. En un vivero se tiene plantas de dos variedades (A y B) en un 35% y 65%


respectivamente. Se sabe que cierta plaga ataca al 1% de las plantas de la variedad A y
al 3% de las plantas de la variedad B.

a. Cul es la probabilidad de seleccionar una planta con plaga?

b. Si se elige al azar una planta y se encuentra afectada por la plaga Cul es la


probabilidad de que sea de la variedad B?

c. Si se elige al azar una planta y no se encuentra afectada por la plaga Cul es la


probabilidad de que sea de la variedad B?

101
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 17. El rea financiera de una distribuidora de productos agrcolas ha observado


que el 25% de las compras son pagadas en efectivo, el 30% son pagadas al crdito y el
resto son pagadas con cheque. Se sabe que el 20% de las compras pagadas en efectivo,
60% de las compras a crdito y 90% de las compras pagadas con cheque; se hacen por
un monto mnimo de $ 150.

Si el agricultor Juan Prez acaba de realizar una compra por un monto de $180, cul es
lo ms probable: qu haya pagado la compra, en efectivo, al crdito o con cheque?

6.8 Independencia de eventos

Los eventos A y B son independientes si cuando ocurre uno de ellos esto no afecta la
probabilidad de ocurrencia del otro, o sea:

P A B P A
P B A P B

En otras palabras, las probabilidades condicionales son iguales a las probabilidades


incondicionales.

Consecuencia: A y B son independientes si P A B P APB . Lo anterior es un


resultado de la definicin de independencia y de la regla de la multiplicacin.

Teorema Si los eventos A y B son independientes entonces, tambin lo sern:


1. A y Bc
2. Ac y B
3. Ac y Bc

Entonces se cumple:
P A B c P A P ( B c )
P Ac B P Ac P( B)
P Ac B c P Ac P( B c )
P A B P A P ( B ) P A P ( B )

Nota: Los eventos A1 y A2 son condicionalmente independientes si:


P A1 A2 B P A1 B P A2 B
102
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 18. En cierta ciudad la probabilidad de que llueva en un da cualquiera es 0.3


y de que ocurra un temblor en un da cualquiera es 0.4. Si estos eventos son
independientes. Calcule la probabilidad de que en un da cualquiera:

a. Llueva y haya un temblor

b. Llueva pero no haya un temblor

c. Llueva o haya un temblor

d. No llueva ni haya un temblor.

e. Llueva dado que ocurri un temblor.

103
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 27
La probabilidad de que se presente determinada enfermedad es 1/500 y un test para
detectarla es 99% confiable (esto quiere decir que si una persona tiene la enfermedad la
probabilidad de que el test de positivo es 0.99 y si una persona no tiene la enfermedad
la probabilidad de que el test de negativo es 0.99).

a. Si a Ud. le resulta el test positivo Cul es la probabilidad de que Ud. tenga la


enfermedad?
Solucin

Sean los eventos:

B Ud. tiene la enfermedad , A A Ud. le corresponde un test positivo

P( A / B) 0.99
Confiable en este contexto significa:
P( A / B ) 0.99
c c

1
P B P A B 0.99
P B A 500 0.1655
P B P A B P Bc P A Bc 1
0.99
499
0.01
500 500

b. Si a Ud. le resulta positivo en dos tests independientes Cul es la probabilidad de que


Ud. tenga la enfermedad?

Solucin

B Ud. tiene la enfermedad , Ai A Ud. le corresponde un test positivo en el test i


P B P A1 A2 B
P B A1 A2
P B P A1 A2 B P B c P A1 A2 B c
1
0.99 0.99
500 0.9516
1 499
0.99 0.99 0.01 0.01
500 500

Note que aqu se ha trabajado la independencia condicional:


P A1 A2 B P A1 B P A2 B

Independencia de k eventos

Utilizando la regla de la multiplicacin generalizada y considerando independencia se


obtiene la siguiente definicin: los eventos A1, A2, ... , Ak son independientes si:

P A1 A2 Ak P A1 P A2 P Ak

Cabe mencionar que el teorema anterior tambin se cumple con k eventos.

Nota: Los eventos A1 , A2 , ,Ak son condicionalmente independientes si:


P A1 A2 Ak B P A1 B P A2 B P Ak B

104
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 19. En la fabricacin de cierto artculo se encuentra que se presenta un tipo de


defecto con una probabilidad de 0.05 y defecto de un segundo tipo con probabilidad 0.10.
Si estos defectos ocurren independientemente Cul es la probabilidad de que un artculo
seleccionado al azar

a. tenga ambos defectos?

b. por lo menos tenga un defecto?

c. Si se sabe que el artculo es defectuoso, halle la probabilidad de que este slo tenga
un tipo de defecto.

Ejemplo 28
En cierta poblacin la probabilidad de que una chica mida ms de 1.75 m es 0.08; de
que tenga el cabello lacio es 0.22 y de que tenga un buen conocimiento de Estadstica es
0.18. Si estas cualidades son independientes.

a. Halle la probabilidad de que una chica, que va a ser seleccionada al azar, tenga las
tres cualidades.

Solucin
Sean los eventos: M = {la chica mide ms de 1.75}
L = {la chica tiene cabello lacio}
E = {la chica tiene un buen conocimiento de estadstica}
T = {la chica tiene las tres cualidades}

PT PM L E PM PL PE 0.08 0.22 0.18 0.003168

b. Halle la probabilidad de que una chica, que va a ser seleccionada al azar, tenga slo
2 de estas cualidades. (queda como ejercicio)

105
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Prctica Dirigida N 4

1. Con la finalidad de conocer los hbitos, usos y preferencias de los usuarios de


telefona mvil, la consultora Comunication Fono encuest a usuarios de telefona
mvil en la ciudad de Lima Metropolitana clasificndolos segn su rango de edad y
rango del tiempo diario que utilizan el celular para enviar whatsapp. Los resultados
para una muestra de 445 clientes se presentan en el siguiente cuadro

Tiempo diario (minutos)


Rango de edad [21 30> [30- 39> [39 48> [48 - 57] Total
(aos) (T1) (T2) (T3) (T4)
Joven(J) 40 72 8 110 230
Adulto (A) 10 20 15 60 105

Adulto mayor (M) 15 25 30 40 110


Total 65 117 53 210 445

Si se elige al azar a un cliente, cul es la probabilidad?

a) Que utilice un tiempo de a lo ms 39 minutos para enviar whatsapp.

b) Que sea un adulto o utilice un tiempo mayor o igual a 39 pero menor a 48


minutos.

c) Que no sea un adulto mayor y ni utilice un tiempo de al menos de 48 minutos.

d) Si se sabe que un encuestado es un joven Cul es la probabilidad de que utilice


un tiempo menor a 30 minutos para enviar mensajes de whatsapp?

106
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

2. Una compaa de seguro ha observado que el 65% de sus clientes han adquirido una
pliza de vida, el 35% para su casa y el 15% de vida y casa. Si se selecciona a un
cliente al azar.

a) Cul es la probabilidad que haya adquirido el seguro de vida y no para su casa?

b) Cul es la probabilidad que no haya adquirido un seguro de vida o ni para su


casa?.

3. Un comerciante adquiere sacos de azcar de dos azucareras nacionales (A1 y A2). Se


sabe que el 68% de los sacos proviene de A1 y el resto de A2. Adems, el 85% de los
sacos que recibe de A1 y el 92% que recibe de A2 son de calidad extra. Si un saco de
arroz se escoge al azar: (defina los respectivos eventos).

a. Cul es la probabilidad que sea de calidad extra?.

b. Sabiendo que es de calidad extra, cul es la probabilidad de que provenga de la


azucarera A1?.

107
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c. Sabiendo que no es de calidad extra, cul es la probabilidad de que provenga de


la azucarera A2?.

4. Las personas sospechosas de incurrir en lavado de activos pueden ser investigadas


por Organismos Gubernamentales responsables. La probabilidad de ser investigada
por el organismo gubernamental A es 0.009 y la probabilidad de ser investigada por
el organismo gubernamental B es 0.018. Si estos eventos son independientes

a) Calcule la probabilidad de que la persona sospechosa sea investigada por el


organismo gubernamental A pero no por el B.

b) Calcule la probabilidad de que un persona sospechosa sea investigada por el


organismo gubernamental A o por el B.

108
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

EJERCICIOS PROPUESTOS

1. De un grupo de personas, el 30% practica ftbol y el 40% juega ajedrez. De los


futbolistas, el 50% juega ajedrez. Si se elige aleatoriamente una persona Cul es la
probabilidad de que:
a) juegue ftbol o ajedrez?
b) practique slo uno de estos deportes?
c) no practique ni ftbol ni ajedrez?

2. De 20 personas que contrajeron cierta enfermedad al mismo tiempo y que fueron


llevados a una misma sala de un hospital, 15 se recuperan completamente en 3 das;
al cabo del cual, se escogen al azar 5 personas para un chequeo.
a) Cul es la probabilidad que los 5 sean dados de alta?
b) Cul es la probabilidad de que exactamente 4 sean dados de alta?
c) Cul es la probabilidad que ninguno sea dado de alta?

3. De 200 familias, 80 compran el peridico A, 95 el peridico B y 40 no compran A pero


si B. Si se selecciona una familia al azar, calcule la probabilidad de que:
a) Compre A o B.
b) Compre A pero no B.

4. En una ciudad el 60 % son hombres, el 20 % son de raza negra y el 8 % son hombres


negros. Si se selecciona a una persona al azar de esa ciudad, halle la probabilidad de
que sea una mujer de raza negra.

5. En una fbrica se seleccion 200 artculos producidos durante un da y se encontr


que 9 tienen fallas de tipo I, 10 tienen fallas de tipo II y 2 tienen ambos tipos de
fallas. Si un artculo es seleccionado al azar, halle la probabilidad de no tenga ninguno
de estos tipos de fallas.

6. Una enfermedad X se puede presentar en forma maligna o benigna. Si se presenta


en forma maligna da origen a un tumor cerebral con probabilidad 0.75, mientras que
la forma benigna produce tumor en un 8 % de los casos. Se sabe adems que la
forma benigna es 7 veces ms probable que la maligna.
a) Cul es la probabilidad de que a una persona que padece la enfermedad no le
aparezca el tumor cerebral?
b) Si alguien que padece esa enfermedad tiene tumor cerebral Cul es la
probabilidad de que tenga la forma maligna?

7. La probabilidad de que un turista haga una reservacin con ms de una semana de


anticipacin es del 10% y la probabilidad de que un turista se inscriba en el tour
completo ofrecido por el hotel es de 35%. Si la probabilidad de que se inscriba en el
tour completo ofrecido por el hotel o haga la reservacin con ms de una semana de
anticipacin es del 40%, Cul es la probabilidad de que se inscriba en el tour
completo ofrecido por el hotel si se sabe que hizo la reservacin con ms de una
semana de anticipacin?

8. En una investigacin realizada a los conductores de taxis, se encontraron los


siguientes resultados: el 20% son mujeres, el 10% de las mujeres tienen estudios
universitarios; el 60% de los hombres no tienen estudios universitarios. Si se toma
un conductor de taxi al azar y resulta que tiene estudios universitarios, cul es la
probabilidad que sea mujer?

9. Sea A el evento de que un cierto libro de Estadstica (primero) se encuentre prestado


fuera de la biblioteca de la universidad, sea B el evento de que otro libro (segundo)
sobre el mismo tema tambin se encuentre prestado. (Nota: los datos de la pregunta
(a.) difieren de la pregunta (b.))
a) Si P(AB)= 0.2 y P(exactamente un libro est prestado)= 0.5. Calcular P(AB)

109
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b) Si P(Ac Bc) = 0.3, P(Ac Bc) = 0.9 y P(slo el primer libro est prestado)=0.4.
Calcular P(A) y P(B)

10. Una planta armadora recibe microcircuitos provenientes de tres distintos fabricantes
(A, B y C). El 52% del total de microcircuitos se compra de A, el 28% de B y el 20%
de C. El porcentaje de microcircuitos defectuosos para A, B y C son 4%, 8% y 10%
respectivamente. Si los microcircuitos se almacenan en la planta sin importar quin
fue el proveedor:
a) Diga, cul es la probabilidad que la planta no reciba microcircuitos del fabricante
B?
b) Si un circuito no est defectuoso, cul es la probabilidad de que no haya sido
vendido por el proveedor C?

11. Suponga que una empresa dedicada a realizar revisiones tcnicas tiene dos talleres A
y B. Cada propietario o conductor elige al azar un taller para pasar por dos exmenes
1 y 2. Un vehculo aprueba la revisin tcnicas si aprueba los dos exmenes. Para un
vehculo que pasa por el taller A, la probabilidad que apruebe los dos exmenes es
0.85 mientras que para un vehculo que pasa por el taller B la probabilidad
correspondiente es 0.9. Considerando que la eleccin del taller A es igual de probable
que la eleccin del taller B.
a) Halle la probabilidad que un vehculo apruebe la revisin tcnica
b) Si se sabe que el vehculo desaprob la revisin tcnica, cul es la probabilidad
que haya escogido el taller B?

12. Un investigador afirma que, en cierta poblacin, el 60% son hombres; el 70% de los
hombres y el 45% de las mujeres tienen un coeficiente intelectual menor que el
promedio. Si una persona de esa poblacin tiene un coeficiente intelectual de por lo
menos el promedio Cul es la probabilidad de que sea hombre?

13. Una fbrica confecciona en un da determinado 400 prendas para varones y 600 para
mujeres. La probabilidad de que una prenda de mujer tenga falla es de 0.01 y la
probabilidad de que una prenda de varn tenga falla es 0.02. Se elige de la produccin
del da una prenda al azar
a) Cul es la probabilidad de que la prenda tenga falla?
b) Si la prenda elegida no tiene falla, cul es la probabilidad de que no sea de mujer?
c) Se eligen cuatro prendas, cul es la probabilidad de que por lo menos una prenda
tenga fallas?

14. La probabilidad de que la construccin de un edificio se termine a tiempo es 17/20,


la probabilidad de que no haya huelga es , la probabilidad de que la construccin se
termine a tiempo dado que no hubo huelga es 14/15, la probabilidad de que haya
huelga y no se termine la construccin a tiempo es 1/10
a) Hallar la probabilidad de que la construccin se termine a tiempo y no haya huelga
b) Hallar la probabilidad de que la construccin no se termine a tiempo si hubo huelga

15. Un estudio acerca de los trabajadores de dos plantas de una empresa manufacturera
incluye la pregunta: cun efectiva es la gerencia para responder a las legtimas
quejas de los trabajadores?. En la planta 1, 48 de 192 trabajadores contestaron
poco efectiva, una respuesta desfavorable; en la planta 2, 80 de 248 trabajadores
respondieron poco efectiva. Se va a seleccionar aleatoriamente a un empleado de
la empresa manufacturera. Sea A el evento el trabajador procede de la planta 1 y
B el evento la respuesta es desfavorable.
a) Encuentre P(A), P(B) y P(AB)
b) son independientes los eventos A y B?
c) Encuentre P(B/A) y P(B/Ac), son iguales?

16. Un cazador dispara 7 balas a un len enfurecido. Si la probabilidad de que una bala
mate es 0.6. Cul es la probabilidad de que el cazador est todava vivo?

110
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

17. En cierta poblacin de perros: el 40% son de raza Bxer, 57% son machos y 32%
tienen ms de dos aos. Asuma que estas tres cualidades son independientes. Si un
perro va a ser seleccionado al azar calcule la probabilidad de que tenga slo una de
estas cualidades.

18. En un club hay 10 hombres y 12 mujeres. 4 de los hombres y 5 de las mujeres tienen
Maestra. Si seleccionan al azar y sin restitucin a 3 personas calcule la probabilidad
de que las tres personas sean hombres o que tengan Maestra.

19. Un dispositivo tiene 3 partes que funcionan independientemente. Sus probabilidades


de falla son: 0.2, 0.3 y 0.4 para la primera, segunda y tercera partes respectivamente.
Hallar la probabilidad de que al menos una de la partes falle.

20. Un lote consta de 10 artculos buenos, 4 con pequeos defectos y 2 con defectos
graves. Se elige un artculo al azar. Encontrar la probabilidad de que:
a) No tenga defectos.
b) Tenga un defecto grave.
c) Que sea bueno o que tenga un defecto grave.
Si se escogen 2 artculos en vez de uno, calcule la probabilidad de que:
d) Ambos sean buenos.
e) A lo menos uno sea bueno.
f) A lo ms uno sea bueno.
g) Ninguno tenga defectos graves.

21. En una serie de observaciones del tiempo de sobrevivencia de peces de una


determinada especie en aguas contaminadas, un pesquero ha encontrado que el 95%
sobrevive 20 das, el 78% sobrevive 40 das, el 33% sobrevive 80 das, el 6%
sobrevive 100 das y ninguno sobrevive despus de 120 das. Estime la probabilidad
de los eventos:
a) Un pez muere dentro de los primeros 20 das.
b) Muere entre 40 y 100 das.
c) Sobrevive a lo ms 80 das.

22. En un saln de clases hay 40 personas. 15 son hombres y 26 estn en segundo ciclo
de los cuales 18 son mujeres. Si se escoge un estudiante al azar:
a) Cul es la probabilidad de que sea hombre y no est en segundo ciclo?
b) Si se selecciona un estudiante y se observa que est en segundo ciclo, cul es la
probabilidad de que sea mujer?

23. Dos mquinas, A y B, producen el 35% y el 65% de las tuercas de una fbrica. Se
sabe que el 10% y el 15% de las tuercas de cada mquina son defectuosas.
a) Si en el mercado se encontr una tuerca defectuosa Cul es la probabilidad de
que haya sido producida por la mquina A?
b) Si en el mercado se seleccionaron independientemente dos tuercas y resultaron
defectuosas Cul es la probabilidad de que hayan sido producidas por la mquina
A?

24. Para evaluar el resultado de una capacitacin, un participante est rindiendo un test
de 5 preguntas, donde cada una vale 2 puntos. Ya ha respondido dos correctamente
y decide elegir al azar las tres respuestas que le faltan.
a) Defina el espacio muestral.
b) Si la calificacin mnima aprobatoria es 6, Cul es la probabilidad de que apruebe
el test?

111
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

25. En una ciudad se estudia la cantidad de usuarios de Internet de acuerdo a ciertas


variables. En el siguiente cuadro, se muestra la distribucin de acuerdo a la Edad y
Velocidad de Internet:

Rango de Edad Total

Velocidad de De 6 a 20 De 21 a De 31 a Ms de 40
Internet aos 30 aos 40 aos aos
1 Mbps 150 80 50 50 330
2 Mbps 55 30 20 20 125
3 Mbps 25 10 5 5 45
Total 230 120 75 75 500

a) Cul es la probabilidad que un usuario seleccionado al azar tenga una velocidad


de 2 Mbps y tenga como mnimo 21 aos?
b) Cul es la probabilidad que un usuario seleccionado al azar tenga una velocidad
de 1 Mbps o tenga a lo ms 20 aos?

26. En la Gerencia de CRM del Supermercado Desco trabajan diez Analistas. Seis de
ellos son informticos y los otros cuatro son Industriales. Para implementar una
campaa comercial, se debe formar un equipo de cuatro miembros. Cul es la
probabilidad que hayan dos informticos en este equipo de cuatro?

27. Una compaa de desarrollo urbano est considerando la posibilidad de construir un


centro comercial en un sector del sur de Lima, Per. Un elemento vital en esta
consideracin es un proyecto de una autopista que una este sector con el centro de
la ciudad. Si el gobierno municipal aprueba esta autopista, hay una probabilidad de
0,90 de que la compaa construya el centro comercial en tanto que si la autopista
no es aprobada, la probabilidad es solo 0,20. Basndose en la informacin
disponible, el gerente de compaa estima que hay una probabilidad de 0,60 que la
autopista sea aprobada.
a) Cul es la probabilidad de que compaa construya el centro comercial?
b) Dado que el centro comercial fue construido, cul es la probabilidad de que
la autopista haya sido aprobada?

28. Un sistema consiste en tres componentes independientes: A, B1 y B2. La


probabilidad de falla es 0,01 para A, 0,02 para B 1 y 0,10 para B2. Si para el
funcionamiento del sistema son necesarios los componentes A y al menos uno de
los B, cul es la probabilidad de que el sistema funcione?

112
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Preguntas de Autoevaluacin

1. Determine el espacio muestral para los siguientes experimento aleatorios:


a) Lanzar una moneda y un dado simultneamente ________________________
b) Anotar el nmero de artculos defectuosos de un lote de seis ______________
c) Lanzar dos monedas a la vez _______________________________________
2. Si se define el evento A={Todos los clientes cuyo gasto es menor a $500}, entonces
el evento Ac se define ______________________________________________
3. Si en un grupo de 12 amigos de colegio, 5 desean viajar a la selva, 4 a la sierra y 3 a
la costa por Semana Santa. Si se selecciona a tres personas al azar, la probabilidad
que haya dos personas que deseen ir a la selva es igual a
____________________________________.
4. Sean los eventos A1, A2,...,Ak definidos sobre , las condiciones que se debe cumplir
para aplicar la ley de la probabilidad total es que los eventos sean
_____________________________________________________________.


5. Si A y B son dos eventos independientes de , entonces P ( A B ) / A
c c c
es igual a
_________________ siendo P( A ) 0 .
c

6. Si los eventos A y B definidos en el espacio muestral son independientes, entonces


P(Ac/B) es igual a _____________________
7. En una encuesta por telfono aplicada a los egresados de una entidad educativa
superior, se encontr que el 66% de los encuestados prefieren ahorrar para comprar
su carro, el 46% para estudiar una maestra y el 16% para ambas cosas. Si se
seleccionada al azar a un egresado encuestado, la probabilidad de que no ahorre para
comprar su carro ni para estudiar una maestra es igual a
______________________________________ .
8. Si P(T)=0.25 y P(S)=0.75, sabiendo que los eventos T y S son independientes,
entonces P(T Sc) es igual a: ______________________.
9. En un programa de asistencia tcnica han participado 120 agricultores en la
capacitacin de dos tcnicas de manejo de cultivo de frijol (A y B). Se sabe que 80
agricultores han usado la tcnica A y el resto la B. De los que usaron la tcnica A, el
65% han conseguido aumentar el rendimiento del cultivo de frijol y de los que usaron
la tcnica B slo el 35% consiguieron aumentar su rendimiento. Si se selecciona al
azar a un agricultor que particip el programa, la probabilidad que haya aumentado
su rendimiento de frijol es igual a : _______________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:

Item Enunciado V/F


a. Para N objetos tomados de n en n, se pude decir que el nmero de
combinaciones es mayor al nmero de permutaciones.
b. Se dice que la probabilidad clsica que es a priori, porque se pude
calcular la probabilidad de un evento antes de realizar el experimento.
c. Para dos eventos A y B , los axiomas de la definicin clsica
corresponden a: P(A)0, P(B)0;P(AB)=1 y AB=.
d. Sean los eventos A1, A2, y A3 definidos sobre , entonces si se cumple
que A1 A2 Ak = se puede afirmar que los eventos forman una
particin de .
e. Si los eventos A y B son mutuamente excluyentes, entonces tambin
se pude decir que son independientes.

113
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

CAPTULO VII

VARIABLES ALEATORIAS

Se estudia las caractersticas y tomando en cuenta los conceptos de probabilidades para


entender la definicin de una variable aleatoria y su distribucin de probabilidad asociada;
as como hallar su media, la variancia y el coeficiente de variacin.

Objetivo. Al finalizar este captulo el estudiante podr entender el concepto de una


variable aleatoria y las aplicaciones que tiene en la teora de probabilidades y en el campo
de la inferencia estadstica.

7.1 Definicin de variable aleatoria

Una variable aleatoria es cualquier funcin que tiene como dominio a los elementos que
constituyen el espacio muestral de un experimento aleatorio y como rango a un
subconjunto de los reales.

7. 2 Clases de variable aleatoria

Las variables aleatorias pueden ser:


Variables aleatorias discretas
Variables aleatorias continuas

Variable aleatoria discreta. Si su rango es un conjunto finito o infinito numerable.

Ejemplo 1
Sea el experimento aleatorio registrar los sexos de los prximos tres nios que van a
nacer. Si se define la v.a.d. Y como el nmero de nios de sexo femenino que nacern.
Halle el dominio y el rango de Y.
Solucin:
={ MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF }
Y(MMM) =0
Y(MMF) = Y(MFM) = Y(FMM) =1
Y(MFF) = Y(FMF) = Y(FFM) =2
Y(FFF) =3

Entonces RY = {0, 1, 2, 3}

114
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Y = nmero de nios de sexo femenino que nacern

MMM 0 RY
MMF
MFM 1
FMM
Y
MFF
FMF 2
FFM
FFF 3

DY = ={ MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF }


RY = {0, 1, 2, 3}

Ejemplo 2
Se va a registrar la variable aleatoria X definida como el nmero de autos que llegan por
cada hora a una playa de estacionamiento entonces el dominio de X ser el conjunto de
todas las horas en estudio y el rango RX = {0, 1, 2, }

Variable aleatoria continua. Si su rango es un conjunto infinito no numerable.

Ejemplo 3
Se desea determinar el pH de un compuesto qumico seleccionado al azar, entonces la
variable aleatoria X definida como el pH del compuesto es una variable aleatoria continua
con rango 0,14

7.3 Funcin de probabilidad de una variable aleatoria discreta


Sea X una variable aleatoria discreta. Se denomina funcin (ley, modelo o distribucin)

de probabilidad de X a la funcin f x definida por f x P X x para todo nmero
real x, que satisface las siguientes condiciones:
i) f x 0 para x Rx
ii ) f x 0 para x Rx
iii ) f x 1
xi RX
i

Ejemplo 4
Con relacin al Ejemplo 1, halle la funcin de probabilidad de la v.a.d Y definida como el
nmero de nios de sexo femenino que nacern, asumiendo que los eventos simples son
igualmente probables (o que P(M)=P(F)=1/2 y que M y F son eventos independientes).
Solucin:
f 0 P Y 0 P MMM
1
8
f 1 P Y 1 P MMF , MFM , FMM
3
8
f 2 P Y 2 P MFF , FMF , FFM
3
8
f 3 P Y 3 P FFF
1
8
La funcin de probabilidad tambin se puede representar de la siguiente manera:

Y 0 1 2 3
f y PY y 1/8 3/8 3/8 1/8
Ejemplo 5
115
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

El nmero de unidades vendidas por da del artculo Z es una variable aleatoria tiene la
siguiente funcin de probabilidad:
c, x 1, 2
1
, x 3, 4
f x P X x 8
2c, x 5, 6

0, otros valores de x
Determine el valor de c.

Solucin
Por propiedad:

f x 1 f 1 f 2 f 3 f 4 f 5 f 6 c c 8 8 2c 2c 1
1 1
xR X

1
resolviendo la ecuacin resulta c .
8
Ejemplo 6
Se tienen 6 impresoras, de las cuales 2 estn defectuosas. Si se seleccionan 3 de ellas,
sin reemplazo, determine la funcin de probabilidad de la variable aleatoria definida como
el nmero de impresoras defectuosas seleccionadas.

Solucin
Sean los eventos: D0 = {obtener 0 impresoras defectuosas y 3 no defectuosas}
D1 = {obtener 1 impresora defectuosa y 2 no defectuosas}
D2 = {obtener 2 impresoras defectuosas y 1 no defectuosa}

Sea X = Nmero de impresoras defectuosas seleccionadas

El rango es: RX = {0, 1, 2}


2 4

nD0 0 3 4
f 0 P X 0 PD0
n 6 20

3
2 4

nD1 1 2 12
f 1 P X 1 PD1
n 6 20

3
2 4

nD2 2 1 4
f 2 P X 2 PD2
n 6 20

3
0.2 x 0, 2

La funcin de probabilidad queda definida: f x P X x 0.6 x 1
0 Otro caso

116
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 1. Una muestra aleatoria con reposicin de tamao n=2 se selecciona del
conjunto {1, 2, 3} obtenindose un espacio muestral:

1,1 , 1, 2 , 1,3 , 2,1 , 2, 2 , 2,3 , 3,1 , 3, 2 , 3,3


Sea X la variable aleatoria la suma de los dos nmeros. Hallar la funcin de probabilidad
de la variable aleatoria X.

Ejercicio 2. Un dispositivo est compuesto por tres elementos (A, B y C) que trabajan
independientemente. La probabilidad de falla de cada elemento en una prueba es 0.1.

a. Halle la funcin de probabilidad de la variable aleatoria X: nmero de elementos que


fallan en una prueba.

b. Cul es la probabilidad de que falle al menos un elemento en una prueba?.

117
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 3. En un distrito de Lima el nmero de hijos por familia es una variable aleatoria
con la siguiente funcin de probabilidad:

0.5k x 0;1
k x 2;3

P X x
2.0k x4
0 otra manera

a. Halle el valor de k para que f(x) sea una funcin de probabilidad.

b. Si se escoge al azar una familia, cul es la probabilidad de que tenga por lo menos
dos hijos?

7.4 Funcin de densidad de una v.a continua X

La funcin f x de la v.a. continua X es su funcin de densidad si cumple con lo


siguiente:

1. f x 0 , x R , f x no es una probabilidad por ejemplo f x =3.9 es posible.



2. f x dx 1

b
3. Si A x a x b P A P a X b f x dx
a
b
4. P a X b P a X b P a X b P a X b f x dx
a

X n 1 bn 1 a n 1
b b

a X dx n 1
n
En general:
a n 1

118
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 7
Suponga que el tiempo, en horas, que necesita un tcnico para reparar cierta avera de
un artefacto elctrico es una variable aleatoria que tiene la siguiente funcin de densidad:

k 6 x , 1 x 3
f x
0 , para otros valores de x

a. Halle el valor de k para que f(x) sea una funcin de densidad.



Por propiedad: f x dx 1 , entonces,

1 3 3
1
f x dx f x dx f x dx f x dx k 6 x dx k 8 k 8
1 k 6 x 3 1
cero cero

1
6 x , 1 x 3
Entonces la funcin de densidad: f x 8
0 , para otros valores de x
b. Calcule la probabilidad de que un tcnico demore por lo menos 1.8 horas pero menos
de 2 horas en reparar esa avera.
2 2
1
A x 1.8 x 2 P A P 1.8 X 2 f x dx 8 6 x dx 0.1025
1.8 1.8

c. Cul es el tiempo mximo que necesita un tcnico para reparar cierta avera de un
artefacto elctrico para estar dentro del 18% de los que usan menor tiempo?

1 8 6 x dx 0.18
1 k
P( X k )

k 1.26 horas

Ejercicio 4. Sea la V.A. X: Peso de un artculo (Kg), cuya funcin de densidad est dada
por:

2
x, 1 x 2
f ( x) 3
0 Otro caso

a. Verifique que f(x) es una funcin de densidad

119
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Halle la probabilidad de que un artculo pese entre 1 y 1.5 kg.

c. Halle la probabilidad de que un artculo pese al menos 1.8 kg.

7.5 Valor esperado, esperanza matemtica o media de una variable aleatoria X

La media de una v.a X, que tiene como funcin de probabilidad f x , est dada por:

1. X EX x f x si X es una variable aleatoria discreta.


xRX

2. X E X x f x dx si X es una variable aleatoria continua.

Propiedades del valor esperado

1. Si c y d son constantes reales, entonces, E c X d c E X d


2. Consecuencias de la propiedad 1:

a. E d d
b. E X d EX d
c. E c X c E X
3. Si X e Y son v.a. y c, d son constantes reales, entonces: E c X d Y c E X d E Y
Casos particulares: E X Y E X E Y
E X Y E X E Y
n n
4. Si X1, , X n son v.a. entonces E X i E X i
i 1 i 1

7.6 La variancia de una variable aleatoria X

La variancia de una v.a X est dada por el valor esperado de la funcin h X X X


2

, es decir:

X2 Var X E X X 2 E ( X 2 ) ( E ( X )) 2 E ( X 2 ) 2

120
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Propiedades de la variancia

La variancia es un nmero real positivo que cumple con las siguientes propiedades:

1.
Var X E X 2 X2

Demostracin
Var X E X X E X 2 X2 2 X E ( X ) E X 2 X2
2

2. Si c y d son constantes reales, entonces, Var c X d c Var X


2

3. Consecuencias de la propiedad 2:

a. Var d 0
b. Var X d Var X
c. Var c X c 2 Var X

4. Si X e Y son v.a. independientes y c, d son constantes reales, entonces:


Var c X d Y c 2 Var X d 2 Var Y .

Casos particulares: Var X Y Var X Var Y


Var X Y Var X Var Y
n n
5. Si X1, , X n son v.a. independientes entonces Var X i Var X i
i 1 i 1

Ejemplo 8
Suponga que una librera compra 6 ejemplares de un libro y el nmero de ejemplares
vendidos en tres meses, tiene la siguiente funcin de probabilidad:

X 1 2 3 4 5 6
f x 1/8 1/8 1/8 1/8 2/8 2/8

a. Halle el nmero de ejemplares que se espera vender en tres meses.

X EX x f x 1 8 2 8 3 8 4 8 5 8 6 8 4 unidades
1 1 1 1 2 2
xR X

b. Halle la variancia del nmero de ejemplares vendidos en tres meses.

Por la propiedad 1 de la variancia:


Var X E X 2 X2

X E X 2 x 2 f x 12 22 32 42 52 62 19
1 1 1 1 2 2
2
xR X 8 8 8 8 8 8
entonces:
Var X E X 2 X2 = 19 42 = 3 unidades2

c. Calcule el coeficiente de variacin del nmero de ejemplares vendidos en tres meses.

X 3
CVX 100 100 43.3 %
X 4

121
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

d. Suponga que la librera compra 6 ejemplares de un libro a $10.00 cada uno, para
venderlos a $20.00 teniendo en cuenta que al terminar el periodo de 3 meses,
cualquier ejemplar no vendido se vender a $7.00. Calcule la media, la variancia y
el coeficiente de variacin de la utilidad neta.

Sean las variables: X = nmero de ejemplares vendidos


6X = nmero de ejemplares no vendidos
U = utilidad neta

U = 20 X + 7 ( 6 X ) 60 = 13 X 18 , aplicando la propiedad 1 del valor esperado


y la propiedad 2 de la variancia se tiene lo siguiente:

E (U) = E (13 X 18) = 13 E (X) 18 = 13 (4) 18 = $34


Var (U) = Var (13 X 18) = 132 Var (X) = 132 (3) = 507

507
CVU = 100 66.2 %
34

e. Calcule la probabilidad de que la utilidad neta sea mayor que 34.

PU 34 P13 X 18 34 P X 4 P X 5 P X 6
2 2
0.5
8 8

Ejercicio 5. Sea la variable aleatoria X, definida como el nmero de artculos defectuosos


producidos por da, cuya funcin de probabilidad es:
0.1, x 0
kx, x 1,2

f ( x) P( X x)
k (5 x), x 3,4
0 otro caso

a. Halle el valor de k para que f(x) sea una funcin de probabilidad.

b. Cul es la probabilidad de encontrar por lo menos dos artculos defectuosos en un da


cualquiera?

122
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c. Halle el valor esperado y el coeficiente de variabilidad.

d. Si la empresa estima que la perdida por cada artculo defectuoso por da es de $25.0
y un gasto de reenvi de $4.5. Halle la prdida media y el coeficiente de variabilidad.

Ejemplo 9
La v.a. continua X definida como la proporcin de accidentes fatales por mes que ocurren
en determinada ciudad tiene como funcin de densidad:

2 x , para 0 x 1
f x
0 , para otros valores de x

a. Calcule la probabilidad de que la proporcin de accidentes por mes sea menor que 0.4

0.4
0.4 0.4
x2
P X 0.4 P 0 X 0.4 f x dx 2 x dx 2 x 2 0.16
0.4

2 0
0
0 0

Nota: Como X es una v.a. continua se cumple que:

0.4
P 0 X 0.4 P 0 X 0.4 P 0 X 0.4 P 0 X 0.4 f x dx 0.16
0
b. Encuentre la proporcin media de accidentes fatales por mes en esa ciudad.
1 1
2 3 1 2
X E X x f x dx x 2 x dx 2 x 2 dx x
0 0
3 0 3

123
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c. Halle la variancia de X.
1 1
EX x f x dx x 2x dx 2x 2 4 1 1
2 2 2 3
dx x
0 0
4 0 2
2
1 2
X2 E X 2 E X
2 1
2 3 18

d. Si Y=0.8X-0.02, calcule la media y la variancia de Y.

E(Y)=E(0.8X-0.02)=0.8E(X)-0.02= 0.5133
1
Var(Y)=Var(0.8X-0.02)= 0.8
2
Var X 0.82 0.0356
18
e. Halle la P Y 0.3
P Y 0.3 = P 0.8 X 0.02 0.3 P X 0.4 0.16

Ejercicio 6. Supngase que la concentracin que cierto contaminante se encuentra


distribuida de manera uniforme en el intervalo de 0 a 20 partes de milln (f(x)=1/20). Si
se considera txica una concentracin de 8 o ms.

a. Cul es la probabilidad de que al tomarse una muestra la concentracin de sta sea


txica?

b. Hallar el valor esperado y la varianza de la concentracin de cierto contaminante.


e.

c. Calcule la probabilidad de que la concentracin de cierto contaminante sea


exactamente 10
d.

124
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

EJERCICIOS PROPUESTOS

1. El gerente de una empresa de transporte sabe que la distribucin de la demanda de


pasajes que diariamente solicitan a su agencia es la que se presenta a continuacin.
Los valores positivos indican que el nmero de pasajes solicitados exceden la
capacidad del mnibus, mientras que los negativos indican que la demanda de pasajes
es menor a la capacidad del mnibus.
0.05 X 15
0.15 X 10

f ( X ) 0.55 X 0
0.1 X 10

0.15 X 15

a) Cul es la probabilidad que en un da la demanda de pasaje exceda la capacidad


del mnibus?
b) Cul es la probabilidad que de tres das seleccionados aleatoriamente dos de ellos
tengan una demanda de pasajes igual a la capacidad del bus?
c) El gasto (Y, en dlares) que ocasiona a los operadores logsticos cuando la
demanda de pasajes no es igual a la capacidad del bus, puede expresarse como:
Y = 2|X|. Halle el gasto medio esperado.

2. El gerente de la empresa de juguetes plsticos le ha encargado al nuevo asistente


que investigue sobre los registros de ventas de un tipo de camioncitos y como
resultado ha calculado la siguiente distribucin de probabilidades para sus ventas
anuales.
Unidades (ventas) 3000 4000 4500 5000
Probabilidad 0.2 0.4 0.2 0.2
Cuntos camioncitos se esperara vender el prximo ao?

3. De acuerdo con el ministerio de transporte, se sabe que el nmero de accidentes por


semana que ocurren en una empresa es una variable aleatoria X con funcin de
distribucin de probabilidades dado por:

X 0 1 2 3 Otros valores
f(x) 0.28 0.35 0.22 0.15 0
a) Hallar la media, la variancia y coeficiente de variacin de X.
b) Si en una semana se sabe que ocurri al menos un accidente, cul es la
probabilidad de que en dicha semana haya ocurrido exactamente uno?
c) Si la empresa incurre en una prdida semanal Y (soles) segn el nmero de
accidentes dada por: Y = 10 + 8X. Hallar la prdida esperada semanal.

4. Cierta variedad de planta es sembrada en parcelas utilizando determinado fertilizante.


Suponga que la produccin X, en miles de Kilos por parcela es una variable aleatoria
continua con la siguiente funcin de densidad:

k x 1 , para 1 x 3
f x
0 , para otros valores de x

a) Halle el valor de k.
b) Calcule la probabilidad de que una parcela tenga una produccin de por lo menos
1500 Kilos pero menos de 2000 Kilos.

125
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c) Si se eligen independientemente 10 parcelas, halle la probabilidad de que en 5 de


ellas la produccin sea mayor que 1000 kilos pero menor que 2000 Kg.
d) Determine el valor de la media y la variancia de X.
e) Un especialista ha establecido que debido a un nuevo fertilizante, la produccin
(en miles de kilos) es una v.a. Z=1.2X-0.08. Calcule la media y la variancia de Z.
f) Halle la probabilidad de que la produccin con el nuevo fertilizante sea menor que
1733.4 kilos.

5. Si el peso X, de un artculo en Kg. tiene como funcin de densidad:

x 8
, para 8 x 10
f ( x) 2
0 , de otro modo
a) Calcule E(X) y Var(X).
b) Si el precio de venta es de 2 u.m. y el costo es de 1 u.m, garantizando un reintegro
cuando el peso es menor de 8.25 Kg. Halle la utilidad esperada por artculo.

6. Suponga que el nmero de accidentes por semana que ocurren en una empresa es
una variable aleatoria X con funcin de distribucin de probabilidades dada por:

X 0 1 2 3 Otros valores
f(x) 0.28 0.35 0.22 0.15 0
a) Hallar la media y la variancia de X.
b) La empresa incurre en una prdida semanal Y segn el nmero de accidentes dada
por Y = 10 + 8X. Hallar la prdida esperada semanal.
c) Determinar la funcin de distribucin acumulada.
d) Si en una semana se sabe que ocurri al menos un accidente, cul es la
probabilidad de que haya ocurrido exactamente uno?

7. Juan Quispe planea gastar su gratificacin en comprar un Blue Ray en Jims Video
Service a un precio de US$300. Ahora tiene la opcin de comprar una pliza de
servicio extendido que ofrece cinco aos de cobertura por US$100. Despus de
conversar con sus amigos y leer los informes, Juan cree que puede incurrir en los
siguientes gastos de mantenimiento durante los prximos cinco aos:

GASTO 0 50 100 150 200 250 300


PROBABILIDAD 0,35 0,25 0,15 0,10 0,08 0,05 0,02

a. Cul es el valor esperado de los costos de mantenimiento pronosticados?


b. Debe Juan pagar US$100 por la garanta? Fundamente su respuesta

8. Sea la variable aleatoria X con la siguiente distribucin:

xi p(xi)
0 a/9
1 2a/9
2 5a/9
3 a/9
a) Hallar a.
b) Hallar E(x) y V(X).
c) Hallar: E(Y) y V(Y), donde Y= 3X+4.
d) Calcular P(Y>1)

126
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Preguntas de Autoevaluacin

1. El dominio de una variable aleatoria es ________________________ y su rango es


________________________
2. La funcin f(x) de una variable aleatoria discreta es conocida como
_________________________________. Dos de sus condiciones
son:______________________________________________
3. El rango de una variable aleatoria discreta es un conjunto _____________________
y el rango de una variable aleatoria continua es un conjunto __________________.
4. Si X es una variable aleatoria, siendo Var(X)=45 y E(X)=5, entonces E(X 2) es igual a
___________________________
5. En las siguientes funciones f(x) indique si son o no funciones de probabilidades

a) b)
X 2 4 6 8 10 X -1 0 1 2
f(x) 0.2 0.2 0.2 0.2 0.2 f(x) 0.25 0.25 0.25 0.25
c) d)
X 10 20 30 40 X 0 1
f(x) 0.2 0.2 0.2 0.2 f(x) -0.5 0.5

________________________________________________________________.

6. Para los siguientes experimentos aleatorios defina el rango de la variable aleatoria:

a) Lanzamiento de dos monedas, sea X=Nmero de caras obtenidas ____________


b) Observar un lote de 5 artculos, sea X=Nmero de artculos defectuosos ______
c) Lanzar dos dados, sea X=La suma de las caras superiores __________________
d) El nmero de quejas recibidas por una operadora en una semana ____________
7. Si X es una variable aleatoria, tal que P(X<12.5)=0.25 y P(X<18.5)=0.75, entonces
el rango intercuartil ser igual a __________________________.

8. Si f (x)=10 ; 1 x a, el valor de a es igual a _________________________

9. Si f(x)=1/12; 6 x 18, verifique que E(X)=(6+18)/2 y Var(X)=(18-6)2/12;


___________________________________________________

10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:

Item Enunciado V/F


a. El valor esperado de una variable aleatoria es un valor que siempre
es igual a uno de los valores del rango de la variable.
b. f(x) denota la funcin de probabilidad si X es una V.A. discreta y
funcin de densidad si es continua.
c. El valor esperado de una variable aleatoria nunca puede tomar valores
negativos
d. Sean X e Y variables aleatorias, entonces Var(X-Y)=Var(X)-Var(Y)
e. Una variable aleatoria discreta y continua nunca puede tomar valores
negativos

127
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

CAPTULO VIII

PRINCIPALES DISTRIBUCIONES DISCRETAS

Se estudiarn las principales distribuciones que corresponden a las variables aleatorias


discretas que son utilizadas muchas aplicaciones en el mundo real, conociendo su funcin
de probabilidad.

A continuacin se presentan las principales distribuciones discretas:

La distribucin de probabilidad binomial


La distribucin de probabilidad hipergeomtrica
La distribucin de probabilidad Poisson

Objetivo. Identificar y aplicar una variable aleatoria discreta, asociada alguna de las
principales distribuciones discretas estudiadas.

8.1 La Distribucin Binomial

Experimento Binomial

Hay muchos experimentos que se ajustan ya sea exacta o aproximadamente a las


siguientes propiedades:

1. El experimento consiste en una secuencia de n intentos (experimentos de


Bernoulli), donde n se fija antes del experimento.
2. Los intentos son idnticos, y cada uno de ellos puede dar lugar a dos posibles
resultados, llamados: xito (E) o fracaso (F).
3. Los intentos son independientes, por lo que el resultado de cualquier intento
particular no afecta el resultado de cualquier otro intento.
4. La probabilidad de xito es constante de un intento a otro; se denota esta

probabilidad por P E . La probabilidad de fracaso es P F 1

Ejemplo 1
En una tienda la llegada de un cliente y determinar si compra o no es un experimento de
Bernoulli donde xito: E = {un cliente compra} y fracaso: F = {un cliente no compra}.

Se sabe que el 75% de los clientes que llegan hacen una compra, entonces P E =
0.75.
Si a la tienda llegan 20 clientes, este sera un experimento binomial donde n=20 y =
0.75

La Funcin de Probabilidad Binomial

Dado un experimento binomial entonces la v.a.d. binomial X se define como el nmero


de xitos en n intentos, y su funcin de probabilidad est dada por:

n x
1
n x
x 0, 1, 2, , n
f x P X x x

0 de otro mod o
Notacin: X ~ Binomial n ,

128
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

La Media y la Variancia de X

Si X ~ Binomial n , entonces: EX n y 2 Var X n 1

Ejemplo 2
Un examen consta de n = 25 preguntas, cada una de las cuales tiene 5 alternativas de
las cuales slo una es correcta, si una persona est adivinando al responder y se desea
saber el nmero de respuestas correctamente respondidas.

Entonces, este es un experimento Binomial con xito: E={la respuesta es correcta} y

P E
1
fracaso: F={la respuesta no es correcta} y siendo: .
5
Sea la v.a. X=El nmero de respuestas correctas en las 25 preguntas,
X Binomial (25,0.2)

La distribucin de probabilidad Binomial ser:


25
f x 0.2 x 0.825 x x 0,1, 2, ...,2 5
x
La probabilidad de que la persona acierte por lo menos 3, pero menos de 5 preguntas es:

P(3 X < 5) = P(X=3)+P(X=4) = 0.1358+0.1867=0.3225

Ejemplo 3
Siguiendo con el Ejemplo 1.
xito: E={un cliente compra} y fracaso: F ={un cliente no compra}. Se sabe que el 75%

de los clientes que llegan hacen una compra, entonces P E = 0.75.
Si a la tienda llegan 20 clientes, este sera un experimento Binomial con n=20 y = 0.75.
Solucin.
Sea v.a. X=El nmero de clientes que hacen una compra. La distribucin de
20
probabilidades se define: f x 0.75x 0.2520 x x 0,1, 2, ...,2 0
x
La probabilidad de que el nmero de clientes que hacen una compra sea mayor que 18
sera:
20 20
P( X 18) 0.75190.251 0.75200.250 0.0211 0.0032 0.0243
19 20

Ejemplo 4
Una compaa vendedora de equipos electrnicos verifica que de todas las mquinas por
ella instaladas, el 40 % exigen nuevos ajustes despus de su instalacin. Si 5 mquinas
fueron seleccionadas al azar:

a. Cul es la probabilidad de que al menos 3 requieran trabajos de ajuste despus de


la instalacin?

El experimento aleatorio que consiste en determinar el nmero de mquinas que


requieren ajustes, en un grupo de 5, es un experimento Binomial con xito: E={una

mquina requiere ajustes} y P E 0.4 .

La v.a.d. X definida como el nmero de mquinas, que requieren ajustes, en un grupo



de 5, es una v.a. binomial. X ~ Bin n , ~ Bin 5,0.4 , entonces:

129
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

5
f x 0.4 x 0.65 x x 0,1, 2, 3, 4, 5
x
5
5
P X 3 f 3 f 4 f 5 0.4 x 0.65 x 0.2304 0.0768 0.0102 0.3174
x 3 x

b. La compaa estima que el costo del ajuste despus de la instalacin es de 100 um


por mquina y que este costo lo debe pagar la compaa Cul es el costo esperado
para la firma?

Solucin.-
Sea la v.a. Y definida como el costo de las mquinas que necesitan ajuste en un
grupo de 5.
Y = 100 X y como:

X ~ Bin n , , entonces E X n 5 0.4 2 por lo tanto:

E Y E 100 X 100 E X 100 2 200 um

Ejemplo 5
El gimnasio El Rpido ha comprobado que el 20% de sus alumnos se dan de baja
durante el primer mes y el 80% restante permanecen todo el ao. Suponga que este ao
se inscribieron 20 alumnos.

a. Cul es la probabilidad de que se den de baja ms de dos alumnos?

Sea la v.a. X=nmero de alumnos que se dan de baja en el gimnasio.


=0.20 y n=20; entonces: X ~ Binomial (20;0.20)

p(X > 2) =1- p(X 2) =1-0.20608472 = 0.79391528

b. Cul es la probabilidad de que permanezcan 12 alumnos todo el ao?


Sea la v.a. Y=nmero de alumnos que permanecen todo el ao en el gimnasio.
=0.80 y n=20; entonces: Y~ Binomial (20;0.80)

P(Y=12) = 0.02216088

c. Al hacer la inscripcin se realiza un nico pago anual de $ 600. Si cada alumno que
permanece todo el ao genera un gasto anual para el gimnasio de $ 150, cul es el
beneficio anual esperado para el gimnasio?

Ingreso: I = 600*20=12000 Gasto: G= 150*(20-X)


Beneficio: B = 12000 - (3000 150X) = 9000+150 X
Se tiene: E(X) = 20*0.2=4
E(B) = 9000+150*4 = 9600

130
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 1. Se conoce por experiencias anteriores que el 20% de las plantas de limonero
son atacadas por cierta plaga. Si se desea llevar a cabo un experimento con 10 plantas.
Cul ser la probabilidad de que:

a. 5 plantas sean atacadas?

b. 3 o ms plantas sean atacadas?

c. ms de 1 pero menos de 5 plantas sean atacadas?

d. Cul es el nmero esperado de plantas enfermas en la muestra?. Cul es la


desviacin estndar?

131
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 2. Una institucin educativa conmemora sus 100 aos de fundacin, con tal
motivo la junta directiva ha invitado a sus 25 profesores fundadores a la ceremonia
principal. Se cree que la probabilidad de que un profesor fundador asista a la ceremonia
es de 0.75.
a. Cul es la probabilidad de que al menos 96% de los profesores fundadores asistan?

b. Si ya confirmaron su asistencia al menos dos profesores fundadores, cul es la


probabilidad de que confirmen su asistencia ms de 23 profesores fundadores?

c. La empresa que da servicios de buffet cobra por persona $35 ms $ 5 por servicio,
halle el costo esperado para la ceremonia.

Ejercicio 3. Cierta clnica cuenta con una poblacin de 20 enfermos, donde el 25%
padece de algn tipo de cncer. Se selecciona con reemplazo una muestra de 4 enfermos.

a. Cul es la probabilidad de haber seleccionado por lo menos un enfermo con cncer?

132
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Hallar el nmero esperado de enfermos con cncer.

Ejercicio 4. Un estudiante se presenta a un examen de seleccin mltiple contiene 20


preguntas cada una con 5 respuestas opcionales (de las cuales slo una es la correcta).
El estudiante est adivinando al momento de responder cada pregunta. Si para aprobar
el curso el estudiante debe responder correctamente ms de 17 preguntas
correctamente. Cul es la probabilidad de que desapruebe el curso?

8.2 La Distribucin Hipergeomtrica

Los supuestos que se consideran para una distribucin hipergeomtrica son:

1. La poblacin o conjunto donde se hace el muestreo tiene N elementos, individuos u


objetos (una poblacin finita)
2. Cada elemento puede ser caracterizado como un xito (E) o fracaso (F), y hay A
xitos en la poblacin entonces son (N-A) fracasos.
3. Se saca una muestra, sin reemplazo, de n elementos de tal forma que sea igualmente
probable obtener cada subconjunto de tamao n.

La Funcin de Probabilidad Hipergeomtrica


La v.a.d. hipergeomtrica X est definida como el nmero de xitos en la muestra de
tamao n.
Notacin: X ~ Hiper N , n, A
Si X ~ Hiper N , n, A entonces su distribucin de probabilidad es:

A N A


f x P X x
x n x
para x entero t.q mx0, n A N x min n, A
N

n

La Media y la Variancia de X
A A N n
EX n , 2 Var X n 1
A
Si X ~ Hiper N , n, A entonces:
N N N N 1

133
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 6
Un embarque de sustancias qumicas llega en 15 contenedores, 2 de los cuales no
cumplen con los requerimientos de pureza. Se eligen 3 contenedores al azar, sin
reemplazo, para hacer una inspeccin de la pureza del producto. Calcule la probabilidad
de que al menos uno de los contenedores que no cumplen los requerimientos est en la
muestra.

La v.a.d. hipergeomtrica X se define como el nmero de contenedores que no cumplen


los requisitos, entonces X ~ Hiper N , n, A ~ Hiper 15,3, 2 por lo tanto:
2 13

x 3 x
f x P X x , mx0, 3 15 2 x min 3, 2 o x 0, 1, 2
15

3
2 13 2 13

P X 1 P X 1 P X 2 0.3714
1 2 2 1
15 15

3 3

Ejemplo 7
Una estacin experimental se compone de 4 ingenieros agrnomos y 9 tcnicos agrcolas.
Si se elige al azar y sin reemplazo a 3 individuos para asignarlos a un trabajo de campo,
cul es la probabilidad que el grupo asignado al trabajo de campo incluya al menos 2
ingenieros agrnomos?

Sea la v.a. x: Nmero de ingenieros agrnomos incluidos en el trabajo de campo.

x ~ H 13,3, 4 N 13 , n 3 , A 4 , x=0,1,2,3
13 4 4 13 4 4


p x 2 p x 2 p x 3 3 0.189 0.014 0.203
3 2 2 3 3
13 13

3 3

Ejemplo 8
Un determinado antibitico es empacado en cajas de 20 botellas. Suponga que una caja,
la cual es enviada a una farmacia hay 5 botellas mal envasadas. El dueo de la farmacia
sospecha que la cantidad de antibitico en algunos de frascos es insuficiente por lo
selecciona al azar y sin reemplazo una muestra de tres frascos y decide que si encuentra
la mitad o ms de frascos mal envasados en esa muestra cambiar de distribuidor. Cul
es la probabilidad de que el dueo de la farmacia no cambie de distribuidor?

Solucin.-
N 20 n 3 A=5 N-A = 15 x 0,1,2,3
5 15 5 15

P( x 2) P( x 0) P( x 1) =0.859
0 3 1 2
20

3

134
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 5. Un lote contiene 15 semillas de cierto cultivo, de los cuales 8 estn daadas.
Sea X la variable aleatoria el nmero de semillas daadas. Del lote se toma una muestra
aleatoria sin reemplazo de 5 semillas.

a. Cul es la probabilidad de que en la muestra se haya seleccionado por lo menos tres


semillas daadas?
a.

b. Cul es la probabilidad de que la muestra no contengan semillas daadas?

Ejercicio 6. En el almacn de una compaa hay 10 impresoras y 4 de ellas son


defectuosas. Un usuario selecciona al azar y sin reemplazo 5 de ellas para usarlas.

a. Cul es la probabilidad de que las cinco impresoras seleccionadas no tengan


defectos?

b. El usuario regresa las defectuosas para su reparacin. Se sabe que cuesta 50 u.m.
reparar cada impresora. Calcule el promedio y la variancia del costo total de
reparacin.

135
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 7. Un ingeniero zootecnista sabe que en cierta regin hay 8 individuos de una
especie de mamfero, de los cuales cinco son machos y el resto son hembras. Si selecciona
al azar a cuatro individuos y observa el nmero de machos seleccionados.
a. Qu valores posibles podra tomar la variable mencionada?

b. Cul es la probabilidad que haya ms de un macho?

c. Cul es la probabilidad que haya el mismo nmero de machos y hembras?

d. Halle la media y la varianza

8.3 La Distribucin de Poisson

Una v.a.d. X tiene distribucin Poisson con parmetro 0 si su funcin de probabilidad


es:
e x
f x P X x x 0,1, 2,
x!
Esta distribucin tiene dos aplicaciones:

Si X ~ Bin n , con n y 0 entonces X ~ Pois n


Proceso de Poisson (sta es la que se usar en el libro)

136
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Proceso de Poisson

El proceso de Poisson es un experimento aleatorio en el que ocurren sucesos en un


intervalo dado de longitud t.

Propiedades de un Proceso de Poisson

1. Los sucesos son de la misma clase u homogneos.


2. Los sucesos en un intervalo son independientes de los sucesos en otros intervalos
no superpuestos.
3. El promedio de sucesos por unidad de intervalo (t = 1), es conocido e igual a v.

La v.a.d. X definida como el nmero de sucesos que ocurren en intervalos de longitud t,


sigue un proceso de Poisson.

Como ejemplos de variables aleatorias Poisson, se tienen las siguientes:

a. El nmero de accidentes fatales por semana en una ciudad.


b. El nmero de fallas que hay en cada 2.5 m 2 de tela.
c. El nmero de renacuajos por cada 4 litros de agua, en cierto estanque.

Funcin de Probabilidad para un Proceso de Poisson

La v.a.d. X definida como el nmero de sucesos que ocurren en intervalos de tamao t.


e v t v t
x
f x P X x x 0,1, 2,
x!
donde:v = promedio de sucesos por unidad de intervalo.
t = tamao del intervalo (ejemplo: t = 2.3, t = 5.8 etc.).
vt = promedio de sucesos por intervalo de tamao t

Notacin: X ~ Pois vt
e x
Tambin se puede expresar: f x P X x x 0,1, 2,
x!
Donde vt , X ~ Pois

La Media y la Variancia de X

Si X ~ Pois entonces: E X y 2 Var X con vt

Ejemplo 9
Los mensajes que llegan a una computadora, utilizada como servidor, lo hacen de acuerdo
con una distribucin Poisson con una tasa promedio de 10 mensajes por hora.

a. Calcule la probabilidad de que lleguen 7 mensajes en 2 horas.

Sea la v.a Y = El nmero de mensajes que llegan al servidor en 2 horas.(t = 2)


Unidad de intervalo = 1 hora
v=promedio de sucesos por unidad de intervalo = 10

t=tamao del intervalo = 2


vt = promedio de sucesos por intervalo de tamao t = 10x2

137
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Y ~ Pois (vt) ~ Pois (102) ~ Pois (20) , entonces:

e 20 20 y
f y P Y y y 0, 1, 2,
y !
e 20 207
P Y 7 0.00052
7 !

b. Encuentre el intervalo de tiempo necesario para que la probabilidad de que no lleguen


mensajes, durante ese lapso, sea 0.9.

Sea la v.a Z = El nmero de mensajes que llegan al servidor en k horas.(t = k)

Z ~ Pois (vt) ~ Pois (10k) ~ Pois (10k), entonces:

e 10 k 10k
z

f z PZ z z 0, 1, 2,
z !
e 10 k 10k
0

P Z 0 e10 k 0.9 k 0.0105 horas


0 !
Nota: La ecuacin anterior se resolvi tomando logaritmos.

Ejemplo 10
Se cree que el nmero promedio de individuos por cada 2 km 2 de cierta especie de
mamfero que habita en las alturas de cierta regin es de 1.2.

a. En una zona de 2.8 km2, cuntos individuos esperaramos en promedio encontrar?.

Sea la v.a. X=Nmero de individuos en 2 km2


El nmero de individuos que habitan en promedio ser: 2.8(1.2) / 2 1.68

b. Si se observa un rea de 3 km2 en dicha regin, cul es la probabilidad que se


encuentren ms de 3 individuos de esta especie?

Sea la v.a. X: Nmero de individuos en 3km21


3(1.2) / 2 1.8
3
e1.8 (1.8) x
p( x 3) 1 p( x 3) 1 1 0.8912 0.1087
x 0 x!

c. Si se selecciona dos reas independientemente de 3 km2 cada una. Cul es la


probabilidad que en cada una de estas reas haya ms de 2 individuos?

Probabilidad que haya en un rea de 3 km2 ms de 2 individuos:


2
e1.8 (1.8) x
p( x 2) 1 p( x 2) 1 0.269378
x 0 x!
Probabilidad que haya en un rea de 3km2 ms de dos individuos.

Y: nmero de reas con ms de dos individuos. Y: 0, 1, 2.


p( y 0) (1 0.2694) 2 0.5338

138
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 8. A cierta fbrica de laminados de madera llegan por trmino medio 3 clientes
cada 2 horas. Suponiendo que las llegadas se distribuyen de acuerdo a una distribucin
de Poisson, calcule:

a) La probabilidad de que en una maana de trabajo (de 9:30 a 13:30 horas) lleguen
ms de 2 clientes.

b) La probabilidad de que el primer cliente llegue en la primera media hora de trabajo.

c) La probabilidad que en una semana lleguen entre 10 y 14 clientes. (Suponer 6 das


de trabajo a 8 horas diarias).

139
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 9. El nmero de barcos que llegan a un puerto cada semana es una variable
aleatoria que tiene distribucin de Poisson con media igual a 9 barcos.

a. Cul es la probabilidad que en una semana lleguen exactamente 5 barcos?

b. Cul es la probabilidad de que en tres das lleguen a lo ms 2 barcos?

c. Cul es la probabilidad de que en una semana lleguen ms de 3 barcos si se sabe


que ya lleg al menos un barco en la semana?

d. Un aduanero sabe que el costo de mantenimiento del puerto por semana est en
funcin del nmero de barcos que arriban, si no llegan barcos el costo es de 2 mil
soles si llega un barco el costo es de 3 mil soles y si llegan dos o ms barcos el costo
es de 5 mil soles. Halle la distribucin del costo y el costo esperado por
mantenimiento del puerto por semana.

140
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Prctica Dirigida N 5

1. Una empresa constructora tiene para ejecutar varios proyectos de inversin


inmobiliarios, los cuales tienen 50% de xito cada uno. Finalmente, decide invertir
en tres proyectos. Sea X la variable aleatoria definida como el nmero de proyectos
exitosos menos el nmero de proyectos fracasados. Determine la funcin de
distribucin de probabilidades de la variable X.

2. El siguiente grfico muestra la distribucin de probabilidades de la variable aleatoria


X, definida como el nmero de reclamos de los clientes de una compaa de seguros.
Distribucin del nmero de reclamos

f(x) 0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
0 2 4 6 8 10
Nmero de reclamos

a) Halle la probabilidad que la compaa de seguros tenga al menos 6 reclamos.

141
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b) Si la empresa estima que por cada reclamo el tiempo perdido es de 10 minutos.


Calcule el coeficiente de variacin del tiempo perdido por los reclamos.

3. Se sabe que en un embarcadero de un Club de yates, el pago anual (en miles nuevos
soles) por yate que realiza los socios, es una variable aleatoria que tiene la siguiente
funcin de densidad.
x
2 x8
f ( x) 30
0 otro caso

a. Qu porcentaje de socios realizan un pago por yate de al menos de 3500?.

b. Halle el pago esperado y su coeficiente de variacin

142
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c. Si se extrae una muestra de 5 socios, halle la probabilidad que tres hayan


realizado un pago anual entre 3000 y 6000 nuevos soles.

4. La oficina de inspeccin de salud de una municipalidad ha iniciado una campaa con


la finalidad de detectar avcolas que no cumplen con las normas de sanidad avcolas.
Con esta finalidad se realiza 8 visitas cada da a las avcolas de Lima Metropolitana.
En campaas pasadas, se ha determinado que el 12% de las avcolas fueron
multadas.

a. Defina la variable aleatoria en estudio y su distribucin de probabilidad.

b. Halle la probabilidad que se multe a lo ms dos avcolas.

c. Halle la probabilidad de que se multen ms de tres pero menos de seis avcolas.

143
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

d. Halle la probabilidad que ninguna avcola sea multada.

e. Cuntas avcolas se esperan que sean multadas?.

5. En la oficina de recursos hdricos de una entidad estatal, existen 6 ingenieros


agrcolas y 4 ingenieros civiles. Se sabe que la oficina debe enviar a 5 ingenieros para
un curso de capacitacin en Manejo del Agua.

a. Defina la variable aleatoria en estudio y su distribucin de probabilidad, para los


ingenieros agrcolas.

b. Cul es la probabilidad que asista al curso al menos dos ingenieros agrcolas?.

c. Cul es la probabilidad que asista ningn ingeniero agrcola?

144
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

d. Cul es la probabilidad que asistan al curso tres ingenieros civiles?

e. Si el costo por persona para asistir al curso es $350 ms $50 por movilidad. Cul
es el costo esperado que pagar la entidad estatal para que asistan al curso los
ingenieros agrcolas?.

6. Una empresa que ofrece los servicios de la tecnologa de Computacin en la Nube


(Cloud Computing), desea analizar la capacidad de sus servidores con la finalidad de
ampliar los servicios a pequeas empresas del interior del pas. Si se sabe que el
nmero de mensajes que llegan a su servidor central, lo hacen de acuerdo con una
distribucin de Poisson con una tasa promedio de 1.5 mensajes por minuto.

a. Calcule la probabilidad de que llegue al menos dos mensaje en media hora.

b. Calcule la probabilidad de que llegue como mximo tres mensaje en una hora.

c. Si se sabe que ya llegaron al menos tres mensajes, calcule la probabilidad que


lleguen a lo ms seis mensajes en 10 minutos

145
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

EJERCICIOS PROPUESTOS

1. Halle la probabilidad de que exactamente 9 de 10 tubos de vacuna duren como


mnimo 1000 horas. La probabilidad que estos tubos duren como mnimo 1000 horas
es de 0.80.

2. El nmero de rayos gamma emitidos por segundo, por cierto sustancia radioactiva
es una variable aleatoria que tiene una distribucin de Poisson con parmetro igual
a 5.6. Si un instrumento de medida se daa cuando recibe por lo menos 3 radiaciones
por segundo. Cul es la probabilidad que este instrumento se dae?

3. La posibilidad de que cada muestra de aire contenga una molcula rara es 10 %. Si


se van a tomar 18 muestras para analizar y asumiendo que las muestras son
independientes con respecto a la presencia de la molcula. Halle la probabilidad de
que exactamente 2 muestras contengan la molcula rara.

4. Juan es un dentista que atiende todos los das a sus clientes de 9:00 am a 4:00pm y
se ha registrado el nmero de clientes atendidos cada tres das, en una muestra de
tamao 5 obtenindose: 18, 21, 19, 20 y 17. Se sabe que el nmero de clientes que
van a consultar sigue una distribucin de Poisson.

a. Si se observa 5 das de atencin. Cul es la probabilidad de que slo hayan ido


tres personas a consultar al dentista?
b. Encuentre el intervalo de tiempo necesario para que la probabilidad de que no
lleguen clientes sea 0.08.

5. En una poblacin de drosphila, que ataca a cierta variedad de fruta, se sabe que el
25% ha desarrollado mutacin en las alas. Si se escogen aleatoriamente 6 moscas de
esta poblacin:
a. Cul es la probabilidad de que 2 de estas moscas presenten mutacin de alas?
b. Cul es la probabilidad que ms de tres presenten mutacin de alas?
c. Cul es la probabilidad que a lo ms una mosca presente mutacin de alas?
d. Si se sabe que ms de una presenta mutacin de alas, Cul es la probabilidad
que como mximo 4 presenten mutacin de alas?

6. La probabilidad que la llanta trasera derecha de un auto tipo Tico reviente al entrar
a una curva es de 0.05. Encontrar la probabilidad que de 16 autos tipo Tico que
pasan por la curva:
a. Se revienten la llanta trasera derecha de a lo ms 3 autos
b. Se revienten la llanta trasera derecha de dos o ms autos.

7. En una pecera se encuentra 20 pececillos ornamentales, de los cuales cinco son de


color anaranjado y el resto no. El dueo de esta pecera ha decidido regalar la pecera
a su mejor amigo si al seleccionar una muestra al azar sin reemplazo de tres pececillos
la mitad o menos son de color anaranjado. Cul es la probabilidad que el dueo de
la pecera regale sta a su mejor amigo?

8. En un estudio se encontr que el nmero total de animales muertos cerca de una


carretera de 30 Km. fue de 18. Si el nmero de animales muertos cerca de la
carretera tiene distribucin Poisson, calcule la probabilidad de encontrar al menos 2
animales muertos en 4.5 Km. de carretera. (Sugerencia v = 18/30 = 0.6).

9. Dos cpsulas se seleccionan sin reemplazo de un frasco que contiene tres aspirinas,
dos sedantes y cuatro cpsulas laxantes. Cul es la probabilidad de no seleccionar
aspirinas?

146
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

10. Se sabe que en el centro de Lima ocurre en promedio un asalto cada dos minutos
entre las 6:00 p.m. y las 8:00 p.m. Mara sale de su trabajo a las 6:30 p.m. y debe
caminar desde la Plaza San Martn hasta la Av. Tacna con direccin hacia el paradero.
Si el trayecto le toma 4 minutos. Cul es la probabilidad que Mara llegue a su
paradero sin que haya ocurrido algn asalto?

11. Los pasajeros de las aerolneas llegan al azar e independientemente a la seccin de


documentacin de un aeropuerto con una frecuencia promedio de llegadas de 10
pasajeros por minuto. Cul es la probabilidad de que a lo ms un pasajero llegue en
15 segundos?

12. Un determinado antibitico se enva a las farmacias en cajas de 24 frascos. El


farmacutico sospecha que la cantidad de antibitico en algunos de los frascos es
insuficiente y decide analizar el contenido de 5 frascos escogidos al azar sin
reemplazo. Suponga que 14 de los 24 frascos tienen cantidad insuficiente de
antibiticos. Cul es la probabilidad de que por lo menos 4 frascos tengan cantidad
suficiente de antibiticos?

13. Segn una encuesta hecha a un grupo de 10 personas, seis de ellas prefieren la
gaseosa Inca Kola y 4 de ellas Coca Cola. Si se seleccionan a 3 personas de ese grupo.
Cul es la probabilidad de que hayan 2 que les guste Inca Kola?

14. Se sabe, por experiencia, que el 42% de todas las personas que reciben un ejemplar
gratuito de una revista se suscriben a ella, calcule la probabilidad de que, a lo ms 3
de las 6 personas seleccionadas al azar que reciben un ejemplar gratuito de una
revista se suscriben a la revista.

15. Si el nmero de solicitudes de informacin sobre cruceros que recibe una agencia de
viajes por da es una variable que tiene una distribucin de Poisson con variancia 2.4.
Halle la probabilidad de que:

a. Ningn solicitante sea recibido en medio da.


b. Al menos dos solicitantes sean recibidos en dos das.

16. Se cree que el nmero promedio de individuos por cada 2 km2 de cierta especie de
mamfero que habita en las alturas de cierta regin es de 1.2. Adems se conoce que
el nmero de individuos por rea de esa regin tiene una distribucin de Poisson.
a. En una zona de 2.8 km2, cuntos individuos esperaramos en promedio encontrar.
b. Si se observa un rea de 3 km2 en dicha regin, cul es la probabilidad que se
encuentren ms de 3 individuos de esta especie?
c. Si se selecciona dos reas independientemente de 3km 2 cada una. Cul es la
probabilidad que en cada una de estas reas no haya ms de 2 individuos?

17. La empresa FERTISA se dedica a la produccin de fertilizantes y tiene ciertos


problemas en el envasado de sus productos. Un lote de 100 sacos que contienen 8
defectuosamente envasados ha sido remitido a la firma Agrouna.
a. Si dicha firma selecciona 10 sacos aleatoriamente, cul es la probabilidad de que
encuentre 3 sacos mal envasados?
b. Dicha firma aceptar el lote si al seleccionar 10 sacos no encuentra defecto en
ninguno de ellos. Si se remiten 10 lotes con 8 sacos defectuosos cada uno, cul
es la probabilidad de que a lo ms 1 lote sea rechazado?

147
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

18. Un bilogo marino ha determinado que el nmero de avistamientos promedio de


mamferos marinos por hora en alta mar es de 3.2.
a) Si decide contar el nmero de ejemplares durante 4 horas cul es la probabilidad
de que se observe entre 10 y 12 ejemplares (ambos nmeros incluidos)?
b) Si se establecen jornadas de trabajo de 6 horas, cul ser el nmero promedio
de avistamientos por jornada?
c) Se sabe tambin que el 35% de los avistamientos corresponden a delfines. Si en
un da se observaron 10 animales, cul es la probabilidad de que se hayan
observado por lo menos 2 delfines?

19. Los agricultores de una regin estn preocupados por la calidad de sus cosechas, ya
que se ha detectado en ciertas reas la existencia de sustancias contaminantes en el
suelo. Para analizarla, se segmenta la tierra en parcelas de 100 m 2, y se concluye
que hay una probabilidad de 0.6 de encontrar estos contaminantes en una
determinada parcela. Se pide:
a) Si un agricultor posee 15 de estas parcelas. Qu probabilidad hay de que tenga
alguna parcela contaminada?
b) Una comunidad posee 100 parcelas del tipo anterior. Qu probabilidad hay de
que tenga entre 10 y 15 parcelas contaminadas?
c) Si por cada parcela contaminada la cooperativa sufre una prdida de 1000 nuevos
soles, cul es la prdida que la comunidad espera tener?.

20. El gerente de una empresa dedicada realizar copias de CD sabe por informacin
histrica el 93% de los CD que provee la compaa Lotus international son no
defectuosos. Si selecciona al azar 5 CD, cul es la probabilidad que 3 sean no
defectuosos, si se sabe que al menos uno es no defectuoso?

21. Por factores internacionales el precio del petrleo ha sufrido ciertas variaciones en
los ltimos meses. REPLUSA ha determinado que la probabilidad de que vare el
precio del petrleo es de 0.60. Si se va a realizar 10 compras de petrleo:
Cul es la probabilidad que el nmero compras de petrleo donde el precio tiene
variacin sea menor que su esperado?

22. Los camiones que reparten el combustible a los diferentes grifos de la capital llegan
a las instalaciones de la refinera a un promedio de tres cada 20 minutos. Si las
instalaciones slo tienen capacidad para recibir 10 camiones por hora, cul es la
probabilidad de que una hora los camiones tengan que regresar en otro momento?

148
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Preguntas de Autoevaluacin

1. Los parmetros de la distribucin Binomial son _______________________, de la


distribucin Hipergeomtrica son _________________________ y la distribucin
Poisson son ________________________

2. La distribucin Binomial est asociada al muestreo __________________________


mientras la distribucin Hipergeomtrica al muestreo _______________________ .

3. Si X Poisson(4) e Y Bin(10,0.35), entonces el coeficiente de variabilidad de X e Y


son ______________________________________ respectivamente.

4. Sea la variable aleatoria: X=Nmero de autos que vende diariamente una


distribuidora, con una media igual a 8.5 y una variancia de 6.25, sabiendo que la
ganancia (en $) de la distribuidora se puede definir por: G=550 X 200, entonces la
desviacin estndar de la ganancia ser ______________________________.

5. Si en una poza de crianza hay 200 truchas, de las cuales el 45% son hembras. Si se
toma una muestra aleatoria con reemplazo de 20 truchas, la variable aleatoria nmero
de truchas hembras tiene una distribucin _________________________.

6. Sea la variable aleatoria H~Hip(N=18,n=12,A=8) entonces el rango de H es el


conjunto ________________________.

7. Si la variable aleatoria X=Nmero de llamadas que a una central telefnica en una


hora tiene una distribucin Poisson y P(X=2)=2/3P(X=1), entonces el nmero
esperado de llamadas que llegan en una hora es igual a ______________________

8. El rango de una variable aleatoria que se distribuye como una Binomial es un conjunto
_____________________, para una Hipergeomtrica es un conjunto
_________________________ y para una Poisson ________________________.

9. En un terreno despus de rociar con cierto insecticida, se determin que el nmero


promedio de insectos vivos es de 4.5 por cada 2 mt2. Asumiendo que el nmero de
insectos vivos tiene distribucin Poisson, la probabilidad de que en 1.5 mt2 de terreno
se encuentren 5 insectos vivos es ________________________________.

10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:

Item Enunciado V/F


a. En un experimento binomial, la probabilidad de xito de un intento a
otro puede variar.
b. Si la variable aleatoria X se distribuye como una Binomial con
P(xito)=0.5, entonces la probabilidad de k xitos es igual a la
probabilidad de k fracasos.
c. Si X es una variable aleatoria que se distribuye como una
Hipergeomtrica, entonces el nmero de xitos nunca puede ser mayor
al de fracasos.
d. Para una variable aleatoria que se distribuye como una Poisson, la
media y desviacin estndar son iguales.
e. El rango de una variable aleatoria que se distribuye como una Poisson
es un conjunto finito.

149
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

CAPTULO IX

DISTRIBUCIONES CONTINUAS

Se estudiarn algunas variables aleatorias continuas particulares cuya distribucin de


probabilidades se conoce. Tambin se conocern las principales distribuciones continuas
y las distribuciones muestrales asociadas a ellas, que se utilizarn posteriormente en
inferencia estadstica (intervalos de confianza y para hacer pruebas de hiptesis).

Objetivo. Al finalizar este captulo el lector conocer los conceptos y aplicaciones de las
principales distribuciones continuas.

9.1 Distribucin Exponencial

La variable aleatoria continua X tiene distribucin exponencial con parmetro con media
igual a E(X)= y variancia V(X) = 2, si su funcin de densidad es:

1 x /
e para x 0; 0
f ( x)
0
para cualquier otro caso

Su notacin: X ~ E()

Grficamente se representa:

Funcin acumulada (calcular la probabilidad):

1 e x / para x 0; 0
F ( x) P( X x) <
0 para x < 0

P( X < k ) p k Ln(1 p)
Para hallar percentiles:
P( X > k ) p k Ln( p)

150
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 1
El tiempo de demora en entregar una pizza tiene distribucin exponencial con media igual
a 25 minutos. Si la pizzera ofrece su producto con la promocin si recibe su pizza
despus de 30 minutos usted no paga nada. Calcule:

a) La probabilidad de que una pizza sea entregada de manera gratuita a un cliente.


b) Si se entregan 12 pizzas, cul es la probabilidad de que 3 sean gratuitas?
c) Cul debe ser el tiempo como mximo, para considerar un pedido de pizza dentro
del 25% de menor tiempo?

Solucin:
a) Sea X: tiempo de demora en entregar una pizza
X~ E(25)
30 30
P(pizza gratis) = P(X>30) = 1- P(X30) = 1 (1 e 25
)e 25
0.3012

b) Y= Nmero de pizzas gratuitas entregadas de un total de 12


Y~ B(12,p)
p= P(pizza gratis) = 0.3012
P(Y=3) = 0.2389

c) Se tiene que: P( X k ) 0.25 k 25 xLn (1 0.25) 7.19 min utos

Ejercicio 1. El tiempo para un proceso de congelamiento de hongos comestibles tiene


una distribucin exponencial con promedio de 4.5 minutos.
a. Cul es la probabilidad que un proceso de congelamiento dure a lo ms de 5
minutos?

b. Sabe que el proceso de congelamiento no debe durar ms de 6 minutos, de lo


contrario el hongo puede malograse. Cul es la probabilidad que el hongo se
malogre?

151
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c. Cul debe ser el tiempo como mnimo para ser considerado un proceso de
congelamiento, dentro del 20% de mayores tiempos?

d. Cul es la desviacin estndar del tiempo de congelamiento?

9.2 Distribucin Normal

La Distribucin Normal fue hallada por primera vez en 1733, por A. De Moivre. Pero el
descubrimiento de De Moivre al parecer pas inadvertido y fue redescubierta por C.F
Gauss en 1809 y P.S Laplace en 1780 hizo trabajos preliminares que profundiz en 1812.

En Estadstica una buena cantidad de variables continuas (peso, longitud, ingresos,


temperatura etc.) se consideran que tienen Distribucin Normal (se dice que es lo normal
que tenga esa distribucin).

La variable aleatoria continua X tiene distribucin normal con media y variancia 2 si su


funcin de probabilidad es:

2
1 x
1
f x e 2
, x > 0
2
Notacin: X N( , 2)

152
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Caractersticas de la distribucin normal

1. Tiene forma acampanada.


2. Es simtrica respecto a la recta X =
3. Es asinttica respecto al eje X

En el grfico anterior se aprecia dos distribuciones normales con igual promedio pero
diferente desviacin estndar (a menor desviacin estndar los datos estn ms cerca de
la media)

9.3 Distribucin Normal Estndar

Si X N( , 2), entonces la v.a.c. Z = (X - ) / se dice tiene distribucin normal


estndar; su media es 0, su variancia 1 y su funcin de probabilidad es:

1 12 z 2
f z e , z
2

Prueba

X X EX
E Z E E 0

X X Var X
2
Var Z Var Var 1
2 2

Esta prueba es incompleta porque slo demuestra que la media y la variancia de Z son 0
y 1 respectivamente pero no demuestra que Z tiene distribucin normal (esto es tema de
un libro de Estadstica Matemtica).

153
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Uso de la tabla de la distribucin Normal Estndar

Ejemplo 2
La estatura de los estudiantes universitarios de cierto pas est normalmente distribuida
con una media de 167.85 cm y desviacin estndar 10.37 cm.

a. Si un estudiante es seleccionado al azar Cul es la probabilidad de que mida menos


de 179 cm?

Sea la v.a.c. X = Estatura de los estudiantes universitarios de ese pas (cm).


X N( , 2) N(167.85, 10.372)
X 179 167.85
P X 179 P P Z 1.07522 P(Z 1.08) 0.8599
10.37
Notacin: Z 0.8599 1.08
Se puede afirmar que el percentil 85.99 de las estaturas es igual a 179 cm y que el
85.99% de los estudiantes mide menos de 179 cm.

b. Halle la probabilidad de que la estatura de un estudiante que va a ser escogido al azar


mida por lo menos 152 cm.

X 152 167.85
P X 152 P P Z 1.53 1 P Z 1.53 1 0.0630 0.9370
10.37

c. Si se est buscando estudiantes universitarios que midan entre 165 y 195 cm para
un casting de TV Qu porcentaje de estudiantes cumplen con esa condicin?

P 165 X 195 P 0.28 Z 2.62 P Z 2.62 P Z 0.28


P 165 X 195 0.9956 0.3897 0.6059

154
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

d. Si se eligen independientemente 9 estudiantes. Encuentre la probabilidad de que siete


de ellos midan menos de 179 cm.

Exito E X 179 , P E P X 179 0.8599


Sea la v.a.d. Y = Nmero de estudiantes con X 179

Y Binomial n, Binomial 9, 0.8599


9
P Y 7 0.8599 0.1401 0.2457
7 2

e. Cul es la altura mnima que debe tener un bus de transporte para que el 97.06% de
los estudiantes viaje de pie sin dificultad?

Segn el problema si k es esa altura, entonces:


X k 167.85 k 167.85
P X k 0.9706 P PZ
10.37 10.37
k 167.85
Z 0.9706 1.89 k 187.4493 cm.
10.37

Ejercicio 2. Las notas del examen final del curso de Informtica se distribuyen
normalmente con media 12 puntos y variancia 4 puntos2. Si se elige un alumno al azar:

a. Qu porcentaje de alumnos estn aprobados (nota mayor a 11)?

b. Si se eligen 8 estudiantes al azar cul es la probabilidad que 2 de ellos hayan


aprobado el curso?.

155
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 3. El dimetro del punto producido por una impresora tiene una distribucin
normal con media igual a 0.002 pulgadas y desviacin estndar de 0.0004 pulgadas.
a. Cul es la probabilidad de que el dimetro del punto sea mayor que 0.0026 pulgadas?

b. Cul es la probabilidad de que el dimetro del punto est entre 0.0014 y 0.0026
pulgadas?

9.4 Distribuciones muestrales asociadas a la Distribucin Normal

Definicin de Estadstico

Un estadstico es cualquier cantidad cuyo valor se puede calcular a partir de datos


muestrales. Antes de obtener datos, hay incertidumbre en cuanto a qu valor resulta de
cualquier estadstico particular. Por lo tanto, un Estadstico es una variable aleatoria y
estar denotada (casi siempre) por una letra mayscula; una minscula se emplea para
representar el valor calculado u observado del Estadstico.

Ejemplo 3
La media muestral X , es un estadstico, (variable aleatoria) y x , es el valor calculado
del estadstico. La variancia muestral S2, es un estadstico, (variable aleatoria) y s2 es el
valor calculado del estadstico.

Definicin de Muestra Aleatoria


Una muestra aleatoria es un subconjunto de la poblacin obtenida al azar.

Distribucin de la Media Muestral ( X )

Sea X1, , X n una muestra de una distribucin con media y desviacin estndar
.Entonces:

156
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Si el muestreo es con reemplazo de una poblacin finita o con o sin reemplazo de una
poblacin infinita:

En este caso la muestra es aleatoria y se cumplen las siguientes igualdades:



a. E X X

2
b. Var X 2
X
y X
n n

El caso de una poblacin con distribucin normal

Si X1, , X n es una muestra aleatoria de una distribucin normal con media y


desviacin estndar . Entonces, para cualquier n, X est normalmente distribuida
2
con media y variancia
n

El caso de una poblacin con distribucin no normal

El teorema del lmite central

Este teorema fundamental de la Estadstica fue enunciado por primera vez por P.S Laplace
en 1812 luego en 1901 A. Liapounoff hizo una demostracin rigurosa en condiciones
bastante generales.

Si X1, , X n es una muestra aleatoria de una distribucin con media y desviacin


estndar . Entonces, para n suficientemente grande, X est distribuida
2
aproximadamente en forma normal con media y variancia .
n

Ejemplo 4
El tiempo que demora una rata de cierta subespecie seleccionada al azar, para que se
duerma despus de aplicrsele un somnfero experimental, es una variable aleatoria
distribuida con 1.5 min y 0.35 min. Suponga que se seleccionan n ratas y denote
por X1, , X n sus tiempos hasta dormirse.

a. Si el tiempo que demora una rata tiene distribucin normal y X1, , X 5 es una muestra
aleatoria de tamao 5 de esa poblacin. Calcule la probabilidad de que la media de
la muestra sea a lo ms 2 min.

Solucin:


E X X 1.5

0.35
2
2

Var X 2
X
n

5
0.0245 y X
n
0.1565

X X 2 1.5

P X 2 P


0.1565
P Z 3.19 0.9993
X

157
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Si el tiempo que demora una rata tiene distribucin desconocida y X1, , X 40 es una
muestra aleatoria de tamao 40 de esa poblacin. Calcule la probabilidad aproximada
de que el tiempo de demora promedio est entre 1.35 y 1.60 min.

Solucin:
Por el teorema del lmite central el tiempo promedio de la muestra tiene,
aproximadamente, distribucin normal con
0.35
2
2

E X X 1.5
Var X 2
X
n

40
0.0030625 .

1.35 1.5 X X 1.60 1.5


P 1.35 T 1.60 P P 2.71 Z 1.81
0.0030625 X 0.0030625

P Z 1.81 P Z 2.71 0.9649 0.0034 0.9615

Ejercicio 4. Sea la variable aleatoria X la cantidad de radiacin que puede ser absorbida
por un individuo antes que le sobrevenga la muerte. Suponga que X es normal con media
de 500 roentgen y una desviacin estndar de 150 roentgen.

a. Qu porcentaje de individuos podrn absorber entre 350 y 430 roentgen de radiacin


antes que le sobrevenga la muerte?

b. Si se extrae una muestra de 20 individuos, cul es la probabilidad que la cantidad


media de radiacin absorbida por un individuo antes de morir se encuentre entre 450
y 550 roentgen?

158
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 5. Sea X una variable aleatoria con funcin de probabilidad

X -1 0 1 2
f (x) 0.3 0.4 0.2 0.1

de la cual se toma una muestra de tamao 36.

a) Halle la probabilidad que el promedio muestral sea menor a 0.34.

b) Si se sabe que el promedio muestral es menor que 0.34, cul es la probabilidad que
el promedio muestral sea mayor o igual a 0.26?

Distribucin de una proporcin por muestreo (p)

Suponga que X1, ,Xn es una muestra aleatoria de n alumnas universitarias de Lima y
se estudia si una alumna mide ms de 1.75 m. Por lo tanto X i Binomial(1,) i=1,,n;
es decir Xi=1 si la alumna mide ms de 1.75 y Xi=0 de otro modo. La proporcin muestral
n

X i
de alumnas que miden ms de 1.75 mt. es p i 1
que como se observa es un
n
promedio muestral pero que se basa en una muestra aleatoria de una distribucin
Binomial(1,). Por lo tanto, si n es grande y utilizando el teorema del lmite central se
puede asegurar que p tiene una distribucin aproximadamente normal con media =
2 (1 )
y variancia y por lo tanto se puede estandarizar de la siguiente manera
n n

159
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

p
Z . La expresin anterior tiene una distribucin normal con media cero y
(1 )
n
variancia uno. A continuacin se presentan los casos de la distribucin p con muestras
aleatorias y con muestras aleatorias simples.

Uso del teorema del lmite central

Si n es suficientemente grande (n 30), por el teorema del lmite central se puede


afirmar que:
p k k
P p k P P Z
p p
p

Ejemplo 5
En un proceso de produccin el porcentaje de unidades defectuosas producidas es 3%.
Para controlar el proceso, se revisan peridicamente los artculos producidos.
Si el proceso de produccin se para al encontrar al menos 5% de unidades defectuosas
producidas al revisar una muestra aleatoria de 200 artculos cada vez. Halle la
probabilidad aproximada de que el proceso contine.

Solucin
La proporcin muestral tiene una distribucin aproximadamente normal. Esto se puede
afirmar por el Teorema del Lmite Central (n grande).
1
p Normal , 2
Aprox. n


p 0.05 0.03
P p 0.05 P P Z 1.65 0.9505
1 0.0121

n

Ejemplo 6
El contenido de slidos solubles (en grados Brix B) en muestras de chirimoya tiene
distribucin normal siendo su esperanza matemtica es 7.78 B y su desviacin estndar
2.54 B. Un especialista selecciona una muestra aleatoria de 80 muestras de chirimoya.
Calcule la probabilidad de que la proporcin muestral de esas muestras de chirimoya con
un contenido de slidos solubles menor de 9.88 B sea menor de 0.72.

Solucin
Sea X el contenido de sustancias solubles en B.
X Normal 7.78, 2 2.542
La probabilidad de que una muestra de chirimoya tenga un contenido menor de 9.88 B
es:
X 9.88 7.78
P X 9.88 P P Z 0.83 0.7967
2.54

160
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

La proporcin muestral tiene una distribucin aproximadamente normal. Esto se puede


afirmar por el Teorema del Lmite Central (n grande).
1
p Normal , 2
Aprox. n


p 0.72 0.7967
P p 0.72 P P Z 1.71 0.0436
1 0.7967 0.2033

n 80

Ejercicio 6. De una empresa se escoge una muestra aleatoria de 300 empleados para
una encuesta sobre condiciones laborales. Halle la probabilidad aproximada de que la
proporcin muestral a favor de las condiciones laborales est comprendido en el intervalo
0.76 y 0.84, si se estima en 80% del total de empleados el porcentaje a favor de las
condiciones laborales.

Ejercicio 7. El diez por ciento de las personas de cierta comunidad tiene sangre tipo B.
Si se selecciona una muestra aleatoria de 900 personas de esa comunidad. Cul es la
probabilidad de que la proporcin muestral de personas con sangre tipo B?

a) Sea al menos 7.2%

b) Sea a lo ms 10.5%

161
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Distribucin de la diferencia de promedios muestrales X 1 X2


Si de dos poblaciones independientes distribuidas con medias 1 , 2 y variancias 12 ,
22 , se extraen muestras de tamaos n1 y n2 , respectivamente; entonces, la variable
aleatoria X 1
X 2 (diferencia de promedios muestrales) tendr una distribucin normal
con media y variancia:

Si las muestras son aleatorias (con o sin reemplazo) de poblaciones normales o se cumple
con el teorema del lmite central con otro tipo de distribucin.
2 2
X 1X 2
1 2 y 2X 1 X 2 1 2
n
1 n2

Ejemplo 7
El tiempo que lleva efectuar un procedimiento de montaje para el mtodo 1 tiene
distribucin con media 35 seg. y variancia 20 seg2 mientras que con un mtodo 2 tiene
distribucin con media 31 seg. y variancia 17 seg 2. Si se selecciona una muestra de 40
empleados entrenados con el mtodo 1 y 50 entrenados con el mtodo 2.

Halle la probabilidad de que el promedio muestral con el mtodo 1 exceda al promedio


muestral con el mtodo 2 en por lo menos 5 seg.

12 22 20 17
X 1 X 2 N 1 2 , N 35 31, N 4, 0.84
n1 n2 40 50
X 1 X 2 X X 54

P X1 X 2 5 P X1X 2
1 2
P Z 1.09 0.1379
0.84

Ejercicio 8. La estatura promedio de un soldado del ejrcito del pas A es de 172.5 cm


con una desviacin estndar de 5 cm. En tanto que para un soldado del ejrcito del pas
B es de 167.5 cm y 2.5 cm respectivamente. Si se selecciona una muestra aleatoria de
90 soldados en cada uno de los ejrcitos, cul es la probabilidad de que la estatura
promedio de la muestra del ejercito B sea inferior al del ejrcito A en 4.5 cm o menos?

162
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 9. En una inspeccin de control de calidad de focos se encontraron los


siguientes resultados:
1. En la empresa A, se obtuvo un promedio de vida til de 30 meses con una desviacin
estndar de 4 meses.
2. En la empresa B, se obtuvo un promedio de vida til de 40 meses con una desviacin
estndar de 6 meses.

Al seleccionar una muestra de 100 focos de A y 80 de B, Cul es la probabilidad que el


promedio de vida til de los focos fabricados por B supere en ms de 8 meses del
promedio de vida til de los focos fabricados por A?

Distribucin de la diferencia de proporciones muestrales ( p1 p2 )


Si p1 y p2 son las proporciones muestrales de dos poblaciones independientes con
proporciones poblacionales 1 y 2 , y de estas poblaciones se extraen muestras de
tamaos n1 y n2 , respectivamente, entonces, la diferencia de proporciones
muestrales p1 p2 tiene una distribucin con media p p 1 2
1 2
y variancia:

1 1 1 2 1 2
2p p
1 2
n1 n2

Uso del teorema del lmite central


Si las muestras son suficientemente grandes entonces:
p1 p2 aprox
N 1 2 , 2p1 p2
La forma de la variancia depende de si la muestra es aleatoria o aleatoria simple.

Ejemplo 8
Si para elaborar un artculo se usan, independientemente, las mquinas I y II, y se sabe
que la probabilidad de producir un artculo defectuoso con la mquina I es 0.15 y 0.08
con la mquina II. Si se eligen al azar 80 artculos producidos por I y 100 producidos por
II, halle la probabilidad de que la proporcin de defectuosos de la muestra de I supere a
la de II en ms de 0.06, si las muestras son aleatorias.

163
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Solucin
0.15 0.85 0.08 0.92
p1 p2
aprox N 1 2 , 2p1 p2 aprox N 0.15 0.08,
80

100


aprox N 0.07, 0.00233
0.06 0.07
P p1 p2 0.06 P Z P Z 0.21 0.5832
0.04827

Ejercicio 10. Se sabe que van a la universidad en movilidad propia el 40% de los
estudiantes de la Universidad L y el 30% de la Universidad S. Si se toman al azar
muestras de 80 y 90 estudiantes respectivamente, halle la probabilidad de que la
proporcin de la muestra de la Universidad L supere a la de S en ms de 9%.

Ejercicio 11. Dos mquinas A y B producen el mismo artculo. Se sabe que la proporcin
de artculos defectuosos producidos por A es de 0.06 y por B es de 0.04. Si se obtiene
una muestra aleatoria de 50 artculos para cada una de las mquinas, halle la probabilidad
que la proporcin de defectuosos de la muestra A sea superior a la proporcin de
defectuosos de la muestra de la mquina B en ms de 0.01.

164
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Prctica Dirigida N 6

1. El tiempo que tarda un proceso de ensamblaje de un artculo puede modelarse como


una variable aleatoria exponencial con una media de 5.5 minutos.

a. Cul es la probabilidad que el proceso de ensamblaje de un artculo dure entre


3.8 y 6.8 minutos?

b. Cunto tiempo como mnimo debe tener un artculo para ser considerado dentro
del 28.5% de los mayor tiempo de ensamblaje?.

c. Halle el RI.

d. Halle el medio del tiempo de ensamblaje y su coeficiente de variacin.

165
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

2. La escuale de manejo El Rpido, estima que el nmero de horas de prctica


necesarias para la obtencin del permiso de conducir para una persona sigue una
distribucin normal con media 24 horas y desviacin estndar 4 horas.

a. Cul es la probabilidad de obtener el permiso de conducir con al menos 20 horas


de prcticas de manejo?

b. Cul debe ser el nmero de horas como mximo, para que una persona sea
considerada dentro del 22% con menos horas de prcticasde manejo?

c. Si una escuela de manejo cobra S/ 35 por hora de prctica ms S/ 45 por


gastos de administrativos. Calcule el ingreso esperado por alumno que tendr
la escuela.

d. Si se extrae una muestra aleatoria de 35 personas, cul es la probabilidad


que el nmero promedio de horas de manejo para obtener la licencia de
conducir sea entre 18 y 26 horas?.

166
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

e. Si se sabe que el 18.5% de las personas desaprueban en la primera vez el


examen de manejo, para una muestra de 120 personas halle la probabilidad
que la proporcin muestral que desaprueban el examen por primera vez sea a
lo ms el 15.5%.

f. La escuela desea hacer una evaluacin respecto al gnero. Se tiene que el


nmero de horas para obtener la licencia de conducir tiene una distribucin
normal, con media de 22 horas y desviacin estndar de 5 horas para los
hombres, mientras que para las mujeres su media es de 28 horas y desviacin
estndar de 8 horas. Halle la probabilidad que el nmero de horas promedio
para tener una licencia de las mujeres sea mayor que el de los hombres en
ms de 3 horas.

167
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

EJERCICIOS PROPUESTOS

1. El tiempo, en horas, de reparacin de un automvil es una variable aleatoria X con


distribucin exponencial. En promedio se demora 4.48 horas.
a. Calcular la probabilidad de que un automvil este ms de 3 horas, si lleva al
menos media hora siendo reparado.
b. Hay un 10% de automviles que son los que requieren de mayor tiempo para
reparacin. Cuntas horas se requiere como mnimo para reparar un
automvil de este tipo?

2. Suponga que la duracin en minutos de las llamadas telefnicas que llegan en forma
independiente a una central telefnica es una variable aleatoria con distribucin
exponencial, con media de 2 minutos por llamada. Cul es la probabilidad que una
llamada dure entre 1 y 4 minutos?

3. El tiempo de incapacidad por enfermedad de los empleados de una compaa en un


mes, tiene distribucin normal, con media 100 horas y desviacin estndar de 20
horas.
a) Cul es la probabilidad de que el tiempo por incapacidad del siguiente mes se
encuentre entre 50 y 80 horas?
b) Cunto tiempo de incapacidad deber planearse para que la probabilidad de
excederlo sea slo 0.1?

4. Suponga que se estima que el 70% de los jvenes de Lima y el 63% de los jvenes
de Arequipa considera que escuchar msica clsica es un buen hbito. Si se toman
muestras de tamao 50 de jvenes de Lima y 60 de jvenes de Arequipa, halle la
probabilidad de que la proporcin de la muestra de Lima supere a la de Arequipa en
menos de 0.05, si Las muestras son aleatorias simples (sin reemplazo), habindose
elegido la primera muestra de 900 jvenes limeos y la segunda de 1400 jvenes
arequipeos.

5. El promedio y la desviacin estndar de las medidas de los dimetros interiores de


ciertos tubos de desage son respectivamente 34.1 cm y 1.5 cm. Si se toma una
muestra de 100 tubos, Cul es la probabilidad de que la media de esta muestra
aleatoria est entre 34 cm. y 34.5 cm?

6. En una poblacin, el 20% de las familias estn suscritas al diario El Comercio, cul
es la probabilidad de que al seleccionar una muestra de 225 familias, la proporcin
de familias suscritas a dicho diario sea menor al 16%?

7. La presin sangunea sistlica de los hombres de 20 a 24 aos se distribuye


normalmente con media 123 y con una desviacin tpica de 137. Si se selecciona al
azar a uno de estos hombres, cul es la probabilidad que su presin sangunea sea
mayor a 139.44?

8. El tiempo que necesita un alumno para terminar el examen final de Qumica General
se distribuye normalmente con una media de 110 minutos y una desviacin estndar
de 8 minutos; mientras que el tiempo que necesita un alumno para terminar el
examen final de Fsica General se distribuye normalmente con una media de 115
minutos y una variancia de 49 minutos2.
a. Si un alumno termina el examen de Fsica General en menos de una hora y media
se puede suponer que domina el curso. Si se selecciona un alumno al azar, cul
es la probabilidad de que domine el curso?
b. Si se seleccionan al azar 5 alumnos de Fsica General, cul es la probabilidad de
que al menos dos alumnos dominen el curso?

168
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

9. El nmero de clientes que llegan a una agencia bancaria cada 5 minutos tiene una
distribucin Poisson con media 3.2. Se selecciona una muestra aleatoria de tamao
40 de esta distribucin. Calcule la probabilidad de que la media muestral sea mayor
que 2.8.

10. Se sabe que el 52% de adolescentes de cierto distrito fuman. Si se selecciona una
muestra aleatoria de 50 adolescentes de ese distrito, halle la probabilidad de que la
proporcin muestral de fumadores sea mayor que 0.40 pero menor que 0.62

11. Una Empresa Arrocera se tienen dos mquinas agrcolas A y B; las cuales presentan
tiempos de duracin que cumplen la funcin de cosechar arroz en forma independiente
tienen una distribucin normal con un tiempo de vida medio de 12 y 15 aos y con
desviaciones estndar de 1.5 aos y 3 aos respectivamente.

a) El administrador de la empresa est dispuesto a reemplazar slo al 3% de las


maquinas con menor tiempo de duracin. Cul es la duracin lmite para que la
mquina A sea considerada para ser reemplazada?
b) Si se toma una muestra de 50 mquinas agrcolas para cada tipo de mquina (A
y B) Cul es la probabilidad de que la duracin de la media de la muestra de la
mquina B sea como mximo 14 como mnimo 16 aos?
c) Si se toma una muestra de 50 mquinas agrcolas para cada tipo de mquina (A
y B) Cul es la probabilidad de que la media de la muestra de la mquina A difiera
de la mquina B en ms de 1 ao?

12. La vida til de una batera se distribuye como una exponencial con una media de 10
aos. El fabricante ofrece una garanta de un ao. Si la batera falla en ese perodo se
reemplaza por otra, a lo ms una vez. Cul debe ser el tiempo de garanta que el
fabricante debe ofrecer para que solo se devuelva el 2% de las bateras producidas?

13. Una mquina fabrica un determinado producto cuya longitud, en centmetros, tiene
un promedio de 6 cm. y una desviacin estndar de 1.2 cm.

a) Si se toma una m.a. de tamao 25 Cul ser la probabilidad de que se obtenga


un promedio muestral de a lo ms 6.25 cm?
b) Se sabe que el costo de fabricacin, por unidad, est dado por C = 4.5X + 6.5,
donde C es el costo unitario y est dado en soles. Si se toma una muestra aleatoria
de tamao 36 Cul es la probabilidad de que el costo promedio, en esta muestra,
supere los 23.5 soles?

14. Un fabricante de electrodomsticos sabe que la vida til de stos sigue una
distribucin normal con media de 100 meses y desviacin estndar de 20 meses.
Determine el tamao mnimo muestral que garantiza, con una probabilidad de 0.98
que la vida til media de los electrodomsticos en dicha muestra se encuentra
entre 90 y 110 meses.

15. Se sabe que la vida de bombillas elctricas es una variable aleatoria distribuida
normalmente con media desconocida y = 200 horas. El precio de un lote de
1
bombillas es dlares. Un posible comprador propone tomar una muestra aleatoria
5
1
de n bombillas y pagar al productor X dlares por el lote de bombillas. Cul debe
5
ser el valor de n, para que la probabilidad de que comprador no sobre pague ni
subpague al productor con ms de 20 dlares, sea 0.95?

169
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

9.5 Distribucin Ji Cuadrado

La distribucin Ji-cuadrado fue encontrada por primera vez por F.R Helmert en 1876.
Esta distribucin toma el nombre de la letra griega elevada al cuadrado. Esta letra en
castellano se llama Ji y en ingls Chi.

Una v.a X tiene distribucin Ji-cuadrado con m grados de libertad si su funcin de


probabilidad est dada por:

1
m
1 x
m x 2
e 2 si x 0
f x 2 m 2
2


0 si x0

Se debe aclarar que el operador m 2 es una integral definida.

Notacin: X 2m

Caractersticas de una distribucin Ji-cuadrado tpica

Como se aprecia en el grfico anterior:

1. Presenta un sesgo o asimetra positiva.


2. Es asinttica con respecto al eje horizontal en el lado positivo.
3. El rango de la variable considera slo los valores positivos.
4. La distribucin tiene menor sesgo conforme los grados de libertad son mayores
(m 30)
5. Si X 2m , entonces X m y X2 2 m .

Teorema Si Z N(0 , 1) entonces Z


2
21 .

Ejemplo 9
X X
2

Si X N , 2
, entonces Z N 0,1 Z
2
21

Teorema Si J1 , , J n son v.a. independientes que tienen distribucin Ji-cuadrado con


n
m1 , , mn grados de libertad, respectivamente; entonces la v.a V J i 2 n
.
i 1
mi
i 1

170
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Distribuciones muestrales asociadas a la distribucin Ji-cuadrado

Distribucin de la v.a.
n 1 S 2
2
Sea X1, , X n una muestra aleatoria de una distribucin normal con media y
n

n 1 S 2
(Xi X ) 2

desviacin estndar , entonces la v.a i 1


2n 1 .
2
2

Ejemplo 10
Si J 219 , determine el valor de:
a. P J 11.651

Solucin
P J 11.651 = 0.1 Notacin: 11.651 20.1,19
b. P J 15.352

Solucin
P J 15.352 1 P J 15.352 1 0.3 0.7

c. P 15.352 J 30.144

Solucin
P 15.352 J 30.144 P J 30.144 P J 15.352 0.95 0.3 0.65

Ejemplo 11
Si L 225 , halle p1 y p2 tales que: P p1 L p2 0.7 y P L p2 0.1 .
Solucin
P L p1 0.2 p1 20.2,25 18.940
P L p2 0.9 p2 20.9,25 34.382

9.6 Distribucin t de Student

La distribucin t fue empleada por primera vez en un problema de Estadstica importante


por W.S Gosset en 1908 (l escriba bajo el seudnimo de Student).

Una v.a X tiene distribucin t con m grados de libertad si su funcin de probabilidad es:

m 1

f x 2 , x
m 1

m x
2 2
m 1
2 2
Notacin: ~()
171
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Caractersticas de la distribucin t

1. Cada curva t m tiene forma acampanada con centro en 0.


2. Cada curva t m es ms dispersa que la curva normal estndar.
m
3. Si X t m , entonces X 0 y X2
m2
4. Conforme aumenta m, la dispersin de la curva t m disminuye.
5. A medida que m , la curva t m se aproxima a la curva normal estndar.

Teorema
Z
Si las v.as Z N 0,1 y V 2m son independientes, entonces la v.a X t m .
V
m

Distribuciones muestrales asociadas a la distribucin t

Sea X1, , X n una muestra de una distribucin normal con media y desviacin
X
estndar , entonces la v.a t n 1 , siendo:
SX
S2
S X2 , si el muestreo es con reemplazo (muestra aleatoria)
n
Teorema
Si de dos poblaciones normales independientes distribuidas con medias 1 , 2 y
variancias
2
1
2
2
2
, se extraen muestras aleatorias de tamaos n1 y n2 ,

respectivamente; entonces, la variable aleatoria Y


X 1 X 2 1 2
t n1 n2 2 ,
1 1
S p2
n1 n2

siendo: S 2

n1 1 S12 n2 1 S22
n1 n2 2
p

172
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 12

Si R t8 , calcule:

a. P R 2.306

P R 2.306 0.025 Notacin: 2.306 t 0.025,8

b. P R 2.896
P R 2.896 1 P R 2.896 1 0.99 0.01

c. P 3.355 R 0.889
P 3.355 R 0.889 P R 0.889 P R 3.355 0.200 0.005 0.195

d. El valor de c si P R c 0.3

P R c 0.3 c t 0.3,8 0.546

9.7 Distribucin F

Ronald A. Fisher (naci en Inglaterra el 17 de Febrero de 1890 y falleci el 29 de Julio de


1962) fue un gran cientfico, matemtico, estadstico, bilogo evolutivo y genetista. Fisher
aport mucho a la estadstica, siendo una de sus ms importantes contribuciones, la
Inferencia Estadstica creada por l en 1920 (que se estudiar de manera introductoria
en el captulo XI de este libro). A la distribucin F tambin se le llama distribucin F de
Snedecor o distribucin F de Fisher-Snedecor.

Una v.a. X tiene una distribucin F con n y m grados de libertad si su funcin de


probabilidad es:
n
n m n 2 2 1
n
x
f x 2 m , x0
nm
n m n x 2
1
2 2 m
Notacin: X F n, m

173
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Caractersticas de la distribucin F

1. Est definida solamente para valores positivos de la variable.


2. Tiene asimetra positiva.
3. Es asinttica respecto al eje horizontal en su parte positiva.
4. Las distribuciones F n, m tienden a ser simtricas cuando n y m son
suficientemente grandes (mayores que 30)

Teorema
Si U 2n y V 2m , son v.a. independientes, entonces la variable aleatoria
U
U m
X n F n, m
V V n
m

Notacin Si X F n, m y P X k k F ,n ,m

1
F ,n ,m
Propiedad recproca
F1 ,m,n

Distribucin muestral asociada a la distribucin F


Sea X 1 , , X n1 una m.a. de una distribucin normal con variancia 12 y Y1 , , Yn2 otra
m.a. (independiente de las Xi) de una distribucin normal con variancia 22 , y denotemos
por S1
2
y S 22 las dos variancias muestrales. Entonces la v.a:
S12 12
F n1 1, n2 1
S22 22
Ejemplo 13

Si W F 8, 21 , halle:
a. P W 2.42

P W 2.42 0.95 2.42 F 0.95,8,21

b. P W 3.51
P W 3.51 1 P W 3.51 1 0.99 0.01

c. P 2.42 W 3.51
P 2.42 W 3.51 P W 3.51 P W 2.42 0.99 0.95 0.04

d. El valor de k en P k W 2.42 =0.94


P k W 2.42 0.94 P W 2.42 P W k 0.94 P W k 0.01
0.95

1 1
k F 0.01,8,21 0.1873
F 0.99,21,8 5.34
Ntese que se utiliz la propiedad recproca.
174
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

EJERCICIOS PROPUESTOS

1. Una muestra aleatoria de 27 observaciones es tomada de una poblacin normal con


2 16.8 . Hallar la probabilidad de obtener una desviacin estndar muestral entre
2.9909 y 5.2045

2. Un fabricante de alambres de acero afirma que la fuerza promedio requerida para


romper los alambres que fabrica es de 500 Kg. Para verificar esta afirmacin se toma
una muestra aleatoria de 25 trozos de este alambre y se somete a prueba
encontrndose una desviacin estndar de 55 Kg. Suponiendo que las fuerzas de
rompimiento pueden considerarse como valores de una variable aleatoria que se
distribuye normalmente. Cul es la probabilidad de obtener un promedio de
rompimiento entre 481.179 y 518.821 Kg?

3. Si Y tiene distribucin t de Student con 15 grados de libertad. Halle el valor de la


constante K tal que:
P(Y K ) P(Y 1.753 ) 0.95

W ~ 2 Z ~ t ( 20) Y ~ F(8,10)
4. Sea (5)
, , . Usando tablas estadsticas hallar las siguientes
probabilidades:

a) P(W 3)
b)
P(W 11.07 )
c)
P( Z 0.860 )
d)
P( Z 1.325 )

e) P(1.325 Z 1.725)
f) P (Y 3.07)
g) P (Y 5.06)
h) P (3.07 Y 5.06)

175
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Preguntas de Autoevaluacin

1. Dos caractersticas de la distribucin Normal son ___________________________


__________________________________________________________________
2. Dos caractersticas de la distribucin t de Student son: _______________________
___________________________________________________________________
3. Dos caractersticas de la distribucin Chi-cuadrado son: ______________________
___________________________________________________________________
4. Dos caractersticas de la distribucin F de Fisher son: _______________________
___________________________________________________________________
5. Si la variable aleatoria X se distribuye como una exponencial, entonces la probabilidad
que X sea mayor a su media es igual a _____________________ y su coeficiente de
variacin es igual a ___________________.
6. Si X tiene una media poblacional igual a 12.5 y una desviacin estndar de 2.5,
entonces para un muestra n de tamao 50, la distribucin de la media segn el
Teorema del Lmite Central es ______________________________
7. Si la variable aleatoria X~ Bin(10,0.85), entonces para una muestra de tamao 40 la
probabilidad que la media muestral sea mayor a 6 es igual a ________________
8. Si Y ~ Hip(15,8,5), entonces para una muestra de tamao 35 la media muestral se
aproxima a la distribucin _________________ con media y variancia
__________________________.
9. La distribucin normal estndar est asociada a la distribucin muestral de
_________, la distribucin t con la distribucin muestral de _________________, la
distribucin Chi-cuadrado con la distribucin muestral de _____________________
y la distribucin F con la distribucin muestra de _________________________ .

10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:

Item Enunciado V/F


a. La mediana en una distribucin normal estndar es igual a cero
b. En la distribucin t, a medida que aumenta los grados de libertad la
distribucin se aproxima a una normal estndar.
c. Las variables aleatorias distribuidas como una Chi-cuadrado y F toman
slo valores positivos.
d. Las variables aleatorias distribuidas como una Normal y Normal
estndar toman slo valores negativos.
e. Conforme aumenta los grados de libertad de la Chi-cuadrado, la
distribucin tiene mayor sesgo.

176
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

CAPTULO X

INFERENCIA ESTADSTICA

La inferencia estadstica se ocupa de la estimacin y prueba de hiptesis de los


parmetros de una poblacin, en base de una muestra aleatoria extrada de dicha
poblacin.

Objetivo. Entender el proceso de inferencia estadstica para la estimacin (estimacin


puntual y por intervalos) y de prueba de hiptesis de los parmetros de una poblacin.

La inferencia estadstica comprende:

1. La estimacin de parmetros (estimacin puntual y por intervalos de confianza).


2. Las pruebas de hiptesis de parmetros.

10.1 Estimacin puntual de parmetros

Sea X1, , X n una muestra de tamao n de una poblacin con parmetro . Se


denomina estimador puntual de a cualquier estadstico h X , , X cuyo valor
1 n

h x , , x dar una estimacin puntual de . En este caso es una variable


1 n

aleatoria y es un nmero. Los estimadores puntuales para la media, varianza y


proporcin sern:
n

X i
Para la media poblacional (): X i 1
n
n

(X i X )2
Para la variancia poblacional (2): 2 S 2 i 1
n 1

Nmero de xitos
Para la proporcin poblacional (): p
n

Ejemplo 1
De una poblacin de tallas (mt) en madres adolescentes con media y varianza , 2se
extrae una muestra aleatoria 8 madres adolescentes, cuyos valores observados son:
1.50, 1.60, 1.58, 1.45, 1.52, 1.68, 1.62, 1.55. Halle un estimador puntual para la media,
la varianza y la desviacin estndar poblacionales.
8

X i
12.5
Entonces se tiene: X i 1
1.56 mt. , ser una estimacin puntual de .
8 8
8
Clculo de la suma de cuadrados: X
i 1
i
2
19.569
Para la varianza, el estimador puntual ser:
n n
Xi
2
n

X i
2
i 1
n
X i
2
nX
19.569 (12.5) 2 19.569 8 x1.562
S
2 i
i
0.0053
n 1 n 1 7 7

Para la desviacin estndar: S 0.0053 0.073


177
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

10.2 Estimacin de parmetros por intervalo de confianza

Sea X1, , X n una muestra aleatoria de tamao n de una poblacin con parmetro ,
cuyos valores observados o datos respectivos son x1 , , xn . Sea adems, la v.a
h X ,
, X n un valor estadstico, con funcin de probabilidad conocida, que estima
1

a . Si P A B 1 , donde A h1 X 1 , , X n y B h2 X 1 , , X n son v.a.


halladas a partir de la distribucin de h X ,
, X n , entonces se dice que el intervalo
1

aleatorio A, B es el intervalo estimador del parmetro , o que A, B con


probabilidad 1 .

Si a h1 x1 , , xn y b h2 x1 , , xn , son los valores numricos que resultan al


reemplazar los valores de la muestra en las v.a. A y B respectivamente, entonces, se dice
que el intervalo numrico a, b es el intervalo de confianza del 1 100 % para ,
o que a, b con un nivel o grado de confianza del 1 100 %.

Interpretacin

Si con los datos de una muestra aleatoria de tamao n se construy el intervalo a b


con nivel de confianza, por ejemplo, 98% para el parmetro , esto quiere decir que
existe un 98% de confianza que el intervalo a, b contenga al parmetro .

Intervalo de confianza para una media poblacional

Intervalo de confianza para una media poblacional con 2 desconocida

Si X1, , X n es una muestra aleatoria de una poblacin normal con media y variancia
2
desconocida. Para cualquier tamao de muestra se tiene que la variable aleatoria la
X
v.a. t ~ t n -1 , entonces para definir el intervalo de confianza del 1 100 %
S
n
se cumple:


P t1 ; n 1 t1 n t1 ; n 1 P t1 ; n 1
X
t1 ; n 1 1 .
2 2 2 S 2

n
Entonces despejando la expresin anterior, el intervalo con un nivel de confianza del
1 100 % para la media ( ) ser hallado por:


s S
X t 1 ;n 1 X t 1 ;n 1


2 n
2 n

a b
178
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

donde a y b son valores numricos que representan el Lmite inferior y Lmite superior
del intervalo.

s
Lmite inferior: LI ( ) X t 1
2;n 1 n
s
Lmite superior: LS ( ) X t 1 ;n 1
2 n

Intervalo de confianza para una proporcin

p
Se usa la v.a. ~ N(0,1) y n>30, entonces para determinar el intervalo de
(1 )
n
confianza del 1 100 % para la proporcin se cumple:



p
P Z Z Z P Z
Z 1
1 1 1 (1 ) 1
2 2
2 2

n

Entonces despejando la expresin anterior, el intervalo con un nivel de confianza del


1 100 % para la proporcin ( ) ser hallado por:

p 1 p p 1 p
p Z p Z
1 n 1 n
2 2
a b

donde a y b son valores numricos que representan el Lmite inferior y Lmite superior
del intervalo.

Intervalo de confianza para la variancia

Sea X1, , X n una muestra aleatoria de una poblacin normal con variancia 2 ,

(n 1) S 2 (X i X )2
desconocida. Se usa ~ 2n -1 , entonces para determinar el
2
2

intervalo de confianza del 1 100 % para la varianza se cumple:


P 2 2,n1 2n1 21 2,n1 1

2
P 2,n1
n 1 S 2


1
2

2 1 2,n1

179
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Entonces despejando la expresin anterior, el intervalo con un nivel de confianza del


1 100 % para la varianza ( 2 ) ser hallado por:

n 1 s 2 2 n 1 s 2
2

2

1 , n 1 , n 1
2 2
a b

Si se desea obtener los lmites de confianza para la desviacin estndar se obtiene la raz
cuadrada en la expresin anterior obtenindose:

n 1 s 2
n 1 s 2
2
2
1 , n 1 , n 1
2 2
a b

Ejemplo 2
En 2011, se tom una muestra de 35 casas en la Ciudad 1, y se hizo el estudio de las
siguientes variables: X= Peso total de basura producida en una casa durante un da (Kg),
Y= Peso de residuos orgnicos producidos (Kg) en una casa durante un da y Z= Hbito
de reciclaje, obtenindose los siguientes resultados:

Peso Peso residuos Hbito de


Casa total de orgnicos reciclaje
basura
1 2.7 1.8 Si
2 3.0 1.5 No
3 1.5 0.8 No
4 1.8 0.8 No
5 3.0 2.1 Si
6 2.5 1.5 No
7 4.0 2.5 No
8 3.0 1.2 No
9 3.5 2.0 Si
10 5.0 3.7 No
11 1.5 0.8 No
12 2.5 1.3 No
13 2.3 1.3 No
14 3.5 2.8 No
15 5.0 3.5 No
16 4.0 2.1 No
17 4.0 2.6 No
18 3.0 1.2 No
19 2.5 1.0 No
20 2.8 2.0 No
21 2.8 1.9 Si
22 3.5 2.6 No
23 4.0 3.3 No
24 3.0 2.0 No
180
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Peso Peso residuos Hbito de


Casa total de orgnicos reciclaje
basura
25 1.9 1.0 No
26 2.7 1.4 No
27 2.8 1.8 No
28 3.7 2.5 No
29 3.2 2.3 No
30 2.9 1.9 No
31 3.5 2.1 Si
32 3.0 1.3 No
33 5.0 3.4 No
34 3.5 2.7 No
35 4.0 3.2 Si
Clculos:

Peso Peso residual


Total Orgnico

3.160 1.997
x
s 0.884 0.818
n 35 35

Del total de casas, slo 6 tienen hbitos de reciclaje

a. Halle e interprete un intervalo de confianza del 95% para el peso total promedio de
basura producida en una casa durante un da.

Solucin:

1 0.95 0.05 1 0.975 . t 0.975,34 2.032
2
0.884 0.884
3.160 2.032 3.160 2.032 2.856 3.464
35 35

Interpretacin: Se tiene un nivel de confianza de 95% que el peso total promedio de


basura producida en una casa durante un da est en el intervalo 2.856,3.464 Kg.

b. Halle un intervalo de confianza de 95% para la verdadera proporcin de casas que


tienen el hbito de reciclaje en esa ciudad.

Solucin:
6
1 0.95 0.05 1 0.975 . Z 0.975 1.96 y p
0.1714
2 35
0.1714 x(1 0.1714) 0.1714 x(1 0.1714)
0.1714 1.96 0.1714 1.96
35 35
0.0465 0.2963

Interpretacin: Se tiene una confianza de 95% que la verdadera proporcin de casas


que tienen el hbito de reciclaje, est en el intervalo 0.0465 , 0.2963 .

181
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c. Halle e interprete un intervalo de confianza del 95% para la varianza y desviacin


estndar del peso de los residuos orgnico.

Solucin:

1 0.95 0.05 1 0.975 20.975,34 51.966 y 20.025,34 19.806
2

(n 1) S 2 (n 1) S 2 (35 1)0.8182 (35 1)0.8182


2 2 0.438 2 1.149
21 ;n 1 2 ;n 1 51.966 19.806
2 2

Interpretacin: Se tiene una confianza de 95% que la verdadera varianza estndar del
peso de los residuos orgnico se encuentra en el intervalo 0.438, 1.149 Kgs . 2

Para la desviacin estndar: 0.438 1.149 0.662 1.072

Interpretacin: Se tiene una confianza de 95% que la verdadera desviacin estndar


del peso de los residuos orgnico se encuentra en el intervalo 1.615, 2.616 Kg.

Ejemplo 3
Los siguientes datos corresponden a los pesos de destete (X 1) y peso de nacimiento (X2),
en gramos, de una muestra aleatoria de 10 cuyes.

X1 210 174 310 127 174 172 296 362 306 352
X2 140 142 140 90 92 84 156 200 185 180

Asumiendo que ambas variables tienen distribucin normal:

a. Halle un intervalo de confianza de 90% para el verdadero peso medio de destete de


los cuyes.
Solucin:
Peso de Peso al
Destete Nacer

x 248.3 140.9
s 85.7 41.4
n 10 10


1 0.90 0.10 1 0.95 . t 0.95;9 1.833
2
s 85.7
x t1 2,n1 248.3 1.833 , de donde se obtiene: 198.624, 297.976
n 10

Interpretacin: Se tiene una confianza de 90% que el peso promedio de destete,


est en el intervalo 198.624, 297.976 gr.

One-Sample T: PDestete

Variable N Media StDev SE Media 90.0% CI


PDestete 10 248.3 85.7 27.1 ( 198.6, 298.0)

182
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Halle un intervalo de confianza de 98% para la verdadera variancia del peso al nacer
de los cuyes.
Solucin:

1 0.95 0.02 1 0.99 20.99,9 21.666 y 20.01,9 2.088
2

(n 1) S 2 (n 1) S 2 (10 1) x 41 .42 (10 1) x 41.42


2
2
711 .975 2 7387 .759
1 ; n 1
2
; n 1
2
21.666 2.088
2 2

Interpretacin: Se tiene una confianza de 98% que la verdadera variancia del peso al
nacer est en el intervalo 711.975, 7387.759 gr2.
Para hallar el intervalo de confianza para , se sacar la raz cuadrada en ambos
lmites: obtenindose: 26.683,85.952 gr.

Ejercicio 1. Un inspector de calidad est evaluando si el contenido de fruta por lata es


el adecuado. Se supone que el contenido de fruta se distribuye como una normal. El
inspector escoge al azar 35 latas y encuentra que el peso promedio es de 29.2 onzas, la
variancia es de 4 onzas2 y que 5 no tienen un peso adecuado.

a. Halle e interprete un intervalo de confianza del 95% para el peso promedio poblacional.

b. Halle e interprete un intervalo de confianza del 95% para la variancia y desviacin


estndar poblacional del contenido de fruta en las latas.

183
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c. Halle e interprete un intervalo de confianza del 99% para la proporcin poblacional de


latas que presentan un peso adecuado

Ejercicio 2. Un fabricante de fibras sintticas disea un experimento para estimar la


tensin de ruptura media de una fibra, observa las tensiones de ruptura, en libras, de 16
hilos seleccionados al azar y se obtiene los siguientes resultados:

Descriptive Statistics: Tensin


Variable N Media StDev Minimo Maximo
Tensin 16 20.381 0.523 19.600 21.100

a. Con una confianza del 95%, halle el intervalo de confianza para la tensin de ruptura
media de las fibras sintticas. Interprete.

b. Halle e interprete un intervalo del 90% de confianza para la variancia de la tensin de


ruptura media de las fibras sintticas.

184
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

10.3 Determinacin del Tamao de Muestra

A continuacin se presenta la manera de hallar el tamao de muestra cuando se estima


a la media poblacional o cuando se estima a la proporcin poblacional .

Determinacin del tamao de muestra para estimar a la media poblacional


x t 2s2
Se sabe que: t , despejando se obtiene el tamao de muestra:
s/ n n 2
e
Donde:
e es el margen de error que se quiere aceptar.
El valor de t t 1
2 depende del nivel de confianza requerido y se trabaja con gl .
La variancia s 2 se obtiene de una muestra piloto.

Determinacin del tamao de la muestra para estimar la proporcin poblacional

Se sabe que:
p Z 2 1
Z
(1 )
, despejando se obtiene el tamao de muestra: n
e2
n

Donde:
e es el margen error permisible.
El valor de Z Z 1 depende del nivel de confianza requerido
2

es el parmetro que se desea estimar y como es desconocido, entonces se puede


tomar una muestra piloto para obtener un valor estimado. Se puede utilizar el valor
conservador igual a 0.5.

Ejemplo 4
Una famosa cadena de hoteles desea desarrollar un intervalo de confianza del 99% para
estimar el nmero promedio de habitaciones ocupadas cada noche en sus sucursales de
toda la nacin. Cuntas noches deben incluirse en la muestra si se puede tolerar un
error de 10 habitaciones y una muestra piloto revela una desviacin estndar de 60
habitaciones?

Solucin:
t 2s2 2.582 x602
0.01 t 1 , t 0.995, 2.58 n 2 239.63 240 noches
2 e 102

185
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 5
Cuntos estudiantes debe tener una muestra, con el fin de estimar la proporcin de
estudiantes que tienen correo electrnico? En un estudio previo, se hall que de 150
estudiantes, 120 tenan correo electrnico. Se desea tener un nivel de confianza del 95%
y un error del 3% en las estimaciones.

Solucin:

120 1.962 0.8 0.2


p 0.8 , Z 0.975 1.96 , entonces n0 682.95 683 y por lo tanto:
150 0.032
En el siguiente cuadro se presenta las estimaciones de tamaos de muestra para
diferentes valores de margen de error:

Margen de error n
0,01 6146,560
0,02 1536,640
0,03 682,951
0,04 384,160
0,05 245,862
Se observa un incremento exponencial de tamao de muestra al disminuir el margen de
error.

Ejercicio 3. Cul debe ser el tamao de muestra para estimar el nivel medio del
consumo de protenas de los adultos de una zona minera, si se desea tener un margen
de error de 0.45 g/dl y un nivel de confianza del 95%?. De una muestra piloto se obtuvo
que el consumo de protenas tiene una desviacin estndar de 2.5 g/dl.

Ejercicio 4. El director comercial de cierta compaa que realiza ventas por correo
electrnico, desea precisar con mucho cuidado su poltica de crdito. Si el director desea
tener un intervalo de confianza del 99% para la proporcin de clientes que estn al da
en sus pagos. Qu tamao de muestra debe usar si se desea tener un margen de error
del 4.5%?. Suponga que en una muestra piloto de 35 clientes se hall que 8 clientes
estn al da en sus pagos.

186
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

10.4 Prueba de hiptesis

Una hiptesis estadstica, es cualquier afirmacin o suposicin que se hace acerca del tipo
de distribucin de probabilidad de la poblacin o al valor o valores de uno o ms
parmetros de la poblacin.

Ejemplo 6
Las siguientes son hiptesis estadsticas:

a) El peso promedio de destete de ciertos cuyes es 230 gr.


b) La proporcin de casas con hbitos de reciclaje es mayor que 0.15
c) La variancia de los dimetros de ciertos rboles es 0.95 m 2
d) Son iguales los pesos promedios al nacer de dos tipos de cuyes (I, II) que se
distribuyen normalmente con variancias iguales 1 2
2 2

Hiptesis nula y alterna

Hiptesis nula (H0 o Hp). Es la hiptesis que es aceptada provisionalmente como


verdadera y cuya validez ser sometida a verificacin experimental. Los resultados
experimentales nos permitirn seguir aceptndola como verdadera o si debemos
rechazarla como tal.

Hiptesis alterna (H1 o Ha). Es la hiptesis que se acepta en caso de que la hiptesis
nula sea rechazada. H1 es la suposicin contraria a H0.

Prueba de hiptesis estadstica es el proceso mediante el cual se toma la decisin de


aceptar o rechazar la hiptesis nula.

La aceptacin de una hiptesis nula, significa que los datos de la muestra no proporcionan
evidencia suficiente para rebatirla. El rechazo significa que los datos de la muestra lo
rebaten.

Tipos de pruebas de hiptesis

El tipo de prueba depende de la forma de la hiptesis alterna:

a. Prueba de hiptesis bilateral o de dos colas, si:

H 0 : 0 contra H1 : 0

b. Prueba de hiptesis unilateral o de cola a la derecha, si:

H 0 : 0 contra H1 : 0 , o
H 0 : 0 contra H1 : 0

c. Prueba de hiptesis unilateral o de cola a la izquierda, si:

H 0 : 0 contra H1 : 0 , o
H 0 : 0 contra H1 : 0

Donde es el parmetro de inters y o el valor supuesto que puede tomar el parmetro.

187
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Errores tipo I y tipo II

Al tomarse una decisin respecto a una hiptesis nula (H 0), se puede presentar cuatro
posibles casos que determinan si la decisin tomada es correcta o incorrecta, esto se
presenta en la siguiente tabla:

Decisin H0 verdadera H0 falsa


Aceptar H0 Decisin correcta Error tipo II
Probabilidad = 1 Probabilidad =
Rechazar H0 Error tipo I Decisin correcta
Probabilidad = Probabilidad = 1

Error tipo I, es el error que se comete cuando se rechaza una hiptesis nula que es
verdadera en la poblacin.

Error tipo II, es el error que se comete cuando se acepta una hiptesis nula que es falsa
en la poblacin.

Nivel de significacin ( ). De una prueba de hiptesis, es la probabilidad de cometer


error tipo I.

La probabilidad de cometer error tipo I se denota por , entonces:


= P(error tipo I) = P(rechazar una hiptesis nula verdadera)

La probabilidad de cometer error tipo II se denota por , entonces:

= P(error tipo II) = P(aceptar una hiptesis nula falsa)

Potencia de prueba. Es igual a 1 - , es la probabilidad de rechazar una hiptesis nula


que es falsa.

Regin crtica y regla de decisin.

La regla de decisin involucra la divisin de la distribucin muestral del estadstico


2
(como X , S etc.) de la prueba en dos partes mutuamente excluyentes: a regin de
rechazo o regin crtica (R.C) de la hiptesis nula, y la regin de aceptacin (R.A) o no
rechazo de la hiptesis nula. La divisin depende de la forma de la hiptesis alternativa,
del nivel de significacin y de la distribucin muestral del estadstico.

188
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Supuestos para las pruebas de hiptesis.

Para las diferentes pruebas de hiptesis se deben cumplir los siguientes supuestos:

1. Prueba de hiptesis para una media poblacional ( ), para la variancia poblacional

y para una proporcin .


2

a. La muestra es aleatoria.
b. La muestra proviene de una distribucin normal.

2. Prueba de hiptesis para diferencias de medias poblacionales 1 2 , para la razn


22
de variancias poblacionales 2 y para la diferencia de proporciones 1 2 .
1

a. Las muestras son aleatorias.


b. Las muestras provienen de distribuciones normales.
c. Las poblaciones son independientes.

Procedimiento general de la prueba de hiptesis de un parmetro

1. Formular la hiptesis nula y la hiptesis alternativa.

2. Elegir el nivel de significacin .

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla de las pruebas de hiptesis.

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de


aceptacin de la hiptesis nula (Ho).

5. Decidir el rechazo de la hiptesis nula (Ho), si E c cae en la regin crtica de rechazo.


En caso contrario, no rechazar la hiptesis nula.

6. Conclusin

189
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Tabla de las pruebas de hiptesis

Hiptesis Valores tabulares E1 y E2


referida Prueba Estadstica (E) =/2 para pruebas bilaterales
a : = para pruebas unilaterales
2 desconocida y poblacin normal

tc=
X 0
~ t n 1
t1= - t(1-,n-1)
t2= t(1-,n-1)
s
n


2

2n 1 S 2
2n1 12 2 , n 1
c 2
0
22 2 1 , n 1
p 0
Zc= ~ N(0,1)
0 (1 0 ) Z1= Z()
Z2 = Z(1-)
n

S12 22
/
2 2 Fc 2 2 F n1 1, n2 1 F1= F(, n1-1, n2-1)
2 1 S2 1 F1= F(1-, n1-1, n2-1)

a. 12 y 22 desconocidas pero
homogneas y poblaciones normales. S p2
n1 1 S12 n2 1 S22
X
X 2 1 2 0
n1 n2 2
t1 t 1 , n1 n2 2
1
tc t n1 n2 2
1 1
S p2 t2 t 1 , n1 n2 2
n1 n2
1 2
b. 12 y 22 desconocidas pero s12 s22
2

heterogneas y poblaciones
H 12 2 2
n n
normales.
s12 s22
X 1 X 2 1 2 0
tc t H n1 n2
s12 s22 n1 1 n2 1

n1 n2
t1 t 1 , H
t2 t 1 , H
a. Cuando 1 2 =0
n1 p1 n2 p2
p1 p2 1 2 0 p
Zc N 0,1 n1 n2
1 1
p 1 p
n1 n2
Z1= Z()
Z2 = Z(1-)
1 2
b. Cuando 1 2 0
p1 p2 1 2 0
Zc N 0,1 Z1= Z()
p1 1 p1 p2 1 p2 Z2 = Z(1-)

n1 n2

190
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 7
(En este ejemplo se usan los resultados del estudio durante 2011 de la ciudad 1 del
ejemplo 2 y datos ya calculados de la cuidad 2 para ese mismo ao). Se estudi el peso
total de basura producida por casa durante un da en dos ciudades, para lo cual se
tomaron dos muestras de tamaos 35 y 40 respectivamente obtenindose:

Ciudad 1 Ciudad 2

3.1600 3.7575
x
s 0.884 0.3809
n 35 40

Hay evidencias estadsticas para afirmar que el peso total promedio en la ciudad 1 es
3.22 Kg? Use =0.05

1. Formular la hiptesis nula y la hiptesis alternativa.


H 0 : 1 3.22
H1 : 1 3.22

2. Elegir el nivel de significacin. =0.05

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:

tc=
X 1 0 n1 ~t(n-1) Clculo: tc
3.16 3.22 35 0.402
s1 0.884

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.

La prueba es bilateral por la forma de la


hiptesis alternativa H1 : 1 3.22
Regin de rechazo=RR=
t 2.032 t 2.032
Regin de aceptacin=RA=
2.032 Z 2.032

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.

tc = -0.402 cae en la RA, entonces no hay evidencias estadsticas para rechazar la H0


, en otras palabras no se rechaza la afirmacin de que el peso total promedio es 3.22
en la ciudad 1.

191
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 8
Despus de la ejecucin en el 2011 del estudio del peso de residuos orgnicos producidos
por casa durante un da en las ciudades 1 y 2; en el 2012 se volvi a recoger datos en
las mismas dos ciudades, para lo cual se tomaron dos muestras de tamaos 17 y 22
casas respectivamente obtenindose:

Ciudad 1 Ciudad 2

x 1.777 2.115

s 0.718 0.6549
n 17 22

a. Hay evidencias estadsticas para afirmar que el peso promedio de residuos orgnicos
en la ciudad 1 es menor de 2.5 Kg? Use =0.025

1. Formular la hiptesis nula y la hiptesis alterna.


H 0 : 1 2.5
H1 : 1 2.5

2. Elegir el nivel de significacin. =0.025

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:

tc=
X 1 0 n1 ~ t(n-1) Clculo: tc
1.777 2.5 * 17 4.1518
s1 0.718

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.
La prueba es unilateral a la izquierda por la forma de la hiptesis alterna H1 : 1 2.5
Regin de rechazo = RR = {t < -2.120}
Regin de aceptacin = RA = {t-2.120}

Regin de
Aceptacin

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.

tc = -2.120 cae en la RR, entonces hay evidencias estadsticas para rechazar la H0 , en


otras palabras se acepta la afirmacin de que el peso promedio de residuos orgnicos
es menor que 2.5 Kg en la ciudad 1.

192
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Hay evidencias muestrales para establecer que el promedio de los residuos orgnicos
de la ciudad 2 excede al de la ciudad 1 en ms de 1 Kg? Use =0.10

Solucin

Caso: Prueba de hiptesis para 2 1 con 12 y 22 desconocidas


Primer Paso.
22
Prueba de hiptesis para 12 22 1
12
1. Formular la hiptesis nula y la hiptesis alterna.

22
H 0 : 12 22 1
12
22
H1 : 12 22 1
12
2. Elegir el nivel de significacin. =0.10

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:

S12 22
Fc ~ F (n1 1, n2 1) ~ F (16,21).
S 22 12
0.7182
Clculo: Fc 1.2019
0.65492

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.
22
La prueba es bilateral por la forma de la hiptesis alternativa H1 : 2 1
2 2
1
1 2

Regin de rechazo = RR = F 16,21; 0.05 0.44 F (16,21; 0.95) 2.16


Regin de aceptacin = RA = 0.44 F 2.16

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.
Fc = 1.2019 cae en la RR, entonces no hay evidencias estadsticas para no rechazar la
22
H0, en otras palabras hay homogeneidad de variancias ( 1 22 1 ).
2

12

193
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Segundo Paso

Caso: Prueba de hiptesis para 2 1 con 12 y 22 desconocidas pero homogneas.

1. Formular la hiptesis nula y la hiptesis alterna.

H o : 2 1 1
H1 : 2 1 1
2. Elegir el nivel de significacin. =0.10

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:

(17 1) * 0.7182 (22 1) * 0.6549 2


S 2
0.46636
17 22 2
p

( 2.115 1.777) 1
tc 3.002
1 1
0.46636( )
22 17

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.

La prueba es unilateral hacia la derecha por la forma de la hiptesis alterna


H 1 : 2 1 1

Regin de rechazo = RR = { t`c 1.69 }


Regin de aceptacin = RA = { tc 1.69 }

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.

tc = 3.002 cae en la RR, entonces hay evidencias estadsticas para rechazar la H 0 y


aceptar la H1, en otras palabras se acepta la afirmacin de que el peso de residuos
orgnicos promedio de la ciudad 2 excede al de la ciudad 1 en 1 Kg.

Ejemplo 9
Se hicieron 9 y 8 observaciones de pH en suelo superficial de cada una de dos diferentes
localidades, obtenindose:

Localidad 1 8.53 8.52 8.01 7.99 7.93 7.89 7.85 7.82 7.80
Localidad 2 7.85 7.73 7.58 7.40 7.35 7.30 7.27 7.27

Suponiendo que en cada localidad el pH tiene distribucin normal.

194
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

a. Se puede afirmar que la verdadera media de valores de pH del suelo en la localidad


1 es por lo menos 8.08? Use =0.05.

Solucin
Localidad 1 Localidad 2

x 8.04 7.47

s 0.285 0.224
n 9 8

1. Formular la hiptesis nula y la hiptesis alternativa.


H 0 : 1 8.08
H1 : 1 8.08

2. Elegir el nivel de significacin. =0.05

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:

tc=
X 1 0 n1 ~ t n 1 t8 Clculo: tc
8.04 8.08 9 0.42
s1 0.285

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.

La prueba es unilateral a la izquierda por la forma de la hiptesis alternativa


H1 : 1 8.08
Regin de rechazo = RR = t 1.86 8

Regin de aceptacin = RA = t 1.86 8

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.

tc = -0.42 cae en la RA, entonces no hay evidencias estadsticas para rechazar la H0,
en otras palabras no se rechaza la afirmacin de que la media del pH es por lo menos
8.08 en la localidad 1.

One-Sample T: Local 1
Test of mu = 8.08 vs mu < 8.08

Variable N Mean StDev SE Mean


Local 1 9 8.0378 0.2852 0.0951

Variable 95.0% Upper Bound T P


Local 1 8.2145 -0.44 0.334

b. Si en realidad 1 8 , Se cometi algn error en la pregunta a). Justifique.

No se rechaz una hiptesis falsa, entonces se cometi error tipo II.

195
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c. Con qu valores del estimador se rechazar la hiptesis planteada en la pregunta


a)?

Se rechazar H 0 si
X 1 0 n1 1.86
X 1 8.08
9 1.86 X 1 7.903
s1 0.285
Se rechazar H 0 si X 1 7.903 .

d. En la localidad 2 la variancia del pH era de 0.022, pero un especialista considera que


ha aumentado Tiene razn el especialista? Use =0.10.

Solucin
Caso Prueba de hiptesis para 22 .

1. Formular la hiptesis nula y la hiptesis alternativa.


H 0 : 22 0.022
H1 : 22 0.022

2. Elegir el nivel de significacin. =0.10

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:

c2
n 1 S22 2 27 . Clculo: c2
8 1 0.2242 15.97
n 1
2 2 2
0.022

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.

La prueba es unilateral a la derecha por la forma de la hiptesis alternativa


H1 : 22 0.022
Regin de rechazo = RR = 12.017 2
7

Regin de aceptacin = RA = 12.017


2
7

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.

c2 = 15.97 cae en la RR, entonces hay evidencias estadsticas para rechazar la H 0 ,


en otras palabras la muestra nos permite afirmar que la variancia aument.

e. Si en realidad 22 0.022 , Se cometi algn error en la pregunta d). Justifique.

Se rechaz una hiptesis planteada verdadera, entonces se cometi error tipo I.

196
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

f. Con qu valores del estimador no se rechazar la hiptesis planteada en la pregunta


d)?

No se rechazar H 0 si:
2 n 1 S22 8 1 S22
12.017 S22 0.038
c
22
0.022
No se rechazar H 0 si: S 0.038 .
2
2

g. Hay homogeneidad de variancias? Use =0.10.

Solucin
22
Caso Prueba de hiptesis para 12 22 1
12
1. Formular la hiptesis nula y la hiptesis alternativa.
22
H 0 : 12 22 1
12
22
H1 : 12 22 1
12
2. Elegir el nivel de significacin. =0.10

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:

S12 22 0.2852
Fc F n1 1, n2 1 F 8, 7 . Clculo: Fc 1.62
S22 12 0.2242

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.
22
La prueba es bilateral por la forma de la hiptesis alternativa H1 : 12 22 1
12

0.29 F 8, 7 3.73
1
Regin de rechazo = RR = F 8, 7
3.50
Regin de aceptacin = RA = 0.29 F 3.73

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.

Fc = 1.62 cae en la RA, entonces hay evidencias estadsticas para no rechazar la H 0 ,


22
en otras palabras hay homogeneidad de variancias ( 2 1 )
2 2

1 1 2

197
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

h. Sugiere la informacin que la verdadera media de valores de pH del suelo difiere para
las dos localidades? Use =0.05.

Solucin
Caso Prueba de hiptesis para 2 1 con 12 y 22 desconocidas y homogneas

1. Formular la hiptesis nula y la hiptesis alternativa.


H 0 : 2 1 0
H1 : 2 1 0

2. Elegir el nivel de significacin. =0.05

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:
X 2 X1 k
tc t n1 n2 2 t15 .
1 1
s 2p ( )
n2 n1

Clculos: s 2p
n1 1 s12 n2 1 s22
8 0.2852 7 0.2242
0.067
n1 n2 2 15

tc
7.47 8.04 0 4.53
1 1
0.067
9 8

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.

La prueba es bilateral por la forma de la hiptesis alternativa H1 : 2 1 1


Regin de rechazo = RR = t15 2.131 t15 2.131
Regin de aceptacin = RA = 2.131 t 15
2.131
5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso
contrario, no rechazar la hiptesis nula.

tc = -4.53 cae en la RR, entonces hay evidencias estadsticas para rechazar la H0 , en


otras palabras la informacin nos permite afirmar que la media de valores de pH del
suelo difiere en ambas localidades.

Two-Sample T-Test and CI: Local 2, Local 1


Two-sample T for Local 2 vs Local 1
N Mean StDev SE Mean
Local 2 8 7.469 0.224 0.079
Local 1 9 8.038 0.285 0.095

Difference = mu Local 2 - mu Local 1


Estimate for difference: -0.569
95% CI for difference: (-0.837, -0.301)
T-Test of difference = 0 (vs not =): T-Value = -4.53 P-Value = 0.000 DF = 15
Both use Pooled StDev = 0.259

198
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 10
La siguiente informacin es el resultado de un experimento para medir el porcentaje de
aumento de peso para ratones jvenes de laboratorio a los que se administr una dieta
estndar y ratones a los que se les dio 2000 partes por milln (ppm) de nitrato (fuerte
dosis) en el agua que bebieron.

Nitrato (1) 12.7 19.3 20.5 10.5 14.0 10.8 16.6 14.0 17.2
Control (2) 18.2 32.9 10.0 14.3 16.2 27.6 15.7

Suponiendo que el porcentaje de aumento de peso con nitrato y del control tienen
distribucin normal.
a. Son homogneas las variancias? Use =0.10.

Solucin

Nitrato (1) Control (2)

x 15.07 % 19.27 %

s 3.558 % 8.053 %
n 9 7
22
Caso Prueba de hiptesis para 2 1
2 2
1
12

1. Formular la hiptesis nula y la hiptesis alterna.


22
H0 : 2 1
2 2
1
1
2

22
H1 : 2 1
2 2
1
1
2

2. Elegir el nivel de significacin. =0.10

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:
S12 22 3.5582
Fc 2 2 F n1 1, n2 1 F 8, 6 . Clculo: Fc 0.195
S2 1 8.0532

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.
22
La prueba es bilateral por la forma de la hiptesis alterna H1 : 2 1
2 2
1
12


0.279 F 8, 6 4.15
1
Regin de rechazo = RR = F 8, 6
3.58
Regin de aceptacin = RA = 0.279 F 4.15

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.
Fc = 0.195 cae en la RR, entonces hay evidencias estadsticas para rechazar la H 0 ,
22
en otras palabras no hay homogeneidad de variancias ( 1 22 1)
2

12

199
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. Determine con =0.01, si una fuerte dosis de nitrato retarda el verdadero promedio
de porcentaje de aumento de peso en ratones.

Solucin

Caso Prueba de hiptesis para 1 2 con 12 y 22 desconocidas y heterogneas

1. Formular la hiptesis nula y la hiptesis alterna.


H 0 : 1 2 0
H1 : 1 2 0

2. Elegir el nivel de significacin. =0.01

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:
X1 X 2 k
tc t H t 8 .
s12 s22

n1 n2
2 2
s12 s22 3.5582 8.0532

Clculos: H n1 n2 9 7
7.825 8
2 2 2 2
s12 s22 3.5582 8.0532

n1 n2 9 7
n1 1 n2 1 8 6

tc
15.07 19.27 0 1.29
3.5582 8.0532

9 7

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.

La prueba es unilateral a la izquierda por la forma de la hiptesis alternativa


H1 : 1 2 0
Regin de rechazo = RR = t8 2.896
Regin de aceptacin = RA = t 2.896
8

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.

tc = -1.29 cae en la RA, entonces hay evidencias estadsticas para no rechazar la H 0 ,


en otras palabras una fuerte dosis de nitrato no retarda el verdadero promedio de
porcentaje de aumento de peso en ratones.

200
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 11
(En este ejemplo se usan los datos de la ciudad 1, del ejemplo 2). Hay evidencias
estadsticas para afirmar que la verdadera proporcin de casas que tienen hbito de
reciclaje es a lo ms 0.15? Use 0.025 .

Solucin
6
p 0.1714
35

Caso Prueba de hiptesis para una proporcin .


Procedimiento
1. Formular la hiptesis nula y la hiptesis alternativa.
H 0 : 0.15
H1 : 0.15
2. Elegir el nivel de significacin. =0.025

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:
p 0 0.1714 0.15
Zc= ~ N(0,1). Clculo: Z c 0.35
0 (1 0 ) 0.15 0.85
n 35

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.

La prueba es unilateral a la derecha por la forma de la hiptesis alternativa


H1 : 0.15

Regin de rechazo = RR = Z 1.96


Regin de aceptacin = RA = Z 1.96

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.

Zc = 0.35 cae en la RA, entonces no hay evidencias estadsticas para rechazar la H0,
en otras palabras la proporcin de casas que tienen hbito de reciclaje es a lo ms
0.15.

Test and CI for One Proportion: Hbitos

Test of p = 0.15 vs p > 0.15

Success = Si

Variable X N Sample p 95.0% Lower Bound Z-Value P-Value


Hbitos 6 35 0.171429 0.066643 0.36 0.361

201
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 12
En una biblioteca universitaria se hace un inventario completo de libros en estantes, una
vez al ao. El bibliotecario propone seleccionar 800 libros al azar de entre la coleccin
de la biblioteca e investigarlos de un modo semejante. Si la evidencia muestral indica
que la verdadera proporcin de libros mal colocados o extraviados es menor 0.02,
entonces el inventario se pospondr. Entre 800 libros buscados, 12 estaban mal
colocados o no se pudieron encontrar.

a. Pruebe las hiptesis pertinentes y asesore al bibliotecario sobre qu hacer. Use =


0.05.

Solucin
12
p 0.015
800

Caso Prueba de hiptesis para una proporcin .

1. Formular la hiptesis nula y la hiptesis alterna.


H 0 : 0.02
H1 : 0.02

2. Elegir el nivel de significacin. =0.05

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:
p 0 0.015 0.02
Zc= ~ N(0,1). Clculo: Z c 1.01
0 (1 0 ) 0.02 0.98
n 800

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.

La prueba es unilateral a la izquierda por la forma de la hiptesis alternativa


H1 : 0.02
Regin de rechazo = RR = Z 1.65
Regin de aceptacin = RA = Z 1.65

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.

Zc = -1.01 cae en la RA, entonces no hay evidencias estadsticas para rechazar la H0,
en otras palabras hay que sugerirle al bibliotecario que haga el inventario.

202
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

b. En otra biblioteca universitaria de 850 libros buscados, 19 estaban mal colocados o


no se pudieron encontrar. Con esta informacin muestral se puede concluir que la
verdadera proporcin de libros mal colocados o extraviados es similar en ambas
universidades. Use =0.05.

Solucin
12 19
p1 0.015 p2 0.022
800 850

Caso Prueba de hiptesis para una diferencia de proporciones 1 2 = 0.

1. Formular la hiptesis nula y la hiptesis alterna.


H 0 : 1 2 0
H1 : 1 2 0

2. Elegir el nivel de significacin. =0.05

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:
p1 p2 1 2
Zc N 0,1 .
1 1

p 1 p
n1 n2
n p n2 p2 800 0.015 850 0.022
Clculos: p 1 1 0.019
n1 n2 800 850

Zc
0.015 0.022 0 1.04
1 1
0.019 0.981
800 850

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.
La prueba es bilateral por la forma de la hiptesis alternativa H1 : 1 2 0
Regin de rechazo = RR = Z 1.96 Z 1.96
Regin de aceptacin = RA = 1.96 Z 1.96

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.

Zc = -1.04 cae en la RA, entonces hay evidencias estadsticas para no rechazar la H 0 ,


en otras palabras la informacin nos permite afirmar la verdadera proporcin de libros
mal colocados o extraviados es similar en ambas universidades.

203
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c. La informacin nos permite afirmar que la verdadera proporcin de libros mal


colocados o extraviados en la universidad 2 es menor que en la universidad 1 en -
0.005. Use =0.05.

Solucin

12 19
p1 0.015 p2 0.022
800 850

Caso Prueba de hiptesis para una diferencia de proporciones 1 2 0.

1. Formular la hiptesis nula y la hiptesis alterna.


H 0 : 1 2 0.005
H1 : 1 2 0.005

2. Elegir el nivel de significacin. =0.05

3. Seleccionar la prueba estadstica apropiada, E, (cuya distribucin depende del valor


estadstico utilizado) y hallar el valor calculado (Ec) de la prueba estadstica. Ver la
tabla:

p1 p2 1 2
Zc N 0,1
p1 1 p1 p2 1 p2

n1 n2
0.015 0.022 0.005
Clculos: Z c 0.30
0.015 0.985 0.022 0.978

800 850

4. Determinar la regla de decisin, estableciendo las regiones de rechazo y de aceptacin


de la prueba.

La prueba es bilateral por la forma de la hiptesis alterna H1 : 1 2 0.005

Regin de rechazo = RR = Z 1.96 Z 1.96


Regin de aceptacin = RA = 1.96 Z 1.96

5. Decidir el rechazo de la hiptesis nula si Ec cae en la regin de rechazo. En caso


contrario, no rechazar la hiptesis nula.

Zc = -0.30 cae en la RA, entonces hay evidencias estadsticas para no rechazar la H 0,


en otras palabras la informacin nos permite afirmar la verdadera proporcin de libros
mal colocados o extraviados en la universidad 2 es menor que en la universidad 1 en
0.005.

204
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 6. Se realiza un control a los conductores deteniendo los autos que circulan a
altas horas de la noche, midiendo a sus conductores el grado de alcohol consumido en
decigramos de alcohol por litro de sangre Se muestra a continuacin el resultado obtenido
en 12 conductores seleccionados aleatoriamente.

Resultados 0.4 0.7 0.5 0.6 0.7 0.6


obtenidos en el
dosaje etlico 0.4 0.7 0.6 0.7 0.6 0.5

a. Suponiendo que los resultados en el dosaje etlico, se distribuyen normalmente. Pruebe


usted la hiptesis que sostiene que el grado medio de alcohol consumido por los
conductores es mayor a 0.4 decigramos de alcohol por litro de sangre. Use = 0.05.
2.

b. Probar la hiptesis que sostiene que la variancia del grado de alcohol consumido por
los conductores que circulan a altas horas de la noche es menor a 0.05 decigramos2
de alcohol por litro de sangre. Use = 0.05.

205
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 7. Un investigador dise un experimento en el que pidi a un determinado


nmero de sujetos que lleven a cabo una tarea especfica en un medio controlado y bajo
dos niveles diferentes de ruido de fondo (el nivel 2 es ms severo que el nivel 1). El
investigador seleccion 44 personas que son capaces de realizar la misma tarea y de
manera prctica en el mismo tiempo.
Los siguientes datos representan los tiempos observados (en minutos) que fueron
necesarios para completar la tarea:

Nivel 1 Nivel 2
n 21 23

x 14.4 18.6
s 2.277 2.450
Asuma que los tiempos observados en cada nivel tienen distribucin normal.

a. Hay evidencias estadsticas para afirmar que el verdadero tiempo medio en el nivel 1
es menor que 15.5 minutos? Use = 0.05.

b. Con qu valores del estimador se acepta la hiptesis planteada en la pregunta a?.

c. Si en realidad el verdadero tiempo promedio con el nivel 1 es 17.5 minutos Se cometi


algn error en la pregunta a?

206
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

d. Si el investigador afirma que la verdadera desviacin estndar del tiempo con el nivel
2 era 2.3, pero un especialista considera que ha aumentado Tiene razn el
especialista? Use =0.10.

e. Si 10 personas a los que se les aplic el primer nivel de ruido excedieron el tiempo
lmite para llevar a cabo la tarea especfica. Pruebe a un =0.05 si ms del 30% de
personas a los que se les aplica el primer nivel de ruido exceden el tiempo lmite para
llevar a cabo la tarea especfica.

207
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

f. Son similares los tiempos medios con ambos niveles de ruido?. Use =0.10.

g. Si 12 personas a los que se les aplic el primer nivel de ruido y 15 personas a lo que
se les aplic el segundo nivel de ruido excedieron el tiempo lmite para llevar a cabo
la tarea especfica. Pruebe a un =0.05 si la proporcin de personas que supera el
tiempo lmite en llevar a cabo la tarea especfica es mayor al aplicar el primer nivel de
ruido que el segundo nivel de ruido.

208
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejercicio 8. Un agricultor desea probar la eficiencia de dos concentraciones de


plaguicidas en muestras de cultivos de frijol canario. Luego de la cosecha se obtuvo los
siguientes resultados de rendimiento en Kg/parcela.
Plaguicida A B
Tamao de muestra 17 19
Rendimiento promedio en Kg/parcela 210 180
Variancia muestral 18.50 58.20

Asumiendo normalidad en los rendimientos (Kg/parcela)

a. Se puede afirmar que el rendimiento de frijol canario es mayor a 185 Kg/parcela


utilizando el plaguicida A? Use = 0.05

b. Se puede afirmar que el rendimiento promedio obtenido utilizando el plaguicida A


supera al plaguicida B en ms de 20 kg/parcela? Use = 0.10

209
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Prctica Dirigida N 7

1. La siguiente tabla muestra datos sobre aumento de peso corporal (grs) para una
muestra de animales de control y una muestra de animales a los que se dio una dosis
de 1 mg/pastilla de cierto esteroide diluido (los animales de control son aquellos que
no recibieron el esteroide).

Tamao de Media Desviacin


Animales
muestra muestral estndar
Control 10 40.5 4.5
Esteroide diluido 8 52.8 2.6

Suponga que el aumento de peso se distribuye normalmente tanto para animales de


control como para los que recibieron el esteroide.

a) Halle e interprete con un nivel de confianza del 98% el aumento promedio de peso
corporal de los animales que se les dio el esteroide diluido.

b) Halle e interprete un intervalo de confianza del 95% la desviacin estndar del


aumento de peso corporal de los animales que no recibieron el esteroide.

c) Se puede concluir que la desviacin estndar del aumento de peso corporal de los
animales que tomaron esteroide es superior a 4.0 gr. Use = 0.05.

210
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

d) Con un nivel de significacin e 0.05, se puede afirmar que hubo una ganancia de
peso corporal de los animales que recibieron el esteroide con respecto a los que
no la recibieron.

211
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

2. La gerencia comercial de la empresa CEREAL S.A que se dedica a la comercializacin


de cajas de cereal en supermercados, desea introducir un nuevo producto con la
finalidad de aumentar su posicionamiento en el mercado de cereales. El nuevo
producto Cheerios se comercializar tambin en bodegas, esperando ser un
producto competitivo. Con esta finalidad la gerencia comercial, ha realizado un
estudio de mercado para evaluar la competitividad y productividad de este nuevo
producto. Para el presente estudio la gerencia de comercializacin se ha planteado
varios objetivos.

Con la finalidad de analizar las empresas de la competencia, se extrae una muestra


aleatoria de 12 bodegas registrando los precios de venta (en soles) del cereal
Cheerios.

4,8 5,9 6,0 6,5 5,8 5,3


4,7 4,9 4,4 6,2 5,8 5,5
a. Mantener el precio de lanzamiento. El gerente de comercializacin decidir
mantener el precio de lanzamiento del nuevo cereal Cheeris de S/. 5.5, si
comprueba que el precio promedio de venta de la competencia es al menos S/.
6.0. Usando un nivel de significacin del 5%, cul ser la decisin del gerente de
comercializacin?.

b. El gerente de comercializacin tambin cree que es importante analizar la


variabilidad del precio de venta de la competencia. El sospecha que la variabilidad
del precio de venta es similar a S/. 0.55. Usando un nivel de significacin de 0.05,
pruebe afirmacin del gerente comercial.

212
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c. Obtener ms del 60% de aceptacin de Cheeris. Con esta finalidad se aplic


una encuesta a 120 personas que compraron el cereal Cheerios, de los cuales 36
dijeron que no seguirin comprando el cereal. Con un nivel de significacin del
4%, se puede concluir que la gerencia comercial ha cumplido este objetivo.

d. Aumentar las ventas de CEREAL S.A. La gerencia de comercializacin desea


determinar si las ventas de la empresa han aumentado significativamente con el
nuevo cereal. La gerencia espera que las ventas promedio con el cereal Cheeris
sean mayores que con el cereal anterior Kereal en ms de $ 30,000. A continuacin
se presentan las estadsticas descriptivas de muestras aleatorias de semanas de
ventas obtenidas con el cereal Cheeris y Kereal. Con un nivel de significacin de
5%, se puede concluir que se la gerencia tienen razn. Suponga que las ventas se
distribuyen normalmente.

Cereal n Media (miles $) Desviacin estndar (miles $)


Cheeris 8 120.0 12.0
Kereal 10 70.0 13.0

213
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

2. Aumentar el porcentaje de cajas vendidas de Cheeris. La gerencia comercial


afirma que el porcentaje de cajas vendidas en el segundo trimestre del cereal Cheeris
a aumentado con respecto al primer trimestre. En el siguiente cuadro se presentan
los resultados del nmero de cajas vendidas para el primer y segundio trimestre, y
para los cereales Cheeris y Kereal. Con un nivel de significacin de 5%, pruebe la
afirmacin de la gerencia comercial.

Trimestre Cheeris Kereal


Primer 5000 3000
Segundo 5850 3150

214
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

EJERCICIOS PROPUESTOS

1. Se estudi la densidad (en gr/cm3) de tres tipos de roca, obtenindose:

Tipo de
n x s
roca
I 14 3.06 0.14
II 18 2.85 0.12
III 22 3.02 0.29

a. Para el tipo de roca III, estime la densidad media con un intervalo de confianza
de 95%.
b. Es la densidad media de la roca tipo II igual a 3 gr/cm3? Use =0.0456.
c. Es la densidad media de la roca tipo III menor que la de tipo I? Use =0.0548.

2. Se est desarrollando un estudio para medir el nivel de estrs promedio de


estudiantes. Se sabe que la poblacin de los puntajes de la prueba para medir el
nivel de estrs de un estudiante preuniversitario se distribuye normalmente con
desviacin estndar de 11 puntos. Calcule un intervalo de confianza para con un
nivel de confianza del 90%, si se elige una muestra aleatoria de tamao 80 ha dado
una media de 72 puntos.

3. Durante una semana, una tienda de grandes almacenes local registr que 8540 de
las 12810 personas que entraron en la tienda hicieron por lo menos una compra.
Tratando esto como una muestra ala azar de todos los clientes potenciales. Hallar un
intervalo de confianza del 90% para la proporcin real de personas que entran en la
tienda y que harn por lo menos una compra.

4. Si en una muestra de 600 estudiantes de Estadstica tomada en universidades del


pas, 360 tienen hermanos en el rea informtica. Cul es el intervalo de confianza
del 90% para la proporcin de todos los estudiantes de Estadsticas que tienen
hermanos en el rea de informtica?. Asuma que el nmero de estudiantes de
Estadstica en todo el pas se estima en 5000.

5. Una planta industrial desea determinar qu tipo de combustible (gas o elctrico)


producir ms energa usada al menor costo. Una medida de la produccin de
energa econmica es la razn cuadrangular calculada tomando la cantidad de
dinero (en dlares) invertido en un uso particular de la planta y dividirla entre la
cantidad liberada de energa (en unidades trmicas). Cuanto ms pequeo es esta
razn, menos es lo que la planta industrial paga por la energa liberada. Se tomaron
muestras aleatorias de 12 plantas que usan combustible elctrico y 15 plantas que
usan combustible a gas, se midi la razn cuadrangular descrita anteriormente
obtenindose:

Planta Elctrica Gas


n 12 15
Media 45.8 35.8
Variancia 67.2 64.5

Asuma que la razn cuadrangular elctrica y a gas tiene distribucin normal.


a. Determine e interprete un intervalo de confianza de 98% para la desviacin
estndar de la razn cuadrangular de plantas con combustible elctrico.
b. Hay homogeneidad de variancias? Use 0.10 .
c. Hay evidencias estadsticas para concluir que en promedio con combustible a gas
se ahorra ms que con combustible elctrico? Use 0.10
215
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

6. Se estudi la cantidad de D.D.T, en partes por milln (ppm), encontrados en tejidos


cerebrales de pelcanos. Con una muestra aleatoria de 10 pelcanos jvenes se
obtuvo una media de 0.041 ppm y una desviacin estndar de 0.017 ppm mientras
que con una muestra aleatoria de 13 pelcanos polluelos se obtuvo una media de
0.026 ppm y una desviacin estndar de 0.006 ppm. Asumiendo que la cantidad de
D.D.T tiene distribucin normal.

a. Hay evidencias estadsticas para establecer que las variancias difieren? Use
0.02 .
b. El contenido promedio de D.D.T en pelcanos jvenes supera al de pelcanos
polluelos en ms de 0.01 ppm? Use 0.02

7. Se sabe que el peso de ciertas bolsas de arroz, embolsadas por una mquina, tiene
distribucin normal. Se tom una muestra aleatoria de 22 bolsas obtenindose una
media de 1.990 Kg y una variancia de 0.0004 Kg 2 .

a. Determine e interprete un intervalo de confianza de 95% para la verdadera


desviacin estndar del peso.
b. La empresa afirma que el verdadero peso promedio de las bolsas es 2 Kg, pero
determinados consumidores dicen que le estn dando menos peso en las bolsas.
Quin tiene la razn? Use 0.05 .
c. Suponga que en realidad el verdadero peso medio es 2 Kg. Se cometi algn
error en la pregunta b? Justifique su respuesta.

8. Un estudio para comparar la actitud de la gente hacia el feminismo con su grado de


autoritarismo. Dos muestras aleatorias fueron usadas, la primera consiste en 24
sujetos con alto grado de autoritarismo y la segunda consta de 22 sujetos con bajo
grado de autoritarismo. Cada sujeto fue evaluado con una prueba de 18 preguntas
donde se revela su actitud frente al feminismo, con una calificacin en una escala de
18 a 90 (Una calificacin alta indica pro-feminismo), obtenindose:

Autoritarismo n x s

Alto 24 68.2 10.4


Bajo 22 54.8 12.5

Hay evidencias estadsticas para afirmar que el nivel de autoritarismo difiere en lo


que se refiere al feminismo?. Use 0.10 para las dos pruebas necesarias.

9. Segn las estadsticas, a lo ms el 35% de los estudiantes universitarios fuman


regularmente. En una muestra aleatoria de 500 estudiantes universitarios se
encontr que 200 fuman regularmente.
a. Tienen razn las estadsticas? Use =0.05.
b. Estime la verdadera proporcin de estudiantes que fuman con un coeficiente de
confianza del 90%. Interprete.

10. Un partido poltico afirma que el 60% de los electores estn de acuerdo con l en
cierto problema. En una muestra aleatoria de 800 electores se encontr que 455
estn a favor.
a. Puede el partido sostener su afirmacin?. Use =0.05.
b. Determine e interprete un intervalo de confianza del 95% para la verdadera
proporcin de electores que estn de acuerdo con ese partido poltico.

216
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

11. En una evaluacin sobre la duracin de llantas mediante su recorrido hasta su


desgaste. Se obtuvieron dos muestras aleatorias de las marcas Greeck y Nico de 30
y 35 llantas respectivamente, los cuales se muestran en la siguiente tabla:

Duracin promedio de Desviacin


Tipo de Tamao de
la llanta (miles de estndar
llanta muestra
km.) muestral

Greeck 20 86 9.8
Nico 25 81 10.4

a) Calcule e interprete un intervalo del 95% de confianza para la duracin promedio


de la marca Greeck.
b) Un primer resultado en este estudio seala que la duracin promedio de las llantas
Greeck es mayor a 86.8 mil kilmetros. Que podra afirmar Ud.? Use = 0.05
c) Se puede afirmar que la variancia de la duracin de las llantas de marca Nico es
menor a 100 (mil km)2? Use = 0.05
d) Se realiz un estudio posterior y se determin que la variancia del tiempo de
duracin de las llantas marca Nico es 89 (mil Km.)2. Se cometi algn error en
la pregunta anterior?
e) De acuerdo a las muestras de llantas tomadas en ambas marcas, Se puede
afirmar que la duracin media de ambas marcas de llantas son similares? Use =
0.10

12. El gerente de una compaa productora de artculos para pintar consulta a un


Ingeniero Estadstico para saber qu tamao de muestra debe tomar para estimar la
cantidad media de pintura contenida en las 9000 latas de un galn producidas. El
Ingeniero Estadstico le pregunta al gerente que margen de error est dispuesto a
aceptar y este le contesta que 0.005 galones. El Gerente le dice al Ingeniero que
con base a trabajos anteriores se sabe que la desviacin estndar es 0.02 galones y
el Ingeniero sugiere un nivel de confianza de 95%. Cuntas latas se debe tomar?

13. Cul debe ser el tamao de muestra para estimar la proporcin de escolares de
quinto de secundaria, en cierto distrito, que saben nadar (asuma que en ese distrito
hay aproximadamente 5000 estudiantes de quinto de secundaria)?. Considere un
error de 3% en las estimaciones y que en un estudio previo con 100 estudiantes se
encontr que 75 saban nadar. Adems se desea tener un nivel de confianza de 95%.

14. El gerente de produccin desea estimar el tiempo promedio que demora cierto
proceso, como el tiempo se mide en minutos, este gerente desea tener un error
mximo de estimacin, del tiempo promedio real, de a lo ms 4 minutos, sabe, por
experiencias anteriores, que la desviacin estndar en los tiempos de procesamiento
es de 10 minutos, qu tamao de muestra debe tomar, si desea un nivel de confianza
del 95% para sus resultados?

15. El tiempo que tarda un proceso de ensamblaje tiene una distribucin normal con una
media de 20 minutos. Para hacer ms eficiente el sistema, se le pide a un ingeniero
que haga un anlisis y proponga algunas mejoras. Tras implementar los cambios
sugeridos, se toma una muestra de 9 artculos y se registran sus tiempos de
ensamblaje obtenindose un tiempo medio de 24.3 minutos con una desviacin
estndar de 6 minutos.
a) Se puede afirmar que los cambios implementados has disminuido el tiempo
promedio del sistema de ensamblaje? (Utilice un nivel de confianza del 95%)
b) Construya un intervalo del 90% de confianza para el tiempo medio de
ensamblaje

217
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

16. Se sabe que en una compaa de taxis el gasto diario promedio en combustible, por
unidad, es una variable con distribucin normal, cuyo promedio es de 187.6 galones,
y una desviacin estndar de 32.5 galones. El gerente de operaciones decide incluir
un aditivo especial al combustible que le permitir un ahorro en ese rubro. Despus
de incluir el aditivo toma una muestra de 6 unidades y encontr los siguientes gastos
en combustible expresado en galones por da:
180.3 179.6 185.7 170.5 158.3 180.6

El gerente operativo afirma que el gasto promedio diario en combustible disminuy


en ms de 12% En base a la informacin muestral presentada se puede aceptar lo
afirmado por el gerente operativo?

17. Una compaa telefnica est tratando de determinar si algunas lneas en una
determinada comunidad deben instalarse subterrneas. Debido a que se har un
pequeo cargo adicional en las cuentas telefnicas para pagar los costos extras de la
instalacin, la compaa ha determinado hacer un estudio entre los clientes y proceder
con la instalacin subterrnea solo si el estudio indica que ms del 60% de todos los
clientes estn a favor de la instalacin.
a) Defina en forma clara el parmetro que utilizar en la prueba de hiptesis
respectiva.
b) Si 118 de 160 clientes entrevistados estn a favor de esta instalacin a pesar del
cargo adicional, qu debe hacer la compaa? Use un =0.01
c) Cules son las conclusiones al respecto?
d) Defina el error tipo I y error tipo II en trminos del problema

18. El Dpto. de Marketing de una compaa que produce el detergente ABC encontr en
una muestra de 200 amas de casa que el 20% utiliza esta marca de detergente.
Despus de una intensa campaa publicitaria, se tom otra muestra de 300 amas de
casa la que indic que el 27% favorece esta marca. Al 5% de significacin, puede
el jefe del Dpto. concluir, en base a los resultados de esta muestra, que la campaa
fue exitosa?

19. Al seor Juan Prez le han propuesto participar en una lista para el congreso, en
representacin de su provincia. Para aceptar la propuesta este seor quiere estar
seguro de que al menos el 25% de los votantes en la provincia que reside estn a
favor de su candidatura. Para determinar esto toma una muestra aleatoria de tamao
n = 450 personas encontrando que 90 estn a favor de su candidatura. Aceptar el
seor Juan Prez participar en la lista? Considere = 5%

218
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Preguntas de Autoevaluacin

1. Cuando el tamao de muestra aumenta, entonces se puede afirmar que la amplitud


del intervalo de confianza para la media _________________________________

2. En la estimacin del tamao de muestra, a mayor margen de error, entonces el


tamao de muestra es _______________________________________________.

3. Si se desea contrastar la venta media con el valor 100, entonces la hiptesis planteada
para una prueba unilateral con cola a la derecha, es __________________________

4. Cuando el tamao de muestra aumenta, entonces se puede afirmar que la amplitud


del intervalo de confianza para la proporcin _____________________________.

5. Cuando disminuye el nivel de significacin, entonces la probabilidad de rechazar la


hiptesis nula __________________________

6. Mencione 2 supuestos de la prueba de hiptesis para la diferencia de medias


____________________________________________________ .

7. En una prueba unilateral para una media con cola a la izquierda, si el estadstico
tc=3.45, entonces la decisin estadstica ser _____________________________.

8. La probabilidad de rechazar una hiptesis nula que es falsa es ____________ y se


conoce como _____________________________.

9. Para realizar una prueba de diferencia de medias, si las varianzas son desconocidas,
se debe realizar previamente _________________________________________.

10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:

Item Enunciado V/F


a. El nivel de confianza (1-)100% para la media, significa que el 95%
de todos los promedios muestrales caen dentro del intervalo estimado
y 5% son errados
b. En la prueba de hiptesis, el rea de la zona de aceptacin de Ho es
igual a 1-
c. La probabilidad de cometer error tipo I, se conoce como el nivel de
significacin.
d. Cuando el tamao de muestra aumenta, entonces se puede afirmar
que la amplitud del intervalo de confianza para la proporcin disminuye
e. Se puede afirmar en una prueba de hiptesis de la media, que a mayor
variabilidad mayor posibilidad de rechazar la hiptesis planteada.

219
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

CAPTULO XI

ANLISIS DE REGRESIN LINEAL SIMPLE

El anlisis de regresin lineal simple, es una tcnica estadstica que permite estudiar la
relacin funcional entre dos variables, una de ellas es la variable dependiente Y (por
ejemplo ventas semanales) y la otra la variable independiente X (por ejemplo el gasto
semanal en publicidad).

Objetivo. Al finalizar este captulo el estudiante debe conocer los supuestos y estimacin
de parmetros en el anlisis de regresin lineal simple, probar si existe relacin lineal
entre dos variables y calcular el coeficiente de determinacin y el coeficiente de
correlacin.

11.1 Diagrama de dispersin

El diagrama de dispersin (tambin llamado grfico de dispersin) muestra la relacin de


dos variables de relacin de intervalo en un plano de coordenadas. Slo se muestran los
puntos. Es la primera etapa de anlisis de regresin. Es una forma rpida de ver si las
variables estn asociadas y la fuerza de la asociacin. Un diagrama de dispersin muestra
tambin la direccin de la relacin. Todos los puntos agrupados juntos en una lnea recta
sugieren que hay una relacin fuerte. Incluso si algunos puntos estn fuera de la lnea,
todava puede existir una relacin. Si los puntos no estn agrupados y se encuentran
dispersos, estn al azar y no hay ninguna relacin.

220
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 1

Se presentan a continuacin la poblacin por departamentos (no se incluye Lima) y el


nmero de delitos registrados en el 2007, existe entre la poblacin y los nmeros de
delitos?

Distribucin del nmero de delitos por departamento en el 2007


Poblacin
Departamento N de delitos
(en miles)
Amazonas 376.0 811
Ancash 1,063.5 4 503
Apurmac 404.2 1 125
Arequipa 1,152.3 9 188
Ayacucho 612.5 2 185
Cajamarca 1,387.8 2 292
Cusco 1,171.4 4 065
Huancavelica 454.8 22
Hunuco 762.2 988
Ica 711.9 2 548
Junn 1,225.5 1 710
La Libertad 1,617.1 9 763
Lambayeque 1,112.9 8 474
Loreto 891.7 3 485
Madre de Dios 109.6 1 387
Moquegua 161.5 1 439
Pasco 280.4 331
Piura 1,676.3 5 518
Puno 1,268.4 1 607
San Martn 728.8 1 338
Tacna 288.8 1 080
Tumbes 200.3 1 529
Ucayali 432.2 2 856
Fuente: INEI y Ministerio del Interior

Grfica de dispersin de Delitos vs. Poblacin


10000

8000

6000
Delitos

4000

2000

0 200 400 600 800 1000 1200 1400 1600 1800


Poblacin

Fuente: Elaboracin propia

Correlacin de Pearson de Poblacin y Delitos = 0.659

221
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

11.2 El Modelo de Regresin Lineal Simple

El modelo de regresin lineal simple es definido por:

Yi 0 1 X i i , i 1,2,3, , n (1)
Donde:

Y es la variable dependiente o variable respuesta.


X es la variable independiente, explicativa o de prediccin.
0 es el coeficiente de interseccin paramtrico. Es el valor de Y cuando X=0.
1 es el coeficiente de regresin paramtrico. Es la pendiente del modelo de regresin.
i es el error o residual.

11.3 Supuestos del anlisis de regresin lineal simple

Los supuestos del anlisis de regresin lineal simple son los siguientes:

La variable independiente X es fija (no aleatoria).


La variable dependiente Y es aleatoria.
Para cada valor de X existe una distribucin normal de Y.
El i ~N(0, 2 ) para i = 1,2,3,...,n. Adems:

i es independiente de j para ij
i es independiente de X

En consecuencia:

Y . X E Yi E 0 1 X i i 0 1 X i E i 0 1 X i
Var Yi Var 0 1 X i i Var i 2

Notar que 1 mide el cambio en el promedio Y.X ante el cambio en una unidad de X.

11.4 Estimacin por el mtodo de mnimos cuadrados

El mtodo de mnimos cuadrados consiste en minimizar la suma de cuadrados del error.

Del modelo de regresin lineal simple (1) se obtiene:

i Yi 0 1 X i , por lo tanto:

n n
Q i2 Yi 0 1 X i
2

i 1 i 1

Los estimadores mnimos cuadrticos de los parmetros 0 y 1 , digamos b0 y b1, se


deben obtener, primero derivando Q con respecto a 0 e igualando a cero y luego
derivando Q con respecto a 1 e igualando a cero. Con el procedimiento anterior se
obtienen las siguientes ecuaciones (denominadas ecuaciones normales).

222
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

n n
n b0 b1 xi yi
i 1 i 1
n n n
b0 xi b1 xi2 xi yi
i 1 i 1 i 1

Resolviendo las ecuaciones normales se obtienen los coeficientes estimados::

SP( XY )
b1 b0 y b1 x
SC ( X )
( xi ) 2
n
SC ( X ) ( xi x) 2 xi2
xi2 n x
2
Suma de cuadrados de X:
i 1 n
n ( xi )( yi )
Suma de productos X e Y: SP( XY ) ( xi x)( yi y ) xi yi xi yi n x y
i 1 n

De tal manera que b0 estima a 0 y b1 estima a 1 . Es decir: 0 b0 y 1 b1

Interpretacin de los coeficientes de regresin:

0 b0 Mide el valor promedio de Y, cuando X es igual a cero.

Mide el cambio (aumento, si es positivo o disminucin, si es negativo)


1 b1
promedio de Y, cuando X se incrementa en una unidad.

11.5 Recta de regresin estimada

El modelo estimado o ecuacin de regresin estimada es: Yi b0 b1 X i , i 1,2,..., n

La ecuacin de la recta Yi b0 b1 X i estima a Y . X 0 1 X i , adems:


Yi y b1 x b1 X i y b1 X i x Yi y b1 X i x , es el efecto de la regresin.
El error estimado es: ei Yi Yi y estima a i Yi Y . X

550
500

450
400
Precio

350
300
Yi
250 ei
200
150 Yi
100
0 5 10
Captura

223
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

11.6 El anlisis de la variancia en la regresin lineal simple

El Anlisis de la variancia (ANVA) consiste en la descomposicin de la variacin total o


2
y
n

2
suma de cuadrados total SC T SC Y yi y 2
i n y en sus fuentes de
i 1
variacin que en este caso son la suma de cuadrados de la regresin y la suma de
cuadrados del error.

Para un valor X i se deduce que:


yi y Yi y yi Yi De donde se obtiene:

y y Y y y Y
i i i i

En la segunda igualdad anterior se aprecia que la desviacin total ( yi y ) es igual a la

desviacin debido a la regresin Yi y ms el error estimado y Y .


i i Elevando al
cuadrado ambos lados de esta segunda igualdad, aplicando sumatorias y simplificando
se obtiene:

y y Y y y Y
n 2 n 2 n 2
i i i i
i 1 i 1 i 1

La expresin indica, que la suma de cuadrados total (SCT) se descompone en la suma de


cuadrados debido a la regresin (SCR) ms la suma de cuadrados del error (SCE).

Haciendo los reemplazos y las simplificaciones correspondientes se obtienen las


expresiones de las sumas de cuadrado de la regresin, total y error o residual.


SCR Yi y
2
b12 xi x 2
b1 SP( XY ) b12 SC ( X )

( yi ) 2
SCT SC (Y ) y yi2 n y
2 2
i
n
SCE SCT SCR
Con la informacin anterior se construye el siguiente cuadro del ANVA.

Cuadro del ANVA

Fuente de Grados de Suma de Cuadrado F calculado


variacin Libertad Cuadrados Medio
(GL) (SC) (CM)
Regresin 1 SCR CMR Fc
Error n-2 SCE CME
Total n-1 SCT

Prueba de hiptesis

H p : 1 0 ( No hay relacin lineal entre X e Y )


H a : 1 0 ( Si hay relacin lineal entre X e Y )

224
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Prueba Estadstica

SC( R) / 2 2 1
CM ( R)
Fc 1 2 1 F 1 , n 2
SCE / 2
n 2 CME
n2 n2

FTab F1 ;1, n 2

Decisin estadstica

De acuerdo a la hiptesis alternativa la prueba es unilateral a la derecha por lo tanto:

Si Fc es mayor que Ftab se rechaza la Hp.


Si Fc es menor o igual que Ftab no se rechaza la Hp.

11.7 Coeficiente de determinacin y de no determinacin

El coeficiente de determinacin (r2) mide la proporcin o porcentaje de la variacin total


de Y que es explicada por el modelo de regresin y el coeficiente de no determinacin (1
- r2) mide la proporcin o porcentaje de la variacin total de Y que no es explicada por el
modelo de regresin.

SCR ( SP( XY )) 2
r
2
x100 x100 , 0 r 2 100%
SCT SC ( X ) xSC(Y )

11.8 Coeficiente de Correlacin Lineal

El coeficiente de correlacin lineal r mide la fuerza de la relacin lineal entre valores


cuantitativos de dos variables. Tambin se le conoce como coeficiente de correlacin de
Pearson, en honor a Karl Pearson quien lo desarroll originalmente.

( )( )
=
( 2 ) ( )2 ( 2 ) ( )2

SP XY
r , 1 r 1
SC X SC Y

El valor de r siempre est entre -1 y +1, inclusive.

Si r > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de
la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a +1. Por
ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.
Si r < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye
el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a
-1. Por ejemplo: peso y velocidad: los alumnos con ms peso suelen correr menos.
Si r = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro
tipo de correlacin (cuadrtica, exponencial, etc.)

225
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Ejemplo 1

En cierto pas se estudi la captura de anchoas, en millones de toneladas mtricas, (X),


y los precios de harina de pescado, en dlares por tonelada, (Y) para los ltimos 13 aos.

Y 190 160 134 129 172 197 167 239 542 372 245 376 454
X 7.23 8.53 9.82 10.26 8.96 12.27 10.28 4.45 1.78 4.00 3.30 4.30 0.80

600

500

400
Precio

300

200

100
0 2 4 6 8 10 12
Captura

Clculos previos

13 13 13 13 13

x
i 1
i 85.98, x 732.2376, y
i 1
2
i
i 1
i 3377, y
i 1
2
i 1089365 x
i 1
i yi 17357.8

SC X x 2

x 163.5791
i
2

i
n

SC Y yi2
y i 2 212124.3077
n

SP XY xi yi
x y i i
4977.1585
n

a) Halle la lnea de regresin estimada. Interprete el coeficiente estimado de


interseccin y el coeficiente estimado de regresin.

SP XY
b1 30.4266
SC X
13
13

i y
xi
b0 y b1 x i 1
b1 i 1 461.0062
13 13

La lnea estimada es:


Yi 461 .0062 30 .4266 X i
El coeficiente de interseccin estimado, b0 461.0062 , representa el precio promedio
de harina de pescado cuando no hay captura de anchoas.

226
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

El coeficiente de regresin estimado, b1 30.4266 , indica que el precio promedio de


harina de pescado disminuye en 30.4266 dlares por tonelada, cuando se incrementa
en un milln de toneladas mtricas la captura de anchoas.

b) Hay relacin lineal entre X e Y? Utilice 0.01

SC ( R) b12 SC ( X ) b1SP( XY ) 151438.075


SC Error SC Y SC R 60686.2327
Tabla de ANVA
Fuente de variacin G. L. S. C. C. M. F calculado
Regresin 1 151438.0750 151438.075 27.45
Error 11 60686.2327 5516.9302
Total 12 212124.3077

Prueba de hiptesis
H p : 1 0 (No hay relacin lineal entre X e Y)
H a : 1 0 (Si hay relacin lineal entre X e Y)

Como Fc 27.45 F0.01,1,11 9.65 entonces se rechaza la hiptesis planteada


por lo tanto hay evidencias estadsticas para concluir que existe relacin lineal
entre X e Y.

c) Estime el precio promedio de harina de pescado (en dlares por tonelada) para una
captura de 5 millones de toneladas mtricas de anchoas.

La lnea estimada es: Yi 461 .0062 30 .4266 X i

Por la tanto, como Xi=5, se tiene: Y 461 .0062 30 .4266 * 5 308 .8732

El precio promedio de harina de pescado es de $ 308.9 para una captura de 5 millones


de toneladas mtricas de anchoas.

d) Calcule e interprete el coeficiente de determinacin y el coeficiente de correlacin.

Coeficiente de determinacin
SC R SP XY 0.7139 71.39%
2

r
2

SC Y SC X SC Y

Indica que el 71.39% de la variacin de los precios es explicada por la regresin.

Coeficiente de correlacin
SP XY
r 0.84
SC X SC Y

Se puede afirmar que hay una alta asociacin negativa entre X e Y en otras palabras
cuando aumenta una de ellas disminuye la otra.

227
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Regression Analysis: Precio versus Captura

The regression equation is


Precio = 461 - 30.4 Captura

Predictor Coef SE Coef T P


Constant 461.01 43.59 10.58 0.000
Captura -30.427 5.807 -5.24 0.000

S = 74.28 R-Sq = 71.4% R-Sq(adj) = 68.8%

Analysis of Variance

Source DF SS MS F P
Regression 1 151438 151438 27.45 0.000
Residual Error 11 60686 5517
Total 12 212124

Predicted Values for New Observations

New Obs Fit SE Fit 95.0% CI 95.0% PI


1 308.9 22.6 ( 259.1; 358.7) ( 138.0; 479.8)

Values of Predictors for New Observations

New Obs Captura


1 5.00

228
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

3
Ejercicio 1. Se desea estudiar la tasa de flujo Y (en m / min ) de un dispositivo para
medir la calidad del aire en funcin de la cada de presin X (en mm de agua) a travs
del filtro del dispositivo. Se tom una muestra de 10 mediciones encontrndose los
siguientes datos:
Y 0.6 0.7 0.8 1.0 1.1 1.2 1.4 1.8 2.2 2.6
X 127 178 229 254 330 381 406 432 457 507

Asumiendo que se cumplen los supuestos respectivos

a) Estime la lnea de regresin. Interprete los coeficientes.

b) Hay relacin lineal entre estas variables? Use 0.05 .

229
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c) Calcule e interprete el coeficiente de determinacin.

d) Estime la tasa de flujo promedio para una cada de presin de 400 mm de agua.

e) Halle e interprete el coeficiente de correlacin.

230
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Prctica Dirigida N 8

1. Una compaa de productos qumicos desea analizar si la eficiencia en una operacin


de extraccin est influenciado por el tiempo de extraccin.

Tiempo (minutos x) 27 45 41 19 35 39 19 49 15 31
Eficiencia (% Y) 47 84 80 46 62 72 52 87 37 68

n 10 x i 320 x 2
i 11490 y i 635 y 2
i 43075 x y
i i 22095
a) Determine la ecuacin de la regresin entre la eficiencia y el tiempo de extraccin.
Interprete el coeficiente de regresin estimado.

b) Pruebe si existe una relacin lineal entre las variables. Use un nivel de significacin
del 5%.

231
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

c) Qu porcentaje de la variabilidad de la eficiencia de la operacin de extraccin es


explicada por la regresin?

d) Estime la eficiencia de operacin de extraccin cuando el tiempo de extraccin es de


55 minutos.

232
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

EJERCICIOS PROPUESTOS

2. Una investigacin de la relacin entre el flujo de trnsito X (en miles de automviles


por 24 horas) y el contenido de plomo Y de la corteza de rboles cerca de la autopista
(ug/gr de peso en seco) produjo los datos siguientes:

X 8.3 8.3 12.1 12.1 17.0 17.0 17.0 24.3 24.3 24.3 33.6
Y 227 312 362 521 640 539 728 945 738 759 1263

a) Obtenga la lnea de regresin estimada. Interprete el coeficiente estimado de


interseccin y el coeficiente estimado de regresin. Tiene interpretacin prctica
el coeficiente de interseccin estimado.
b) Existe relacin lineal entre X e Y? Utilice 0.05 .
c) Calcule e interprete los coeficientes de determinacin y de correlacin.

3. Se ha realizado un estudio para establecer una ecuacin mediante la cual se pueda


utilizar la concentracin de estrona en la saliva pg/ml (X), para predecir la
concentracin del esteroide en el plasma pg/ml (Y). Para el estudio se extrae una
muestra aleatoria de 12 varones sanos y se obtienen los siguientes clculos previos

Xi = 173 X2i = 2,728.5 Yi = 578.5 Y2i = 29,734.25


Xi Yi = 8,959.25
a) Calcule e interprete los coeficientes estimados para la regresin lineal simple
entre X e Y.
b) Pruebe con un nivel de significacin de 0.05, si existe relacin lineal entre X e Y.
c) Predecir la concentracin del esteroide en el plasma, cuando se tiene una
concentracin de estrona en la saliva de 18 pg/ml.

3. Se estudia, en un proceso qumico, el tiempo de reaccin Y (en horas) y la temperatura


X (en C) de la cmara donde tiene lugar la reaccin. Se tom una muestra de 10
mediciones encontrndose:

X 82 84 86 91 93 94 99 110 115 125


Y 3.10 2.98 3.09 2.92 2.80 2.93 3.10 2.70 2.84 2.83

Asumiendo que se cumplen los supuestos respectivos

a) Estime la lnea de regresin. Interprete los coeficientes.


b) Hay relacin lineal entre estas variables? Use 0.05
c) Calcule e interprete el coeficiente de determinacin.
d) Obtenga e interprete el coeficiente de correlacin.
e) Estime el tiempo promedio de reaccin para una temperatura de 120 C.
f) Descomponga el efecto total de la medicin 8 en sus efectos respectivos.

4. En un centro de salud se han tomado los datos de las edades y la Presin Sistlica
de 12 pacientes, bajo la sospecha de que la edad y la presin estaban relacionadas
de alguna manera. Los datos que se tomaron son los siguientes.

Edad (X) 56 42 72 36 63 47 55 49 38 42 68 60
Presin sistlica (Y) 147 125 160 118 149 128 150 145 115 140 152 155

a) Obtenga el Diagrama de Dispersin y comente los resultados.


b) Calcule la ecuacin de regresin estimada e Interprete el valor de cada uno de los
coeficientes de la recta anterior.
c) Calcule e interprete el valor del coeficiente de determinacin.
d) Puede Ud. afirmar que la pendiente de la recta es significativamente distinta de
cero, con = 0,05?

233
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

5. Se hizo un estudio con yeguas de los niveles de progesterona en la sangre (X) y en


heces (Y), estos niveles se expresan en ng/ml donde ng = nanogramos.

X 8.37 6.09 5.81 8.86 6.21 0.38 0.31


Y 10.74 10.75 9.85 10.85 10.00 4.31 1.30

a) Estime la lnea de regresin. Interprete los coeficientes.


b) Hay relacin lineal entre estas variables? Use 0.05 .
c) Calcule e interprete el coeficiente de determinacin.
d) Poner el efecto total 5 en trminos del efecto de la regresin y el error.

7. El banco Prstamo estudia la relacin entre las variables Ingresos (X) y ahorros
(Y) mensuales de sus clientes. Una muestra aleatoria de de sus clientes revelo los
siguientes datos.

X 1200 1380 1550 1725 3278 2932 2415 3105 2070


Y 345 380 450 552 1210 1225 870 1104 450

a) Estime la recta de regresin.


b) Utilice la recta estimada para pronosticar el valor del ahorro cuando el ingreso sea
de 2800 soles.
c) Se puede afirmar que existe una relacin lineal significativa entre los ingresos y
el ahorro? A un nivel de significacin del 5%
d) Qu porcentaje de la variacin muestral se puede atribuir a la relacin del
modelo?

8. Una empresa en consultora contable desea desarrollar un modelo que le permita


predecir el costo de la auditora en funcin del nmero de documentos revisados.
Para este fin extrae una muestra de 12 auditoras, registrando el costo de la auditora
(miles $) y el nmero de documentos revisados (miles documentos).

Nmero de 28 17 32 48 6 14 19 24 34 22 20 46
documentos (miles
documentos)
Costo de la auditora 50 35 65 98 12 24 38 45 65 45 36 85
(miles $)

a) Analice el diagrama de dispersin. Qu se puede afirmar acerca de la relacin


entre el nmero de documentos revisados y el costo de la auditora?.
b) Interprete los coeficientes de regresin. Presente la ecuacin estimada.
c) Pruebe con un nivel de significacin de 5%, si existe relacin lineal entre el nmero
de documentos revisados y el costo.
d) Halle e interprete el coeficiente de determinacin
e) Estime el costo promedio de la auditora cuando se revisen 25,000 documentos.
f) Halle e interprete el coeficiente de determinacin.

9. Las materias primas empleadas en la produccin de una fibra sinttica son


almacenadas en un lugar donde no se tiene control sobre la humedad. Las mediciones
de la humedad relativa en el lugar de almacenamiento (x) y la humedad de una
muestra de las materias primas (y) (ambas en porcentaje) para 12 das se presenta
en la siguiente tabla.

Humedad en el 42 35 50 43 48 62 31 36 44 39 55 48
almacenamiento (%)
Humedad en la 12 8 14 9 11 16 7 9 12 10 13 11
materia prima (%)

234
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

a) Analice el diagrama de dispersin. Qu se puede afirmar acerca de la relacin


entre la humedad de almacenamiento y la humedad en la materia prima?.
b) Interprete los coeficientes de regresin. Presente la ecuacin estimada.
c) Pruebe con un nivel de significacin de 5%, si existe relacin lineal entre la
humedad de almacenamiento y la humedad en la materia prima.
d) Estime la humedad promedia de la materia prima, cuando se tiene una humedad
de almacenamiento de 45%.
e) Halle e interprete el coeficiente de determinacin
f) Pruebe con un nivel de significacin de 5%, si existe correlacin entre la humedad
de almacenamiento y la humedad de la materia prima.

10. Se cuenta con informacin de una muestra de 10 fondos de inversin, respecto a su


rentabilidad porcentual para un periodo de doce meses y el activo total (en millones
de $). Los datos se presentan en la siguiente tabla.

Activo total 22 18 14 8 26 10 16 19 20 7
(millones $)
Rentabilidad 29.3 17.6 16.0 9.5 22.6 12.4 18.5 21.4 18.2 12.5
(%)

a) Analice el diagrama de dispersin. Qu se puede afirmar acerca de la relacin


entre el activo total y rentabilidad del fondo de inversin?.
b) Interprete los coeficientes de regresin. Presente la ecuacin estimada.
c) Pruebe con un nivel de significacin de 5%, si existe relacin lineal entre el activo
total y la rentabilidad.
d) Estime la rentabilidad promedia, cuando se tiene un activo de 18 millones de
dlares.
e) Halle e interprete el coeficiente de determinacin
f) Pruebe si existe correlacin entre el activo total y la rentabilidad. Use un nivel de
significacin de 5%.

11. El gerente de ventas permite que los agentes vendedores que tiene a su cargo reciban
charlas para motivarlos, dichas charlas se dan en diferentes horarios y los agentes
tienen absoluta libertad para elegir el horario que crean conveniente. El gerente cree
que dichas charlas influyen en la eficiencia de las ventas. Para verificar esto toma una
muestra de 10 vendedores y determin el tiempo acumulado de horas en las que estuvo
presente en una o ms charlas durante el ltimo trimestre y la eficiencia de sus ventas,
los datos encontrados fueron:

Tiempo acumulado (Horas) 27 45 41 19 35 39 19 49 15 31


Eficiencia en las ventas (%) 47 84 80 46 62 72 52 87 37 68

a)Es posible afirmar que existe una relacin lineal entre el nmero de horas de charla
y la eficiencia en las ventas?. Use un =0.05.
b) Interprete adecuadamente el coeficiente de regresin.
c) El Gerente de ventas afirma que cuando un agente vendedor recibe charlas esto
permite un mejor desempeo en sus nivel de ventas y cree adems que por cada
hora adicional de charla su rendimiento se incrementa en ms de un punto
porcentual. Utilizando un nivel de significacin del 5% Qu puede concluir con
respecto a la afirmacin que hace el gerente de ventas?.

235
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

12. En ocasiones es conveniente comprar la mayor cantidad posible de ciertos artculos. Por
lo general el precio unitario es menor al adquirir grandes cantidades. Para contrastar
esta teora se obtuvieron los siguientes datos:

Nmero de Unidades (X) 1 3 5 10 12 15 24


Costo Unitario (Y) $ 55 52 48 36 32 30 25

a) Interprete el coeficiente de regresin estimado.


b) Qu % de la variabilidad en el costo no es explicada por la recta de regresin?
c) Es la pendiente de la recta diferente de cero significativamente?. Use un =0.05.
d) Estime el costo promedio unitario cuando se compran 40 unidades.
e) Es posible afirmar, en base a la informacin muestral obtenida y utilizando un nivel
de significacin del 5%, que por cada unidad adicional que se compre el precio del
artculo disminuye en ms de $1,2. Use un =0.05.

13. Un banco quiere determinar la relacin entre las variables Ingresos mensuales
(variable independiente) y Ahorros mensuales (variable dependiente) de sus
clientes. Para esto, selecciona una muestra aleatoria de seis clientes y obtiene los
siguientes resultados:
Y: Ahorros
X: Ingresos mensuales mensuales
1.0 0,20
1,2 0,22
1,5 0,25
0,8 0,18
1,8 0,30
2.0 0,35

a) Halle la ecuacin de regresin e interprete sus coeficientes.


b) Calcule el coeficiente de determinacin e interprtelo.
c) Utilice el modelo de regresin desarrollado para predecir los ahorros mensuales
si el ingreso mensual de su cliente es de 2500 soles.
d) Plantee las hiptesis respectivas y diga si el modelo hallado es significativo o no.
Utilizar un nivel de significancia del 5%.

236
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Preguntas de Autoevaluacin

1. El grfico que permite visualizar la existencia de una posible relacin lineal entre la
variable X e Y, se conoce como _______________________________________ .

2. El mtodo de estimacin para estimar los coeficientes de regresin 0 y 1, se conoce


como _____________________________________ .

3. En el anlisis de regresin lineal simple, el valor que mide el cambio o variacin en la


variable Y, cuando la variable X aumenta en una unidad, se conoce como
____________________________.

4. Uno de los supuestos del anlisis de regresin es que la variable X se considera un


valor ______________, en cambio la variable Y se considera ________________.

5. Para probar si existe una relacin lineal entre las variables X e Y en un anlisis de
regresin, la hiptesis nula formulada es ____________________________ .

6. El rango en que vara el coeficiente de determinacin es ______________________

7. Si el coeficiente de correlacin estimado se aproxima a 1, indica que existe una


correlacin ______________________, si se aproxima a -1, __________________
y se aproxima a cero __________________________ entre las variables X en que
vara el e Y.

8. La ecuacin estimada en un anlisis de regresin entre la ventas (Y) en miles de $


sobre los aos de experiencia de los vendedores (X) en aos, result: Y = 250 1.2X.
Entonces el coeficiente de regresin se interpreta como
_________________________________________________________________.

9. La interpretacin del coeficiente de correlacin entre el peso y la talla de una muestra


de 12 estudiantes cuyo valor fue igual a 0.88, es
____________________________________________________________.

10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:

Item Enunciado V/F


a. El coeficiente de determinacin mide el porcentaje de la variabilidad
de X que es explicada por la regresin.
b. Los coeficientes de regresin estimados, asumen como unidad de
medida la de la variable dependiente (Y).
c. El rango del coeficiente de correlacin es [-1, 1] .
d. El coeficiente de regresin estimado b1, no puede tomar un valor
negativo.
e. El cuadro del ANVA, muestra la descomposicin de la variabilidad de la
variable Y, en dos fuentes (regresin y error).

237
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Bibliografa

1. Anderson, D. y Sweeney, D. y Williams, T. (2008). Estadstica para Administracin y


Economa (10a. ed.) Mxico: Cengage Learning Editores.
2. Daniel, W. (2004). Bioestadstica: base para el anlisis de las ciencias de la salud
(4ta. ed.). Mxico: Limusa. Grupo Noriega editores.
3. Johnson, R. y Kuby, P. (2008). Estadstica elemental: lo esencial (10ma. ed.). Mxico:
Cengage Learning Editores.
4. Levin, R y Rubi, D.(2004). Estadstica para Administracin y Economa (7ma. ed.)
Mxico: Pearson Educacion. Prentice Hall.
5. Montgomery, D. y Runger, G. (2002). Probabilidad y Estadstica aplicadas a la
ingeniera (2da. ed.). Mxico: Editorial Limusa. Grupo Noriega editores.
6. Newbold, P. y Carlson, W. y Thorne, B. (2008). Estadstica para Administracin y
Economa (6ta. ed.) Madrid: Pearson Education. Prentice Hall.
7. Miranda, F. & Salinas, J. & Otros. (2012). Estadstica General. Lima: Universidad
Nacional Agraria La Molina.
8. Triola, M. (2009). Estadstica (10ma. ed.). Mxico: Pearson Educacion. Adisson.

238
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Anexo N 1

Laboratorio de Cmputo N1

Estadstica Descriptiva con MINITAB

Se trabajar con el conjunto de datos alumnos.mtw que contiene informacin de los


alumnos de primer ciclo de una Universidad del pas. Las variables consideradas son:
Especialidad del estudiante.
Sexo del estudiante.
Edad del estudiante.
Nota obtenida por el estudiante en un curso general comn a todas las carreras.
Promedio ponderado del primer ciclo del estudiante.

Se mostrar el procedimiento para realizar cada uno de los anlisis que se han visto en
el curso y extraer informacin sobre este conjunto de datos.

I. Estadstica Descriptiva

Para poder obtener medidas descriptivas como las medidas de tendencia central o de
dispersin seguiremos la siguiente secuencia en el men:

Al hacer click en esa opcin aparecer la siguiente ventana:

239
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Desde seleccionaremos la variable o variables con las que queremos trabajar,


posteriormente elegiremos qu estadsticas descriptivas queremos obtener. Por ejemplo
elegiremos la variable Nota (haciendo doble click en ella) y seleccionaremos algunas
medidas estadsticas:

Hemos elegido media, coeficiente de variacin, mediana, mnimo y mximo. Solo queda
darle click a Aceptar a esta ventana y a la siguiente y habremos obtenido estas medidas
requeridas.

Estadsticos descriptivos: Nota

Variable Media CoefVar Mnimo Mediana Mximo


Nota 13.048 16.39 9.000 13.000 20.000

Ejercicios:
1. Obtenga el coeficiente de variabilidad de la variable Edad: _________________
2. Obtenga la desviacin estndar de la variable Nota: ______________________
3. Obtenga la mediana de la variable Nota de acuerdo al Sexo de los estudiantes:
________________________________________________________________

240
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

II. Grficos

Desde esta opcin podemos elegir entre los grficos ms conocidos haciendo click sobre
el que deseemos obtener:

Grfico de barras

Elegiremos el grfico de barras Simple.

Luego elegiremos la variable que queremos graficar, existen otras opciones que se
pueden personalizar, como Escala, Etiquetas, etc.

241
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Finalmente obtenemos el grfico de barras de estudiantes por Especialidad.

Grfica de Especialidad
25
23.2
22

20 19.2 19.2

16.4
Porcentaje

15

10

0
Contabilidad Derecho Industrial Psicologa Sistemas
Especialidad
Porcentaje en todos los datos.

242
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Grfico circular

Directamente podemos elegir la variable de inters, tambin podemos personalizar


algunas opciones.

Este es el grfico que hemos obtenido y muestra la distribucin de estudiantes por la


especialidad.

Grfica circular de Especialidad


Categora
Contabilidad
Derecho
19.2% 16.4% Industrial
Psicologa
Sistemas

19.2%

22.0%

23.2%

243
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Histograma

Elegiremos el histograma Simple.

En la siguiente ventana indicamos la variable y podemos personalizar algunas opciones.

Este es el histograma de frecuencias que obtenemos, podemos personalizar algunas otras


opciones (como la marca de clase, pues no es igual al que se ha trabajado en clases)
haciendo click derecho en las barras:

244
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Desde esta opcin podemos editar los LI y LS del histograma, para esta variable el
mximo es 18.5 y el mnimo 8.5, el nmero de intervalos de clase es 9, teniendo as que
el TIC es de 1.2

Con esto hemos editado nuestro histograma de frecuencias y podemos obtener uno como
el que se ha trabajado en clases:

245
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Histograma de Promedio
60

50

40
Frecuencia

30

20

10

0
8.5 1 0.9 1 3.3 1 5.7 1 8.1
Promedio

Grfica de cajas

Podemos obtener un grfico de cajas Simple o Con grupos, elegiremos esta segunda
opcin pues resulta interesante comparar variables cuantitativas de acuerdo a
agrupaciones.

En este ejemplo la variable a graficar ser Nota y la variable de agrupacin ser


Especialidad.

246
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Obtenemos el grfico de cajas de Nota agrupado por Especialidad, podemos identificar


un valor outlier para la especialidad de Contabilidad.

Grfica de caja de Nota


20

18

16
Nota

14

12

10

Contabilidad Derecho Industrial Psicologa Sistemas


Especialidad

247
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Tallo y hojas

En esta ventana podemos elegir directamente la variable que queremos graficar.

Diseo de tallo y hoja: Promedio

Tallo y hoja de Promedio N = 250


Unidad de hoja = 0.10

3 8 559
5 9 45
22 10 13334444556688889
58 11 000111113334444555555666667778899999
96 12 00000111123333333444555555577788999999
(42) 13 000111111111133344444444555555566789999999
112 14 0000001111233333333333444455555555555566667788889999
60 15 0000000111113334455566666777788888999
23 16 1113556666668999
7 17 01456
2 18 35

Ejercicios:

Obtenga el diagrama de cajas de la variable Nota agrupada por Sexo, responda:


1. Existen valores atpicos? Cules son y a qu categora corresponden?
___________________________________________________________________

___________________________________________________________________

2. Para ambas categoras identifique:


Femenino Masculino
Primer cuartil
Mediana
Tercer cuartil
LCI
LCS
N

248
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Anexo N 2

Laboratorio de Cmputo N2

Estadstica Inferencial con MINITAB

Nuevamente trabajaremos con el conjunto de datos alumnos.mtw que cuenta con cinco
variables: Especialidad, Sexo, Edad, Nota, Traslado.

Intervalos de confianza y Pruebas de Hiptesis


Para la media

Siguiendo estas opciones podremos obtener intervalos de confianza y realizar la prueba


de hiptesis para la media de la variable Nota.

Al elegir esta opcin de prueba t para una muestra obtendremos la siguiente ventana:

249
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Desde esa ventana podremos elegir la variable con la que queremos trabajar. Podemos
especificar el valor de la media poblacional hipottica que este caso hemos definido con
el valor de 17 aos. Tambin debemos marcar la casilla para realizar la prueba de
hiptesis de la media (de lo contrario solo se obtendr el intervalo de confianza). Hacemos
click en Aceptar y obtendremos el siguiente resultado:

T de una muestra: Edad

Prueba de = 17 vs. 17

Error
estndar
de la
Variable N Media Desv.Est. media IC de 95% T P
Edad 250 18.284 1.668 0.105 (18.076, 18.492) 12.17 0.000

Estos resultados muestran el intervalo de confianza para la media al 95% y el valor de la


T calculada para la prueba de hiptesis.

Para una proporcin

Puede ser de inters realizar pruebas de hiptesis para una proporcin. Podramos querer
probar si el valor de la proporcin de estudiantes de Contabilidad es superior al 15%,
teniendo en cuenta que 41 de los 250 son de esa especialidad. Para ello tendramos que
ingresar a las pruebas de 1 proporcin y definir estos valores:

Haciendo click a Opciones podemos especificar qu tipo de prueba de hiptesis es la


que deseamos:

250
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Habiendo definido estas opciones hacemos click en Aceptar y obtenemos los siguientes
resultados:

Prueba e IC para una proporcin

Prueba de p = 0.15 vs. p > 0.15

Lmite
inferior
Muestra X N Muestra p de 95% Valor Z Valor p
1 41 250 0.164000 0.125480 0.62 0.268

Uso de la aproximacin normal.

De esa manera contamos con los valores de los intervalos de confianza y el Valor Z
calculado.

Para diferencia de medias

Si se quiere comparar si las medias de las Edad de acuerdo al Sexo son distintas, primero
debemos realizar la prueba de Hiptesis para determinar si las varianzas son o no
homogneas.

251
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Para ello debemos definir:

En Opciones podemos definir la relacin y el nivel de confianza con el que se trabajar,


de la siguiente manera:

Obtenindose estos resultados:

Prueba e IC para dos varianzas: Edad vs Sexo

Mtodo

Hiptesis nula Varianza(Femenino) / Varianza(Masculino) = 1


Hiptesis alterna Varianza(Femenino) / Varianza(Masculino) 1
Nivel de significancia = 0.1

252
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Estadsticas

IC de 90%
para
Sexo N Desv.Est. Varianza varianzas
Femenino 116 1.711 2.926 (2.551, 3.453)
Masculino 134 1.627 2.648 (2.324, 3.094)

Relacin de desviaciones estndar = 1.051


Relacin de varianzas = 1.105

Intervalos de confianza de 90%

IC para IC para
relacin de relacin de
Mtodo Desv.Est. varianza
Bonett (0.948, 1.168) (0.899, 1.364)
Levene (0.906, 1.214) (0.821, 1.475)

Pruebas

Estadstica
Mtodo GL1 GL2 de prueba Valor p
Bonett 0.422
Levene 1 248 0.28 0.600

Y el siguiente grfico que resume los resultados:

253
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Para hacer la prueba de comparacin de medias:

Y en Opciones tambin se personaliza lo siguiente, debemos marcar la casilla si es que


en la prueba de Homogeneidad de Varianzas estas resultan iguales:

254
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Teniendo como resultado:

Prueba T e IC de dos muestras: Edad, Sexo

T de dos muestras para Edad

Error
estndar
de la
Sexo N Media Desv.Est. media
Femenino 116 18.15 1.71 0.16
Masculino 134 18.40 1.63 0.14

Diferencia = (Femenino) - (Masculino)


Estimacin de la diferencia: -0.256
IC de 95% para la diferencia: (-0.673, 0.160)
Prueba T de diferencia = 0 (vs. ): Valor T = -1.21 Valor p = 0.226 GL =
248
Ambos utilizan Desv.Est. agrupada = 1.6665

Podemos observar los valores de la media y la varianza de las edades para cada uno de
los grupos por Sexo. El clculo del intervalo de confianza al 95% y el valor T calculado
obtenido.

Ejercicios:

1. Realice la prueba correspondiente que le permita determinar si el valor de la


desviacin estndar de las Notas de esta muestra de 250 estudiantes es mayor a 2.

2. Compare si existen diferencias entre los Promedios de acuerdo al Sexo de los


estudiantes.

255
UNA La Molina - Dpto. de Estadstica e Informtica Estadstica General

Anexo N 3

TABLAS ESTADSTICAS

Distribucin Normal Estndar


Distribucin Chi-Cuadrado
Distribucin t
Distribucin F

256

Вам также может понравиться