Академический Документы
Профессиональный Документы
Культура Документы
Estadística Descriptiva
MA460 201601
Las profesoras y los profesores del curso
Unidad 1: Organización de datos
Logro de la unidad 1
Al finalizar la unidad 1,
el estudiante interpreta con rigurosidad tablas y gráficos,
con ayuda del programa MS Excel 2010.
Temario
La Estadística y sus subdivisiones.
Definiciones de población, muestra, variables, clasificación de variables, parámetros y estadísticos.
Métodos de organización y presentación de datos:
• Datos cualitativos
• Datos cuantitativos
• Tablas de distribución de frecuencias y representaciones gráficas (circular, barras, Pareto)
• Tablas de doble entrada
4 Estadística Descriptiva 201601
Subdivisión de la Estadística
La Estadística se puede dividir en Estadística descriptiva y Estadística inferencial.
Estadística Son métodos y técnicas que hacen posible estimar una o más
inferencial características de una población o tomar decisiones sobre población
basadas en el resultado de muestras.
Estas conclusiones no son totalmente válidas y tienen cierto margen de
error.
Ejercicio 1
Según la encuesta nacional realizada por la encuestadora CPI publicada el 18 de marzo
del 2016, la intención de voto para las próximas elecciones es la siguiente:
Notas importantes
Unidad 1. Organización de Datos 5
1.2. Definiciones
Unidad elemental, variables y observación
Observación es el
Variables son las
Unidad elemental conjunto de
características de
es la entidad mediciones
interés de las
acerca de la cual se obtenido de una
unidades
reúne los datos unidad elemental
elementales
particular
Ejemplo 1
Ella responde:
A una persona se le pregunta su
“Soy mujer y tengo
(Unidad género y edad.
19 años”
elemental) (Variables)
(Observación)
Dato
Es el resultado de medir una característica observable de una unidad elemental.
Notas importantes
6 Estadística Descriptiva 201601
Población y muestra
Población
Muestra
Población es el conjunto de todos las
unidades elementales de interés en
determinado estudio. Muestra es un subconjunto de la población.
Es un conjunto de personas, objetos, Será representativa si se parece a la
conceptos, etc. de los cuales se sacan población de la que proviene.
conclusiones a partir de una o más
características observables de
naturaleza cualitativa o cuantitativa.
Ejemplo 2
La Secretaría Académica de una universidad está interesada en realizar un estudio sobre
los motivos por los cuales algunos alumnos del pregrado han decidido dar exámenes de
recuperación ese ciclo. La universidad cuenta con quince facultades y un total de 7500
alumnos, de los cuales 830 han decidido rendir exámenes de recuperación ese ciclo. De
la población se va a entrevistar a una muestra aleatoria de 200 alumnos. Defina la po-
blación y la muestra
Solución
Población
Muestra
Los 830 alumnos que han decidido dar
exámenes de recuperación ese ciclo. Los 200 alumnos que han decidido dar
exámenes de recuperación ese ciclo.
Ejercicio 2
El objetivo de una investigación es estimar la estatura media de los peruanos de 18
años. Indique la población y la muestra.
Población
Muestra
......................................................................
...........................................................................................................................................
...........................................................................................................................................
Notas importantes
Unidad 1. Organización de Datos 7
Población
Muestra
......................................................................
...........................................................................................................................................
...........................................................................................................................................
Además, Juan quiere determinar el porcentaje de vuelos que salen sin retraso, con el fin
de ver si es necesario establecer políticas de mejora. Indique la población y la muestra
de dicha investigación.
Población
Muestra
......................................................................
...........................................................................................................................................
...........................................................................................................................................
Por otro lado, Juan quiere determinar la media del número mensual de pasajeros de la
aerolínea Wayra. Indique la población y la muestra de dicha investigación.
Población
Muestra
......................................................................
...........................................................................................................................................
...........................................................................................................................................
Notas importantes
8 Estadística Descriptiva 201601
Escalas de
medición
•Una variable está medida en escala ordinal cuando los datos son
etiquetas y el orden es significativo.
•Se pueden ordenar, de tal manera que puedan expresar grados
de la característica medida.
Ordinal
•No tiene sentido medir la distancia entre los valores de la
variable ni realizar operaciones aritméticas con ellos pues no
toman valores numéricos específicos ni existe proporcionalidad
entre categorías vecinas.
Notas importantes
Unidad 1. Organización de Datos 9
Ejemplo 3
Notas importantes
10 Estadística Descriptiva 201601
Variable Variable
cualitativa cuantitativa
Variable discreta
Tiene un número finito o infinito
numerable de posibles valores; es
decir, que en un intervalo solo
puede tomar ciertos valores.
Variable continua
Tiene un número infinito no
numerable de posibles valores; es
decir, que en un intervalo puede
tomar cualquier valor.
Ejemplo 4
Variables Tipo de variable Escala de medición
Marca de computadora personal que utiliza Cualitativa Nominal
Tiempo que usa la computadora por semana Cuantitativa continua Razón
Número de perros en una casa Cuantitativa discreta Razón
Número de granos de arena en una gran playa Cuantitativa discreta Razón
Notas importantes
Unidad 1. Organización de Datos 11
Parámetro y estadístico
Ejemplo 5
En un estudio entre alumnos de la UPC, se registró la edad de todos los alumnos de la
UPC. La media de la edad fue de 19,3 años. Además, de una muestra de aleatoria de 300
alumnos se encontró que el 12% trabaja. Indique lo siguiente.
Ejercicio 3
El objetivo de una investigación es estimar el sueldo promedio de un obrero en la ciudad
de Lima. En una muestra aleatoria, se encontró una media de 1650 soles. Indique lo si-
guiente.
Población: …………………….……………………………………………………………………………………………….
Usando el registro del aeropuerto Jorge Chávez, se encontró que la media del tiempo de
retraso de todos los vuelos de la aerolínea Wayra fue 32 minutos. Indique lo siguiente.
Notas importantes
12 Estadística Descriptiva 201601
Estudios estadísticos
Los datos se obtienen mediante la realización de un estudio estadístico. A esos estudios
se les clasifica como experimentales u observacionales.
Ejercicio 5
Indique a qué tipo de estudio, experimental u observacional, corresponden los siguien-
tes ejemplos.
Tomado de http://elcomercio.pe/economia/peru/turistas-gastan-nuestra-gastronomia-us350-millones
Notas importantes
Unidad 1. Organización de Datos 13
Fuentes de datos
Los siguientes sitios web son ejemplos donde conseguir datos de fuente secundaria.
Fuentes privadas: bases de datos de las empresas, bases de datos que se compran a
empresas de estudios de mercado, bases de datos en Internet, como por ejemplo.
Notas importantes
14 Estadística Descriptiva 201601
Frecuencia absoluta •de una clase es la cantidad de elementos que pertenecen a esa
(fi) clase
Frecuencia
•de una clase es la frecuencia relativa multiplicada por 100%
porcentual (pi)
Se tiene que:
frecuencia absoluta fi
frecuencia relativahi
número de casos n
frecuencia absoluta f
frecuencia porcentualpi hi % 100% i 100%
número de casos n
Distribución de frecuencias
Es un resumen, expresado en un cuadro, de un conjunto de datos que muestra las fre-
cuencias absolutas, relativas y porcentuales en cada una de varias clases que no se tras-
lapan.
Título: ……………………………………………………………………………………
Categorías Frecuencia absoluta fi Frecuencia relativa hi Frecuencia porcentual pi = hi%
f1 f1
Categoría 1 f1 h1 p1 100%
n n
f f
Categoría 2 f2 h2 2 p2 2 100%
n n
… … … …
fk fk
Categoría k fk hk pk 100%
n n
Fuente: ………………………
Notas importantes
Unidad 1. Organización de Datos 15
Ejemplo 6
Población
Año
Total Censada Omitida
Notas importantes
16 Estadística Descriptiva 201601
Perú. Distribución de peruanos según idioma o lengua con el que aprendió hablar. 2007
Idioma o lengua con que aprendió a hablar Frecuencia absoluta fi Frecuencia relativa hi
Castellano 21 713 165
Quechua 3 360 331
Aymará 443 248
Otra lengua nativa 174 410 0,0068
Asháninka 67 724 0,0026
Es sordomudo 30 019 0,0012
Idioma extranjero 21 434 0,0008
Total 25 810 331 1,0000
Fuente ………………………………………………………………………………………….
Indique el número de peruanos que aprendieron a hablar en una lengua diferente al cas-
tellano.
Notas importantes
Unidad 1. Organización de Datos 17
1.5. Gráficos
“Un gráfico puede valer más que mil palabras,
pero puede tomar muchas palabras para hacerlo”
John Wilder Tukey (1915-2000)
Gran estadístico del siglo XX, con gran influencia en la visualización de información
Las fuentes de donde se obtuvieron los datos que permitieron su construcción, así
como quiénes o qué entidad elaboró el diagrama y cualquier otra información se
debe indicar siempre que sea relevante.
Notas importantes
18 Estadística Descriptiva 201601
Elección de la base de comparación
Eliminación de ruido
Notas importantes
Unidad 1. Organización de Datos 19
Gráfico de barras
Es una forma de representar datos cualitativos resumidos en una distribución de fre-
cuencias.
En uno de los ejes, se representan las categorías o clases de la variable; para el otro eje,
se puede usar una escala de frecuencias absolutas, relativas o porcentuales. Se traza una
barra sobre cada indicador de clase de una altura proporcional a la frecuencia corres-
pondiente.
Las barras deben estar separadas para enfatizar el hecho de que cada clase es diferente
de otra.
Diagrama circular
Cuando se utiliza el gráfico circular, también llamado pastel, cada sector circular repre-
senta la frecuencia observada de una clase o categoría.
El sector circular que representa a una determinada clase de la variable tiene un ángulo
en el centro proporcional a la frecuencia relativa de dicha clase. El ángulo que le corres-
ponde a cada clase se obtiene multiplicando 360º por la respectiva frecuencia relativa.
Notas importantes
20 Estadística Descriptiva 201601
Caso Aerolínea Wayra
Objetivo: Determinar la composición porcentual de los usuarios según motivo de viaje
Felipe realizó una encuesta a una muestra de 150 pasajeros de la aerolínea, en base a la
siguiente información complete la siguiente gráfica.
Título: _________________________________________
40% 34%
35%
30%
25% 20% 20%
20%
15% 10% 10%
10%
5%
0%
Competencia Estudios Retorno a casa Trabajo Turismo Visita Familiar
Deportiva
______________________
Fuente:_________
- Son _______ el total de pasajeros cuyo motivo de viaje fue estudios o trabajo.
Frecuencia
•de una clase es la cantidad de elementos que pertenecen
acumulada
hasta esa clase
absoluta (Fi)
Frecuencia
•de una clase es la proporción de elementos que pertenecen
acumulada relativa
hasta esa clase
(Hi)
Frecuencia
•de una clase es la frecuencia acumulada relativa
acumulada
multiplicada por 100%
porcentual (Pi)
Se tiene que:
frecuencia absoluta acumulada Fi
frecuencia relativa acumulada Hi
número de datos n
Notas importantes
Unidad 1. Organización de Datos 21
Diagrama de Pareto
El diagrama de Pareto, también llamado curva
80%-20%, es una gráfica para organizar
datos de forma que queden en orden pocos factores
El diagrama de
descendente, de izquierda a derecha. Pareto permite pueden
ver que, en producir la
Permite asignar un orden de prioridades, muchos casos, mayoría de las
afirmando que en todo grupo de factores consecuencias,
Construya la distribución de
La categoría “Otros” es colocada en la
frecuencias, ordenando las categorías
última posición. No importa cuán
en forma descendente respecto de la
grande sea.
frecuencia.
Notas importantes
22 Estadística Descriptiva 201601
Ejemplo 7
El gerente de producción de una empresa, que produce asientos de fibra de vidrio, quie-
re identificar los problemas más frecuentes reportados en la fabricación de este produc-
to, y planear soluciones de acuerdo con la recurrencia del problema. Al extraer una
muestra aleatoria de productos fallados, obtuvo los siguientes resultados:
Distribución de productos según problemas reportados de asientos de fibra de vidrio
Tipo de problema reportado Número de ocurrencias (fi)
Color inadecuado 28
Forma no simétrica 16
Medidas fuera de norma 50
Superficie rugosa 71
Bordes afilados 9
Desprendimiento de capa protectora 12
Otros 14
Fuente: Gerencia de Producción
Solución
Lo primero es ordenar los datos en orden descendente a la frecuencia fi. La categoría
Otros va al final. Luego, se calcula las frecuencias relativas y las relativas acumuladas.
Distribución de productos según problemas reportados de asientos de fibra de vidrio
Tipo de problema reportado fi hi Fi Hi
Superficie rugosa 71 0,355 71 0,355
Medidas fuera de norma 50 0,250 121 0,605
Color inadecuado 28 0,140 149 0,745
Forma no simétrica 16 0,080 165 0,825
Desprendimiento de capa protectora 12 0,060 177 0,885
Bordes afilados 9 0,045 186 0,930
Otros 14 0,070 200 1,000
Fuente: Gerencia de Producción
Se puede realizar el gráfico usando las frecuencias relativas hi y las frecuencias relativas
acumuladas Hi.
Notas importantes
Unidad 1. Organización de Datos 23
Caso Aerolínea Wayra
Objetivo: Identificar las principales quejas de los pasajeros sobre el servicio que brinda
la aerolínea.
Notas importantes
24 Estadística Descriptiva 201601
Ejercicio 7
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e In-
formática se preguntó a las peruanas de 12 a más años por la cantidad de hijos que han
tenido vivos, obteniéndose los siguientes resultados.
Perú. Distribución de madres según edad de la madre y número de hijos nacidos vivos
Número total de hijos/a que ha tenido nacidos vivos
Edad de la madre Cero hijos Un hijo Dos hijos Tres hijos Cuatro hijos Total
12 años 298,985 1,028 300,013
13 años 284,650 1,162 285,812
14 años 285,732 1,638 734 288,104
15 años 283,045 4,909 994 288,948
16 años 247,888 12,358 922 576 261,744
17 años 231,839 24,243 2,280 636 258,998
18 años 216,999 38,938 5,089 586 481 262,093
19 años 193,952 52,797 9,273 1,118 496 257,636
Total 2,043,090 137,073 19,292 2,916 977 2,203,348
Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda
Notas importantes
Unidad 1. Organización de Datos 25
Notas importantes
26 Estadística Descriptiva 201601
Caso Aerolínea Wayra
Objetivo: Identificar el porcentaje de pasajeros que siendo de nacionalidad peruana via-
jan al extranjero y porcentaje de pasajeros que siendo de nacionalidad extranjera viajan
al interior de nuestro país.
18%
16%
14%
12%
10%
8% Peruano
6% Extranjero
4%
2%
0%
Arequipa Cuzco Miami México D.F Piura Río de
Janeiro
Notas importantes
Unidad 1. Organización de Datos 27
Complete todos los elementos del siguiente gráfico.
100%
90% 17.9%
33.3% 31.3%
80%
50.0%
70%
60% 77.8%
50% Extranjero
40%
Peruana
30%
20%
10%
0%
Arequipa Cuzco Miami México Piura Río de
D.F Janeiro
100%
90% 25.6%
80%
2.2% Río de Janeiro
70%
60% 24.4% Piura
40% Miami
22.2%
30% Cuzco
20% Arequipa
16.7%
10%
8.9% 13.3%
0%
Peruana Extranjero
Notas importantes
28 Estadística Descriptiva 201601
Título: ……………………………………………………………….……
Valores de la variable Frecuencia Frecuencia Frecuencia absolu- Frecuencia relati-
discreta absoluta fi relativa hi ta acumulada Fi va acumulada Hi
f1
x1 f1 h1 F1 f1 H1 h1
n
f
x2 f2 h2 2 F2 f2 F1 H2 h2 H1
n
… … … … …
fk
xk fk hk Fk fk Fk 1 Hk hk Hk 1
n
Fuente: ……………………………..
Gráfico de bastones
En este caso, la variable se ubica en el eje de las abscisas y las frecuencias, absolutas, re-
lativas o porcentuales, en el eje ordenado.
500,000
400,000
300,000
200,000 119,642
58,315
100,000 18,748 9,908 81 32 22 7
0
0 1 2 3 4 5 6 7 8 9
Número de veces que postuló
Fuente: PERÚ, II Censo Nacional Universitario 2010. INEI
Notas importantes
Unidad 1. Organización de Datos 29
Caso Aerolínea Wayra
Objetivo: Determinar el número de viajes más frecuente realizados por los pasajeros.
Título: ……………………………………………………………………………………………………………
Número de viajes Número de pasajeros pi Pi
1 15
2 12%
3 38%
4 30
5
150
Fuente: ……………………………………………….
Número de viajes
Responda al objetivo.
Para Fiestas Patrias, la empresa está dispuesta a realizar una promoción en los pasajes
de su aerolínea siempre y cuando el porcentaje de pasajeros que hayan realizado como
mínimo cuatro viajes supere el 70%. ¿La empresa debe realizar una promoción en los
pasajes para Fiestas Patrias para este grupo de pasajeros?
Notas importantes
30 Estadística Descriptiva 201601
Los tres pasos necesarios para definir en una distribución de frecuencias con datos cuan-
titativos son los siguientes:
Cantidad de clases
Se recomienda usar entre 5 y 20 clases, inclusive.
La regla de Sturges la
La idea es emplear suficientes clases para mostrar la varia- propuso Herbert
ción de los datos, pero no tantas que varias contendrían unos Sturges (1926). La
cuantos elementos. fórmula trata de que
el histograma resul-
Para determinar el número de clases se usa la regla de Stur- tante se aproxime a la
ges. k=1+3,322 log n. Si la estimación tiene decimales, se to- distribución normal.
ma el entero más próximo.
rango
Amplitud
k
La amplitud se redondea al número inmediato superior de acuerdo con la cantidad de
decimales que tienen los datos o según la precisión con que se desea trabajar.
El límite inferior de clase es el valor mínimo posible de los datos que se asigna a la clase.
El límite superior de clase es el valor máximo posible de los datos que se asigna a la cla-
se.
Notas importantes
Unidad 1. Organización de Datos 31
Ejemplo 8
El jefe de la Oficina de Rentas de una Municipalidad ha realizado un estudio sobre los
impuestos que pagan los vecinos del distrito. La tabla muestra los pagos de impuestos,
en soles, en el 2014 de 48 viviendas elegidas al azar.
145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1
Elabore la tabla de frecuencias para la variable: pago por impuestos municipales año
2014.
Solución
El rango r se calcula con:
r 206
w 29,429 29,5 (Redondeo por exceso a un decimal)
k 7
Notas importantes
32 Estadística Descriptiva 201601
Se seleccionó una muestra al azar de pasajeros de la aerolínea Wayra que viajaron a di-
ferentes destinos turísticos.
4,2 4,6 4,9 5,7 5,9 7,3 7,3 7,5 7,5 7,5
7,6 7,7 7,9 8,0 8,0 8,1 8,3 8,4 8,4 8,5
8,6 8,8 8,9 9,0 9,0 9,1 9,4 9,4 9,4 9,5
9,7 9,7 9,7 9,8 9,8 9,9 9,9 9,9 9,9 10,0
10,5 10,6 10,7 11,0 11,5 12,0 12,0 12,3 12,4 12,7
Título: …………………………………………………………………………………………………………………….
Fuente: ………………………………..……………………………………
Notas importantes
Unidad 1. Organización de Datos 33
Indique e interprete el valor de las siguientes frecuencias para la distribución de fre-
cuencias anterior.
f3
F2
H4
La idea básica para distribuciones de frecuencias de dos o más grupos de datos es tener
intervalos comunes, es decir, que los límites de los intervalos para ambas distribuciones
sean iguales. Para ello, debemos seguir los siguientes pasos:
Hallar el mínimo de todos los datos y el máximo de todos los grupos de datos, y usarlos
para calcular el rango.
k 1 3,322log10 n
Notas importantes
34 Estadística Descriptiva 201601
Ejemplo 9
La empresa de investigación de mercado “Eléctrico” lleva a cabo un estudio para obte-
ner indicadores que le permitan inferir respecto al consumo de energía eléctrica men-
sual (medido en kilovatios, redondeado al entero más próximo) de las familias en los
departamentos de Arequipa y Tacna. Dicho estudio, sustentado en el análisis de mues-
tras aleatorias tomadas en ambos departamentos, arrojó los siguientes resultados:
Arequipa
227 231 261 270 291 351 359 369 371 382 387 392 393 395 396 413 420 422 424 436
453 461 463 471 495 498 510 512 533 534 541 542 584 589 591 628 630 630 657 666
Tacna
217 219 263 287 294 340 346 347 348 377 390 392 395 396 397 408 418 424 426 429
438 438 442 446 447 450 456 481 496 508 511 533 549 583 609 636
Usando la regla de Sturges, calcule intervalos comunes y marcas de clase de una tabla de
distribución de frecuencias que permita comparar los datos.
Solución
Hallar el mínimo de todos los datos (217) y el máximo de todos los datos (666) de ambas
ciudades, y usarlos para calcular el rango.
Notas importantes
Unidad 1. Organización de Datos 35
Caso Aerolínea Wayra
Objetivo: Comparar la distribución de las horas diarias trabajadas según las horas extras.
Datos sobre horas diarias trabajadas con y sin horas extras pagadas
Horas diarias trabajadas con horas extras pagadas Horas trabajadas sin horas extras pagadas
6,7 8,9 9,8 10,8 11,2 11,8 12,3 13,2 5,0 8,2 8,5 8,9 9,7 10,8
7,9 8,9 10,1 10,8 11,3 11,9 12,4 13,4 7,0 8,2 8,5 8,9 9,8 11,0
8,0 9,0 10,2 10,9 11,4 12,0 12,4 13,5 7,0 8,2 8,5 8,9 9,9 11,2
8,0 9,1 10,2 11,0 11,4 12,0 12,4 13,6 7,0 8,3 8,6 9,0 9,9 11,6
8,1 9,1 10,3 11,0 11,5 12,1 12,5 13,7 7,0 8,3 8,6 9,1 10,0 11,7
8,1 9,3 10,4 11,0 11,5 12,1 12,5 13,9 7,1 8,3 8,7 9,1 10,0 12,2
8,2 9,4 10,6 11,1 11,5 12,1 12,6 14,6 8,1 8,4 8,7 9,3 10,3 12,5
8,5 9,5 10,6 11,1 11,6 12,2 12,7 14,8 8,2 8,4 8,7 9,4 10,5 12,9
8,6 9,7 10,7 11,1 11,7 12,2 12,9 15,0 8,2 8,4 8,8 9,6 10,5 13,3
8,8 9,7 10,8 11,2 11,7 12,3 13,1 15,5 8,2 8,4 8,8 9,7 10,6 14,0
Fuente: Aerolínea Wayra
Notas importantes
36 Estadística Descriptiva 201601
Caso Aerolínea Wayra
Objetivo: Comparar el exceso de peso del equipaje de los pasajeros según su género.
Se realizó un estudio en el cual, se elaboró bajo una muestra elegida al azar de 40 pasa-
jeras y 110 pasajeros, obteniéndose la siguiente gráfica. Además, se considera exceso de
peso cuando el pasajero lleva consigo maletas que sobrepasan los 32 kilogramos.
65% 83%
70% 74%
60% Femenino
50% 61%
40% 31% Masculino
30% 20%
20%
10% 0% 13%
0%
20 24 28 32 36 40 44
Fuente: Aerolínea Wayra Peso, en kilogramos
Complete las siguientes afirmaciones, tenga en cuenta que se considera exceso de peso
cuando las maletas sobrepasan los 32 kilogramos.
a. El número de pasajeros hombres _______ que llevan consigo maletas que pesan
más de 36 kilogramos pero a lo más 40 kilogramos.
b. El _______ % de las pasajeras mujeres lleva consigo maletas que pesan hasta 36 ki-
logramos.
c. El _______% de los pasajeros hombres lleva consigo maletas con exceso de peso.
d. El género que presenta un mayor porcentaje de pasajeros con exceso de peso del
equipaje es _____________ y representa en __________ % superior con respecto al
otro género.
Notas importantes
Unidad 1. Organización de Datos 37
Notas importantes
38 Estadística Descriptiva 201601
Polígono de frecuencias
Un polígono de frecuencias es un gráfico de líneas que une los puntos asociados a las
marcas de clase de una variable. La altura del punto asociado a cada marca de clase es
proporcional a la frecuencia de dicho valor.
Se realiza uniendo
Los polígonos de frecuencias
con segmentos de recta
se cierran creando
los puntos de intersección
dos intervalos ficticios,
de las marcas de clase
uno antes del primer intervalo
con las frecuencias
y uno después del último.
(absolutas, relativas o porcentuales).
Notas importantes
Unidad 1. Organización de Datos 39
Distribuciones acumuladas
La distribución de frecuencias acumuladas muestra la cantidad de elementos con valores
menores o iguales al límite superior para cada clase.
Ojiva
La ojiva es la gráfica de una distribución acumulada de frecuencias.
Se obtiene uniendo
con segmentos de recta
La ojiva
los puntos de intersección
usa los líimtes de los intervalos
del límite superior de cada intervalo
y no las marcas de clase.
y la frecuencia acumulada
respectiva.
Con la ojiva
se puede estimar fácilmente
el número
o porcentaje de observaciones
que corresponden
a un intervalo determinado.
80% 84.75%
70%
60% 57.62%
50%
40%
30%
20% 19.82%
10%
0%
0 4 8 12 16 20
Número de años
Fuente: Empresa A. Gerencia de RRHH
Notas importantes
40 Estadística Descriptiva 201601
Caso Aerolínea Wayra
Objetivo: Determinar el porcentaje de pasajeros que exceden el peso de equipaje de
mano.
Use uno de los gráficos para calcular, aproximadamente, porcentaje necesario para re-
solver el objetivo.
Notas importantes
Unidad 1. Organización de Datos 41
2. Según el estudio “Rumores de oficina”, el 42% de los ejecutivos limeños considera que
los rumores influyen mucho en el clima laboral de la oficina. Indique el elemento, una va-
riable a medir y una posible observación.
3. En una investigación, se quiere estimar el promedio del número de asistentes a los con-
ciertos de artistas internacionales realizados en Lima durante el año 2014. Indique el
elemento, una variable a medir y una posible observación.
6. Según los Censos Nacionales XI de Población y VI de Vivienda 2007 ejecutados por el INEI,
el 50,30% de los peruanos son mujeres. Indique si este dato es un parámetro o un esta-
dístico.
7. La nueva lista roja de aves de 2014, confeccionada con datos de BirdLife, muestra que de
las 10.425 especies de aves identificadas en el mundo, el 13% están amenazadas de ex-
tinción. Estas listas, dice Juan Carlos Atienza, de SEO BirdLife, contribuyen establecer
prioridades a la hora de favorecer políticas de conservación y declarar nuevos espacios
protegidos. Indique si este valor corresponde a un parámetro o a un estadístico.
8. El gráfico muestra la evolución de la inflación desde el año 1980 al 2013. Indique si el ín-
dice de precios al consumidor IPC que obtiene el INEI es un parámetro o un estadístico.
Notas importantes
42 Estadística Descriptiva 201601
10. El objetivo de una investigación es estimar el porcentaje de peruanos que aprueban la
gestión de Ollanta Humala como presidente de la República, para lo cual se tomó una
muestra aleatoria de personas de 18 a 70 años y se les preguntó por su opinión. Los re-
sultados son los siguientes.
Tabla. …………………………………….………………………………………………………………………
Tipo de institución fi hi Ángulo
Estatal 256 060 0,5405
Particular 154 275 0,3256
Particular religioso 58 673 0,1238
No escolarizado 4 472 0,0094
Otro 309 0,0007
Total 473 789
Notas importantes
Unidad 1. Organización de Datos 43
13. En la publicación Revista Científica-Estudiantil de Ciencias Médicas de Cuba se publicó el
artículo “Pancreatitis aguda. Retos y perspectivas” el cual contenía el siguiente gráfico.
Observe el gráfico e indique un posible error.
Fuente: Datos tomados de HC del departamento de archivo del HDCQ “10 de Octubre”
Tomado de http://www.16deabril.sld.cu/rev/228/articulo3.html
14. Observe los dos gráficos siguientes e indique la posible diferencia de interpretación entre
ambos.
15. En la agencia de viajes A se realizó una encuesta a 330 clientes respecto a las principales
quejas que tienen clientes acerca de los tours del tipo todo incluido al exterior. Las cuales
se detallan en el siguiente cuadro:
Notas importantes
44 Estadística Descriptiva 201601
16. Uno de los objetivos de una investigación en la empresa A es mostrar la composición
porcentual del número de cursos de capacitación dadas a sus trabajadores. Los siguien-
tes datos muestran el número de capacitaciones que 48 trabajadores han recibido en el
presente año.
3 3 1 2 1 1 2 2 1 6 3 1 3 1 3 2
1 1 1 1 3 2 2 4 1 2 2 2 1 3 1 2
3 2 2 3 2 2 1 2 2 2 2 1 1 1 6 2
167 172 173 180 182 182 183 183 183 184 185 186
186 186 187 189 190 191 191 192 193 194 194 194
194 195 195 195 197 197 199 201 201 201 201 201
203 204 205 207 207 207 207 209 210 212 212 213
213 214 218 218 218 219 220 222 223 226 228 232
Realice la tabla de distribución de frecuencias de los datos.
- 780
- 150
-
Fuente. Gerencia de Recursos Humanos. Agosto 2014. Empresa A
19. En economía, la prima de riesgo es el sobreprecio que paga un país para financiarse en
los mercados en comparación con otros países. De esta forma, cuanto mayor es el riesgo
país, más alta será su prima de riesgo. Significa la confianza de los inversores en la solidez
de una economía. La prima de riesgo de los países de la Unión Europea se calcula respec-
to de Alemania porque se supone que su deuda pública es la que tiene menor riesgo de
impago. Para el caso de España, la agencia de calificación de riesgos A ha medido la pri-
ma de riesgo durante 50 días desde junio del 2015.
Notas importantes
Unidad 1. Organización de Datos 45
España. Distribución de días según prima de riesgo. Junio y julio del 2015
Prima de riesgo Marca de clase fi hi Fi Hi
[ 120 ; 130 ] 125 1 0,0200 1 0,0200
] 130 ; 140 ] 135 3 0,0600 4 0,0800
] 140 ; 150 ] 145 11 0,2200 15 0,3000
] 150 ; 160 ] 155 14 0,2800 29 0,5800
] 160 ; 170 ] 165 12 0,2400 41 0,8200
] 170 ; 180 ] 175 6 0,1200 47 0,9400
] 180 ; 190 ] 185 3 0,0600 50 1,0000
Fuente: Agencia de Calificación de Riesgos A.
20. Indique el tipo y escala de medición de las siguientes variables y su escala de medición.
Variable
21. En el II Censo Nacional Universitario del año 2010 realizado por el INEI se preguntó a los
alumnos de todo el Perú por su tipo de universidad y su género. Los datos se muestran
en el siguiente cuadro.
Elabore un gráfico comparativo que permita ver la composición porcentual por género y
tipo de universidad.
Elabore un gráfico comparativo que permita ver la composición porcentual por género
según tipo de universidad.
Elabore un gráfico comparativo que permita ver la composición porcentual por tipo de
universidad según género.
Notas importantes
46 Estadística Descriptiva 201601
22. Encuentre todos los errores del siguiente gráfico, realizado a partir de la Encuesta Nacio-
nal de Hogares realizada por el Instituto Nacional Estadística e Informática del Perú entre
los años 2005 y 2011.
Tomado de http://www.inei.gob.pe/perucifrasHTM/inf-soc/cuadro.asp?cod=3718&name=edu14&ext=gif
Afirmación
Solo las variables cuantitativas continuas pueden toman valores con decimales
En un gráfico circular, el ángulo que le corresponde a cada parte se obtiene multiplicando 360º
por la respectiva frecuencia absoluta dividida entre la cantidad de datos.
La frecuencia porcentual de una clase es la proporción de elementos que pertenecen a esa
clase.
En un gráfico de barras apiladas al 100%, el alto de las barras es igual en cada categoría.
Notas importantes
Unidad 1. Organización de Datos 47
Frecuencia acumulada
100
80 80
72
60
40 30 40
20
0
0 20 40 60 80 100
Tiempo (en minutos)
Fuente: Calidad Educativa Universidad A
Afirmación
25. A nivel nacional, se observa que la curva de frecuencia acumulada del ingreso real para el
año 2012 se ha desplazado ligeramente hacia la derecha, lo que indica un ……………………..
(aumento o decremento) del ingreso en todos los segmentos de la distribución.
26. Loy Toy es una red de librerías, con sucursales en los distritos de Santiago de Surco, San
Borja y San Luis. Se ha observado que durante los últimos meses los montos de ventas
vienen disminuyendo, por lo que el administrador desea conocer los factores que están
originando este problema y le ha encargado a su equipo de trabajo realizar una encuesta
entre sus clientes, seleccionados aleatoriamente de cada sucursal.
Entre los clientes que respondieron la pregunta sobre el aspecto que considera deficien-
te del local, se tiene:
Notas importantes
48 Estadística Descriptiva 201601
Distribución de clientes según aspecto que considera deficiente del local
Aspecto deficiente Número de clientes
Local muy pequeño 53
Poco stock de libros 56
Limpieza 10
Otros 12
Pocas ofertas 38
Personal no capacitado 31
Fuente: Loy Toy
Elabore el gráfico de Pareto y realice una conclusión.
Al procesar los datos de 50 clientes del local de San Borja, se obtuvo la siguiente infor-
mación:
Número de hijos en edad escolar fi hi
1 a
2 2a
3 12
4 6
5 2
Complete la tabla y responda:
- La variable en estudio es ______________________ y su escala es _____________.
- El gráfico a usar para esta variable es _______________.
- Calcule el valor de interprete f2 y h5.
El siguiente gráfico se ha obtenido a partir de la información brindada por 100 clientes de
la sucursal de San Borja y 110 clientes de la sucursal de San Luis.
Notas importantes
Unidad 2. Medidas descriptivas 49
Logro de la unidad 2
Al finalizar la unidad 2,
el estudiante analiza el comportamiento de datos reales
aplicando las medidas de resumen de datos,
utilizando el programa MS Excel 2010.
Temario
Medidas de tendencia central: media aritmética, mediana, moda, media ponderada
Medidas de posición: cuartiles, deciles, percentiles
Medidas de dispersión: varianza, desviación estándar, coeficiente de variación
Medidas de asimetría
Diagramas de cajas
Notas importantes
50 Estadística Descriptiva 201601
10,6 14,5 17,2 12,8 13,6 11,6 11,3 13,0 13,5 10,8 13,9 14,2 15,3 14,3 14,3 14,3
11,8 16,1 16,8 18,8 14,8 14,0 16,4 14,2 16,5 12,1 13,3 12,0 14,3 14,9 15,1 14,4
Ejercicio 8
Luego de una investigación se tiene muchos datos, con ellos se puede realizar algunos
gráficos y distribuciones de frecuencias, pero ¿cómo resumir alguna característica de la
información en un solo número?
Notas importantes
Unidad 2. Medidas descriptivas 51
Media
La media aritmética (media o promedio) de un conjunto de valores de una variable es la
suma de dichos valores dividida entre el número de valores.
Notas importantes
52 Estadística Descriptiva 201601
Cálculo de la media aritmética
La fórmula para la media poblacional es
N
x i
i 1
N
Las fórmulas para la media muestral son:
4 5 7 2 3,5 5 2 0,5 6 7 1 2
Notas importantes
Unidad 2. Medidas descriptivas 53
A una muestra de viajeros frecuentes se les preguntó por el número de veces que viajó
con Wayra en el último mes. Calcule e interprete la media muestral.
Distribución de viajeros frecuentes según el número de veces que viajó en el último mes
Número de veces fi
1 71
2 133
3 346
4 85
6 15
Fuente: Wayra
A una muestra de 500 pasajeros premium se les preguntó por la cantidad de dinero que
estarían dispuestos a pagar por un menú gourmet durante un vuelo nacional. Los datos
se muestran a continuación.
Distribución de viajeros premium según lo que pagarían por menú gourmet en vuelo nacional
Dinero (en soles) Marca de clase fi hi Fi Hi
, 20 0,05
, 225
, 30 0,75
,
Fuente: Wayra
Notas importantes
54 Estadística Descriptiva 201601
Ejercicio 9
Calcule la media de los siguientes grupos de números.
Grupo 1 1 2 3 4 5 6 7
Grupo 2 1 2 3 4 5 6 700
Características de la media
- Se puede calcular para datos medidos en escala de intervalo o razón.
- El valor de la media es sensible a los valores extremos, por lo que varía mucho con
valores muy grandes o muy pequeños con respecto a los demás.
y ax b
Si el sueldo promedio es de 4100 soles, ¿cuál de las dos ofertas debe aceptar el sindicato
si lo que desea es hacer máximo el sueldo medio de los trabajadores
Notas importantes
Unidad 2. Medidas descriptivas 55
Mediana
La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a di-
cho conjunto.
Ejercicio 10
Interprete alguna de las siguientes medianas.
Notas importantes
56 Estadística Descriptiva 201601
Cálculo de la mediana
8 20 15 14 20 10 5 14 13 16 17 14 8 25
Notas importantes
Unidad 2. Medidas descriptivas 57
De una muestra de 50 vuelos, se ha registrado el número de personas que pierden su
vuelo por presentarse tarde al counter del aeropuerto. Los datos se muestran a conti-
nuación.
Distribución de …………………………………………………………………………………………………………………….
Número de pasajeros fi hi%
0 10
1 17
2 13
3 7
5 3
Fuente: Wayra
De una muestra de 600 pasajeros que habían realizado compras en el duty free durante
el vuelo, se registró la cantidad de dinero, en dólares, que habían gastado. Los datos se
muestran a continuación.
Distribución de …………………………………………………………………………………………………………………….
Dinero (en dólares) Marca de clase fi hi Fi Hi
0 , 162
, 70 240
, 143
,
Fuente: Wayra
Notas importantes
58 Estadística Descriptiva 201601
Ejercicio 11
Calcule la mediana de los siguientes grupos de números.
Grupo 1 10 11 12 13 14 15 16
Grupo 2 10 11 12 13 14 15 700
Características de la mediana
- Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
Notas importantes
Unidad 2. Medidas descriptivas 59
Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta
con mayor frecuencia.
Ejercicio 12
Interprete alguna de las siguientes modas.
Notas importantes
60 Estadística Descriptiva 201601
Cálculo de la moda
No No Sí No No Sí No Sí Sí Sí No No No Sí
Sí No Sí Sí No Sí No No No Sí Sí No Sí Sí
Notas importantes
Unidad 2. Medidas descriptivas 61
De una muestra de 500 vuelos de Wayra, se ha registrado el número de personas por
vuelo que han tenido problemas de salud. Los datos se muestran a continuación.
Distribución de …………………………………………………………………………………………………………………….
Número de pasajeros fi
0 310
1 146
2 33
3 7
4
Fuente: Wayra
Distribución de …………………………………………………………………………………………………………………….
Tiempo de anticipación (en días) Marca de clase fi hi Fi Hi
Notas importantes
62 Estadística Descriptiva 201601
Ejercicio 13
Calcule la moda de los siguientes grupos de números.
Grupo 1 1 2 3 3 4 4 5
Grupo 2 1 2 3 3 4 4 500
Características de la moda
- La moda se puede calcular para cualquier escala de medición.
- El valor de la moda no se ve afectada por valores extremos.
- La moda no siempre es un valor único. Una serie de datos puede tener dos modas
(bimodal) o más modas (multimodal). Algunas series de datos no tienen moda.
Media ponderada
Permite calcular el valor medio considerando la importancia o peso de cada valor sobre
el total.
x w i i
xw i 1
n
w
i 1
i
donde:
xi: Observación individual wi: Peso asignado a cada observación
Ejercicio 14
Las notas de un alumno de Estadística Descriptiva son:
Notas importantes
Unidad 2. Medidas descriptivas 63
Caso Aerolínea Wayra
Objetivo: Comparar la media de los precios de pasajes por tipo de cliente.
Wayra lanzará una campaña de marketing a los dos tipos de clientes con los precios me-
dios de pasajes más altos. Indique los tipos de clientes a los que lanzará la campaña.
Wayra lanzará una campaña de fidelización de clientes y rebajará 15% los precios de los
pasajes a Miami. Si la media del precio de estos pasajes es 740 dólares. Indique el nuevo
precio medio.
Wayra lanzará una campaña de fidelización de clientes y rebajará 10 dólares los precios
de los pasajes a Cusco. Si la media del precio de estos pasajes es 105 dólares. Indique el
nuevo precio medio.
Notas importantes
64 Estadística Descriptiva 201601
Objetivo. Analizar un reclamo de clientes Premium sobre el precio excesivo de pasajes.
Los clientes tipo Premium han expresado su malestar por las altas tarifas en los precios
de los pasajes que pagan. Por ello, la empresa desea conocer cuál es el precio mínimo de
los pasajes más costosos que paga la mitad de clientes Premium, con el fin de revisar un
porcentaje de descuento en su próximo viaje ¿Cuál es este precio mínimo?
La empresa desea lanzar una campaña de marketing directo a los clientes de tipo grupos
considerando el precio de pasaje más frecuente que suelen pagar. ¿Cuál es ese precio?
Notas importantes
Unidad 2. Medidas descriptivas 65
1.2. Cuantiles
Los cuantiles son valores de la distribución que la dividen en partes iguales, es decir, en
intervalos, que comprenden el mismo número de valores. Los más usados son:
Deciles
Un decil se refiere a cada uno de los nueve valores que dividen un grupo de datos (clasi-
ficados con una relación de orden) en diez partes iguales, de manera que cada parte re-
presenta un décimo de la población.
Ejercicio 15
El siguiente gráfico muestra la evolución del ingreso real promedio per cápita en el Perú
del año 2013 al 2014. ¿Qué grupo mejoró porcentualmente más sus ingresos, las perso-
nas con menores o con mayores ingresos?
Notas importantes
66 Estadística Descriptiva 201601
Percentil
El percentil k-ésimo Pk es un valor tal que por lo menos k por ciento de las observaciones
son menores o iguales que este valor.
Ejercicio 16
Interprete alguno de los siguientes percentiles.
Notas importantes
Unidad 2. Medidas descriptivas 67
Cálculo del percentil
Ejercicio 17
Calcule el percentil 75 de los siguientes grupos de números.
Grupo 1 10 12 13 14 15 16 17
Grupo 2 10 12 13 14 15 16 17 700
Notas importantes
68 Estadística Descriptiva 201601
Caso Aerolínea Wayra
Objetivo. Analizar un reclamo de clientes Premium sobre el precio excesivo de pasajes.
Calcule el precio máximo de un pasaje para estar en el 15% de los pasajes más baratos.
Calcule el precio mínimo de un pasaje para estar en el 25% de los pasajes más caros.
Notas importantes
Unidad 2. Medidas descriptivas 69
Ejemplo 10
La siguiente tabla corresponde a la distribución de frecuencias de los 200 trabajadores
de la empresa A según salario, en soles, del último mes.
Calcule el sueldo mínimo para estar en el 15% de los trabajadores mejores pagados.
Solución
Usando las frecuencias absolutas se tiene:
w n 85 200 200 85
P85 Li F4 1 1050 132 1208,33
f4 100 48 100 soles
w 85 200 85
P85 Li H4 1 1050 100 0,66 1208,33
h4 100 0,24 soles
Notas importantes
70 Estadística Descriptiva 201601
Con las medidas de tendencia central es Las medidas de variabilidad indican cuán
posible determinar el valor central de una alejados están los valores de una variable
distribución, pero no indican qué tan del valor que los representa y, por lo tanto,
cercanos o lejanos están los datos de dicho permiten evaluar la confiabilidad de ese
valor central. valor central.
Si la medida de dispersión:
- tiene un valor pequeño, los datos están concentrados alrededor de la medida de tendencia
central,
- tiene un valor grande, los datos no están concentrados alrededor de la medida de tendencia
central.
Notas importantes
Unidad 2. Medidas descriptivas 71
Varianza
La varianza es el promedio de los cuadrados de la diferencia de cada dato con la media.
Las unidades de la varianza son las unidades de los datos al cuadrado.
Cálculo de la varianza
La fórmula para la varianza poblacional es
N
x
2
i
2 i 1
Desviación estándar
La desviación estándar es la raíz cuadrada positiva de la varianza.
La desviación estándar poblacional se denota por y la muestral por s.
Ejercicio 18
Calcule la desviación estándar de los siguientes grupos de números.
Grupo 1 1 2 3 4 5 6 7
Grupo 2 1 2 3 4 5 6 700
Notas importantes
72 Estadística Descriptiva 201601
Características de la varianza y la desviación estándar
- La varianza y la desviación estándar se ven afectadas por valores extremos.
- La varianza y la desviación estándar son números reales no negativos.
- Se pueden calcular para variables medidas en escala de intervalo o razón.
- La varianza es expresada en unidades cuadráticas a las unidades de los datos, mien-
tras que, la desviación estándar es expresada en las mismas unidades de los datos.
- Si cada uno de los n valores xi es transformado en yi = a xi + b, siendo a y b constan-
tes, entonces, la varianza de los n valores yi es:
sY2 a2 s2X sY = a sX
Ejercicio 19
Calcule la desviación estándar de los siguientes grupos de números.
Grupo 1 1 2 3 4 5 6 7
Coeficiente de variación
El coeficiente de variación (CV) de un conjunto de datos indica lo grande que es la des-
viación estándar en comparación con la media.
Notas importantes
Unidad 2. Medidas descriptivas 73
Caso Aerolínea Wayra
Objetivo: Analizar si la compra con promociones genera mayor variabilidad de los tiem-
pos de espera en la compra de un pasaje.
35% 36.3%
Porcentaje de pasajeros
Sin promoción
30% 30.0%
26.7% Con promoción
25% 23.3% 25.0%
20% 20.0%
17.5%
15%
10% 11.3%
5% 2.5%
3.8% 1.3% 2.5%
0.0%
0%
7.5 12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5 52.5
Tiempos de espera, en minutos
Fuente: Aerolínea Wayra S.A.
Ejemplo 11
Los siguientes datos representan resúmenes del número de mediciones de resistencia
de cierto artículo que realizaron dos grupos de técnicos.
Grupo 1: media = 3 y desviación estándar = 1,10
Grupo 2: media = 5 y desviación estándar = 1,66
¿En cuál de los grupos el número de mediciones es más disperso?
Solución
Como los promedios son diferentes, se usa como indicador el coeficiente de variación:
1,10
CV1 100% 36,67%
3
1,66
CV2 100% 33,20%
5
El número de mediciones es más disperso en el grupo 1.
Notas importantes
74 Estadística Descriptiva 201601
Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la dife-
rencia entre el dato mayor y el dato menor.
donde Xmax y Xmin son los valores máximo y mínimo observados de la variable
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.
P25 P
75
RIC = P75- P25
Notas importantes
Unidad 2. Medidas descriptivas 75
Ejercicio 20
Calcule la mediana y desviación estándar muestral de los siguientes grupos de datos.
Grupo 1 1 2 3 4 5 8 8 8 8
Grupo 2 2 2 2 2 5 6 7 8 9
En base a sus resultados, ¿qué puede afirmar sobre los datos de cada grupo?
x Mediana
As 3
s
Si el coeficiente de simetría As es:
Notas importantes
76 Estadística Descriptiva 201601
Dato atípico
Es un dato inusualmente grande o pequeño con
respecto a los otros datos. Se considera dato atípi-
co a cualquier punto que esté:
Notas importantes
Unidad 2. Medidas descriptivas 77
Caso Aerolínea Wayra
Objetivo. Comparar el precio de los pasajes por condición de compra.
Notas importantes
78 Estadística Descriptiva 201601
Ejemplo 12
Los registros policíacos del distrito A muestran los siguientes números de informes de
delitos diarios para una muestra de días durante los meses de invierno y una muestra de
días durante los meses de verano.
Invierno 5 5 6 7 7 8 12 14 15 15 17 17 18 18 20 21 21 21 21 22
Verano 5 5 8 8 9 9 10 12 18 20 20 20 24 24 26 27 27 27 28 28
Construya un gráfico que permita comparar, entre invierno y verano, los valores medios,
la variabilidad y encontrar los valores atípicos del número de delitos diarios.
Solución
Se debe calcular los percentiles con datos simples. No calcule la distribución de fre-
cuencias.
Para el invierno, de acuerdo con los datos, los bigotes llegan como mínimo a 5 y como
máximo a 22.
Para el verano, de acuerdo con los datos, los bigotes llegan como mínimo a 5 y como
máximo a 28.
Notas importantes
Unidad 2. Medidas descriptivas 79
Ejercicios de la Unidad 2
1. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de
hombres peruanos de 18 años. Calcule e interprete la media de la estatura de la muestra.
1,67 1,70 1,83 1,65 1,70 1,65 1,60 1,70 1,61 1,69
, 155 0,48
, 0,32
, 167 0,95
, 600
Fuente: MINSA
4. Una tienda rebaja los precios, en 12%, a toda su línea de casacas. Si la media de los pre-
cios de las casacas antes de la rebaja era de 155 soles. Calcule la nueva media de los pre-
cios.
5. En una empresa el sueldo medio es 2500 soles. La gerencia, luego de la negociación con
el sindicato, decide realizar un aumento del 3,5% y un bono de 150 soles a cada trabaja-
dor. Calcule el nuevo sueldo medio.
6. Se registra los tiempos, en minutos, que se demora una cajera en atender a algunos
clientes del supermercado A.
5,3 2,7 10,7 8,2 3,0 5,4 5,6 10,2 11,3 2,6 2,6 5,4 3,5 7,0 11,5
Notas importantes
80 Estadística Descriptiva 201601
7. En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e In-
formática se preguntó a las madres peruanas que fueron menores de edad cuando nació
su primer hijo(a) nacido vivo, obteniéndose los siguientes resultados.
Perú. Distribución de peruanas según edad al nacer su primer hijo(a) vivo. 2007
Edad de la madre fi hi Fi Hi
12 años 6,380 0,0054 6,380 0,0054
13 años 13,840 0,0118 20,220 0,0173
14 años 62,898 0,0537 83,118 0,0710
15 años 210,250 0,1795 293,368 0,2505
16 años 366,822 0,3132 660,190 0,5636
17 años 511,133 0,4364 1,171,323 1,0000
Fuente: PERÚ, INEI. Censos Nacionales 2007
8. En una ciudad, se tomó una muestra aleatoria de 1000 personas y se les preguntó por su
ingreso mensual, en dólares, obteniéndose los siguientes resultados.
“La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a
dicho conjunto. El …………………………………………….. son menores o igual a la mediana.”
“Usar la mediana como medida de tendencia central es preferible a usar la media cuan-
do…………………………………………………….………………………”
Notas importantes
Unidad 2. Medidas descriptivas 81
11. Calcule e interprete la moda de los siguientes datos, que corresponden al número de
errores ortográficos por correo electrónico que cometen algunos gerentes de una em-
presa en una comunicación escrita.
2 2 5 2 3 3 2 3 2 1 2 0 0 1 3 0 3 2 1 2
4 2 1 3 1 1 3 3 3 1 2 4 2 0 1 4 2 2 2 2
3,0 7,5 5,5 12,0 6,5 2,7 2,0 4,5 8,0 4,0 2,5 3,0 1,5 7,0
14. Los datos corresponden a las notas de 327 alumnos en la primera práctica de Estadística
Descriptiva del ciclo anterior. Calcule la desviación estándar muestral.
15. Los datos muestran las ventas de 90 vendedores de una empresa en el último mes.
Notas importantes
82 Estadística Descriptiva 201601
16. En una tienda, la desviación estándar de los precios de los jeans es de 20 soles, calcule la
nueva desviación estándar de los precios de los jeans si se realiza:
a. una rebaja del 6% de todos los precios,
b. una oferta y se rebaja ocho soles a cada precio.
17. El siguiente cuadro muestra la distribución de los sueldos mensuales, en soles, de los
empleados de las empresas A y B.
18. Los siguientes datos representan las notas de la primera práctica de alumnos de Estadís-
tica Descriptiva. Calcule e interprete el percentil 25 de los siguientes datos.
19. Las notas de un curso de capacitación sobre tributación se muestran en la siguiente dis-
tribución de frecuencias.
Notas importantes
Unidad 2. Medidas descriptivas 83
Calcule la nota mínima para estar en el quinto superior.
Calcule la nota máxima para estar en el 10% de las notas más bajas.
Calcule el porcentaje de personas que tuvo notas menores o iguales a 13.
Calcule el porcentaje de personas que tuvo notas mayores a 12 y menores o iguales a
15,5.
20. Dados los siguientes datos, calcule e interprete el percentil 30 y el percentil 75.
38 45 20 20 10 12 18 28 18 23 11 15 3 5 6 4 3 5 5
Tomado de http://www.sciencedirect.com/science/article/pii/S1575092208758455
¿Qué significa que para las jóvenes de 18 años el percentil 3 del peso sea 44 kilos?
¿Qué significa que para las jóvenes de 19 años el percentil 50 de la talla es 1,64 metros?
22. El tiempo, en meses, que viene laborando 51 trabajadores en una empresa se registra en
la siguiente tabla.
6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60
Notas importantes
84 Estadística Descriptiva 201601
23. Indique si son verdaderas o falsas las siguientes afirmaciones.
24. La siguiente tabla muestra información de los precios del artículo A (en soles) en estable-
cimientos elegidos al azar en el distrito de La Molina.
H1 10 11 11 12 12 12 12 13 13 13 14 15 15 16 16 17 18 18 19 19 19 20
H2 4 11 11 11 12 12 13 13 14 14 15 15 16 16 15 16 16 17 17 18
H3 9 9 10 10 10 11 12 12 12 12 13 13 13 13 14 14 15 15 15 17
Indique el horario con mayor mediana de notas, el horario con mayor rango intercuartil
y el horario donde existen valores atípicos.
“Se trazan los bigotes desde los … ……………………... de las cajas hasta los valores mínimo
y máximo ……………..……………. de los límites inferior y superior.
Notas importantes
Unidad 2. Medidas descriptivas 85
27. Indique si son verdaderas o falsas las siguientes afirmaciones.
Con la intención de conocer los hábitos y preferencias de los estudiantes acerca de los
productos naturales, se contrató los servicios de la consultora Data Mining Today S.A. la
cual elaboró una encuesta para el estudio de mercado y se aplicó a 400 estudiantes de
diferentes instituciones educativas. Algunos resultados fueron:
Población
Variable cuantitativa continua
Variable cuantitativa discreta
Notas importantes
86 Estadística Descriptiva 201601
13 12 13 14 15 15 15 18 23 24 24 25 25 36 42 48 60
30. El siguiente cuadro muestra la distribución de los sueldos mensuales de los empleados de
las empresas A y B.
32. Loy Toy es una red de librerías, con sucursales en los distritos de Santiago de Surco, San
Borja y San Luis. Se ha observado que durante los últimos meses los montos de ventas
vienen disminuyendo, por lo que el administrador desea conocer los factores que están
originando este problema y le ha encargado a su equipo de trabajo realizar una encuesta
entre sus clientes, seleccionados aleatoriamente de cada sucursal.
Notas importantes
Unidad 2. Medidas descriptivas 87
La administración se ha trazado cumplir los siguientes objetivos:
1. Identificar el número de libros universitarios más frecuente que vende diariamente
en cada una de las sucursales.
2. Determinar el monto de venta mínima que debe tener la librería en un día, para estar
considerada dentro del 18% de los días con mayores ventas.
3. Determinar la sucursal que tiene las ventas más homogéneas.
4. Identificar el comportamiento de las ventas de los grupos de artículos: útiles escola-
res, material de oficina y libros universitarios.
Para cumplir los objetivos 1, 2 y 3 se seleccionaron muestras de las dos sucursales las
que se representan a continuación:
10
9
8 8
Número de días
7 7
6
5
4
3
2
1
0Fuente: Loy Toy
1 2 3 4 5 6 7
Notas importantes
88 Estadística Descriptiva 201601
El gerente comercial otorgará un bono al personal de la sucursal, cuya venta mínima dia-
ria del 18% de los días con mayores ventas sea superior a 250 soles. ¿En qué sucursal o
sucursales los trabajadores recibirán el bono de reconocimiento? Justifique numérica-
mente su resultado usando el gráfico y la tabla.
El gerente comercial de Loy Toy realizó el análisis de las ventas diarias por sucursal consi-
derando solo los promedios, pero esto generó el reclamo de los trabajadores. ¿Qué me-
dida adicional le sugiere calcular para realizar una comparación objetiva que le permita
determinar la sucursal con ventas más homogéneas? Justifique numéricamente su res-
puesta usando el gráfico y la tabla de la pregunta anterior. Para cumplir el objetivo 4 se
seleccionarán muestras de artículos que fueron clasificados en tres grupos: útiles escola-
res, material de oficina y libros universitarios.
El gerente comercial analizará las ventas del mes de agosto según grupo de artículos. Los
resultados se muestran a continuación:
Notas importantes
Unidad 2. Medidas descriptivas 89
Ventas en miles de nuevos soles, del mes de agosto según grupo de artículos
Material de oficina 29,2 29,5 33,4 35,8 37,4 44,5 57,6 58,8 62,7 65,3 75,1 115,0
Libros universitarios 55,0 67,5 74,2 78,0 78,7 80,0 85,0 85,0 85,0 86,6 92,0 100,0 115,0 125,0
Libros universitarios
Mínimo Límite Inferior
80
75.1
70
67.1 64.65
60
50 51.05
40 39.8
31.5 34
30 29.2
20
Útiles escolares Material de oficina Libros universitarios
Fuente: Lay Toy
Grupo de artículos
Notas importantes
90 Estadística Descriptiva 201601
Si el gerente comercial desea identificar qué grupo de artículos: útiles escolares, mate-
rial de oficina y libros universitarios presenta mayor dispersión en el 50% de las ventas
centrales. ¿Cuál sería su conclusión? Justifique su respuesta.
Notas importantes
Unidad 3:
Teoría de la probabilidad
Logro de la unidad 3
Temario
Reglas de conteo y combinaciones
Probabilidad: concepto, experimento aleatorio, espacio muestral y evento
Operaciones con eventos
Probabilidad condicional
Probabilidad total
Teorema de Bayes
Diagrama del árbol
Eventos independientes
92 Estadística Descriptiva 201601
Ejercicio 21
Marque con un aspa, asignando una opción a la situación descrita de acuerdo con su po-
sibilidad de ocurrencia.
Igualmente pro-
Muy poco Poco Bastante Muy
Situación bable que ocurra
probable probable probable probable
o que no ocurra
Una mujer será la
próxima presienta
del Perú
Aprobaré este
curso
Lanzo un dado y
sale un número par
El PBI del Perú
crecerá 4% este
año
Perú se clasificará
al Mundial Rusia
2018
Experimento aleatorio
Es todo proceso que genera dos o más resultados bien definidos sin que se pueda pre-
decir con certeza cuál de ellos será observado u ocurrirá en cada realización del proceso.
En cualquier repetición simple de un experimento, ocurrirá uno y solo uno de los posi-
bles resultados experimentales.
Espacio muestral
Es el conjunto de todos los posibles resultados de todos los resultados experimentales.
Se le suele simbolizar por S o Ω.
Evento
Un evento es un subconjunto del espacio muestral.
Al realizar un experimento, diremos que el evento A ha ocurrido si el resultado obtenido
es un elemento del evento A.
Usualmente a un evento se le denota con las letras mayúsculas del abecedario (A, B, C,
etc.)
Notas importantes
Unidad 3. Teoría de Probabilidad 93
Probabilidad de un evento
La probabilidad es una medida numérica de la posibilidad de que ocurra un evento. Por
tanto, la probabilidad es una medida del grado de incertidumbre asociado con un even-
to.
Una probabilidad cercana a 0 indica que es difícil que el evento ocurra, mientras que,
una probabilidad cercana a 1 indica que es casi seguro que el evento ocurra.
0 0,5 1
La ocurrencia del evento es
tan probable como improbable
Ejemplo 13
Sea el experimento aleatorio “Una app se ofrece por App Store y se registra el número
de descargas en un día”, indique el espacio muestral definido, un evento y asigne una
probabilidad de ocurrencia a dicho evento.
Ejercicio 22
Sea el experimento aleatorio “Un alumno se matricula en Estadística Descriptiva y anali-
za su situación al final del ciclo (aprobado, desaprobado, retirado)”. Indique el espacio
muestral definido, un evento y asigne una probabilidad de ocurrencia a dicho evento.
Experimento
aleatorio
Espacio muestral S={
Evento A=
Probabilidad P(A) =
Notas importantes
94 Estadística Descriptiva 201601
Ejemplo 14
Sea el experimento aleatorio “Lanzar un dado y anotar el número de puntos de la cara
superior”, indique el espacio muestral definido, un evento e indique su probabilidad de
ocurrencia.
Solución
Experimento Espacio muestral Evento Probabilidad
aleatorio
Ejemplo 15
Sea el experimento aleatorio “Lanzar dos dados y anotar el número de puntos de cada
cara superior”, indique el espacio muestral definido, un evento e indique su probabili-
dad de ocurrencia.
Solución
Experimento Espacio muestral Evento Probabilidad
aleatorio
Ejercicio 23
Sea el experimento aleatorio “Lanzar dos monedas y anotar el resultado”, indique el es-
pacio muestral definido, un evento e indique su probabilidad de ocurrencia.
Solución
Experimento aleatorio
Lanzar dos monedas y anotar el resultado
Espacio muestral
S={
Evento
A=
Probabilidad
P(A) = n(A)/n(S) =
Notas importantes
Unidad 3. Teoría de Probabilidad 95
Complemento (AC)
Para un evento A cualquiera se define su complemento AC como el evento consistente
en todos los puntos de S que no están en A.
Se tiene que:
P(A) = 1 - P(AC)
Ejercicio 24
Diego invierte en un negocio. Escriba el evento complementario al evento A:= Diego tie-
ne éxito en el negocio.
Ejercicio 25
Una gerente toma diez decisiones en su empresa. Escriba el evento complementario al
evento A:= La gerente tiene razón en tres o más de las decisiones.
Ejercicio 26
Complete los espacios en blanco.
La probabilidad de que una empresa gane una licitación es 0,60, por lo tanto, la probabi-
lidad de que no la gane ……………………….
La probabilidad de que una persona gane la Tinka con una jugada es del 0,0000123%,
por lo tanto, la probabilidad de que no la gane en una jugada es …………………………%.
Notas importantes
96 Estadística Descriptiva 201601
Unión de eventos (A B)
Para dos eventos A y B, la unión del evento A con el evento B es el evento que contienen
todos los puntos de S que pertenecen a A o a B o a ambos.
Intersección de eventos (A ∩ B)
Para dos eventos A y B, la intersección de los eventos A y B es el evento que contienen
todos los puntos de S que pertenecen tanto a A como a B.
Diferencia de eventos (A - B)
Para dos eventos A y B, la diferencia de los eventos A y B es el evento que contienen to-
dos los puntos de S que pertenecen a A y no pertenecen a B.
Notas importantes
Unidad 3. Teoría de Probabilidad 97
Ejercicio 27
Una financista invierte en fondos mutuos y en la Bolsa de Valores. Se definen los even-
tos:
A:= que la financista tenga éxito en la inversión de fondos mutuos
B:= que la financista tenga éxito en la inversión en la Bolsa de Valores.
Escriba los siguientes eventos en función de los eventos A y B. Además, grafique dicho
evento en un diagrama de Venn.
Notas importantes
98 Estadística Descriptiva 201601
Ejercicio 28
Indique si los siguientes eventos son mutuamente excluyentes.
Tengo cinco soles, A: Compro un sándwich que cuesta cuatro soles, B: Compro una ga-
seosa que cuesta dos soles …….………………
Notas importantes
Unidad 3. Teoría de Probabilidad 99
Regla de la multiplicación
Si un experimento se realiza por una sucesión de k pasos, en los el primer paso tiene n1
resultados posibles, el segundo tiene n2 resultados posibles y así sucesivamente, enton-
ces el número total de resultados del experimento es n1 x n2 x … x nk.
n!
C xn
x!n x !
Caso Aerolínea Wayra
En un vuelo, la aerolínea ha sobrevendido pasajes, por lo que tendrá que ofrecer pre-
mios a pasajeros para que no viajen en ese vuelo. Si hay 15 pasajeros que viajan solos y
están dispuestos a no viajar y recibir los premios ¿De cuántas maneras diferentes se
puede elegir a solo ocho de ellos?
En cada vuelo se elegirá al azar al 5% de los pasajeros para realizar una inspección ex-
haustiva, la cual detecta si una persona lleva sustancias ilegales. Si en un vuelo de 120
personas, hay tres personas que llevan sustancias ilegales. Calcule la probabilidad de de-
tectar al menos a una de ellas.
Notas importantes
100 Estadística Descriptiva 201601
Axiomas de la probabilidad
Sea un experimento aleatorio, S el espacio muestral asociado a dicho experimento alea-
torio y A un evento definido en S, entonces la probabilidad del evento A, denotada por
P(A), es aquel número que cumple los siguientes axiomas:
Axioma 3
Axioma 1 Axioma 2 Si A y B son dos eventos
mutuamente excluyentes
0 P(A) 1 P(S) = 1
entonces:
P(A B) = P(A) + P(B)
A:= ………………………………………………………………………………………………………………
B:= ………………………………………………………………………………………………………………
Notas importantes
Unidad 3. Teoría de Probabilidad 101
P A B
P A B
P B
Ejemplo 16
En un grupo, conformado por hombres y mujeres, existen profesionales y no profesiona-
les de acuerdo con la siguiente tabla.
Solución
Primero, definamos los eventos necesarios para resolver este problema:
Notas importantes
102 Estadística Descriptiva 201601
Calcule la probabilidad de que una persona elegida al azar compre pasajes por Internet y
tenga un destino de viaje internacional.
Si la probabilidad de que un cliente viaje dentro del país supera a 0,6, se decidirá partici-
par del próximo Cyber Day. ¿Qué decisión se tomará?
Solución
Defina los eventos necesarios para resolver este problema:
……………:= ………………………………………………………………………………………………………………
……………:= ………………………………………………………………………………………………………………
……………:= ………………………………………………………………………………………………………………
……………:= ………………………………………………………………………………………………………………
……………:= ………………………………………………………………………………………………………………
Notas importantes
Unidad 3. Teoría de Probabilidad 103
Pregunta Probabilidad
Calcule la probabilidad de que una persona P(………………………) =
elegida al azar compre pasajes por Internet
y tenga un destino de viaje internacional.
Si se elige al azar a un cliente frecuente, P(………………………) =
calcule la probabilidad de que compre pasa-
jes de forma presencial.
Si la probabilidad que un cliente viaje dentro P(………………………) =
del país supera a 0,6, se decidirá participar
del próximo Cyber Day. ¿Qué decisión se
tomará?
Ejemplo 17
La mayoría de las estaciones de servicio venden tres tipos de gasolina: 90 octanos, 95
octanos y 97 octanos. Con frecuencia, alguna de cada está enriquecida con un aditivo. La
tabla siguiente ilustra los porcentajes de clientes que prefieren cada tipo.
Solución
¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 oc-
tanos?
P A C c PA P C c P A C c 0,20 0,50 (0,05 0,05) 0,60
P D Cc P(D C c ) 0,30
0,60
P Cc 0,50
PA Bc
c
0,65
P Ac Bc 0,8125
PB
c
0,80
Notas importantes
104 Estadística Descriptiva 201601
Árbol de probabilidades
Notas importantes
Unidad 3. Teoría de Probabilidad 105
Probabilidad total
Sean los k eventos A1, A2, A3,..., Ak, mutuamente excluyentes y que constituyen una par-
tición del espacio muestral S, entonces para cualquier evento B de S se cumple:
PAi B
P Ai B
PB
PAi PB / Ai
PAi B
PA1 PB / A1 PA2 PB / A2 ... PAk PB / Ak
Notas importantes
106 Estadística Descriptiva 201601
Caso Aerolínea Wayra
Objetivo específico: Evaluar la situación de incidentes mecánicos de los aviones y su re-
paración dentro de las 24 horas con la finalidad de dar un bono de reconocimiento a los
mecánicos.
Se sabe que el 30% de los incidentes mecánicos ocurren con el avión 1, el 50% en el
avión 2 y el resto con el avión 3. Asimismo, la probabilidad que el avión 1 sea reparado
dentro de las 24 horas después de ocurrido el incidente es 90%, de 73% para el avión 2 y
de 65% para el avión 3.
Si el informe dice que el avión no fue reparado dentro de las 24 horas, ¿de cuál de los
aviones es más probable que sea el informe?
Solución
Los eventos y el árbol de probabilidades necesarios para resolver este problema son:
….:= ………………………………………………………………………………………………………………
….:= ………………………………………………………………………………………………………………
….:= ………………………………………………………………………………………………………………
Si el informe dice que el avión no fue reparado dentro de las 24 horas, ¿de cuál de los
aviones es más probable que sea el informe?
Notas importantes
Unidad 3. Teoría de Probabilidad 107
Ejemplo 18
El departamento de créditos de una tienda comercial sabe que sus ventas se pagan con
dinero en efectivo, con cheque o al crédito, con probabilidades respectivas de 0,3; 0;3 y
0,4. La probabilidad de que una venta sea por más de $50, es igual a 0,2 si ésta es en
efectivo, es igual a 0,9 si ésta es con cheque y es igual a 0,6 si ésta es al crédito.
Si compra por más de $50, ¿qué es más probable que haya pagado en efectivo, con che-
que o al crédito?
Solución
Sean los eventos:
Se pide calcular:
0,30 0,20 2
P E / M
0,57 19
0,30 0,90 9
P CH / M
0,57 19
0,40 0,60 8
P C / M
0,57 19
Notas importantes
108 Estadística Descriptiva 201601
PA B PA
PA B PAPB
Tres eventos A, B y C son independientes si se cumple que:
PA B PAPB
PA C PAPC
PB C PBPC
PA B C PAPBPC
¿Cuál es la probabilidad que por lo menos uno de los clientes compre su pasaje vía In-
ternet?
Notas importantes
Unidad 3. Teoría de Probabilidad 109
Si se tiene un grupo de 30 clientes premium que no se conocen entre sí, calcule la pro-
babilidad de que al menos uno de ellos compre su pasaje por Internet.
Si se tiene un grupo de 30 clientes premium que no se conocen entre sí, calcule la pro-
babilidad de que al menos dos de ellos compren sus pasajes por Internet.
Notas importantes
110 Estadística Descriptiva 201601
Ejercicios de la Unidad 3
33. Indicar, para cada uno de los siguientes experimentos aleatorios, los respectivos espacios
muestrales: lanzar una moneda, jugar un partido de fútbol, jugar un partido de tenis, lan-
zar un dado, lanzar dos dados.
34. Un experimento consiste en lanzar primero un dado para después lanzar una moneda,
siempre y cuando el número del dado sea par. Si el resultado del dado es impar, la mo-
neda se lanza dos veces. Determine el espacio muestral de este experimento.
35. Se lanzan dos dados, calcule la probabilidad de que la suma de los dos dados sea mayor a
siete. Rpta: 0,4167
37. En el presente año, la probabilidad de que una persona viaje a Miami es 0,40; a Máncora
es 0,5 y Madrid es 0,37. Además, la probabilidad de viajar a Miami y Máncora es 0,15; a
Miami y Madrid es 0,10 y de Máncora y Madrid es 0,12. Si la probabilidad de que la
persona viaje a por lo menos a una ciudad es 0,95; calcule la probabilidad de que la
persona viaje a una sola ciudad.
38. En un hogar hay diez personas y un encuestador necesita entrevistar a dos de ellas, sin
importar el orden. ¿De cuántas maneras diferentes se puede elegir a esas dos personas?
39. Al fin del ciclo, los 30 alumnos de una sección deben elegir a tres de ellos al azar para que
organicen un “compartir”. ¿Cuántos grupos diferentes de tres personas se pueden ele-
gir?
40. De 50 conductores, 9 nueve no tienen los papeles en regla. Si un policía escoge al azar a
cinco conductores y les pide sus papeles,
a. Calcule la probabilidad de que elija a dos que no tengan los papeles en regla.
41. En un lote de polos, hay 70 polos rojos, 150 blancos y 90 azules. Si extrae un polo al azar.
42. Según el II Censo Universitario, en el año 2010, 63 900 alumnos ingresaron a las universi-
dades públicas y 194 151 a las universidades privadas. De ellos, en las universidades pú-
blicas, 28 798 ingresantes fueron mujeres, mientras que en las privadas lo fueron 98 942.
Si se elige al azar a una ingresante, calcule la probabilidad de que estudie en una univer-
sidad privada.
44. En una empresa hay 150 trabajadores; 25 de los hombres y 35 de las mujeres realizan ac-
tividades de responsabilidad social en la empresa. El total de mujeres en la empresa es
de 57.
Notas importantes
112 Estadística Descriptiva 201601
45. Para elegir a una persona entre tres se prepara una bolsa con dos bolas negras y una bola
blanca. Los tres van sacando, por orden, una bola que no devuelven. Quien saque la bola
blanca gana. ¿Quién lleva más ventaja: el primero, el segundo o el tercero?
46. En una empresa el 35% de los trabajadores son mujeres y el 65% son hombres. Un día ha
llegado tarde a trabajar el 2% de las mujeres y el 4% de los hombres.
47. Una empresa que fabrica polos mediante tres máquinas, A, B y C, producen el 25%, 30%
y 45%, respectivamente, del total de los polos producidos en la fábrica. Los porcentajes
de producción defectuosa de estas máquinas son del 2%, 4% y 3% respectivamente.
48. Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer
trabajo es del 70% y que sea aceptado en el segundo es del 50%. Si ser aceptado en di-
chos trabajos es independiente entre sí.
b. ¿Cuál es la probabilidad de que solamente sea aceptado en uno solo de los trabajos?
49. El pulpo Paul es un octópodo que ha sido empleado como oráculo para predecir los re-
sultados de la selección alemana de fútbol en el Mundial de Fútbol 2010, acertando los
ocho emparejamientos que se le propusieron, los siete partidos de Alemania en la Copa
Mundial de Fútbol de 2010 y la final entre España y Holanda.
Antes de cada partido, a Paul se le presentaron dos contenedores idénticos con comida:
uno de ellos estaba marcado con una bandera, usualmente la de Alemania y el otro con
la bandera del equipo oponente. La elección de Paul se interpretaba como el equipo que
lograría la victoria. Si el pulpo Paul, en realidad, escogió los contenedores al azar, calcule
la probabilidad de acertar en los resultados de los ocho los partidos que le propusieron.
Asuma independencia entre cada elección.
50. Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer
trabajo es del 70% y que sea aceptado en el segundo es del 50%. Si ser aceptado en di-
chos trabajos es independiente entre sí.
51. Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que
en una chica acepte bailar con él es del 4%. Si en una fiesta saca a bailar a 40 chicas.
Asuma independencia entre la decisión de una chica y otra. Calcule la probabilidad de
que baile por lo menos con una de ellas.
Notas importantes
Unidad 3. Teoría de Probabilidad 113
52. Indique si son verdaderas o falsas las siguientes afirmaciones.
Afirmación V F
Si PA B 0,3 , entonces, se cumple que P AC B 0,7 V F
Si PA B 0,3 , entonces, se cumple que P A B c 0,7 V F
En algunos casos especiales la probabilidad de un evento podría ser mayor que uno V F
Notas importantes
114 Estadística Descriptiva 201601
53. Loy Toy es una red de librerías, con sucursales en los distritos de Santiago de Surco, San
Borja y San Luis. Se ha observado que los libros que comercializa en las diferentes sucur-
sales presentan fallas de compaginación, razón por la cual el gerente general está intere-
sado en conocer las probabilidades de estas fallas en cada sucursal. También está intere-
sado en conocer las probabilidades de la demanda por los libros que comercializa en las
diferentes sucursales, con la finalidad de tomar decisiones administrativas.
40%
30%
30% 25%
20%
10%
0%
Surco San Borja San Luis
Gráfico N° 2:
100%
Porcentaje de libros
80%
60%
95% 88% 92%
40%
20%
5% 12% 8%
0%
Surco San Borja San Luis
Sucursal
Error Sin error
Fuente: Librería Loy Toy
Notas importantes
Unidad 4: Variables aleatorias
Logro de la unidad 4
Temario
Definición de variable aleatoria discreta y continua.
Función de probabilidad de una variable aleatoria discreta.
Función de densidad y función de distribución acumulada de una variable aleatoria continua.
Valor esperado y varianza de variables aleatorias discretas y continuas.
Estudio de propiedades de las siguientes distribuciones: binomial, hipergeométrica, Poisson,
uniforme, continua, normal, t-Student
116 Estadística Descriptiva 201601
Variable aleatoria
Se denomina variable aleatoria a una descripción numérica del resultado de un experi-
mento.
La variable aleatoria
Lo que es aleatorio
atribuye a cada evento
es el experimento
un número
sobre cuyo espacio muestral
que no es aleatorio o imprevisible,
se define la variable aleatoria.
sino fijo y predeterminado.
Evento (X = a)
El evento (X a) se define como ( X a) { w S / X (w) a }
Notas importantes
Unidad 4. Variables aleatorias 117
Por ejemplo: número de alumnos matriculados por curso, cantidad de preguntas correc-
tamente contestadas en una evaluación de personal, cantidad de clientes que visitan un
centro comercial en un día determinado.
f(x) = P(X = x)
- f(x) 0
n
- f (x ) 1
i 1
i
Ejercicio 29
Sea S el espacio obtenido al lanzar una moneda dos veces y observar si sale cara (c) o se-
llo (s) cada vez.
Notas importantes
118 Estadística Descriptiva 201601
Ejercicio 30
Se lanza un dado, sea la variable aleatoria X igual al número de la cara superior del dado.
Determine y grafique la función de probabilidad de la variable X.
Ejercicio 31
Indique cuáles de las siguientes funciones puede ser función de probabilidad.
Notas importantes
Unidad 4. Variables aleatorias 119
Ejercicio 32
Indique cuáles de las siguientes funciones puede ser función de probabilidad.
x
x 1, 2, 3
f x 6
0 en otro caso
C 2 p x (1 p)2 x x 0, 1, 2
f x x
0 en otro caso
Ejemplo 19
Calcule a para que la siguiente función sea una función de probabilidad. Grafique f(x)
La primera condición, f(x) > 0, se cumple cuando a es mayor que cero, puesto que x > 0.
n
La segunda condición, f (x ) 1 , se cumple si a10 15a 20a 25a 1 , esto se cum-
i 1
i
0.5
0.4
0.3
f(x)
0.2
0.1
0.0
010 15 20 25
X
Notas importantes
120 Estadística Descriptiva 201601
Ejemplo 20
Sea X el número de lanzamientos de un dado hasta que salga el primer seis. Determine
la función de probabilidad de la variable X y calcule P(X 3)
Solución
Sea la variable aleatoria X:= número de lanzamientos de un dado hasta que salga el pri-
mer seis.
El número de personas que no se presentan a un vuelo se modela con una variable alea-
toria X con la siguiente función de probabilidad.
x 0 1 2 3 4 5 6
f(x) 0,20 0,25 0,22 0,15 0,10 0,05 a
Notas importantes
Unidad 4. Variables aleatorias 121
2
V X E X X x X f x
xRX
2
Se cumple V X E X 2 E X
2
E a1 a1
Si X1, X2, X3, . . ., Xn son n variables aleatorias, y a1, a2, . . ., an son n constantes, entonces:
E X1 X2 ... X n n
Notas importantes
122 Estadística Descriptiva 201601
Propiedades de la varianza en variables aleatorias
Si Y = aX + b, con a y b son constantes, entonces Y2 a2 X2
Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes, y a1, a2, a3, . . ., an son n
constantes, entonces:
Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes con la misma función de
probabilidad, entonces se cumple que V Xi 2 y, por lo tanto:
V X 1 X 2 ... X n n 2
Caso Aerolínea Wayra
Objetivo específico: Comparar el grado de dispersión del número de cancelaciones en
vuelos, tanto nacional e internacional.
x 1 2 3 4 5
f(x) 0,25 0,42 0,15 0,10 a
y 0 1 2 3 4
f(y) 0,27 0,37 0,18 0,12 b
Notas importantes
Unidad 4. Variables aleatorias 123
Ejemplo 21
Sea X una variable aleatoria con la siguiente función de probabilidad. Calcular el valor
esperado de X2
ax 1, 2, 3, 4, 5
f ( x)
0 en otro caso
Solución
5
Lo primero es determinar a, planteamos que f x 1 , de donde a = 1/15.
i 1
i
Nos piden
E X 2 xi2 f xi 12
5
1 1 1 1 1
22 32 42 52 15
i 1 15 15 15 15 15
Ejemplo 22
Sea X una variable aleatoria con la siguiente función de probabilidad. Calcule la varianza
de X.
x
1, 2, 3, 4, 5
f (x) 15
0 en otro caso
Solución
El esperado de X es
5
1 2 3 4 5 55
E X xi f xi 1 2 3 4 5
i 1 15 15 15 15 15 15
Se tiene que E X 2 15
2
55
Luego se tiene que V X E X 2 E X 15 1,556
2
15
Notas importantes
124 Estadística Descriptiva 201601
f x P X x C xn px 1 p
n x
x = 0, 1, 2,..., n
Se dice que la variable aleatoria X sigue una distribución binomial con parámetros n y p,
se denota X~B (n, p)
Es simétrica si p = 0,5. Para valores de p < 0,5 la distribución tiene sesgo derecho y para
valores p>0,5 tiene sesgo izquierdo, independientemente de los valores de n.
Para valores de n suficientemente grandes (n > 50), y sólo tomando en cuenta los valo-
res relevantes de probabilidad, la distribución es prácticamente simétrica.
Media E X np
Varianza 2 V X np 1 p
Notas importantes
Unidad 4. Variables aleatorias 125
Caso Aerolínea Wayra
Objetivo específico: Estimar la probabilidad de tener una emergencia médica durante el
viaje.
La aerolínea sabe por experiencias pasadas que el 0,5% de los pasajeros tendrá alguna
emergencia médica durante el vuelo.
Si en un vuelo hay 120 pasajeros, calcule la probabilidad de que ningún pasajero tenga
una emergencia médica durante el viaje. Asuma independencia entre un pasajero y otro.
Si en un vuelo hay 120 pasajeros, calcule la probabilidad de que, como máximo, un pasa-
jero tenga una emergencia médica durante el viaje.
Si en un vuelo hay 120 pasajeros, calcule la probabilidad de que por lo menos dos pasa-
jeros tengan una emergencia médica durante el viaje.
Calcule el valor esperado del número de pasajeros que tengan una emergencia médica
durante un viaje de 160 pasajeros.
Notas importantes
126 Estadística Descriptiva 201601
Distribución hipergeométrica
Consideremos N elementos, de los cuales r son considerados éxitos y por lo tanto N - r
como fracasos. Como en el caso de la distribución binomial estamos interesados en sa-
ber la probabilidad de obtener x éxitos en una muestra de n elementos.
El experimento hipergeométrico consiste en extraer al azar y sin reposiciónn n elemen-
tos de un conjunto de N elementos, r de los cuales son éxitos y N - r son fracasos.
Se dice que la variable aleatoria X sigue una distribución hipergeométrica con paráme-
tros N, r y n y se denota X ~ H (n, r, N)
r
Media EX n
N
r r N n
Varianza 2 V X n 1
N N N 1
Notas importantes
Unidad 4. Variables aleatorias 127
Caso Aerolínea Wayra
En un vuelo se van a servir 130 comidas. La oficina de control de calidad de los alimentos
durante el vuelo selecciona al azar cinco de ellas para verificar que están en perfecto es-
tado. Dentro de las 130 comidas, hay seis que no están en perfecto estado.
Calcule la probabilidad de detectar a dos de las comidas que no están en perfecto esta-
do.
Calcule la probabilidad de detectar menos de tres de las comidas que no están en per-
fecto estado.
Calcule el valor esperado del número de comidas que no están en perfecto estado que
serán detectadas.
Notas importantes
128 Estadística Descriptiva 201601
Distribución de Poisson
El experimento que origina una variable aleatoria que sigue una distribución de Poisson
se denomina proceso de Poisson y posee las siguientes propiedades:
0.16
0.14
0.12
0.10
f(x)
0.08
0.06
0.04
0.02
0.00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X
Se dice que la variable aleatoria X sigue una distribución de Poisson con parámetro y
se denota X~P().
Siempre es una distribución sesgada a la derecha. A medida que aumenta y tomando
en cuenta sólo los valores relevantes de probabilidad, la distribución tiende a hacerse
simétrica.
Media: EX
Varianza: 2 V X
En Excel 2010, use la función =POISSON.DIST(x, media, acumulado)
Notas importantes
Unidad 4. Variables aleatorias 129
Caso Aerolínea Wayra
El número de llamadas hacia una azafata por los pasajeros durante un vuelo se modela
con una variable Poisson con una media de 0,5 llamadas cada diez minutos.
Calcule la probabilidad de que una azafata reciba más de una llamada durante un viaje
de 50 minutos.
Si una azafata ya recibió una llamada durante los primeros veinte minutos del viaje, cal-
cule la probabilidad de que reciba dos llamadas más durante dicho viaje de 50 minutos.
Notas importantes
130 Estadística Descriptiva 201601
Ejemplo 23
Suponga que el número de llamadas que llegan a una central telefónica es 0,5 por mi-
nuto en promedio.
Calcule la probabilidad de que en un minuto no lleguen llamadas
Solución
X:= número de llamadas / minuto = 0,5 llamadas / minuto
e 0.5 0,50
P X 0 0,6065
0!
Ejemplo 24
El administrador de un almacén ha observado que en promedio ingresan al estableci-
miento 20 personas cada 30 minutos. ¿Cuál es la probabilidad de que en seis minutos
ingresen al almacén a lo más 5 clientes pero más de 3?
Solución
Lo primero es definir la variable adecuada, sea X:= número de personas que entren al
establecimiento en un periodo de seis minutos.
Como nos dicen que la variable cuenta las llegadas por unidad de tiempo, se tiene que
X ~ P().
Luego, debemos determinar el valor de , para lo cual vamos a hacer una regla de tres
simple, pues es una propiedad de la distribución Poisson.
Si en 30 minutos llegan en promedio 20 personas, entonces en 6 minutos llegarán, en
promedio, ,= 4 personas.
Se tiene que X ~ P( = 4)
e 4 44 e 4 45
Nos piden P 3 X 5 P X 4 P X 5 0,3517
4! 5!
Notas importantes
Unidad 4. Variables aleatorias 131
Ejemplo 25
Si se sabe que en cada 100 metros de longitud de un cable hay un promedio de 80 pun-
tos por los cuales este puede ser seccionado. ¿Cuál es la probabilidad de que en un
tramo de 13,5 metros se encuentren cinco puntos de seccionamiento?
Solución
Sea X:= número de puntos de seccionamiento. Como nos dicen que la variable cuenta
puntos por unidad de longitud, se tiene que X ~ P().
Luego, debemos determinar el valor de , para lo cual vamos a hacer una regla de tres
simple, pues es una propiedad de la distribución Poisson.
Observe que si lambda sale un valor que no es entero, no se debe redondear a un en-
tero.
Notas importantes
132 Estadística Descriptiva 201601
f x 0 para todo x R
f x dx 1
b
Se tiene que P a X b f x dx
a
Ejercicio 34
Una variable aleatoria continua tiene la siguiente función de densidad de probabilidad:
ax 0x5
f ( x)
0 en otro caso
Determine el valor de a.
Notas importantes
Unidad 4. Variables aleatorias 133
Calcule la probabilidad de P(X < 4)
Ejemplo 26
Para cierto negocio por correo electrónico la proporción de los pedidos procesados en
24 horas tiene la función de densidad de probabilidad.
f (x) 2(1 x) ; 0 x 1
Compruebe si f(x) es una función de densidad.
Solución
Se debe comprobar que:
- f x 0 para todo x R. Este se cumple pues para 0 x 1 , es f (x) 2 (1 x) 0
- f x dx 1 . Existen dos formas de responder esta pregunta.
Integrando la función de densidad f(x) y verificando que el área es igual a 1 y que cada
f(x) sea positivo
1
x2
f x dx 2 (1 x) dx 2 x 2
1 1
1
2x x 2
0 0 2 0
0
Calculando el área del triángulo a partir de la gráfica y verificando que el área es igual a
y que cada f(x) sea positivo.
b h 1 2
Área 1
2 2
Notas importantes
134 Estadística Descriptiva 201601
¿Cuál es la probabilidad que al menos el 80% de los pedidos sean procesados dentro de
24 horas?
Solución
Existen dos formas de responder esta pregunta.
Integrando la función de densidad f(x) de 0,8 a 1.
1.0
F(x)
0.8
0.6
0.4
0.2
0.0
-2 -1 0 1 2 3 4 5
Notas importantes
Unidad 4. Variables aleatorias 135
Ejercicio 35
Sea X una variable aleatoria con la siguiente función de densidad
( )
Determine y grafique la función de distribución acumulada de la variable aleatoria X.
Use la función de distribución acumulada de la variable X para calcular P(0,1 < X < 0,7)
Ejercicio 36
Marque la(s) gráfica(s) que pueden ser funciones de distribución acumulada.
Notas importantes
136 Estadística Descriptiva 201601
Ejercicio 37
Indique la(s) funciones que pueden ser función de distribución acumulada.
1 x 2
F x x 1 1 x 2
0 x 1
1 x 2
2
F x x 1 1 x 2
0 x 1
Ejemplo 27
Encuentre el rango intercuartil de X, si X es el tiempo de vida de un sistema es una va-
riable aleatoria, en años, cuya función de distribución acumulada es:
0 x5
F x 25
1 x 2 x 5
Solución
Sea X:= tiempo, en años, de vida de un sistema. Para calcular el rango intercuartil, de-
bemos hallar el cuartil 1 y el cuartil 3, para esto hay dos posibilidades: integrar la función
de densidad f(x) o reemplazar en la función de distribución acumulada
Por definición de cuartil 3, el 75% de los datos es menor o igual a él, es decir P(X ≤ Q3) =
0,75, o lo que es lo mismo F(Q3) = 0,75
25
F Q3 0,75 1 de donde Q3 = 10.
Q32
25
Haciendo lo mismo para el cuartil 1. F Q1 0,25 1 de donde Q1 = 5,77.
Q12
Luego el RIC = Q3 – Q1 = 4,23.
Si X1, X2, X3, . . ., Xn son n variables aleatorias con la misma función de densidad, enton-
ces se cumple que E Xi y, por lo tanto:
E X1 X2 ... Xn n
Notas importantes
138 Estadística Descriptiva 201601
X2 V X E X 2 E X
2
Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes, y a1, a2, a3, . . ., an son n
constantes, entonces:
V a1 X1 a2 X2 an Xn a12V X1 a22V X2 an2V X n
Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes con la misma función de
densidad, entonces se cumple que V Xi 2 y, por lo tanto:
V X1 X2 ... Xn n 2
Notas importantes
Unidad 4. Variables aleatorias 139
Función de densidad
1
axb
f x b a
0 en otro caso
ab
Media:
2
b a
2
Varianza:
2
12
Notas importantes
140 Estadística Descriptiva 201601
Calcule la probabilidad de que un avión llegue con un retraso mayor a cuatro minutos.
Si se escoge al azar 100 vuelos, calcule el número esperado de viajes con retrasos mayo-
res cuatro minutos.
Notas importantes
Unidad 4. Variables aleatorias 141
Ejemplo 28
En ciertos experimentos, el error cometido al determinar la densidad de una sustancia
es una variable aleatoria cuya distribución es uniforme con a = -0,025 y b = 0,025.
a. ¿Cuál es la probabilidad de que tal error esté entre 0,010 y 0,015?
Solución
Sea X:= error al determinar la densidad de una sustancia
La variable X ~ U(a = -0,025, b = 0,025) tiene la siguiente función de densidad
1
0,025 x 0,025
f (x) 0,025 (0,025)
0 en otro caso
1
0,025 x 0,025
f (x) 0,05
0 en otro caso
Nos piden P(0,010 X 0,015) . Existen dos formas de calcular esta probabilidad:
integrando la función de densidad f(x) o calculándola a partir del área del rectángulo.
0,015
1 1
P(0,010 X 0,015) dx 0,015 0,010 0,10
0,010
0,050 0,050
b. ¿Cuál es el error esperado cometido?
Solución
La variable X ~ U(a = -0,025, b = 0,025) tiene el siguiente número esperado de errores
a b 0,025+0,025
0
2 2
Ejemplo 29
La llegada de cada uno de los empleados a su centro de labores se produce indepen-
dientemente, de acuerdo a la distribución uniforme en el intervalo comprendido entre
las 8:00 y 8:25 am. De una muestra de 10 empleados, calcule la probabilidad de que cua-
tro de ellos hayan llegado entre las 8:15 y 8:20 AM.
Solución
Sea X:= tiempo, en minutos, desde las 8 AM hasta la hora de llegada de los empleados al
centro de trabajo, luego XU (0, 25)
1
f ( x) ; 0 x 25
25
Se define la variable Y:= número de empleados que llegan al centro de trabajo entre
8:15 y 8:20 AM. Debe calcularse la probabilidad de éxito p de que un empleado llegue al
centro de trabajo entre 8:15 y 8:20 AM esto es:
20 15
p 0,20
25
Entonces Y B(10; 0,20)
f (y) Cy10 (0,20)y (0,80)10y , y 0,1, ,10
Se pide P(Y 4) f (4) C410 (0,2)4 (0,80)6 0,0881
Notas importantes
142 Estadística Descriptiva 201601
Función de densidad
2
1 x
1
f x e 2
2
Se dice que la variable aleatoria X sigue una distribución normal con parámetros y .
Se denota X ~ N (, 2)
La función de densidad tiene forma de campana y es simétrica, por lo que las medidas
de tendencia central coinciden.
El rango de la variable normal es toda la recta real, esto es, de – a + .
En Excel 2010, use la función =DISTR.NORM.N(x, media, desviación estándar, acumula-
do) para calcular la probabilidad.
En Excel 2010, use la función =INV.NORM(Probabilidad, media, desviación estándar)
para calcular el valor de la variable aleatoria.
Estandarización
Se toma como referencia una distribución normal estándar ( = 0 y 2 = 1). Se trabaja
con la distancia entre x y en función de la desviación estándar, tal como se muestra.
X
Z
La utilidad de convertir cualquier variable normal en una normal estándar es que pode-
mos usar solo una tabla para calcular cualquier probabilidad de una variable normal.
Notas importantes
Unidad 4. Variables aleatorias 143
Ejercicio 38
Si Z ~ N 0, 2 1 , calcular
Tabla de la distribución normal estándar (Ver la tabla completa al final de esta guía)
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
Notas importantes
144 Estadística Descriptiva 201601
Cálculo de probabilidad de una variable normal con una calculadora Casio
Ponga la calculadora en modo estadístico. Apriete MODE y luego, apriete
STAT
Luego apriete SHIFT, STAT (1) y luego elija la opción DISTR. Aparecerá
una pantalla con P(, Q(, R( y t.
- P( calcula la probabilidad de que Z esté entre - y el valor que ingresa
- Q( calcula la probabilidad de que Z esté entre 0 y el valor que ingresa
- R( calcula la probabilidad de que Z esté entre el valor que ingresa y +.
Tabla de la distribución normal estándar (Ver la tabla completa al final de esta guía)
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
Notas importantes
Unidad 4. Variables aleatorias 145
Ejercicio 39
La cantidad de dinero destinada al ahorro mensual de los clientes de un banco es una
variable aleatoria que tiene una distribución normal con una media igual a 460 soles y
una desviación estándar igual a 50 soles.
Calcule la probabilidad de que un cliente ahorre menos de 480 soles en un mes.
Calcule la probabilidad que el ahorro mensual de un cliente esté entre 460 y 520 soles.
¿Cuál es el ahorro mínimo mensual para estar en el 15% de los clientes que más aho-
rran?
Notas importantes
146 Estadística Descriptiva 201601
¿Cuál es el ahorro máximo mensual para estar en el 25% de los clientes que menos aho-
rran?
Ejemplo 30
En Buck Café, la máquina surtidora de refrescos está ajustada de tal forma que sirve en
promedio 250 mililitros por vaso. Si la cantidad de refresco servido en los vasos sigue,
aproximadamente, una distribución normal con una desviación estándar de 10 mililitros.
¿Qué proporción de los vasos servidos contendrán entre 240 y 255 mililitros de refres-
co?
Solución
Sea X:= cantidad de refresco servido por vaso, X ~ N(µ = 250, 2 = 102)
Ejemplo 31
Se informa que la cantidad X de azúcar de los paquetes marcados con un kilo, tiene dis-
tribución normal con media kilos y desviación estándar 0,02 kilos. Hallar el valor de
si la cantidad de azúcar que contiene cada paquete es menor o igual a 0,95 kilos con
probabilidad 0,102.
Solución
Sea X:= pesos de los paquetes de azúcar, en kilos. X ~ N(µ , 2 = 0,022)
X 0,95 0,95
Estandarizando se tiene P 0,102 P Z 0,102
0,02
0,95
1,27 . De donde µ = 0,9754
0,02
Notas importantes
Unidad 4. Variables aleatorias 147
Distribución exponencial
En variables que representan los tiempos de vida útil, tiempos de sobrevivencia, en
tiempos de ocurrencia en procesos de Poisson se suele utilizar la distribución exponen-
cial.
Se denota X ~ Exp(β) y se lee que la variable aleatoria X sigue una distribución exponen-
cial con parámetro β.
Pc X d
d 1 t
c
1
e dt
Esperanza de X: E X
Varianza de X: 2 V X 2
Se cumple que:
x
P X x e
P X k t / X k P X t
Notas importantes
148 Estadística Descriptiva 201601
Caso Aerolínea Wayra
El tiempo de vida útil de un tipo de llanta de avión se modela con una variable aleatoria
con distribución exponencial, cuya media es 20 días.
Calcule la probabilidad de que la vida útil de una llanta sea mayor a 20 días.
Calcule la probabilidad de que la vida útil de una llanta esté entre 20 y 25 días.
Si una llanta ya duró 20 días, calcule la probabilidad de que la vida útil de esa llanta sea
menor a 25 días.
Notas importantes
Unidad 4. Variables aleatorias 149
Ejercicios de la Unidad 4
54. En un lote de 30 polos hay tres con fallas. Se toma una muestra aleatoria de cinco polos y
se define la variable aleatoria X como el número de polos defectuosos en la muestra. De-
termine y grafique la función de probabilidad de la variable X.
55. La demanda diaria de un producto es una variable aleatoria X cuya distribución de pro-
babilidades es simétrica y está dada por la tabla siguiente:
x 1 2 3 4 5
f(x) a 0,20 b c 0,05
La empresa obtiene por cada unidad demandada de producto 100 soles de utilidad. Si la
cantidad demanda en un día es mayor a dos unidades, se obtiene una utilidad adicional
de 15 soles por unidad demandada de producto.
Calcule el valor de a, b y c.
Determine la probabilidad que la demanda diaria sea de por lo menos tres productos.
Calcule el valor esperado de la utilidad por la demanda diaria de productos.
56. Indique si son verdaderas o falsas las siguientes afirmaciones.
Notas importantes
150 Estadística Descriptiva 201601
57. Un examen de admisión consta de 100 preguntas. Cada una pregunta tiene cinco opcio-
nes para marcar y solamente una respuesta correcta Por cada respuesta correcta se le
otorga al postulante un punto, mientras que si la respuesta es incorrecta al postulante se
le resta un cuarto de punto. Si un postulante contesta todas las preguntas del examen al
azar, calcule el valor esperado del puntaje obtenido.
58. Se lanza un dado una vez, sea la variable aleatoria X igual al número de la cara superior.
Calcule la varianza y desviación estándar de la variable X.
59. Se lanzan dos dados y sea la variable aleatoria X igual a la suma de los números de las ca-
ras superiores. Calcule la varianza de la variable X.
x 12 15 17 18 20 25
f(x) a 0,12 0,35 2a 0,14 0,09
El costo de cada ensalada es de cuatro soles y las vende a seis soles. Toda ensalada no
vendida en el día se desecha. Calcule la media y desviación estándar de la utilidad diaria,
si el restaurante prepara 20 ensaladas por día.
61. Una compañía de comida rápida sabe que el 90% de sus tiendas por franquicia tendrán
éxito comercial. Si el éxito de cada tienda se puede considerar independiente de las de-
más tiendas. Calcule la probabilidad de que al menos dieciocho tiendas tengan éxito, si la
compañía va a instalar 20 tiendas el año 2015.
62. Según la Asociación para el Fomento de la Infraestructura Nacional el 48% de los hogares
de Lima no tienen acceso a agua potable de calidad, por no contar con la dosificación
adecuada de cloro o comprarla de manera informal a los camiones cisternas. Si se eligen
al azar a diez hogares de Lima, calcule la probabilidad de que cinco de ellos no tengan ac-
ceso agua potable de calidad.
63. La empresa San Fernando ha lanzado su campaña “Plato calato no” para salvar sus ven-
tas de verano 2013. Si de un total de 60 personas, donde 34 recuerdan la campaña, se
eligen al azar a ocho personas para entrevistarlos, calcule la probabilidad de elegir al me-
nos a tres personas que recuerden la campaña.
64. En una distribuidora hay 25 televisores de los cuales seis son de tecnología OLED. Si se
seleccionan al azar diez televisores, calcule la probabilidad de que se haya seleccionado
por lo menos dos televisores de tecnología OLED.
65. Un comerciante recibe un lote de 30 computadoras portátiles. Para protegerse de una
mala remesa, el comerciante revisará diez computadoras y rechazará todo el lote si en-
cuentra una o más computadoras defectuosas. Si en el lote hay seis computadoras defec-
tuosas, ¿cuál es la probabilidad de que rechace el lote?
66. En una pastelería, el número demandado de un cierto tipo de torta se modela con una
variable Poisson con una media de tres tortas al día. La pastelería, siempre, produce tres
tortas diarias. Cada torta cuesta producirla 50 soles y se vende a 80 soles. Toda torta no
vendida en el día se remata en 20 soles y siempre las compran todas las tortas a ese pre-
cio. Calcule el valor esperado de la utilidad por dicho concepto.
Notas importantes
Unidad 4. Variables aleatorias 151
67. Indique si son verdaderas o falsas las siguientes afirmaciones.
68. La duración (en minutos) de una llamada telefónica en la sala de profesores puede mode-
larse por una variable aleatoria X con la siguiente función de densidad
a 3 x 0 x 3
f x
0 en otro caso
Determine el valor de a.
Calcule la probabilidad de que una llamada dure menos de un minuto y medio.
Si una llamada ya duró un minuto, calcule la probabilidad de que dure más de dos minu-
tos.
69. La proporción de personas que responden a una encuesta enviada por correo electrónico
se modela con una variable aleatoria X con la siguiente función de densidad
2x 9
0 x 1
f x 10
0 en otro caso
( ) {
Notas importantes
152 Estadística Descriptiva 201601
71. La variable X se distribuye uniformemente con media igual a 24 y varianza igual a 12, cal-
cular los parámetros de la función de densidad.
72. La función de Excel =ALEATORIO() genera un número con distribución uniforme con pa-
rámetros a igual a cero y b igual a uno. Sea X una variable aleatoria definida como el nú-
mero generado por dicha función.
Calcule la probabilidad de que la función genere un número aleatorio entre 0,2 y 0,7.
Use la función de distribución acumulada para calcular P(0,15 < X < 0,55).
73. El tiempo, en minutos, que demora un servicio de delivery en entregar una pizza puede
modelarse por una variable aleatoria uniforme con parámetros 10 y 38. Si la pizza se tar-
da más de 30 minutos en ser entregada, el cliente no la pagará.
Si una familia pide una pizza, calcule la probabilidad de que le salga gratis.
Si la familia pide una pizza diaria durante diez días seguidos, calcule la probabilidad de
que por lo menos una de ellas le salga gratis.
Una familia pidió una pizza hace 25 minutos y aún no ha llegado, ¿cuál es la probabilidad
de que le salga gratis?
74. Una compañía ha comprado una prueba para seleccionar personal. Los que han diseña-
do la prueba saben que las notas siguen una distribución normal con una media de 75
puntos y una desviación estándar de diez puntos. Calcule la probabilidad de que una
persona que rinda esta prueba obtenga una nota superior a 90 puntos.
75. En una ciudad se estima que la temperatura máxima en un día del mes de enero puede
modelarse con una variable normal con media 30°C y desviación estándar 2°C.
Si se escoge al azar un día del mes de enero, calcule la probabilidad de que la tempera-
tura máxima sea menor a 31°C.
Si se escoge al azar un día del mes de enero, calcule la probabilidad de que la tempera-
tura máxima esté entre 28,5 y 32°C.
Calcule el número esperado de días en el mes de enero en que la temperatura máxima
es mayor a 33°C. Asuma independencia entre las temperaturas de un día y otro.
76. Marque la opción correcta.
Notas importantes
Unidad 4. Variables aleatorias 153
78. Indique si son verdaderas o falsas las siguientes afirmaciones.
79. Loy Toy es una red de librerías, con sucursales en los distritos de Santiago de Surco, San
Borja y San Luis. Se ha observado que los libros que comercializa en las diferentes sucur-
sales presentan fallas de compaginación, razón por la cual el gerente general está in-
teresado en conocer las probabilidades de estas fallas en cada sucursal. También está in-
teresado en conocer las probabilidades de la demanda por los libros que comercializa en
las diferentes sucursales, el valor esperado de la utilidad, con la finalidad de tomar deci-
siones administrativas.
El gerente de la sucursal de San Luis para satisfacer a sus clientes que leen libros de lite-
ratura, en su pedido a la central consideró un 45% de libros de literatura, 20% de libros
de ciencias, 15% de libros de historia y el resto de libros de arte y amenidades. Si se se-
lecciona una muestra al azar de 10 libros, ¿cuál es la probabilidad de que se tenga a lo
más 8 libros de literatura?
Otra preocupación del administrador de la red de librerías “Loy Toy” es ofrecer a sus
clientes libros de buena calidad, de manera fluida y estar siempre con las últimas nove-
dades. La próxima publicación en Pekín del libro “Enciclopedia de la cultura china” del
ensayista peruano Guillermo Dañino, se cree traerá una gran demanda de este libro. El
gerente comercial de la librería “Loy Toy” del distrito de San Borja decide hacer un pedi-
do de 150 libros para el próximo mes siempre y cuando la probabilidad de la demanda
de por lo menos 2 libros por día sea más de 0,95 caso contrario sólo pedirá 100 libros. Se
Notas importantes
154 Estadística Descriptiva 201601
sabe que la demanda de dicho libro sigue un proceso de Poisson con un promedio de
150 libros por mes. Considere 30 días por mes.
( ) {
Notas importantes
Unidad 5: Distribuciones muestrales
Logro de la unidad 5
Al finalizar la unidad 5,
el alumno utiliza las distribuciones muestrales
para calcular probabilidades para el total y la media muestral.
Temario
La suma de
con otra es una
una
variable variable
variable
aleatoria aleatoria
aleatoria
normal normal
normal
Ejercicio 40
Sea X1 ~ N(1 = 5, 12 = 10) y X2 ~ N(2 = 6, 22 = 24) variables aleatorias independientes.
Calcule la distribución de las siguientes variables:
Y = X1 + X2
Y = X1 - X2
Y = X1 - 8X2
Notas importantes
Unidad 5. Distribuciones muestrales 157
Caso Aerolínea Wayra
Objetivo específico: Analizar el peso de los pasajeros.
El peso de los pasajeros adultos de un avión se modela con una variable normal:
Si en un avión donde el 60% de los pasajeros son mujeres, se elige una persona al azar,
calcule la probabilidad de que esta persona pese entre 70 y 80 kilogramos.
Notas importantes
158 Estadística Descriptiva 201601
Ejemplo 32
Dos supermercados compiten por tomar el liderazgo del mercado. Un estudio reciente
de una compañía de investigación de mercados, estimó que las ventas diarias (en miles
de dólares) de los dos supermercados se distribuyen normalmente con medias de 15 y
17 y desviaciones estándar de 3 y 4 respectivamente.
Solución
Sean las variables:
X: Ventas diarias del primer supermercado
Y: Ventas diarias del segundo supermercado
X N(15, 9); Y N(17, 16)
Se pide: P(Y > X) o su equivalente: P(Y – X > 0)
Calcule la probabilidad de que la diferencia entre las ventas diarias de ambos supermer-
cados no supere los 1000 dólares.
Solución
En este caso se pide calcular:
1 2 W 1 2
P W 1 P 1 W 1 P P 0,6 Z 0,2 0,1465
5 5
Notas importantes
Unidad 5. Distribuciones muestrales 159
Definiciones
Debido a que, muchas veces, es imposible preguntarle o medir a toda la población, un
estudio estadístico se inicia con la selección de una muestra.
Notas importantes
160 Estadística Descriptiva 201601
2
Varianza V X
n
Notas importantes
Unidad 5. Distribuciones muestrales 161
entonces la variable
Sean n variables aleatoria
aleatorias X1, X2, X3,...Xn independiente-
independientes e Y = X1 + X2 + X3 +...+ Xn
mente de la
igualmente distribuidas tiene una distribución distribución de la
con media aproximadamente población.
y varianza 2 normal a medida que n
crece,
El peso del equipaje de los pasajeros de un avión se modela con una variable uniforme
con parámetros 10 y 30 kilos. Calcule la probabilidad de que el peso total del equipaje
de 50 pasajeros supere los 1050 kilos.
Notas importantes
162 Estadística Descriptiva 201601
Objetivo específico: Analizar el número de vuelos cancelados.
x 0 1 2 3 4 5
f(x) 0,40 0,25 0,15 0,1 0,05 0,05
Se toma una muestra de 100 días, calcule la probabilidad de que se cancelen entre 125 a
135 vuelos nacionales.
Notas importantes
Unidad 5. Distribuciones muestrales 163
Ejercicios de la Unidad 5
80. En un estudio de evaluación de la atención de un servicio de cafeterías, los tiempos, en
minutos, que tardan en atender a un cliente las cafeterías A y B se modelaron con las va-
riables aleatorias X ~ N(4,9) y Y ~ N(5,16) respectivamente y de manera independiente.
Si en cada cafetería son atendidas 20 personas, halle la probabilidad de que el tiempo
total de atención en la cafetería B sea mayor que el de la cafetería A.
81. Lima y El Cairo (Egipto) son las dos principales ciudades del mundo que están situadas
en zonas desérticas y con extremo estrés hídrico. En París, Zurich o Berlín, el consumo
promedio por persona de agua bordea los 130 litros por día. Sin embargo, según una in-
vestigación del Centro de Investigación en Geografía Aplicada de la Pontificia Universi-
dad Católica del Perú, en Lima, el consumo promedio por persona asciende a 250 litros
por día. Además, la desviación estándar del consumo por persona se estima en 60 litros
por día. Si se toma una muestra aleatoria en Lima de 100 personas, calcule la probabili-
dad de que el consumo total muestral en un día sea menor a 24 mil litros.
82. La cantidad de mango que exporta una empresa mensualmente se modela con una va-
riable aleatoria con media de 25 toneladas y desviación estándar de cuatro toneladas.
Encontrar la probabilidad de que la cantidad exportada en tres años sea menor a 920
toneladas. Asuma independencia entre las cantidades mensuales exportadas.
83. El número de personas que llega a un concierto se modela con una variable Poisson con
una media de 3,1 personas por minuto. Calcule la probabilidad de que en una hora lle-
guen entre 180 y 190 personas.
84. La duración, en minutos, de una llamada telefónica en la sala de profesores puede mo-
delarse por una variable aleatoria X con la siguiente función de densidad
a 3 x 0 x 3
f x
0 en otro caso
Calcule la probabilidad de que el tiempo total de 100 llamadas sea mayor a 100 minutos.
85. Una familia tiene tres hijos. El monto de la propina semanal que se le da a cada hijo
puede modelarse como una variable normal. Al menor se le da en media 20 soles por
semana con una desviación estándar de 3 soles, al segundo hijo se le da el doble que al
menor y al mayor se le da el triple que al menor. Calcular la probabilidad de que en cua-
tro semanas la suma total recibida en propinas por los tres sume más de 500 soles.
Notas importantes
164 Estadística Descriptiva 201601
87. Marque la afirmación correcta.
Notas importantes
Unidad 6: Muestreo
Logro de la unidad 6
Temario
1.1. Definiciones
Elemento
• Es el objeto sobre el cual se hace la medición. También llamada unidad
elemental.
Población muestreada
• Es la colección de todos los elementos posibles que podrían extraerse en
una muestra.
Marco muestral
• Es una lista de los elementos que están disponibles para su elección en la
etapa de muestreo.
Censo
• Es el estudio completo de todos los elementos de la población.
Parámetro
• Es un resumen de una característica de una población.
Estadístico
• Es un resumen de una característica de una muestra.
Ejemplo 33
Notas importantes
168 Estadística Descriptiva 201601
Notas importantes
Unidad 6. Muestreo 169
Muestreo sistemático
Se selecciona un primer elemento aleatoriamente y, luego, los demás elementos que
conformarán la muestra cada cierto intervalo. Este muestreo supone que se cuenta con
una enumeración completa de los elementos de la población.
Muestreo estratificado
Se selecciona la muestra de los diversos estratos. Un estrato es una parte de la pobla-
ción, cuyos elementos tienen características similares. El objetivo de estratificar la po-
blación es buscar homogeneidad entre los estratos.
Notas importantes
170 Estadística Descriptiva 201601
Ejercicio 42
Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cua-
dro siguiente, información acerca del ingreso mensual (en soles) y años cumplidos en la
empresa de cada uno de sus trabajadores.
Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las
columnas C4, C8, C11 y C15 de la tabla de números aleatorios.
Seleccione una muestra de diez trabajadores usando muestreo simple aleatorio. Use las
columnas C11, C6, C1 y C9 de la tabla de números aleatorios.
Notas importantes
Unidad 6. Muestreo 171
Trabajadores registrados
Ingreso Ingreso Ingreso Años en la
Nº Años en la empresa Nº Años en la empresa Nº
(en soles) (en soles) (en soles) empresa
1 2300 5 51 2100 13 101 2400 16
2 2800 11 52 2100 9 102 1700 0
3 2400 4 53 1800 1 103 2500 12
4 2500 2 54 2000 9 104 1700 3
5 2300 3 55 2100 10 105 2400 17
6 2100 2 56 1900 4 106 2400 16
7 1700 2 57 2000 10 107 1900 7
8 2000 0 58 2300 11 108 1700 1
9 2200 7 59 2000 7 109 2100 6
10 2100 4 60 1700 1 110 2000 5
11 1700 0 61 1900 6 111 2000 3
12 2500 2 62 2000 9 112 2500 13
13 2800 13 63 2400 17 113 1700 0
14 2400 9 64 1700 0 114 2500 19
15 1700 1 65 1700 2 115 1700 3
16 2400 9 66 2400 17 116 2600 19
17 2200 10 67 2500 13 117 1600 1
18 2200 4 68 2600 16 118 1800 6
19 2300 10 69 2100 14 119 2100 10
20 2800 11 70 1900 7 120 1700 0
21 2100 7 71 2000 9 121 2400 16
22 1700 1 72 1800 7 122 2600 17
23 2500 6 73 2100 10 123 2100 10
24 2400 9 74 2300 12 124 2100 8
25 2700 17 75 2700 20 125 2400 17
26 1700 0 76 2800 20 126 1700 1
27 1600 2 77 1800 3 127 2600 20
28 2600 17 78 1700 5 128 2400 16
29 2500 13 79 1700 4 129 2700 17
30 2500 16 80 1700 0 130 2100 12
31 2700 17 81 1700 1 131 1600 0
32 1700 1 82 2100 6 132 2100 15
33 1600 1 83 2600 17 133 1900 5
34 2400 11 84 2400 9 134 2100 12
35 1900 3 85 2600 19 135 2200 12
36 1800 5 86 1900 7 136 2400 13
37 1800 3 87 1600 0 137 1800 4
38 2400 14 88 1900 3 138 2600 17
39 2600 16 89 2100 14 139 2700 20
40 2700 18 90 1700 0 140 2500 16
41 2100 11 91 2100 15 141 2500 16
42 2300 14 92 1700 1 142 1900 6
43 1700 0 93 2300 14 143 2100 15
44 2200 13 94 2500 16 144 1700 9
45 2900 20 95 2600 18 145 1500 0
46 1800 5 96 1900 3 146 1800 18
47 2100 16 97 2500 19 147 2100 10
48 2000 12 98 1800 6 148 2700 19
49 2000 12 99 1700 2 149 1800 9
50 2900 20 100 2000 10 150 2100 15
Notas importantes
172 Estadística Descriptiva 201601
Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las
columnas C4, C8, C11 y C15 de la tabla de números aleatorios.
Solución
Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de
la muestra, usando una tabla de números aleatorios. Como el marco muestral tiene 150
elementos usemos las columnas C4, C5 y C6, para elegir números de tres cifras y luego C8,
C9 y C10.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Los elementos seleccionados son:
Posición 114 81 134 148 39 97 105 98 126 64 109 122 142 145 149
Notas importantes
Unidad 6. Muestreo 173
Seleccione una muestra de diez trabajadores usando muestreo simple aleatorio. Use las
columnas C1, C10, C12 y C4 de la tabla de números aleatorios.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Notas importantes
174 Estadística Descriptiva 201601
Los elementos seleccionados son:
Posición
En el muestreo sistemático se elige un elemento del marco muestral cada cierto interva-
lo. Este muestreo supone que se cuenta con una enumeración completa de los elemen-
tos de la población.
Ejemplo 34
Se tiene una población de 12 personas y se desea elegir a cuatro de ellas mediante un
muestreo sistemático. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna
C3, C6 y C12.
Solución
N 12
Calculemos el valor de k, donde k 3 . El valor de k se redondea al valor del
n 4
entero menor, luego k = 3.
Notas importantes
Unidad 6. Muestreo 175
Seleccionemos aleatoriamente un número entero entre 1 y k = 3, llamado arranque
aleatorio (A). Observando la columna C3 de la tabla de números aleatorios tenemos que
A = 2.
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es
decir la quinta posición (3 + 2 = 5) del listado del marco muestral y así sucesivamente
hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 2, 5, 8 y 11.
Ejemplo 35
Solución
N 15
Calculemos el valor de k, donde k 2,5 . El valor de k se redondea al valor del
n 6
entero menor, luego k = 2.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es
decir la tercera posición (1 + 2 = 3) del listado del marco muestral y así sucesivamente
hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 1, 3, 5, 7, 9 y
11.
Notas importantes
176 Estadística Descriptiva 201601
Ejemplo 36
Se tiene información de 40 personas de un barrio de Lima Metropolitana. Obtenga una
muestra aleatoria de ocho personas usando el muestreo sistemático y elabore una tabla
con los elementos seleccionados. Utilice las columnas C8; C10; C11 de la tabla de números
aleatorios.
Individuos registrados
Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura
1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 69
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 76
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 74
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 90
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 164
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 164
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162
Solución
N 40
Calculemos el valor de k, donde k 5
n 8
El valor de k se redondea al valor del entero menor, luego k = 5.
Seleccionemos aleatoriamente un número entero entre 1 y k = 5, llamado arranque
aleatorio (A).
Observando la columna C8 de la tabla de números aleatorios tenemos que A = 5.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es
decir la décima posición (5+5 = 10) del listado del marco muestral y así sucesivamente
hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 5, 10, 15,
20, 25, 30, 35 y 40.
Los elementos seleccionados son:
Posición 5 10 15 20 25 30 35 40
Notas importantes
Unidad 6. Muestreo 177
Ejercicio 43
Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en
la tabla que se muestra a continuación información acerca de las variables: ingreso men-
sual (en soles), nivel de educación y años cumplidos en la empresa.
Trabajadores registrados
Ingreso Nivel de Años en Ingreso Nivel de Años en Ingreso Nivel de Años en
Nº Nº Nº
(soles) Educación empresa (soles) Educación empresa (soles) Educación empresa
1 2300 Secundaria 5 51 2100 Técnica 13 101 2400 Técnica 16
2 2800 Secundaria 11 52 2100 Técnica 9 102 1700 Técnica 0
3 2400 Secundaria 4 53 1800 Técnica 1 103 2500 Técnica 12
4 2500 Secundaria 2 54 2000 Técnica 9 104 1700 Técnica 3
5 2300 Secundaria 3 55 2100 Técnica 10 105 2400 Técnica 17
6 2100 Secundaria 2 56 1900 Técnica 4 106 2400 Técnica 16
7 1700 Secundaria 2 57 2000 Técnica 10 107 1900 Técnica 7
8 2000 Secundaria 0 58 2300 Técnica 11 108 1700 Técnica 1
9 2200 Secundaria 7 59 2000 Técnica 7 109 2100 Técnica 6
10 2100 Secundaria 4 60 1700 Técnica 1 110 2000 Técnica 5
11 1700 Secundaria 1 61 1900 Técnica 6 111 2000 Superior 3
12 2500 Secundaria 2 62 2000 Técnica 9 112 2500 Superior 13
13 2800 Secundaria 13 63 2400 Técnica 17 113 1700 Superior 0
14 2400 Secundaria 9 64 1700 Técnica 0 114 2500 Superior 19
15 1700 Secundaria 1 65 1700 Técnica 2 115 1700 Superior 3
16 2400 Secundaria 9 66 2400 Técnica 17 116 2600 Superior 19
17 2200 Secundaria 10 67 2500 Técnica 13 117 1600 Superior 1
18 2200 Secundaria 4 68 2600 Técnica 16 118 1800 Superior 6
19 2300 Secundaria 10 69 2100 Técnica 14 119 2100 Superior 10
20 2800 Secundaria 11 70 1900 Técnica 7 120 1700 Superior 0
21 2100 Secundaria 7 71 2000 Técnica 9 121 2400 Superior 16
22 1700 Secundaria 1 72 1800 Técnica 7 122 2600 Superior 17
23 2500 Secundaria 6 73 2100 Técnica 10 123 2100 Superior 10
24 2400 Secundaria 9 74 2300 Técnica 12 124 2100 Superior 8
25 2700 Secundaria 17 75 2700 Técnica 20 125 2400 Superior 17
26 1700 Secundaria 0 76 2800 Técnica 20 126 1700 Superior 1
27 1600 Secundaria 2 77 1800 Técnica 3 127 2600 Superior 20
28 2600 Secundaria 17 78 1700 Técnica 5 128 2400 Superior 16
29 2500 Secundaria 13 79 1700 Técnica 4 129 2700 Superior 17
30 2500 Secundaria 16 80 1700 Técnica 0 130 2100 Superior 12
31 2700 Secundaria 17 81 1700 Técnica 1 131 1600 Superior 0
32 1700 Secundaria 1 82 2100 Técnica 6 132 2100 Superior 15
33 1600 Secundaria 1 83 2600 Técnica 17 133 1900 Superior 5
34 2400 Secundaria 11 84 2400 Técnica 9 134 2100 Superior 12
35 1900 Secundaria 3 85 2600 Técnica 19 135 2200 Superior 12
36 1800 Secundaria 5 86 1900 Técnica 7 136 2400 Superior 13
37 1800 Secundaria 3 87 1600 Técnica 0 137 1800 Superior 4
38 2400 Secundaria 14 88 1900 Técnica 3 138 2600 Superior 17
39 2600 Secundaria 16 89 2100 Técnica 14 139 2700 Superior 20
40 2700 Secundaria 18 90 1700 Técnica 0 140 2500 Superior 16
41 2100 Técnica 11 91 2100 Técnica 15 141 2500 Superior 16
42 2300 Técnica 14 92 1700 Técnica 1 142 1900 Superior 6
43 1700 Técnica 0 93 2300 Técnica 14 143 2100 Superior 15
44 2200 Técnica 13 94 2500 Técnica 16 144 1700 Superior 9
45 2900 Técnica 20 95 2600 Técnica 18 145 1500 Superior 0
46 1800 Técnica 5 96 1900 Técnica 3 146 1800 Superior 18
47 2100 Técnica 16 97 2500 Técnica 19 147 2100 Superior 10
48 2000 Técnica 12 98 1800 Técnica 6 148 2700 Superior 19
49 2000 Técnica 12 99 1700 Técnica 2 149 1800 Superior 9
50 2900 Técnica 20 100 2000 Técnica 10 150 2100 Superior 15
Notas importantes
178 Estadística Descriptiva 201601
Aplique el muestreo sistemático para seleccionar una muestra de ocho empleados. Ela-
bore un listado con el número seleccionado. Utilice la columna C3, C9, y C12 de la tabla de
números aleatorios.
Solución
N
Calculemos el valor de k, donde k ………………………...
n
El valor de k se redondea al valor del entero menor, luego k = ……………..……..
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k) del
listado del marco muestral y así sucesivamente hasta completar la muestra.
Los elementos seleccionados son:
Posición
Notas importantes
Unidad 6. Muestreo 179
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Notas importantes
180 Estadística Descriptiva 201601
Estratificar significa dividir a la población en varias partes de acuerdo con ciertas carac-
terísticas de sus elementos.
El objetivo de estratificar la población es buscar homogeneidad entre los estratos.
1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que in-
cluyan a todos los elementos de la población y que cada elemento pertenezca sola-
mente a un estrato.
Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no es-
tén relacionadas entre sí.
Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto pue-
den no ser considerados.
Notas importantes
Unidad 6. Muestreo 181
Ejemplo 37
La empresa de telecomunicaciones RTV tiene 120 empleados de los cuales tiene infor-
mación de las variables: ingreso en soles, nivel de educación y años en la empresa.
Años
Ingreso Años Ingreso Ingreso Años
Nivel de Nivel de cumplidos Nivel de
Nº (en cumplidos Nº (en Nº (en cumplidos
educación educación en la empre- educación
soles) en la empresa soles) soles) en la empresa
sa
1 2300 Secundaria 5 41 2100 Técnica 13 81 2000 Superior 3
2 2800 Secundaria 11 42 2100 Técnica 9 82 2500 Superior 13
3 2400 Secundaria 4 43 1800 Técnica 1 83 1700 Superior 0
4 2500 Secundaria 2 44 2000 Técnica 9 84 2500 Superior 19
5 2300 Secundaria 3 45 2100 Técnica 10 85 1700 Superior 3
6 2100 Secundaria 2 46 1900 Técnica 4 86 2600 Superior 19
7 1700 Secundaria 2 47 2000 Técnica 10 87 1600 Superior 1
8 2000 Secundaria 0 48 2300 Técnica 11 88 1800 Superior 6
9 2200 Secundaria 7 49 2000 Técnica 7 89 2100 Superior 10
10 2100 Secundaria 4 50 1700 Técnica 1 90 1700 Superior 0
11 1700 Secundaria 0 51 1700 Técnica 1 91 2400 Superior 16
12 2500 Secundaria 2 52 2100 Técnica 6 92 2600 Superior 17
13 2800 Secundaria 13 53 2600 Técnica 17 93 2100 Superior 10
14 2400 Secundaria 9 54 2400 Técnica 9 94 2100 Superior 8
15 1700 Secundaria 1 55 2600 Técnica 19 95 2400 Superior 17
16 2400 Secundaria 9 56 1900 Técnica 7 96 1700 Superior 1
17 2200 Secundaria 10 57 1600 Técnica 0 97 2600 Superior 20
18 2200 Secundaria 4 58 1900 Técnica 3 98 2400 Superior 16
19 2300 Secundaria 10 59 2100 Técnica 14 99 2700 Superior 17
20 2800 Secundaria 11 60 1700 Técnica 0 100 2100 Superior 12
21 2100 Secundaria 7 61 2100 Técnica 15 101 1600 Superior 0
22 1700 Secundaria 1 62 1700 Técnica 1 102 2100 Superior 15
23 2500 Secundaria 6 63 2300 Técnica 14 103 1900 Superior 5
24 2400 Secundaria 9 64 2500 Técnica 16 104 2100 Superior 12
25 2700 Secundaria 17 65 2600 Técnica 18 105 2200 Superior 12
26 1700 Secundaria 0 66 1900 Técnica 3 106 2400 Superior 13
27 1600 Secundaria 2 67 2500 Técnica 19 107 1800 Superior 4
28 2600 Secundaria 17 68 1800 Técnica 6 108 2600 Superior 17
29 2500 Secundaria 13 69 1700 Técnica 2 109 2700 Superior 20
30 2500 Secundaria 16 70 2000 Técnica 10 110 2500 Superior 16
31 2100 Técnica 11 71 2400 Técnica 16 111 2500 Superior 16
32 2300 Técnica 14 72 1700 Técnica 0 112 1900 Superior 6
33 1700 Técnica 0 73 2500 Técnica 12 113 2100 Superior 15
34 2200 Técnica 13 74 1700 Técnica 3 114 1700 Superior 9
35 2900 Técnica 20 75 2400 Técnica 17 115 1500 Superior 0
36 1800 Técnica 5 76 2400 Técnica 16 116 1800 Superior 18
37 2100 Técnica 16 77 1900 Técnica 7 117 2100 Superior 10
38 2000 Técnica 12 78 1700 Técnica 1 118 2700 Superior 19
39 2000 Técnica 12 79 2100 Técnica 6 119 1800 Superior 9
40 2900 Técnica 20 80 2000 Técnica 5 120 2100 Superior 15
Notas importantes
182 Estadística Descriptiva 201601
Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use
como variable de estratificación el nivel educacional. Elabore un listado identificando el
número de dato seleccionado.
Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9,
C10 y C11 y para el estrato 3 use las columnas C4, C3, C5 y C7.
Solución
Se divide a la población en estratos que sean mutuamente excluyentes, luego los estra-
tos 1, 2 y 3 son: secundaria, técnica y superior, respectivamente. Para cada uno de los
estratos, seleccionamos muestras aleatorias simples.
Posiciones
Estratos
Números de elementos Cantidad seleccionada por estrato nh Nh n
en el estrato Nh (desde – hasta) N
N1 30
1. Secundaria N1 = 30 1 – 30 n1 n 16 4
N 120
N2 50
2. Técnica N2 = 50 31 – 80 n2 n 16 6,67 7
N 120
N3 40
3. Superior N3 = 40 81 – 120 n3 n 16 5,33 5
N 120
Total N = 120 n = 16
Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las colum-
nas C1, C3 y C5. Observemos que las posiciones de los elementos a elegir están entre el 1
y el 30.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es:
Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas
C8, C9, C10 y C11. Observemos que las posiciones de los elementos a elegir están entre el
31 y el 80.
Notas importantes
Unidad 6. Muestreo 183
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:
Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas
C4, C3, C5 y C7. Observemos que las posiciones de los elementos a elegir están entre el 81
y el 120.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:
Notas importantes
184 Estadística Descriptiva 201601
Ejercicio 44
La siguiente tabla muestra a los 120 alumnos de la especialidad de Administración, de la
universidad El Saber, a quienes se les preguntó por su emisora radial preferida y por la
cantidad de horas a la semana que la escucha.
Notas importantes
Unidad 6. Muestreo 185
Elabore un listado con el alumno seleccionado. Para el estrato 1 use las columnas C7, C3
y C1, para el estrato 2 use las columnas C8, C3, C2 y C10 y para el estrato 3 use las colum-
nas C1, C4, C10; C7, C12, y C13.
Posición Nh
Estrato Nh nh n
(desde – hasta) N
Estrato 1:
Posición
Estudio 92
Estrato 2:
Posición
Oxígeno
Estrato 3:
Posición
Planeta
Notas importantes
186 Estadística Descriptiva 201601
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Notas importantes
Unidad 6. Muestreo 187
Problemas resueltos
1. El gerente de Wallmarket al distribuir los productos en las diferentes tiendas toma una muestra
de 250 unidades de los tres productos y en los dos tipos de envases, del almacén con la idea de
distribuirlos aleatoriamente en las tiendas. La distribución de los productos es la siguiente:
Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
( )
( ) ( ) ( ) ( )
Notas importantes
188 Estadística Descriptiva 201601
c. Si el envase es sachet, ¿cuál es la probabilidad de que sea esencia?
( )
2. Si Expórtame distribuye sus productos de la siguiente manera: 45% en jugo, 35% en mermelada y
el resto en esencia. Además, se sabe que la probabilidad de que un jugo esté en mal estado es
4%, una mermelada es 2% y una esencia es 3%.
c. Si de los productos en mal estado se selecciona uno al azar, calcule la probabilidad de que
sea jugo.
Notas importantes
Unidad 6. Muestreo 189
3. Los productos de Expórtame también tienen buena acogida en el mercado nacional. El supermer-
cado Súper adquiere un lote pero conoce que algunos envases están defectuosos. La distribución
de los productos en el lote se muestra en las siguientes gráficas:
Esencia
28% Jugo
35%
Mermelad
a
37%
La distribución de los productos en el lote que son defectuosos se muestran en la siguiente gráfica
80%
Porcentaje
60%
98 98.5 96
40% Buen estado
20% Defectuoso
2 1.5 4
0%
Jugo Mermelada Esencia
Tipo de producto
Fuente: Supermercados Súper
Notas importantes
190 Estadística Descriptiva 201601
P( defectuoso) = 0.024
El gerente decidirá adquirir un lote mayor de productos
a. Si el envase está en buen estado, ¿qué tan probable es que sea de esencia?
b. Si el envase está en mal estado, ¿qué tipo de producto es más probable que sea?
( ) ( )
Como la probabilidad pedida es menor al 30%, entonces los productos no serán rechazados.
b. Calcule el valor esperado y varianza del número envases en mal estado y su varianza?
E(X) = n p = 60 x 0.01 = 0,6
V(X) = n p (1-p) = 60 x 0,01 x (1 – 0,01) = 0,594
Notas importantes
Unidad 6. Muestreo 191
5. Luego de embalar un contenedor de envases de productos de Expórtame, se tienen 60 envases,
de los cuales 25 son frascos. Si selecciona una muestra aleatoria de 20 envases para el control de
calidad.
a. Calcule la probabilidad de que ocho envases sean de frasco.
El rango de X, es decir todos los valores que puede tomar la variable, es igual 0, 1, 2,…, 20. En-
tonces, X H(N = 60; r = 25; n = 20) y Rx = {0, 1,…,20}
La probabilidad pedida es
( )
( )
( ) ( )( ) ( )( )
El coeficiente de variación de X es
√ ( ) √
( )
( )
6. El número de unidades envasados se modela con una variable Poisson con un promedio 10 uni-
dades por cada 20 minutos.
b. Si la máquina funciona durante dos horas consecutivas, calcule la probabilidad de que se ha-
yan envasado 50 productos.
1 = 60 unidades en dos horas
P(X = 50) = 0,0233
Notas importantes
192 Estadística Descriptiva 201601
7. Sea la variable aleatoria X el número de frascos vendidos en un supermercado por semana, con la
siguiente función de probabilidad:
1
f ( x) k (x 3)2 para x 1 ,2 , 3 , 4 , 5 , 6
38
a. Calcule el valor de k.
k = 0,25
x 12 24 36 48 60 72
f(x) 0,1447 0,2237 0,25 0,2237 0,1447 0,01316
c. Si la utilidad por docena de frascos vendido (en soles) viene dada por la función: U(X) = 10X –
5, expresada en soles, calcule la utilidad esperada mensual y su varianza?
E(X) = 3,0396
8. La demanda mensual de uno de los productos Expórtame varía grandemente de un mes a otro.
Con base a la información de los últimos 24 meses se estimó las probabilidades para la demanda
mensual del producto jugo en frasco.
E(X) = 101,5
b. Cada frasco tres soles y lo vende cinco soles. Si en un mes determinado, ha solicitado al dis-
tribuidor 140 frascos. Sea U(X) la utilidad del dueño de la tienda. Calcule la utilidad esperada.
E(U(X)) = 87,5
Notas importantes
Unidad 6. Muestreo 193
Caso: El Metropolitano
El Metropolitano es el sistema integrado de transporte público para Lima, que cuenta con buses arti-
culados de gran capacidad que circulan por corredores exclusivos, bajo el esquema de autobuses de
tránsito rápido BRT (Bus Rapid Transit en inglés). El objetivo de este moderno sistema es elevar la
calidad de vida de los ciudadanos, al ahorrarles tiempo en el traslado diario, proteger el medio am-
biente, brindarles mayor seguridad, una mejor calidad de servicio y trato más humano, especialmen-
te a las personas de la tercera edad y con discapacidad.
Se ha encargado a una empresa que modele ciertos procesos del Metropolitano con el fin de tener
estimaciones que permitan tomar decisiones.
1. Se define la variable aleatoria X definida como el número de recargas de la tarjeta de los usuarios
a la semana con la siguiente función de probabilidad.
X: Número de recargas 0 1 2 3 4
f(x) 0,10 4k 0,30 k 0,10
Para que f(x) sea una función de probabilidad debe cumplir que ∑ ( )
Por lo tanto, f(0) + f(1) + f(2) + f(3) + f(4) = 0,10 + 4k + 0,30 + k + 0,10 = 1, de donde k= 0,1
b. Calcule la probabilidad de que un usuario, elegido al azar, recargue su tarjeta más de una vez a
la semana.
c. Si un usuario recargó una vez su tarjeta en una semana, calcule la probabilidad de que dicho
usuario recargue su tarjeta por lo menos una vez más en esa semana.
( )
Se pide, ( ⁄ ) ( )
d. Si el costo de una recarga es de cinco soles y el Metropolitano tiene 560 mil usuarios, determi-
ne el monto esperado semanal por recargas.
Tenemos que ( ) ∑ ( )
El esperado del monto será 1,7 x 5 x 560 000 = 4 760 000 soles
Notas importantes
194 Estadística Descriptiva 201601
Objetivo: Estimar el número esperado de usuarios que realizan conexiones
2. Se sabe que el 12% de los usuarios del Metropolitano realizan conexiones de rutas. Si elegimos al
azar 80 usuarios,
a. Defina la variable, indique su distribución, parámetros y rango.
Sea X = cantidad de usuarios del Metropolitano que realizan conexiones de rutas en la mues-
tra
X B(n = 80; p = 0,12) y Rx = {0,1,…,80}
c. Sea la variable Y definida como el número de usuarios que realizan conexiones de los 560 mil
usuarios. Calcule el valor esperado y varianza de Y.
3. El gasto mensual de un usuario en el Metropolitano se modela con una variable normal con media
de 100 soles y una desviación estándar de cinco soles. Se elige un usuario al azar.
a. Calcule la probabilidad de que gaste entre 90 y 110 soles.
c. Determine el gasto mensual mínimo para que esté en 10% de los que más gastan.
Notas importantes
Unidad 6. Muestreo 195
Objetivo: Determinar el número esperado de usuarios que han sufrido robos
4. El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 1% de las usuarias y el
0,8% de los usuarios ha sufrido de algún tipo de robo durante el uso del Metropolitano.
a. Si se elige un usuario al azar, ¿cuál es la probabilidad de que haya sido víctima de robo?
Sean los eventos
R:= Que el usuario sea víctima de robo
H:= Que el usuario sea hombre. M:= Que el usuario sea mujer
b. Si se elige un usuario al azar que no ha sido víctima de robo, calcule la probabilidad de que
sea hombre. Indique el resultado con cuatro decimales.
( ⁄ )
c. Si el sistema tiene 560 mil usuarios, calcule el número esperado de usuarios que han sido víc-
timas de robo durante el uso del Metropolitano. Defina la variable necesaria y determine su
distribución.
Y:= número de usuarios que han sido víctima de robo
Y B(n = 560 000; p = 0,0089)
E(Y) = np = 560 000 x 0,0089 = 4984
5. El Metropolitano cuenta con una cuenta de correo para cualquier consulta, sugerencia, queja o
reclamo. El número de correos electrónicos que llegan a la cuenta de correo se modela como una
variable aleatoria Poisson con una media de ocho correos por día.
a. Calcule la probabilidad que en medio día llegue más de tres correos con consultas, sugeren-
cias, quejas o reclamos. Defina la variable necesaria y establezca su distribución, rango y pa-
rámetros.
Sea X = número de correos electrónicos que llegan a la cuenta de correo del Metropolitano
en medio día
y t = 0,5 día
X ~ P(µ = 4 correos )
b. Si se eligen al azar 100 días, calcule la probabilidad que la cantidad total de correos recibidos
en esos 100 días esté entre 790 y 810.
Notas importantes
196 Estadística Descriptiva 201601
Sea Xi = número de correos electrónicos que llegan a la cuenta de correo del Metropolitano
en el día, i = 1,…,100
Sea Y := cantidad total de correos en los 100 días
Nos piden ( ) ( ) .
Nos piden ( ) ( ̅ )
Luego, ( ) ( ̅ )
6. El peso de un usuario hombre del Metropolitano se modela con una variable normal con media de
75 kilos y desviación estándar de 15 kilos, mientras que para una usuaria mujer con media de 60
kilos y desviación estándar de 10 kilos. Si en un bus hay 50 hombres y 30 mujeres.
a. Si se elige una persona al azar, calcule la probabilidad de que pese más de 70 kilos.
Luego, ( ) ( ) ( ⁄ ) ( ) ( ⁄ )
Notas importantes
Unidad 6. Muestreo 197
b. Calcule la probabilidad de que el peso total de los 50 hombres y 30 mujeres supere 5500 ki-
los
∑ ∑
Nos piden ( ) ( ) .
7. El tiempo de espera para tomar un bus de un usuario se modela con una variable uniforme con
parámetros 0 y 10 minutos.
a. Si se elige un usuario al azar, calcule la probabilidad de que su tiempo de espera sea mayor a
ocho minutos.
b. Si se elige al azar a 500 usuarios, calcule la probabilidad de que la media del tiempo de espe-
ra de esos 500 usuarios esté en 4,8 y 5,2 minutos.
µ = (a+b)/2 = (0+10)/2= 5
σ2= (10 - 0)2/12 = 8,3333
Nos piden ( ̅ ) ( )
8. La actriz Magaly Solier es la décima séptima mujer en denunciar una agresión sexual ocurrida en
un bus del Metropolitano, desde noviembre del 2012. Solo un proceso está cerca de recibir sen-
tencia, según Silvia Loli, gerenta de la Mujer de la Municipalidad de Lima. Explica que en este caso
el agresor se acogió a la confesión sincera y podría recibir de dos a cuatro años de prisión suspen-
dida, cumplir trabajos comunitarios o pagar reparación civil. Si la oficina de relaciones públicas del
Metropolitano, quiere darle seguimiento exhaustivo a tres de las denuncias y elige al azar entre
los 17 casos existentes. Calcule la probabilidad de elegir el caso que está cerca de recibir senten-
cia. Defina la variable necesaria y establezca su distribución, rango y parámetros.
Notas importantes
198 Estadística Descriptiva 201601
Sea X = número de casos que están cerca de recibir sentencia
X H(N= 17; n = 3; r = 1) y Rx = {0,1}
P(X = 1) = f(1) = 0,1765
Objetivo: Estimar la media del número de días que un usuario usa el Metropolitano
9. Se define la variable aleatoria X: número de días a la semana que un usuario usa el Metropolitano.
Esta variable presenta la siguiente función de probabilidad.
X: Número de días 0 1 2 3 4 5 6 7
f(x) 0,05 0,10 0,15 0,15 0,20 0,25 0,05 0,05
b. Si se elige al azar una muestra de 1000 usuarios, calcule la probabilidad de que la media
muestral del número de días que usan el Metropolitana esté entre 3,5 y 3,6 días.
Nos piden ( ̅ ) ( )
10.La distancia, en metros, que recorre un usuario caminando para llegar a una estación del Metro-
politano se modela con la variable aleatoria X con la siguiente función de densidad.
( ) {
Primero hallemos a
∫ ∫
b. Calcule la probabilidad de que un usuario camine entre 300 y 700 metros para llegar a una es-
tación.
( ) ∫ ∫
Notas importantes
Tablas Estadísticas 199
Tablas estadísticas
Todas las tablas de este manual han sido calculadas usando el MS Excel.
Tabla de la distribución normal estándar
Área bajo la curva normal: PZ z
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350
-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
200 Tablas Estadísticas
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
Tablas Estadísticas 201
Índice alfabético
—A— —G—
Axiomas de la probabilidad, 100 Gráfico
circular, 19
—C— de barras, 19
de barras agrupadas, 24
Coeficiente de variación, 72 de barras apiladas, 25
de barras apiladas al 100%, 25
—D— de cajas, 76
de Pareto, 21
Deciles, 65 Ojiva, 39
Desviación estándar, 71 Polígono de frecuencias, 38
Distribución
binomial, 124
de frecuencias, 14, 28, 30
—M—
de la media muestral, 160 Media, 51
de probabilidad, 116, 117 ponderada, 62
hipergeométrica, 126 Mediana, 55
normal, 142 Moda, 59
Poisson, 128 Muestreo
uniforme continua, 139 aleatorio simple, 170
estratificado, 180
—E— probabilístico, 169
sistemático, 174
Escalas de medición, 8
Espacio muestral, 92
Estadística
—P—
Definición, 4 Parámetro, 11
Subdivisión, 4 Percentiles, 66
estadístico, 11 Población, 6
Estadístico, 11 Propiedad reproductiva de la normal, 156
Evento, 92
Complemento, 95
Eventos —T—
independientes, 108 Teorema
Intersección de, 96 de Bayes, 105
mutuamente excluyentes, 98 del límite central, 161
Unión de, 96
Experimento aleatorio, 92
—V—
—F— Valor esperado
de una función de una variable aleatoria, 121, 137
Función Variable, 10
de densidad, 132 aleatoria continua, 132
de distribución acumulada, 134 aleatoria discreta, 117
Varianza, 71
de una variable aleatoria, 121, 138