Вы находитесь на странице: 1из 205

MA460

Estadstica Descriptiva

Cuaderno de trabajo
Los profesores del curso

rea de Ciencias - Agosto 2017


Contenido

Unidad 1 Organizacin de datos.................................................................................................... 7


Definicin de Estadstica ........................................................................................................... 9
Definiciones ........................................................................................................................... 10
Unidad elemental, variables y observacin ................................................................................................. 10
Dato .............................................................................................................................................................. 10
Poblacin y muestra ..................................................................................................................................... 11
Escalas de medicin de las variables ............................................................................................................ 13
Tipos de variables segn su naturaleza ........................................................................................................ 15
Parmetro y estadstico ................................................................................................................................ 16
Estudios estadsticos .................................................................................................................................... 18
Errores en la adquisicin de datos ............................................................................................................... 19
Fuentes de datos .......................................................................................................................................... 19
Estadstica Descriptiva ............................................................................................................ 20
Frecuencias absolutas, relativas y porcentuales .......................................................................................... 20
Distribucin de frecuencias .......................................................................................................................... 20
Ttulo de una distribucin de frecuencias o grfico de una variable ............................................................ 21
Distribucin de frecuencias de variables cualitativas................................................................ 22
Grficos estadsticos ............................................................................................................... 23
Recomendaciones sobre la presentacin de grficos .................................................................................. 23
Grfico de barras .......................................................................................................................................... 25
Diagrama circular ......................................................................................................................................... 25
Frecuencias acumuladas, absolutas relativas y porcentuales ...................................................................... 27
Diagrama de Pareto ...................................................................................................................................... 27
Tabulaciones cruzadas ............................................................................................................ 30
Ttulo de un grfico de una tabla de contingencia ....................................................................................... 30
Grfico de tabulaciones cruzadas de dos variables ...................................................................................... 31
Resumen de datos cuantitativos ............................................................................................. 35
Distribucin de frecuencias de variables discretas ...................................................................................... 35
Grfico de bastones...................................................................................................................................... 35
Distribucin de frecuencias de variables continuas ..................................................................................... 37
Grficos de datos cuantitativos ............................................................................................... 43
Ejercicios adicionales de la Unidad 1 ............................................................................................................ 46

Unidad 2 Medidas descriptivas ................................................................................................... 53


Datos simples y datos agrupados ................................................................................................................. 54
Medidas de tendencia central ................................................................................................. 55
Media ........................................................................................................................................................... 55
Mediana ....................................................................................................................................................... 59
Moda ............................................................................................................................................................ 62
Media ponderada ......................................................................................................................................... 64
Cuantiles ................................................................................................................................ 67
Percentil ....................................................................................................................................................... 67
Deciles .......................................................................................................................................................... 68
Medidas de variabilidad.......................................................................................................... 71
Varianza ........................................................................................................................................................ 72
Desviacin estndar ..................................................................................................................................... 72
Coeficiente de variacin ............................................................................................................................... 74
Rango............................................................................................................................................................ 76
Rango intercuartil ......................................................................................................................................... 77
Medidas de asimetra ............................................................................................................. 78
Coeficiente de asimetra de Pearson ............................................................................................................ 78
Diagrama de cajas................................................................................................................... 80
Ejercicios de la Unidad 2............................................................................................................................... 84

Unidad 3 Unidad 3: Teora de la probabilidad .............................................................................. 93


Experimentos, reglas de conteo y asignacin de probabilidades ............................................... 95
Experimento aleatorio .................................................................................................................................. 95
Espacio muestral .......................................................................................................................................... 95
Evento .......................................................................................................................................................... 95
Probabilidad de un evento ........................................................................................................................... 96
Definicin clsica de la probabilidad de un evento ...................................................................................... 97
Algunas relaciones bsicas de probabilidad ................................................................................................. 98
C
Complemento (A ) ........................................................................................................................................ 98
Unin de eventos (A B) ............................................................................................................................. 99
Interseccin de eventos (A B) ................................................................................................................... 99
Diferencia de eventos (A - B) ........................................................................................................................ 99
Diferencia simtrica de eventos (A B) ..................................................................................................... 100
Eventos mutuamente excluyentes ............................................................................................................. 101
Reglas de conteo y combinaciones .........................................................................................101
Axiomas de la probabilidad ........................................................................................................................ 103
Ley aditiva para eventos cualesquiera ....................................................................................................... 103
Probabilidad condicional........................................................................................................105
Ley multiplicativa para eventos cualesquiera ............................................................................................ 110
rbol de probabilidades ............................................................................................................................. 110
Particin del espacio muestral ................................................................................................................... 111
Probabilidad total ....................................................................................................................................... 111
Teorema de Bayes .................................................................................................................111
Eventos independientes.........................................................................................................115
Ley de la multiplicacin para eventos independientes .............................................................................. 115
Ejercicios de la Unidad 3............................................................................................................................. 117

Unidad 4 : Variables aleatorias ..................................................................................................121


Variable aleatoria ..................................................................................................................123
Rango o recorrido de una variable aleatoria .............................................................................................. 123
Tipos de variable aleatoria ......................................................................................................................... 123
Evento (X = a) ............................................................................................................................................. 123
Variable aleatoria discreta .....................................................................................................124
Distribucin de probabilidad de una variable aleatoria discreta ............................................................... 124
Valor esperado de una variable aleatoria discreta ..................................................................................... 127
Valor esperado de una funcin de variable aleatoria discreta ................................................................... 128
Varianza y desviacin estndar de una variable aleatoria discreta ........................................................... 128
Distribuciones de probabilidad de variables discretas .............................................................133
Distribucin binomial ................................................................................................................................. 133
Distribucin hipergeomtrica ..................................................................................................................... 137
Distribucin de Poisson .............................................................................................................................. 140
Variable aleatoria continua ....................................................................................................144
Funcin de densidad de una variable aleatoria continua .......................................................................... 144
Funcin de distribucin acumulada de probabilidad ................................................................................. 147
Valor esperado de una variable aleatoria continua ................................................................................... 150
Valor esperado de una funcin de variable aleatoria continua ................................................................. 150
Varianza y desviacin estndar de una variable aleatoria continua .......................................................... 151
Distribuciones de probabilidad de variable continua...............................................................152
Distribucin uniforme ................................................................................................................................ 152
Distribucin normal .................................................................................................................................... 155
Distribucin exponencial ............................................................................................................................ 160
Ejercicios de la Unidad 4............................................................................................................................. 162
Unidad 5 : Distribuciones muestrales .........................................................................................167
Propiedad reproductiva de la normal .....................................................................................168
Definiciones ..........................................................................................................................172
Muestreo con y sin reemplazo ................................................................................................................... 172
Poblacin finita e infinita............................................................................................................................ 172
Distribucin muestral de un estadstico ..................................................................................172
Distribucin de la media muestral ..........................................................................................173
Teorema central del lmite .....................................................................................................174
Ejercicios de la Unidad 5............................................................................................................................. 178

Unidad 6 : Muestreo..................................................................................................................181
Definiciones ..........................................................................................................................183
Ventajas y desventajas del muestreo frente al censo ................................................................................ 184
Muestreo probabilstico .........................................................................................................185
Muestreo aleatorio simple .....................................................................................................186
Muestreo sistemtico ............................................................................................................190
Muestreo estratificado ..........................................................................................................195
Tablas estadsticas ...................................................................................................................................... 202
ndice alfabtico ......................................................................................................................................... 204
Unidad 1 Organizacin de datos
Logro de la unidad 1

Al finalizar la unidad 1,
el estudiante interpreta con rigurosidad tablas y grficos,
a partir de datos reales dentro del mbito de su carrera.

Temario
La Estadstica y sus subdivisiones.
Definiciones de poblacin, muestra, variables, clasificacin de variables, parmetros y estadsticos.
La investigacin estadstica. Metodologa.
Mtodos de organizacin y presentacin de datos:
Datos cualitativos
Datos cuantitativos
Tablas de distribucin de frecuencias y representaciones grficas (circular, barras, Pareto)
Tablas de doble entrada
8 Estadstica Descriptiva 201702

Notas importantes
Unidad 1. Organizacin de Datos 9

Definicin de Estadstica

Es la ciencia que proporciona un conjunto de mtodos, tcnicas y procedimientos para


recopilar, organizar, presentar y analizar datos con el fin de describirlos o realizar gene-
ralizaciones vlidas.

Recoleccin Organizacin Presentacin Anlisis

Subdivisin de la Estadstica
La Estadstica se puede dividir en Estadstica descriptiva y Estadstica inferencial.

Estadstica Son mtodos y tcnicas de recoleccin, caracterizacin, resumen y


descriptiva presentacin que permiten describir apropiadamente las caractersticas
de un conjunto de datos.
Comprende el uso de grficos, tablas, diagramas y criterios para el
anlisis.

Estadstica Son mtodos y tcnicas que hacen posible estimar una o ms


inferencial caractersticas de una poblacin o tomar decisiones sobre poblacin
basadas en el resultado de muestras.
Estas conclusiones no son totalmente vlidas y tienen cierto margen de
error.

Ejercicio 1
Indique si los siguientes enunciados corresponden al uso de la Estadstica descriptiva o
de la Estadstica inferencial.

En la segunda vuelta de las elecciones 2016, el Descriptiva Inferencial


50,12% de los votantes lo hizo por Peruanos por el
Kambio, segn la ONPE.
Segn una encuesta de Ipsos Apoyo de diciembre de Descriptiva Inferencial
2016, Ricardo Gareca tiene un 81% de aprobacin.
El director de Investigaciones Econmicas de Citi Descriptiva Inferencial
para la Regin Andina, Munir Jalil, sostuvo que la
cotizacin del dlar llegar a S/ 3.55 en el 2017.
En una muestra, el 15% de las personas afirmaron Descriptiva Inferencial
que tenan contratado Netflix
A nivel mundial se calcula que la acondroplasia (una Descriptiva Inferencial
causa del enanismo) tiene una incidencia de alrede-
dor de 1/25.000 nacidos vivos.

Notas importantes
10 Estadstica Descriptiva 201702

Definiciones
Unidad elemental, variables y observacin

Observacin es el
Variables son las
Unidad elemental conjunto de
caractersticas de
es la entidad mediciones
inters de las
acerca de la cual se obtenido de una
unidades
rene los datos unidad elemental
elementales
particular

Ejemplo 1

Ella responde:
A una persona se le pregunta su
Soy mujer y tengo
(Unidad gnero y edad.
19 aos
elemental) (Variables)
(Observacin)

Dato
Es el resultado de medir una caracterstica observable de una unidad elemental.

Caso Aerolnea Wayra


Aerolnea Wayra S.A es una empresa peruana de transporte areo con vuelos nacionales
e internacionales, ofrece un servicio alta calidad a sus pasajeros y busca mejorar conti-
nuamente la eficiencia de sus operaciones, valorando el empeo diario de su personal.
Actualmente, la flota de la empresa est constituida por cuatro aviones Boeing, que
brindan una gran capacidad de empuje y autonoma. Sus aviones han sido remodelados
en su interior. Se desea determinar si las remodelaciones en la flota han servido para
brindar un mejor servicio a los pasajeros. Por esta razn, se entrevist a 125 pasajeros
que viajaron en el ltimo ao. A cada persona se le hizo 30 preguntas.
Indique la unidad elemental en la investigacin.

Indique la cantidad de observaciones y datos obtenidos.

Notas importantes
Unidad 1. Organizacin de Datos 11

Poblacin y muestra

Poblacin
Muestra
Poblacin es el conjunto de todos las
unidades elementales de inters en
determinado estudio. Muestra es un subconjunto de la poblacin.
Es un conjunto de personas, objetos, Ser representativa si se parece a la
conceptos, etc. de los cuales se sacan poblacin de la que proviene.
conclusiones a partir de una o ms
caractersticas observables de
naturaleza cualitativa o cuantitativa.

Ejemplo 2
La Secretara Acadmica de una universidad est interesada en realizar un estudio sobre
los motivos por los cuales algunos alumnos del pregrado han decidido dar exmenes de
recuperacin ese ciclo. La universidad cuenta con quince facultades y un total de 7500
alumnos, de los cuales 830 han decidido rendir exmenes de recuperacin ese ciclo. De
la poblacin se va a entrevistar a una muestra aleatoria de 200 alumnos. Defina la po-
blacin y la muestra

Solucin

Poblacin
Muestra
Los 830 alumnos que han decidido dar
exmenes de recuperacin ese ciclo. Los 200 alumnos que han decidido dar
exmenes de recuperacin ese ciclo.

Ejercicio 2
El objetivo de una investigacin es estimar el promedio de la nota final de los alumnos
que han llevado el curso Estadstica Descriptiva de la UPC. Indique la poblacin y la
muestra.

Poblacin
Muestra
......................................................................
...........................................................................................................................................
...........................................................................................................................................

Notas importantes
12 Estadstica Descriptiva 201702
Ejercicio 3
En una investigacin, de los clientes que han recibido algn prstamo del banco A, se
desea determinar el porcentaje de ellos que han pagado a tiempo todas sus cuotas. In-
dique la poblacin y la muestra de dicha investigacin

Poblacin
Muestra
......................................................................
...........................................................................................................................................
...........................................................................................................................................

En otra investigacin, se quiere estimar la media del ingreso en el ltimo mes de los
clientes del banco A. Indique la poblacin y la muestra de dicha investigacin

Poblacin
Muestra
......................................................................
...........................................................................................................................................
...........................................................................................................................................

Caso Aerolnea Wayra


Se quiere estimar el porcentaje de vuelos de la aerolnea Wayra que salen sin retraso.
Indique la poblacin y la muestra de dicha investigacin.

Poblacin
Muestra
......................................................................
...........................................................................................................................................
...........................................................................................................................................

Por otro lado, se quiere estimar la media del precio que los pasajeros pagan por vuelo
de ida y vuelta a Piura. Indique la poblacin y la muestra de dicha investigacin.

Poblacin
Muestra
......................................................................
...........................................................................................................................................
...........................................................................................................................................

Notas importantes
Unidad 1. Organizacin de Datos 13

Escalas de medicin de las variables


Son los tipos de valores asignados a las unidades elementales para una variable definida.

La escala de medicin permite determinar la cantidad de informacin que contienen los


datos y el anlisis estadstico ms apropiado.

Escalas de
medicin

Nominal Ordinal Intervalo Razn

Una variable est medida en escala nominal cuando los datos


Nominal son etiquetas que se emplean para definir un atributo del
elemento.

Una variable est medida en escala ordinal cuando los datos son
etiquetas y el orden es significativo.
Se pueden ordenar, de tal manera que puedan expresar grados
de la caracterstica medida.
Ordinal
No tiene sentido medir la distancia entre los valores de la
variable ni realizar operaciones aritmticas con ellos pues no
toman valores numricos especficos ni existe proporcionalidad
entre categoras vecinas.

Una variable est medida en escala de intervalo si los datos


tienen propiedades de datos ordinales y el intervalo entre
observaciones se expresa en trminos de una unidad fija de
Intervalo medida.
Los datos de intervalo siempre son numricos.
El cero es relativo, es decir, no indica la ausencia de la
caracterstica medida.

Una variable est medida en escala de razn si los datos tienen


todas las propiedades de los datos de intervalo y se puede
realizar cualquier operacin aritmtica (suma, resta,
Razn multiplicacin y divisin) y lgica (comparacin y
ordenamiento).
El cero es absoluto, es decir, indica la ausencia total de la
caracterstica medida.

Notas importantes
14 Estadstica Descriptiva 201702
Ejemplo 3

El gnero de las personas


Nominal El estado civil de los empleados de una empresa
Las carreras profesionales universitarias

El orden de mrito de los atletas en una competicin


Ordinal El grado de instruccin de los clientes de un banco

Las escalas de temperatura. Las temperaturas en grados


Intervalo centgrados 0C, y 20C equivalen a, en grados Fahrenheit, 32F,
y 68F

El sueldo de los empleados de una empresa


Razn El tiempo en terminar un examen

Caso Aerolnea Wayra


Se realiz una encuesta a una muestra de 125 pasajeros de la aerolnea. Algunas de las
variables fueron las siguientes. Indique la escala de medicin de cada variable.

Variable Nominal Ordinal Intervalo Razn


Tipo de boleto (Primera, business,
econmica)
Tiempo de vuelo, en horas
Opinin respecto al servicio: malo
regular, bueno, muy bueno
Edad del pasajero
Altura sobre el nivel del mar de la
ciudad de destino del viaje
Nmero de maletas con las que
viaja un pasajero
Precio del pasaje, en dlares
Nmero de asiento (1A, 1B,)
Temperatura de la cabina, en
grados centgrados
Temperatura de la cabina, en
grados Kelvin
Peso del equipaje, en kilogramos
Color de la maleta

Notas importantes
Unidad 1. Organizacin de Datos 15

Tipos de variables segn su naturaleza


Las variables se pueden clasificar en cualitativas o cuantitativas.

Variable Variable
cualitativa cuantitativa

Es una variable que Es una variable que A su vez, la variable


puede ser expresada puede ser medida en cuantitativa se
en escala nominal u escala de intervalo o clasifica en discreta o
ordinal. de razn. continua.

Variable discreta
Tiene un nmero finito o infinito
numerable de posibles valores; es
decir, que en un intervalo solo
puede tomar ciertos valores.

Variable continua
Tiene un nmero infinito no
numerable de posibles valores; es
decir, que en un intervalo puede
tomar cualquier valor.

Ejemplo 4
Variables Tipo de variable Escala de medicin
Marca de computadora personal que utiliza Cualitativa Nominal
Tiempo que usa la computadora por semana Cuantitativa continua Razn
Nmero de perros en una casa Cuantitativa discreta Razn
Nmero de granos de arena en una gran playa Cuantitativa discreta Razn

Caso Aerolnea Wayra


Se tienen otras variables como las siguientes. Indique su escala de medicin y tipo.

Variable Tipo de variable Escala de medicin

Cantidad de pasajeros por vuelo

Lnea area preferida

Tiempo de permanencia en el aeropuerto

Opinin sobre atencin (mejor, igual, empeor)

Notas importantes
16 Estadstica Descriptiva 201702

Parmetro y estadstico

Parmetro Es cualquier resumen de la poblacin.

Estadstico Es cualquier resumen de la muestra.

Ejemplo 5
En un estudio entre alumnos de la UPC, se registr la edad de todos los alumnos de la
UPC. La media de la edad fue de 19,3 aos. Adems, de una muestra de aleatoria de 300
alumnos se encontr que el 12% trabaja. Indique lo siguiente.

Medida de resumen Variable Valor Parmetro o estadstico

Media Edad 19,3 aos Parmetro

Porcentaje Condicin de trabajo 12% Estadstico

Ejercicio 4
La Organizacin Mundial de la Salud indica que una persona debera consumir 100 litros
de agua al da para atender todas sus necesidades. De acuerdo al grfico siguiente calcu-
lado de una muestra aleatoria indique lo siguiente.

Poblacin: ..

Medida de resumen Variable Valor Parmetro o estadstico

Notas importantes
Unidad 1. Organizacin de Datos 17
Caso Aerolnea Wayra
En una muestra de 200 vuelos, se determin que el 68% de los vuelos de la aerolnea
Wayra salan a tiempo. Indique lo siguiente.

Medida de resumen Variable Valor Parmetro o estadstico

Usando el registro del aeropuerto Jorge Chvez, se encontr que la media del tiempo de
retraso de todos los vuelos de la aerolnea Wayra fue 25 minutos. Indique lo siguiente.

Medida de resumen Variable Valor Parmetro o estadstico

Ejercicio 5
En mayo del 2015, se public el siguiente grfico en el diario Per 21 a partir de infor-
macin mensual proporcionada por la Superintendencia Nacional de Servicios de Sa-
neamiento (SUNASS). Indique lo siguiente respecto a dicha investigacin por muestreo.

Poblacin: ..

Muestra: ..

Unidad elemental: ...

Medida de resumen Variable Valor Parmetro o estadstico

Tomado de http://peru21.pe/economia/hogares-sin-acceso-al-agua-gastan-s72-al-mes-2219838

Notas importantes
18 Estadstica Descriptiva 201702

Estudios estadsticos
Los datos se obtienen mediante la realizacin de un estudio estadstico. A esos estudios
se les clasifica como experimentales u observacionales.

En un estudio experimental, se identifican las variables


Estudio de inters, las cuales son controladas por el investigador.
experimental Luego, se identifican otras variables que influyan en las
variables de inters.

Estudio En un estudio observacional, no se trata de controlar las


variables de inters, ni de influir sobre ellas, por ejemplo,
observacional en una encuesta.

Ejercicio 7
Indique a qu tipo de estudio, experimental u observacional, corresponden los siguien-
tes ejemplos.

Tomado de http://elcomercio.pe/economia/peru/turistas-gastan-nuestra-gastronomia-us350-millones

Actualizado el 27 de julio de 2015 a: 03:54 p.m. Por: AFP

Estudio clnico confirma eficacia de vacuna contra el dengue


La vacuna contra el dengue del laboratorio Sanofi es eficaz en ms de 80% de los afectados de es-
ta infeccin tropical transmitida por el mosquito, segn un nuevo anlisis independiente.

Notas importantes
Unidad 1. Organizacin de Datos 19

Errores en la adquisicin de datos


Un error en adquisicin de datos se presenta cuando el valor obtenido de los datos no
es igual al valor real que se hubiera obtenido con un procedimiento correcto.

Se debe comprobar la consistencia interna de los datos.

Tambin se analiza la existencia de valores demasiado grandes o demasiado pequeos,


conocidos atpicos, que son datos candidatos a posibles errores.

Fuentes de datos

Fuentes Los datos se obtienen por medio de encuestas y


estudios experimentales realizados con el objeto de
primarias recolectar nuevos datos.

Fuentes Los datos se han compilado y estn disponibles para el


secundarias anlisis estadstico.

Los siguientes sitios web son ejemplos donde conseguir datos de fuente secundaria.

Fuentes pblicas: bases de datos de ministerios y de oficinas gubernamentales de esta-


dstica, como por ejemplo.

Instituto Nacional de Estadstica e Informtica www.inei.gob.pe


Banco Central de Reserva del Per www.bcrp.gob.pe/
Ministerio de Salud del Per www.minsa.gob.pe

Fuentes privadas: bases de datos de las empresas, bases de datos que se compran a
empresas de estudios de mercado, bases de datos en Internet, como por ejemplo.

Datum Per www.datum.com.pe/


Ipsos Apoyo. Opinin y Mercado www.ipsos-apoyo.com.pe/
Instituto de Opinin Pblica PUCP www.pucp.edu.pe/iop/

Caso Aerolnea Wayra


Luego de la encuesta realizada por Felipe se tiene una base de datos. Parte de los resul-
tados se muestra en la siguiente tabla:
Nmero de Precio
Pasajero Edad Gnero Nacionalidad Motivo de viaje Destino Queja
viajes realizados pagado
1 20 M Peruana Negocios Mxico DF 1 $899,00 Desinformacin
2 43 M Chileno Turismo Cuzco 2 $399,00 Precio
..

Qu podemos hacer para resumir esta informacin?

Notas importantes
20 Estadstica Descriptiva 201702

Estadstica Descriptiva
Frecuencias absolutas, relativas y porcentuales

Frecuencia absoluta de una clase es la cantidad de elementos que pertenecen a esa


(fi) clase

Frecuencia relativa de una clase es la proporcin de elementos que pertenecen a


(hi) esa clase
Frecuencia
de una clase es la frecuencia relativa multiplicada por 100%
porcentual (pi)

Se tiene que:

frecuencia absoluta fi
frecuencia relativahi
nmero de casos n

frecuencia absoluta f
frecuencia porcentualpi hi % 100% i 100%
nmero de casos n

Distribucin de frecuencias
Es un resumen, expresado en un cuadro, de un conjunto de datos que muestra las fre-
cuencias absolutas, relativas y porcentuales en cada una de varias clases que no se tras-
lapan.

Ttulo:
Categoras Frecuencia absoluta fi Frecuencia relativa hi Frecuencia porcentual pi = hi%
f1 f1
Categora 1 f1 h1 p1 100%
n n
f f
Categora 2 f2 h2 2 p2 2 100%
n n

fk fk
Categora k fk hk pk 100%
n n
Fuente:

Es usual, usar en estos cuadros la frecuencia relativa en el mbito acadmico y la fre-


cuencia porcentual fuera del mbito acadmico.

Notas importantes
Unidad 1. Organizacin de Datos 21

Ttulo de una distribucin de frecuencias o grfico de una variable


Siguiendo indicaciones del INEI, en este curso, usaremos el siguiente esquema para es-
cribir el ttulo:

Distribucin de <elementos> segn <variable>


Puede ver ms en la Gua para la presentacin de grficos estadsticos en
https://www.inei.gob.pe/media/MenuRecursivo/metodologias/libro.pdf

Ejercicio 8
Per: Distribucin de vctimas de feminicidio, segn departamento de ocurrencia. 2014

Departamento fi pi
Lima 29 31.87%
Arequipa 10 10.99%
Puno 7 7.69%
Cusco 6 6.59%
Junn 6 6.59%
La Libertad 5 5.49%
Ayacucho 4 4.40%
Hunuco 4 4.40%
Lambayeque 4 4.40%
Callao 3 3.30%
Otros 13 14.30%
Fuente: Ministerio Pblico Per - Observatorio de Criminalidad.2014

Qu es un feminicidio?

Interprete p1

Se podra afirmar que los hombres son ms violentos en Lima que en Arequipa?

Notas importantes
22 Estadstica Descriptiva 201702

Distribucin de frecuencias de variables cualitativas


Ttulo: ..
Categoras Frecuencia absoluta fi Frecuencia relativa hi
f1
Categora 1 f1 h1
n
f
Categora 2 f2 h2 2
n

fk
Categora k fk hk
n
Fuente:

Ejercicio 9
En los Censos Nacionales 2007 ejecutados por el INEI se pregunt a todos los peruanos
el idioma o lengua con el que aprendi hablar, obtenindose los siguientes resultados.

Per. Distribucin de peruanos segn idioma o lengua con el que aprendi hablar. 2007
Idioma o lengua con que aprendi a hablar Frecuencia absoluta fi Frecuencia relativa hi
Castellano 21 713 165
Quechua 3 360 331
Aymar 443 248
Otra lengua nativa 174 410 0,0068
Ashninka 67 724 0,0026
Es sordomudo 30 019 0,0012
Idioma extranjero 21 434 0,0008
Total 25 810 331 1,0000
Fuente .

Indique e interprete el valor de f3

Indique e interprete el valor de h1%.

Indique el nmero de peruanos que aprendieron a hablar en aymar.

Indique el porcentaje de peruanos que aprendieron a hablar en un idioma diferente al


castellano.

Notas importantes
Unidad 1. Organizacin de Datos 23

Grficos estadsticos
Un grfico puede valer ms que mil palabras,
pero puede tomar muchas palabras para hacerlo
John Wilder Tukey (1915-2000)
Gran estadstico del siglo XX, con gran influencia en la visualizacin de informacin

William Playfair (1759-1823), economista e ingeniero escocs es considerado el pionero


de la estadstica grfica. Fue el creador del grfico circular, de sectores y de barras. Los
principios de su trabajo fueron los siguientes:

El mtodo grfico El mtodo grfico


Las personas
es una forma de Un grfico es ms ayuda al cerebro,
ocupadas
simplificar lo accesible que una ya que permite
necesitan ayuda
tedioso y lo tabla entender y
visual
complejo memorizar mejor.

Recomendaciones sobre la presentacin de grficos


Descripcin del diagrama

En los ejes, siempre se debe indicar


El ttulo del grfico siempre debe ser
explcitamente las variables que se est
indicado. representando y las respectivas unidades.

Las fuentes de donde se obtuvieron los datos que permitieron su construccin, as


como quines o qu entidad elabor el diagrama y cualquier otra informacin se
debe indicar siempre que sea relevante.

Notas importantes
24 Estadstica Descriptiva 201702
Eleccin de la base de comparacin

Si se va a representar Si se va a comparar el comportamiento de una


grficamente los datos de solo variable en dos o ms poblaciones distintas, pero
una muestra, el mismo diagrama solo se tiene muestras representativas de las
sirve para representar las poblaciones, entonces es conveniente usar la
frecuencias absolutas y relativas. frecuencia relativa.

Si bien es totalmente factible comparar


Si se va a comparar el comportamiento de
grficamente dos o ms series de datos
una variable en dos o ms poblaciones y se
que han sido agrupados en intervalos
tiene los datos de las poblaciones, entonces
distintos en amplitud y lmites, es
se puede realizar la comparacin por
preferible para facilitar la comparacin
separado de las frecuencias absolutas y de
que todas las series de datos utilicen los
las relativas.
mismos intervalos.

Uso adecuado de la escala de los ejes

La escala utilizada en los


ejes debe mantenerse. El
cambio de proporciones Si se ha utilizado una escala
Debe hacer que los valores
distorsiona el propsito de especial en alguno de los
de la variable abarquen
usar grficos, el cual ejes del diagrama, por
adecuadamente la longitud
consiste en ver ejemplo, escala logartmica,
de cada eje.
rpidamente la proporcin esta se debe indicar.
con que se est
distribuyendo la variable.

Eliminacin de ruido

Los excesivos adornos y la inclusin de El uso de algunas figuras en lugar de


figuras, muchas veces, en lugar de barras o columnas puede distorsionar
aclarar ms los diagramas, terminan visualmente la real proporcin de las
confundiendo o dificultando su rpida magnitudes que se estn
comprensin. representando.

Uso del punto inicial del eje vertical

El punto de inicio del eje vertical debe


El cambio de punto de inicio distinto de
empezar con un cero para no
cero debe estar completamente
distorsionar la impresin visual respecto
justificado.
de la magnitud.

Notas importantes
Unidad 1. Organizacin de Datos 25

Grfico de barras
Es una forma de representar datos cualitativos resumidos en una distribucin de fre-
cuencias.

En uno de los ejes, se representan las categoras o clases de la variable; para el otro eje,
se puede usar una escala de frecuencias absolutas, relativas o porcentuales. Se traza una
barra sobre cada indicador de clase de una altura proporcional a la frecuencia corres-
pondiente.

Las barras deben estar separadas para enfatizar el hecho de que cada clase es diferente
de otra.

Diagrama circular
Cuando se utiliza el grfico circular, tambin llamado pastel, cada sector circular repre-
senta la frecuencia observada de una clase o categora.

El sector circular que representa a una determinada clase de la variable tiene un ngulo
en el centro proporcional a la frecuencia relativa de dicha clase. El ngulo que le corres-
ponde a cada clase se obtiene multiplicando 360 por la respectiva frecuencia relativa.

Notas importantes
26 Estadstica Descriptiva 201702
Ejercicio 10
Segn la Oficina Nacional de Procesos Electorales (ONPE) los resultados de la segunda
eleccin en las elecciones presidenciales en el Per fueron los siguientes:

Organizacin poltica Total % votos vlidos

8,596,937 50,12
Peruanos por el Kambio

8,555,880 49,88
Fuerza Popular

Realice un grfico circular de frecuencias porcentuales.

Caso Aerolnea Wayra


Objetivo: Determinar la composicin porcentual de los usuarios segn motivo de viaje
Felipe realiz una encuesta a una muestra de 300 pasajeros de la aerolnea, en base a la
siguiente informacin complete la siguiente grfica.

Complete los siguientes enunciados.


- El motivo de viaje ms frecuente es . por tener el ..

- Son el total de pasajeros cuyo motivo de viaje fue trabajo o visita familiar.

Notas importantes
Unidad 1. Organizacin de Datos 27

Frecuencias acumuladas, absolutas relativas y porcentuales

Frecuencia
de una clase es la cantidad de elementos que pertenecen
acumulada
hasta esa clase
absoluta (Fi)
Frecuencia
de una clase es la proporcin de elementos que pertenecen
acumulada relativa
hasta esa clase
(Hi)
Frecuencia
de una clase es la frecuencia acumulada relativa
acumulada
multiplicada por 100%
porcentual (Pi)

Se tiene que:
frecuencia absoluta acumulada Fi
frecuencia relativa acumulada Hi
nmero de datos n

frecuencia absoluta acumulada F


frecuencia porcentual acumulada Pi 100% i 100%
nmero de datos n

Diagrama de Pareto
El diagrama de Pareto permite ver que, en muchos casos, pocos factores pueden produ-
cir la mayora de las consecuencias, lo que se podra resumir como pocos factores son
vitales y muchos son triviales. Por ejemplo, en control de calidad, se puede mostrar que
la mayora de los defectos surgen de un nmero pequeo de causas. Los pasos para rea-
lizar un grfico de Pareto son los siguientes:

Construya la
distribucin de La categora Otros
frecuencias. Ordene es colocada en la Dibuje dos ejes
las categoras en ltima posicin. No verticales y uno
forma descendente importa cun grande horizontal.
respecto a la sea.
frecuencia.

En el eje vertical
derecho, marque una En el eje horizontal:
escala de 0% a 100%. marque los espacios Elabore el diagrama de
En el eje vertical donde estarn barras y dibuje la lnea
izquierdo, marque una dibujadas las barras de frecuencias
escala de 0 hasta el para cada una de las acumuladas
nmero de observa- categoras, incluida la (Curva de Pareto)
ciones o de 0% a categora Otros.
100%.

Notas importantes
28 Estadstica Descriptiva 201702
Ejemplo 6
El gerente de produccin de una empresa, que produce asientos de fibra de vidrio, quie-
re identificar los problemas ms frecuentes reportados en la fabricacin de este produc-
to, y planear soluciones de acuerdo con la recurrencia del problema. Al extraer una
muestra aleatoria de productos fallados, obtuvo los siguientes resultados:
Distribucin de productos segn problemas reportados de asientos de fibra de vidrio
Tipo de problema reportado Nmero de ocurrencias (fi)
Color inadecuado 28
Forma no simtrica 16
Medidas fuera de norma 50
Superficie rugosa 71
Bordes afilados 9
Desprendimiento de capa protectora 12
Otros 14
Fuente: Gerencia de Produccin

Elabore el diagrama de Pareto.

Solucin
Lo primero es ordenar los datos en orden descendente a la frecuencia fi. La categora
Otros va al final. Luego, se calcula las frecuencias relativas y las relativas acumuladas.
Distribucin de productos segn problemas reportados de asientos de fibra de vidrio
Tipo de problema reportado fi hi Fi Hi
Superficie rugosa 71 0,355 71 0,355
Medidas fuera de norma 50 0,250 121 0,605
Color inadecuado 28 0,140 149 0,745
Forma no simtrica 16 0,080 165 0,825
Desprendimiento de capa protectora 12 0,060 177 0,885
Bordes afilados 9 0,045 186 0,930
Otros 14 0,070 200 1,000
Fuente: Gerencia de Produccin

Se puede realizar el grfico usando las frecuencias relativas hi y las frecuencias relativas
acumuladas Hi.

Distribucin de productos segn problemas reportados de asientos de fibra de vidrio

Notas importantes
Unidad 1. Organizacin de Datos 29
Caso Aerolnea Wayra
Objetivo: Identificar las principales quejas de los pasajeros sobre el servicio que brinda
la aerolnea.

Teniendo en cuenta la siguiente informacin, elabore el diagrama de Pareto:

Distribucin de pasajeros segn principal queja del servicio de la aerolnea Wayra


Principal queja Nmero de pasajeros
Impuntualidad de los vuelos 25
La comida no es buena 59
Pocos vuelos 16
Tarifas muy caras 9
Otros 17
Mucho tiempo en cola en el counter 92
Fuente: Wayra S.A

Construya la tabla completa para realizar un diagrama de Pareto.

Distribucin de pasajeros segn principal queja del servicio de la aerolnea Wayra


Principal queja fi hi Fi Hi

Fuente: Wayra S.A

Construya el grfico completo y realice una conclusin al respecto.

Notas importantes
30 Estadstica Descriptiva 201702

Tabulaciones cruzadas
Tambin llamadas tablas de contingencia o de doble entrada. Se usan para resumir de
manera simultnea los datos para dos variables.

Ejercicio 11
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadstica e In-
formtica se pregunt a las peruanas de 12 a ms aos por la cantidad de hijos que han
tenido vivos, obtenindose los siguientes resultados.

Per. Distribucin de madres segn edad de la madre y nmero de hijos nacidos vivos
Nmero total de hijos/a que ha tenido nacidos vivos
Edad de la madre Cero hijos Un hijo Dos hijos Tres hijos Cuatro hijos Total
12 aos 298,985 1,028 300,013
13 aos 284,650 1,162 285,812
14 aos 285,732 1,638 734 288,104
15 aos 283,045 4,909 994 288,948
16 aos 247,888 12,358 922 576 261,744
17 aos 231,839 24,243 2,280 636 258,998
18 aos 216,999 38,938 5,089 586 481 262,093
19 aos 193,952 52,797 9,273 1,118 496 257,636
Total 2,043,090 137,073 19,292 2,916 977 2,203,348
Fuente: INEI - Censos Nacionales 2007: XI de Poblacin y VI de Vivienda

Rellene los espacios en blanco.

El nmero de peruanas entre 12 y 17 aos que tienen hijos es .

El porcentaje de peruanas de 17 a 19 que tienen hijos es ...%

Ttulo de un grfico de una tabla de contingencia


Siguiendo indicaciones del INEI, en este curso, usaremos el siguiente esquema.

Si el grfico presenta las frecuencias absolutas o las frecuencias porcentuales con res-
pecto al total, el ttulo ser:

Distribucin de <elementos> segn <variable 1> y <variable 2>

Si el grfico presenta las frecuencias porcentuales con respecto a la variable 2, el ttulo


ser:

Distribucin de <elementos> segn <variable 1> por <variable 2>

Notas importantes
Unidad 1. Organizacin de Datos 31

Grfico de tabulaciones cruzadas de dos variables

En cada columna, las


Todas frecuencias Todas frecuencias
frecuencias suman
suman n o 100% suman n o 100% 100%
Grfico de barras Grfico de barras Grfico de barras
agrupadas apiladas apiladas al 100%

Un grfico de barras agrupadas muestra todas las series en una sola barra por cada
categora. El alto de cada barra es proporcional a la frecuencia de cada categora.
Un grfico de barras apiladas muestra todas las series apiladas en una sola barra para
cada categora. El alto de cada barra es proporcional a la frecuencia de cada catego-
ra.

Un grfico de barras apiladas 100% muestra todas las series apiladas en una sola ba-
rra para cada categora. El alto de cada barra es el mismo para cada categora.

Ejercicio 12
Ponga ttulo a los siguientes grficos.

Ttulo: .

Notas importantes
32 Estadstica Descriptiva 201702

Ttulo: ...

Ttulo: ..

100%

90%

80%
No sabe/no contesta
Porcentaje de votantes

70%
Ninguno, blanco viciado
60%
Otros
50%
Alejandro Toledo
40%
Alan Garca
30% Csar Acua
20% Pedro Pablo Kuczynski

10% Keiko Fujimori

0%
Lima Norte Centro Sur Oriente
Fuente: Per 21 Encuesta nacional Regin
urbano rural de Datum. 7 dic 2015

Notas importantes
Unidad 1. Organizacin de Datos 33
Caso Aerolnea Wayra
Objetivo:
Identificar el porcentaje de pasajeros que siendo de nacionalidad peruana viajan al ex-
tranjero y porcentaje de pasajeros que siendo de nacionalidad extranjera viajan al inte-
rior de nuestro pas.

A continuacin, se muestra la informacin de una tabla de contingencia y un grfico in-


completo para las variables lugar de destino y nacionalidad.

Distribucin de pasajeros segn su lugar de destino y nacionalidad

Nacionalidad
Lugar de destino Total
Peruana Extranjero
Arequipa 8 8 16
Cuzco 15 20 35
Miami 20 10 30
Mxico D.F 22 10 32
Piura 2 7 9
Ro de Janeiro 23 5 28
Total 90 60 150
Fuente: Wayra S.A

Complete todos los elementos del siguiente grfico.

Distribucin de pasajeros segn su lugar de destino y nacionalidad

18%
16%
14%
12%
10%
8% Peruano

6% Extranjero

4%
2%
0%
Arequipa Cuzco Miami Mxico D.F Piura Ro de
Janeiro

Notas importantes
34 Estadstica Descriptiva 201702
Realice el grfico que tenga el siguiente ttulo.

Distribucin de pasajeros segn lugar de destino por nacionalidad

Usando la informacin pertinente, de respuesta al objetivo propuesto.

Notas importantes
Unidad 1. Organizacin de Datos 35

Resumen de datos cuantitativos


Distribucin de frecuencias de variables discretas
Es un resumen de un conjunto de datos que consiste en presentar para cada valor de la
variable el nmero de elementos (frecuencia) que la componen. Es un cuadro que se
calcula de la siguiente manera.

Ttulo: .
Valores de la variable Frecuencia Frecuencia Frecuencia absolu- Frecuencia relati-
discreta absoluta fi relativa hi ta acumulada Fi va acumulada Hi
f1
x1 f1 h1 F1 f1 H1 h1
n
f
x2 f2 h2 2 F2 f2 F1 H2 h2 H1
n

fk
xk fk hk Fk fk Fk 1 Hk hk Hk 1
n
Fuente: ....

Grfico de bastones
En este caso, la variable se ubica en el eje de las abscisas y las frecuencias, absolutas, re-
lativas o porcentuales, en el eje ordenado.

Distribucin de alumnos de pregrado segn nmero de veces


que postul a la universidad donde estudia
700,000
576,215
600,000
Nmero de alumnos

500,000

400,000

300,000

200,000 119,642
58,315
100,000 18,748 9,908 81 32 22 7
0
0 1 2 3 4 5 6 7 8 9
Nmero de veces que postul
Fuente: PER, II Censo Nacional Universitario 2010. INEI

Notas importantes
36 Estadstica Descriptiva 201702
Caso Aerolnea Wayra
Objetivo: Determinar el nmero de viajes ms frecuente realizados por los pasajeros.

Complete los valores de la tabla.

Ttulo:
Nmero de viajes Nmero de pasajeros pi Pi
1 15
2 12%
3 38%
4 30
5
150
Fuente: .

Realice el grfico de bastones.

Nmero de viajes

Responda al objetivo.

Para Fiestas Patrias, la empresa est dispuesta a realizar una promocin en los pasajes
de su aerolnea siempre y cuando el porcentaje de pasajeros que hayan realizado como
mnimo cuatro viajes supere el 70%. La empresa debe realizar una promocin en los
pasajes para Fiestas Patrias para este grupo de pasajeros?

Notas importantes
Unidad 1. Organizacin de Datos 37

Distribucin de frecuencias de variables continuas


Es un resumen de un conjunto de datos que consiste en presentar para cada categora el
nmero de elementos (frecuencia) que la componen.

Los tres pasos necesarios para definir en una distribucin de frecuencias con datos cuan-
titativos son los siguientes:

Determine la cantidad Determine el ancho Determine los lmites


de clases de cada clase de cada clase

Cantidad de clases
Se recomienda usar entre 5 y 20 clases, inclusive.

La idea es emplear suficientes clases para mostrar la variacin de los datos, pero no tan-
tas que varias contendran unos cuantos elementos.

Para determinar el nmero de clases se usa la regla de Sturges. k=1+3,322 log n. Si la es-
timacin tiene decimales, se toma el entero ms prximo.

Amplitud de cada clase


Se usa el mismo ancho para todas las clases.

Se calcula de la siguiente manera:

rango
Amplitud
k
La amplitud se redondea al nmero inmediato superior de acuerdo con la cantidad de
decimales que tienen los datos o segn la precisin con que se desea trabajar.

Lmites de cada clase


Los lmites de clase se escogen de tal manera que cada valor de dato pertenezca a una
clase y slo a una.

El lmite inferior de clase es el valor mnimo posible de los datos que se asigna a la clase.
El lmite superior de clase es el valor mximo posible de los datos que se asigna a la cla-
se.

La marca de clase es el punto medio de los lmites de cada intervalo.

Notas importantes
38 Estadstica Descriptiva 201702
Ejemplo 7
El jefe de la Oficina de Rentas de una Municipalidad ha realizado un estudio sobre los
impuestos que pagan los vecinos del distrito. La tabla muestra los pagos de impuestos,
en nuevos soles, en el 2014 de 48 viviendas elegidas al azar.

145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1

Elabore la tabla de frecuencias para la variable: pago por impuestos municipales ao


2014.

Solucin
El rango r se calcula con:

r = valor mximo valor mnimo = 351,1 145, 1 = 206

Siguiendo la regla de Sturges, el nmero de intervalos es:

k 1 3,322log10 n 1 3,322log10 (48) 6,585 7

El ancho del intervalo es:

r 206
w 29,429 29,5 (Redondeo por exceso a un decimal)
k 7

Distribucin de frecuencias del pago de impuestos municipales del ao 2014


Pago de impuestos Marca de clase fi hi Fi Hi
[145,1 ; 174,6] 159,85 3 0,0625 3 0,0625
]174,6 ; 204,1] 189,35 3 0,0625 6 0,1250
]204,1 ; 233,6] 218,85 10 0,2084 16 0,3334
]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834
]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292
]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750
]322,1 ; 351,6] 336,85 6 0,1250 48 1,0000
Total 48 1,0000

Notas importantes
Unidad 1. Organizacin de Datos 39

Caso Aerolnea Wayra


Objetivo: Determinar el nmero de pasajeros que exceden el peso de equipaje de
mano.

Se seleccion una muestra al azar de pasajeros de la aerolnea Wayra que viajaron a di-
ferentes destinos tursticos.

Peso del equipaje de mano por pasajeros, en kilogramos

4,0 4,7 4,8 5,0 5,3 6,2 6,9 7,0 7,1 7,2
7,4 7,6 7,7 7,9 8,0 8,1 8,3 8,4 8,4 8,5
8,6 8,8 8,9 9,0 9,0 9,1 9,4 9,4 9,4 9,5
9,7 9,7 9,7 9,8 9,8 9,9 9,9 9,9 9,9 10,0
10,2 10,6 10,7 11,0 11,5 12,0 12,0 12,3 12,4 13,0

Construya la tabla de frecuencia utilizando el mtodo de Sturges.

El valor mximo es ...

El valor mnimo es ...

Luego, el rango es ...

Siguiendo la regla de Sturges, la cantidad de intervalos es igual a k = 1 + 3,322 log(.)

esto es igual a ...

Como, la cantidad de intervalos es un nmero entero, entonces k = .

La amplitud es igual al rango entre la cantidad de intervalos, esto es, w = ..

El valor de la amplitud se redondea por exceso a decimal(es), pues los

datos tienen decimal(es), entonces la amplitud (w) es

Ttulo: .....

Marca de Frecuencia Frecuencia Frecuencia absoluta Frecuencia relati-


Intervalo
clase absoluta fi relativa hi acumulada Fi va acumulada Hi






Fuente: ..
Notas importantes
40 Estadstica Descriptiva 201702
Indique e interprete el valor de las siguientes frecuencias para la distribucin de fre-
cuencias anterior.

f2

F4

H3

Si el peso mximo permitido en equipaje de mano por persona es de 10 kg y el pago por


cada kilo o fraccin adicional es de tres dlares. Cul fue el monto total de dinero que
recibi la compaa Wayra por exceso de peso de equipaje de mano?

Distribuciones de frecuencias de dos o ms grupos de datos con intervalos co-


munes
La idea bsica para distribuciones de frecuencias de dos o ms grupos de datos es tener
intervalos comunes, es decir, que los lmites de los intervalos para ambas distribuciones
sean iguales. Para ello, debemos seguir los siguientes pasos:

Hallar el mnimo de todos los datos y el mximo de todos los grupos de datos, y usarlos
para calcular el rango.

Calcular el nmero de categoras, el nmero de datos es el mximo nmero de datos de


cada grupo. Tener en cuenta que no es la suma de ambos tamaos muestrales.

Siguiendo la regla de Sturges, el nmero de intervalos es

k 1 3,322log10 n

Notas importantes
Unidad 1. Organizacin de Datos 41
Ejemplo 8
La empresa de investigacin de mercado Elctrico lleva a cabo un estudio para obte-
ner indicadores que le permitan inferir respecto al consumo de energa elctrica men-
sual (medido en kilovatios, redondeado al entero ms prximo) de las familias en los
departamentos de Arequipa y Tacna. Dicho estudio, sustentado en el anlisis de mues-
tras aleatorias tomadas en ambos departamentos, arroj los siguientes resultados:

Arequipa
227 231 261 270 291 351 359 369 371 382 387 392 393 395 396 413 420 422 424 436
453 461 463 471 495 498 510 512 533 534 541 542 584 589 591 628 630 630 657 666

Tacna
217 219 263 287 294 340 346 347 348 377 390 392 395 396 397 408 418 424 426 429
438 438 442 446 447 450 456 481 496 508 511 533 549 583 609 636

Usando la regla de Sturges, calcule intervalos comunes y marcas de clase de una tabla de
distribucin de frecuencias que permita comparar los datos.

Solucin
Hallar el mnimo de todos los datos (217) y el mximo de todos los datos (666) de ambas
ciudades, y usarlos para calcular el rango.

Calcular el nmero de categoras, el nmero de datos es el mximo nmero de datos


(40) entre ambas ciudades. Tener en cuenta que no es la suma de ambos tamaos
muestrales.

Siguiendo la regla de Sturges, el nmero de intervalos es:

k 1 3,322log10 n 1 3,322log10 (40) 6,322 6 (Redondeo simple)

Tabla 1. Distribucin de clientes segn consumo elctrico


Consumo de energa Marca de clase
217 ; 292 254,5
292 ; 367 329,5

367 ; 442 404,5


442 ; 517 479,5
517 ; 592 554,5

592 ; 667 629,5


Fuente: Empresa A

Notas importantes
42 Estadstica Descriptiva 201702
Caso Aerolnea Wayra
Objetivo: Comparar el exceso de peso del equipaje de los pasajeros segn su gnero.

El jefe de recursos humanos de la aerolnea Wayra est interesado en analizar el impac-


to en los empleados al suprimir las horas extras de trabajo pagadas que anteriormente
se aplicaba. Con este fin se extraen dos muestras aleatorias. La primera de 80 emplea-
dos tomando de los datos histricos de un da al azar con el sistema anterior y la segun-
da de 60 empleados tomando los datos de un da al azar con el sistema vigente. Se
muestran las horas de trabajo por da por empleado.

Datos sobre horas diarias trabajadas con y sin horas extras pagadas
Horas diarias trabajadas con horas extras pagadas Horas trabajadas sin horas extras pagadas
7,4 8,9 9,8 10,8 11,2 11,8 12,3 13,2 7,0 8,2 8,5 8,9 9,7 10,8
7,9 8,9 10,1 10,8 11,3 11,9 12,4 13,4 7,0 8,2 8,5 8,9 9,8 11,0
8,0 9,0 10,2 10,9 11,4 12,0 12,4 13,5 7,0 8,2 8,5 8,9 9,9 11,2
8,0 9,1 10,2 11,0 11,4 12,0 12,4 13,6 7,0 8,3 8,6 9,0 9,9 11,6
8,1 9,1 10,3 11,0 11,5 12,1 12,5 13,7 7,0 8,3 8,6 9,1 10,0 11,7
8,1 9,3 10,4 11,0 11,5 12,1 12,5 13,9 7,1 8,3 8,7 9,1 10,0 12,2
8,2 9,4 10,6 11,1 11,5 12,1 12,6 14,6 8,1 8,4 8,7 9,3 10,3 12,5
8,5 9,5 10,6 11,1 11,6 12,2 12,7 14,8 8,2 8,4 8,7 9,4 10,5 12,9
8,6 9,7 10,7 11,1 11,7 12,2 12,9 15,0 8,2 8,4 8,8 9,6 10,5 13,3
8,8 9,7 10,8 11,2 11,7 12,3 13,1 15,3 8,2 8,4 8,8 9,7 10,6 14,0
Fuente: Aerolnea Wayra

Determine los intervalos comunes de las distribuciones de frecuencias que permitan


comparar los datos de ambas muestras.

Notas importantes
Unidad 1. Organizacin de Datos 43

Grficos de datos cuantitativos

Usa los intervalos de clase Usa las marcas de clase Usa los intervalos de clase
Polgono de
Histograma frecuencias
Ojiva

Histograma
Un histograma es una representacin grfica de una variable en forma de barras, donde
la altura de cada barra es proporcional a la frecuencia de los valores representados.

Se coloca la variable sobre el eje horizontal y las frecuencias sobre el eje vertical.

Cada frecuencia de clase se representa trazando un rectngulo, cuya base es el intervalo


de clase sobre el eje horizontal y cuya altura es proporcional a la frecuencia correspon-
diente (absoluta, relativa o porcentual). Los rectngulos adyacentes se tocan entre s.

Polgono de frecuencias
Un polgono de frecuencias es un grfico de lneas que une los puntos asociados a las
marcas de clase de una variable. La altura del punto asociado a cada marca de clase es
proporcional a la frecuencia de dicho valor.

Se realiza uniendo con segmentos de recta los puntos de interseccin de las marcas de
clase con las frecuencias (absolutas, relativas o porcentuales).

Los polgonos de frecuencias se cierran creando dos intervalos ficticios, uno antes del
primer intervalo y uno despus del ltimo.

Si los intervalos creados toman valores que pueden no ser reales, igual se crea el inter-
valo, como, ejemplo, tiempos negativos.

Ojiva
La ojiva es la grfica de una distribucin acumulada de frecuencias.

Se obtiene uniendo con segmentos de recta los puntos de interseccin del lmite supe-
rior de cada intervalo y la frecuencia acumulada respectiva.

La ojiva usa los lmites de los intervalos y no las marcas de clase.

Con la ojiva se puede estimar fcilmente el nmero o porcentaje de observaciones que


corresponden a un intervalo determinado.

Notas importantes
44 Estadstica Descriptiva 201702
Caso Aerolnea Wayra
Objetivo: Comparar el exceso de peso del equipaje de los pasajeros segn su gnero.

Se realiz un estudio en el cual, se elabor bajo una muestra elegida al azar de 40 pasa-
jeras y 110 pasajeros, obtenindose la siguiente grfica. Adems, se considera exceso de
peso cuando el pasajero lleva consigo maletas que sobrepasan los 32 kilogramos.

Distribucin porcentual de los pasajeros


segn el peso de sus maletas por gnero
100%
100% 93%
90% 83%
80%
Porcentaje de pasajeros

65% 83%
70% 74%
60% Femenino
50% 61%
40% 31% Masculino
30% 20%
31%
20%
10% 0% 13%
0%
20 24 28 32 36 40 44
Fuente: Aerolnea Wayra Peso, en kilogramos

Complete las siguientes afirmaciones, tenga en cuenta que se considera exceso de peso
cuando las maletas sobrepasan los 32 kilogramos.

a. El nmero de pasajeros hombres ........... que llevan consigo maletas que pesan ms
de 24 kilogramos pero a lo ms 32 kilogramos.

b. El ............ % de las pasajeras mujeres lleva consigo maletas que pesan hasta 40 kilo-
gramos.

c. El .......% de los pasajeros hombres lleva consigo maletas con exceso de peso.

d. El gnero que presenta un mayor porcentaje de pasajeros con exceso de peso del
equipaje es ................. y representa en .............. % superior con respecto al otro g-
nero.

Notas importantes
Unidad 1. Organizacin de Datos 45
Caso Aerolnea Wayra
Objetivo: Determinar el porcentaje de pasajeros que exceden el peso de equipaje de
mano.

Grafique el histograma, el polgono de frecuencias y la ojiva de frecuencias porcentuales


con los datos de la muestra del ejercicio anterior.

Use uno de los grficos para calcular, aproximadamente, porcentaje necesario para re-
solver el objetivo.

Notas importantes
46 Estadstica Descriptiva 201702

Ejercicios adicionales de la Unidad 1


1. El objetivo de una investigacin es estimar la media, en aos, de la edad de los egresados
de la UPC. Indique el elemento, una variable a medir y una posible observacin.

2. Segn el estudio Rumores de oficina, el 42% de los ejecutivos limeos considera que
los rumores influyen mucho en el clima laboral de la oficina. Indique el elemento, una va-
riable a medir y una posible observacin.

3. En una investigacin, se quiere estimar el promedio del nmero de asistentes a los con-
ciertos de artistas internacionales realizados en Lima durante el ao 2014. Indique el
elemento, una variable a medir y una posible observacin.

4. El objetivo de una investigacin en la ciudad de Lima es determinar la ocupabilidad en


hoteles de 4 y 5 estrellas en Cusco durante el da de ao nuevo del 2013, es decir, el por-
centaje de habitaciones ocupadas durante ese da. Indique la poblacin y la muestra.

5. El objetivo de una investigacin en el Per es determinar el promedio de la edad de las


mujeres en edad frtil que usan mtodos anticonceptivos. Defina la poblacin, muestra,
elemento y variable. El INEI considera a la edad frtil en las mujeres desde los 15 hasta
los 49 aos.

6. Segn los Censos Nacionales XI de Poblacin y VI de Vivienda 2007 ejecutados por el INEI,
el 50,30% de los peruanos son mujeres. Indique si este dato es un parmetro o un esta-
dstico.

7. La nueva lista roja de aves de 2014, confeccionada con datos de BirdLife, muestra que de
las 10 425 especies de aves identificadas en el mundo, el 13% estn amenazadas de ex-
tincin. Estas listas, dice Juan Carlos Atienza, de SEO BirdLife, contribuyen establecer
prioridades a la hora de favorecer polticas de conservacin y declarar nuevos espacios
protegidos. Indique si este valor corresponde a un parmetro o a un estadstico.

8. El grfico muestra la evolucin de la inflacin desde el ao 1980 al 2013. Indique si el n-


dice de precios al consumidor IPC que obtiene el INEI es un parmetro o un estadstico.

9. Segn el estudio Rumores de oficina realizado por la empresa Transearch publicado en


julio del 2014, el 42% de los ejecutivos limeos considera que los rumores influyen mu-
cho en el clima laboral de la oficina. Indique los siguientes conceptos con respecto a di-
cho estudio: poblacin, muestra, elemento, variable, estadstico, valor del estadstico.
Por qu los encargados del estudio calcularon estadsticos y no parmetros?

Notas importantes
Unidad 1. Organizacin de Datos 47
10. El objetivo de una investigacin es estimar el porcentaje de peruanos que aprueban la
gestin de Ollanta Humala como presidente de la Repblica, para lo cual se tom una
muestra aleatoria de personas de 18 a 70 aos y se les pregunt por su opinin. Los re-
sultados son los siguientes.

Desaprueba Aprueba Desaprueba Aprueba Desaprueba Desaprueba Desaprueba


No sabe Aprueba Aprueba Desaprueba Aprueba Aprueba Aprueba
Desaprueba Desaprueba Aprueba Aprueba Desaprueba No sabe Desaprueba
Aprueba Desaprueba Aprueba Aprueba Desaprueba Desaprueba Aprueba
Desaprueba Desaprueba Desaprueba Desaprueba Aprueba Desaprueba Desaprueba
Aprueba No sabe Desaprueba Desaprueba Aprueba Desaprueba No sabe
Aprueba Desaprueba Desaprueba Desaprueba Aprueba Aprueba Desaprueba
Desaprueba Desaprueba Desaprueba Aprueba Aprueba Desaprueba Desaprueba
Aprueba Desaprueba No sabe Aprueba Desaprueba Desaprueba Aprueba
Aprueba Aprueba Aprueba Desaprueba Desaprueba Desaprueba Desaprueba

Construya la distribucin de frecuencias de los datos. Interprete los valores f2 y h1.

11. Se tiene como objetivo mostrar la composicin porcentual de alumnos universitarios en


el Per por tipo de institucin educativa al final de la secubdaria, para lo cual se tom
como referencia los datos del II Censo Universitario 2010 realizado por el INEI, donde se
pregunt a los alumnos universitarios por el tipo de institucin educativa donde
terminaron su educacin secundaria. Los resultados se muestran en la siguiente tabla.

Tabla. .
Tipo de institucin fi hi ngulo
Estatal 256 060 0,5405
Particular 154 275 0,3256
Particular religioso 58 673 0,1238
No escolarizado 4 472 0,0094
Otro 309 0,0007
Total 473 789

Realice un diagrama circular con dichos datos.

12. Observe el siguiente grfico e indique un posible error.

Notas importantes
48 Estadstica Descriptiva 201702
13. En la publicacin Revista Cientfica-Estudiantil de Ciencias Mdicas de Cuba se public el
artculo Pancreatitis aguda. Retos y perspectivas el cual contena el siguiente grfico.
Observe el grfico e indique un posible error.

Distribucin de pacientes segn hbito txico

Fuente: Datos tomados de HC del departamento de archivo del HDCQ 10 de Octubre


Tomado de http://www.16deabril.sld.cu/rev/228/articulo3.html

14. Observe los dos grficos siguientes e indique la posible diferencia de interpretacin entre
ambos.

15. En la agencia de viajes A se realiz una encuesta a 330 clientes respecto a las principales
quejas que tienen clientes acerca de los tours del tipo todo incluido al exterior. Las cuales
se detallan en el siguiente cuadro:

Agencia A. Distribucin de clientes segn principales quejas de clientes


Queja Nmero de quejas
Cambio de fecha de los vuelos 120
El hotel no era de la categora que se vea en el folleto 94
Los hoteles no incluyen bebidas premium 61
La comida de los hoteles no es de calidad excelente 23
Otros 25
Que les venden otros servicios como tiempo compartido 7
Fuente: Direccin de Atencin al cliente. Agencia A

Realice el diagrama de Pareto correspondiente a estos datos.

Notas importantes
Unidad 1. Organizacin de Datos 49
16. Uno de los objetivos de una investigacin en la empresa A es mostrar la composicin
porcentual del nmero de cursos de capacitacin dadas a sus trabajadores. Los siguien-
tes datos muestran el nmero de capacitaciones que 48 trabajadores han recibido en el
presente ao.

3 3 1 2 1 1 2 2 1 6 3 1 3 1 3 2
1 1 1 1 3 2 2 4 1 2 2 2 1 3 1 2
3 2 2 3 2 2 1 2 2 2 2 1 1 1 6 2

Complete el cuadro y construya el grfico de bastones de frecuencias porcentuales para


la variable nmero de capacitaciones.

17. El objetivo de una investigacin sobre la lcuma, de la empresa A en el presente mes, es


establecer la distribucin de su peso para la exportacin. La lcuma es originaria de las
regiones tropicales de Sudamrica. Es empleada, sobre todo, en la preparacin de dulces,
postres y helados. En el siguiente cuadro se muestra el peso, en gramos, de una muestra
de 60 frutos.

167 172 173 180 182 182 183 183 183 184 185 186
186 186 187 189 190 191 191 192 193 194 194 194
194 195 195 195 197 197 199 201 201 201 201 201
203 204 205 207 207 207 207 209 210 212 212 213
213 214 218 218 218 219 220 222 223 226 228 232
Realice la tabla de distribucin de frecuencias de los datos.

18. La siguiente tabla corresponde a la distribucin de frecuencias de los salarios, en nuevos


soles, del ltimo mes de los empleados de la empresa A. Complete la tabla.

Empresa. A. Distribucin de trabajadores segn salarios, en nuevos soles, del ltimo mes
Clase Marca Frecuencia Frecuencia Frecuencia abso- Frecuencia rela-
de clase absoluta fi relativa hi luta acumulada tiva acumulada
Fi Hi
1200 - 120
- 1 800 300 0,42

- 780
- 150
-
Fuente. Gerencia de Recursos Humanos. Agosto 2014. Empresa A

19. En economa, la prima de riesgo es el sobreprecio que paga un pas para financiarse en
los mercados en comparacin con otros pases. De esta forma, cuanto mayor es el riesgo
pas, ms alta ser su prima de riesgo. Significa la confianza de los inversores en la solidez
de una economa. La prima de riesgo de los pases de la Unin Europea se calcula respec-
to de Alemania porque se supone que su deuda pblica es la que tiene menor riesgo de
impago. Para el caso de Espaa, la agencia de calificacin de riesgos A ha medido la pri-
ma de riesgo durante 50 das desde junio del 2015.

Notas importantes
50 Estadstica Descriptiva 201702
Espaa. Distribucin de das segn prima de riesgo. Junio y julio del 2015
Prima de riesgo Marca de clase fi hi Fi Hi
[ 120 ; 130 ] 125 1 0,0200 1 0,0200
] 130 ; 140 ] 135 3 0,0600 4 0,0800
] 140 ; 150 ] 145 11 0,2200 15 0,3000
] 150 ; 160 ] 155 14 0,2800 29 0,5800
] 160 ; 170 ] 165 12 0,2400 41 0,8200
] 170 ; 180 ] 175 6 0,1200 47 0,9400
] 180 ; 190 ] 185 3 0,0600 50 1,0000
Fuente: Agencia de Calificacin de Riesgos A.

Grafique el histograma de frecuencias relativas, el polgono de frecuencias absolutas y la


ojiva de frecuencias relativas.

20. Indique el tipo y escala de medicin de las siguientes variables y su escala de medicin.

Variable

Nmero de personas que van a ver una pelcula

Gnero de una pelcula (drama, comedia, accin, etc.)

Duracin de una pelcula

Opinin sobre la pelcula (buena, regular, mala)

21. En el II Censo Nacional Universitario del ao 2010 realizado por el INEI se pregunt a los
alumnos de todo el Per por su tipo de universidad y su gnero. Los datos se muestran
en el siguiente cuadro.

Per. Distribucin de alumnos de pregrado por gnero y tipo de universidad. 2010


Gnero Pblica Privada Total
Mujer 135 082 247 743 382 825
Hombre 174 093 226 052 400 145
Total 309 175 473 795 782 970
Fuente: INEI. II Censo Universitario. 2010

Interprete el valor 135 082 de la tabla.

Elabore un grfico comparativo que permita ver la composicin porcentual por gnero y
tipo de universidad.

Elabore un grfico comparativo que permita ver la composicin porcentual por gnero
segn tipo de universidad.

Elabore un grfico comparativo que permita ver la composicin porcentual por tipo de
universidad segn gnero.
Notas importantes
Unidad 1. Organizacin de Datos 51
22. Encuentre todos los errores del siguiente grfico, realizado a partir de la Encuesta Nacio-
nal de Hogares realizada por el Instituto Nacional Estadstica e Informtica del Per entre
los aos 2005 y 2011.

Tomado de http://www.inei.gob.pe/perucifrasHTM/inf-soc/cuadro.asp?cod=3718&name=edu14&ext=gif

23. Indique si son verdaderas o falsas las siguientes afirmaciones.

Afirmacin

El valor de un parmetro se puede conocer solamente si se realiza un censo

En un estudio observacional se controlan las variables de inters

Solo las variables cuantitativas continuas pueden toman valores con decimales

Variable es el conjunto de mediciones obtenido de un elemento particular

Para graficar las ojivas se usan las marcas de clase

Con la ojiva se puede estimar el porcentaje de observaciones que corresponde a un intervalo


determinado

Para el polgono de frecuencias solamente se usa las frecuencias relativas

Los cuadros de doble entrada usan exclusivamente variables ordinales o nominales.

En un grfico circular, el ngulo que le corresponde a cada parte se obtiene multiplicando 360
por la respectiva frecuencia absoluta dividida entre la cantidad de datos.
La frecuencia porcentual de una clase es la proporcin de elementos que pertenecen a esa
clase.

En un grfico de barras apiladas al 100%, el alto de las barras es igual en cada categora.

Notas importantes
52 Estadstica Descriptiva 201702
24. Se ha tomado un examen a 100 personas y registrado el tiempo empleado en terminarlo.
Indique si son verdaderas o falsas las siguientes afirmaciones con respecto al grfico.

Distribucin porcentual de alumnos


segn el tiempo en resolver un examen
100

Frecuencia acumulada
100
80 80
60 72

40 30 40
20
0
0 20 40 60 80 100
Tiempo (en minutos)
Fuente: Calidad Educativa Universidad A

Afirmacin

El nmero de personas que tarda 20 minutos o menos es 30

El nmero de personas que tarda ms de 20 pero menos o igual a 70 minutos es 42

El porcentaje de personas que tarda ms de 60 minutos es 28%

El porcentaje de personas que tarda 25 minutos o menos es 40%

El porcentaje de personas que tarda 20 minutos es 30%

25. Por qu se usan los grficos de bastn para variables discretas en vez de un grfico de
barras?

26. Por qu se redondea por exceso la amplitud en las distribuciones de frecuencias de da-
tos continuos?

27. A nivel nacional, se observa que la curva de frecuencia acumulada del ingreso real para el
ao 2012 se ha desplazado ligeramente hacia la derecha, lo que indica un ..
(aumento o decremento) del ingreso en todos los segmentos de la distribucin.

Notas importantes
Unidad 2. Medidas descriptivas 53

Unidad 2 Medidas descriptivas

Logro de la unidad 2

Al finalizar la unidad 2,
el estudiante analiza el comportamiento de datos reales
aplicando las medidas de resumen de datos.

Temario
Medidas de tendencia central: media aritmtica, mediana, moda, media ponderada
Medidas de posicin: cuartiles, deciles, percentiles
Medidas de dispersin: varianza, desviacin estndar, coeficiente de variacin
Medidas de asimetra
Diagramas de cajas

Notas importantes
54 Estadstica Descriptiva 201702

Datos simples y datos agrupados

Datos simples Datos agrupados


Se denomina datos simples (datos no Se denomina datos agrupados a los
agrupados) a los valores que no estn valores que estn agrupados en
agrupados en distribuciones de distribuciones de frecuencia.
frecuencia.

Si se tienen datos simples no se construye la distribucin de frecuencias


para calcular la media, la mediana o cualquier estadstico,
se prefiere el clculo con los datos simples.

Ejemplo de datos simples

10,6 14,5 17,2 12,8 13,6 11,6 11,3 13,0 13,5 10,8 13,9 14,2 15,3 14,3 14,3 14,3
11,8 16,1 16,8 18,8 14,8 14,0 16,4 14,2 16,5 12,1 13,3 12,0 14,3 14,9 15,1 14,4

Ejemplo de datos agrupados por intervalos

Empresa A. Distribucin de obreros segn descuentos en su planilla en el presente mes


Marca de
Descuentos, en nuevos soles fi hi Fi Hi
clase
[204,1 ; 233,6] 218,85 16 0,2084 16 0,3334
]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834
]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292
]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750
]322,1;351,6] 336,85 6 0,1250 48 1,0000
Total 48 1,0000
Fuente: RRHH Empresa A

Ejercicio 13
Luego de una investigacin se tiene muchos datos, con ellos se puede realizar algunos
grficos y distribuciones de frecuencias, pero cmo resumir alguna caracterstica de la
informacin en un solo nmero?

Notas importantes
Unidad 2. Medidas descriptivas 55

Medidas de tendencia central


Una medida de localizacin o de tendencia central se refiere al valor central que repre-
senta a los datos de una determinada variable.

Media
La media aritmtica (media o promedio) de un conjunto de valores de una variable es la
suma de dichos valores dividida entre el nmero de valores.

Ejercicio 14
Interprete alguna de las medias descritas en el grfico.

Notas importantes
56 Estadstica Descriptiva 201702
Clculo de la media aritmtica
La frmula para la media poblacional es
N

x i
i 1

N
Las frmulas para la media muestral son:

Caso Aerolnea Wayra


A una muestra de tripulantes de la aerolnea Wayra se les pregunt el tiempo, en aos,
que venan trabajando en Wayra. Calcule e interprete la media muestral.

3,0 2,7 5,0 2,4 4,5 5,1 2,5 0,8 6,3 7,1 1,4 1,2

Si la media muestral es mayor a 3,5 aos, se implementar un programa de incentivo


para que los tripulantes postulen a ascensos. Indique lo que har la compaa

Notas importantes
Unidad 2. Medidas descriptivas 57
Caso Aerolnea Wayra
A una muestra de viajeros frecuentes se les pregunt por el nmero de veces que viaj
con Wayra en el ltimo mes. Calcule e interprete la media muestral.

Distribucin de .
Nmero de veces fi hi%

1 65
2 156
3 235
4 84
6 10
Fuente: Wayra

Caso Aerolnea Wayra


A una muestra de 500 pasajeros premium se les pregunt por la cantidad de dinero que
estaran dispuestos a pagar por un men gourmet durante un vuelo nacional. Los datos
se muestran a continuacin. Calcule e interprete la media muestral.

Distribucin de viajeros premium segn lo que pagaran por men gourmet en vuelo nacional
Dinero (en soles) Marca de clase fi hi Fi Hi

, 20 0,05

, 225

, 30 0,75

,
Fuente: Wayra

Calcule e interprete la media muestral.

Notas importantes
58 Estadstica Descriptiva 201702
Ejercicio 15
Calcule la media de los siguientes grupos de nmeros.

Grupo 1 1 2 3 4 5 6 7

Grupo 2 1 2 3 4 5 6 700

Qu nota al calcular la media de cada grupo?

Caractersticas de la media
- Se puede calcular para datos medidos en escala de intervalo o razn.

- El clculo de la media es sencillo y es una medida muy conocida.

- El valor de la media es sensible a los valores extremos, por lo que vara mucho con
valores muy grandes o muy pequeos con respecto a los dems.

- Si cada uno de los n valores xi es transformado en: yi = a xi + b, siendo a y b constan-


tes, entonces, la media de los n valores yi es:

y ax b

Caso Aerolnea Wayra


La empresa Wayra ha decidido hacer dos ofertas a su sindicato sobre el aumento de
sueldo anual a sus trabajadores:

- Aumento general del 4%.

- Aumento del 1,5% ms un bono de 190 soles.

Si el sueldo promedio es de 4500 soles, cul de las dos ofertas debe aceptar el sindicato
si lo que desea es hacer mximo el sueldo medio de los trabajadores

Notas importantes
Unidad 2. Medidas descriptivas 59

Mediana
La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a di-
cho conjunto.

Ejercicio 16
Interprete alguna de las siguientes medianas descritas en el grfico.

Notas importantes
60 Estadstica Descriptiva 201702

Clculo de la mediana

Caso Aerolnea Wayra


A una muestra de pasajeros se les registr el tiempo, en minutos, que demoraron en la
cola hasta ser atendidos en los counters del aeropuerto. Calcule e interprete la mediana
muestral. Los datos se muestran en la tabla siguiente.

12 17 15 17 18 17 5 12 19 14 17 14 10 21

Si la mediana es mayor a 16 minutos se aumentar la cantidad de personas en los coun-


ters de atencin del aeropuerto. Indique lo que har la compaa.

Notas importantes
Unidad 2. Medidas descriptivas 61
De una muestra de 50 vuelos, se ha registrado el nmero de personas que pierden su
vuelo por presentarse tarde al counter del aeropuerto. Los datos se muestran a conti-
nuacin.

Distribucin de vuelos segn nmero de personas que pierden el vuelo por llegar tarde
Nmero de pasajeros fi hi%

0 9
1 17
2 13
3 7
5
Fuente: Wayra

Calcule e interprete la mediana muestral.

Ejercicio 17
Calcule la mediana de los siguientes grupos de nmeros.

Grupo 1 9 11 12 13 14 15 16

Grupo 2 9 11 12 13 14 15 700

Qu concluye al calcular la mediana de cada grupo?

Caractersticas de la mediana
- Se puede calcular para variables medidas en escala de ordinal, intervalo o razn.

- La mediana no se ve afectada por valores extremos, por lo que se prefiere como


medida de tendencia central cuando hay datos extremos o la distribucin de fre-
cuencias no es simtrica.

Notas importantes
62 Estadstica Descriptiva 201702

Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta
con mayor frecuencia.
Ejercicio 18
Interprete alguna de las siguientes modas.

EL VIDEO DE YOUTUBE VISTO CON


MAYOR FRECUENCIA ES DESPACITO
CON MS DE 3190 MILLONES DE
VISTAS (14 DE AGOSTO DEL 2017)

Ejercicio 19
En un examen apareci la siguiente pregunta La moda del ingreso mensual de los traba-
jadores es 1 850 nuevos soles. Interprete. Un alumno respondi La mayora de traba-
jadores gana 1 850 nuevos soles. Indique si es correcta o incorrecta tal respuesta.

Notas importantes
Unidad 2. Medidas descriptivas 63
Clculo de la moda

Para datos en distribuciones de frecuencia por intervalo,


- si la moda est en el primer intervalo, entonces d1 es igual a la primera frecuencia
- si la moda est en el ltimo intervalo, entonces d2 es igual a la ltima frecuencia.
Ejercicio 20
Calcule la moda de los siguientes grupos de nmeros.

Grupo 1 1 2 3 3 4 4 5

Grupo 2 1 2 3 3 4 4 500

Qu concluye al calcular la moda?

Caractersticas de la moda
- La moda se puede calcular para cualquier escala de medicin.
- El valor de la moda no se ve afectada por valores extremos.
- La moda no siempre es un valor nico. Una serie de datos puede tener dos modas
(bimodal) o ms modas (multimodal). Algunas series de datos no tienen moda.

Notas importantes
64 Estadstica Descriptiva 201702

Media ponderada
Permite calcular el valor medio considerando la importancia o peso de cada valor sobre
el total.

Clculo de la media ponderada


La frmula es:
n

x w i i
xw i 1
n

w
i 1
i

donde:
xi: Observacin individual
wi: Peso asignado a cada observacin

Ejercicio 21
Las notas de un alumno de Estadstica Descriptiva son:

PC1 PC2 Promedio de Evaluacin de Examen Examen Trabajo


laboratorios desempeo parcial final final
12 12 13 15 13 9 15

Si las prcticas pesan ....de la nota final, los


laboratorios ., la evaluacin de desempeo
, el examen parcial ., el examen final y el
trabajo final. cul es el promedio final del alumno?

Notas importantes
Unidad 2. Medidas descriptivas 65
Caso Aerolnea Wayra
Objetivo: Comparar la media de los precios de pasajes por tipo de cliente a Bogot.

Distribucin de pasajeros segn precio de pasajes a Bogot, en dlares, por tipo de cliente
Precios de Marca de hi% hi% hi% hi%
pasajes clase Grupos Ocasional Premium Viajero frecuente
300 400 12,5% 13,0% 10,2% 13,7%
400 500 20,6% 39,8% 35,2% 40,0%
500 600 37,5% 42,5% 47,2% 33,3%
600 700
Fuente Aerolnea Wayra S.A.

Wayra lanzar una campaa de marketing a los dos tipos de clientes con los precios me-
dios de pasajes ms altos. Indique los tipos de clientes a los que lanzar la campaa.

Objetivo. Analizar un reclamo de clientes Premium sobre el precio excesivo de pasajes a


Bogot.

Los clientes tipo Premium han expresado su malestar por las altas tarifas en los precios
de los pasajes que pagan a Bogot. Por ello, la empresa desea conocer cul es el precio
mnimo de los pasajes ms costosos que paga la mitad de clientes Premium, con el fin de
revisar un porcentaje de descuento en su prximo viaje Cul es este precio mnimo?

Notas importantes
66 Estadstica Descriptiva 201702
Objetivo. Lanzar una campaa para los clientes de tipo grupos a Bogot.

La empresa desea lanzar una campaa de marketing directo a los clientes de tipo grupos
considerando el precio de pasaje ms frecuente que suelen pagara Bogot. Cul es ese
precio?

Objetivo: Establecer el costo medio de una campaa de fidelizacin de clientes.

Wayra lanzar una campaa de fidelizacin de clientes y rebajar 15% los precios de los
pasajes a Miami. Si la media del precio de estos pasajes es 740 dlares. Indique el nuevo
precio medio.

Wayra lanzar una campaa de fidelizacin de clientes y rebajar 10 dlares los precios
de los pasajes a Cusco. Si la media del precio de estos pasajes es 105 dlares. Indique el
nuevo precio medio.

Notas importantes
Unidad 2. Medidas descriptivas 67

Cuantiles
Los cuantiles son valores de la distribucin que la dividen en partes iguales, es decir, en
intervalos, que comprenden el mismo nmero de valores. Los ms usados son:

- cuartiles, que dividen a la distribucin en cuatro partes,


- deciles, que dividen a la distribucin en diez partes,
- percentiles, que dividen a la distribucin en cien partes.

Percentil
El percentil k-simo Pk es un valor tal que por lo menos k por ciento de las observaciones
son menores o iguales que este valor.

Ejercicio 22
Interprete alguno de los siguientes percentiles.

Notas importantes
68 Estadstica Descriptiva 201702

Deciles
Un decil se refiere a cada uno de los nueve valores que dividen un grupo de datos (clasi-
ficados con una relacin de orden) en diez partes iguales, de manera que cada parte re-
presenta un dcimo de la poblacin.

Clculo del percentil

Ejercicio 23
Calcule el percentil 75 de los siguientes grupos de nmeros.

Grupo 1 10 12 13 14 15 16 17

Grupo 2 10 12 13 14 15 16 17 700

Qu concluye al calcular dicho percentil?

Notas importantes
Unidad 2. Medidas descriptivas 69
Caractersticas de los percentiles
- Se puede calcular en variables medidas en escala ordinal, de intervalo y razn.

- El valor del percentil no se ve afectado por valores extremos.

Caso Aerolnea Wayra


Objetivo. Analizar el precio de los pasajes a Iquitos.

Distribucin de pasajeros segn precio de pasajes a Iquitos, en dlares


Precios de pasajes Marca de clase hi% Hi%
60 100 19,4%
100 140 31,2%
140 180 18,2%
180 220 18,2%
220 260 13,0%
Fuente Aerolnea Wayra S.A.

Calcule el precio mnimo de un pasaje para estar en el 25% de los pasajes ms caros.

Calcule el precio mximo de un pasaje para estar en el 10% de los pasajes ms baratos.

Calcule el porcentaje de clientes que pag como mximo 170 dlares.

Notas importantes
70 Estadstica Descriptiva 201702
Ejemplo 9
La siguiente tabla corresponde a la distribucin de frecuencias de los 200 trabajadores
de la empresa A segn salario, en nuevos soles, del ltimo mes.

Distribucin de empleados segn salario del ltimo mes


Salario (en nuevos soles) fi hi Fi Hi

450 - 650 32 0,160 32 0,160


650 - 850 40 0,200 72 0,360
850 1 050 60 0,300 132 0,660
1 050 1 250 48 0,240 180 0,900
1 250 1 450 20 0,100 200 1,000
Fuente: Empresa A

Calcule el sueldo mnimo para estar en el 15% de los trabajadores mejores pagados.

Solucin
Usando las frecuencias absolutas se tiene:

w n 85 200 200 85
P85 Li F4 1 1050 132 1208,33
f4 100 48 100 nuevos soles

Usando las frecuencias relativas se tiene:

w 85 200 85
P85 Li H4 1 1050 0,66 1208,33
h4 100 0,24 100 nuevos soles

El sueldo mnimo para estar en el 15% de los trabajadores mejores pagados es


S/.1208,33.

Notas importantes
Unidad 2. Medidas descriptivas 71

Medidas de variabilidad

Con las medidas de tendencia central es Las medidas de variabilidad indican cun
posible determinar el valor central de una alejados estn los valores de una variable
distribucin, pero no indican qu tan del valor que los representa y, por lo tanto,
cercanos o lejanos estn los datos de dicho permiten evaluar la confiabilidad de ese
valor central. valor central.

Si la medida de dispersin:
- tiene un valor pequeo, los datos estn concentrados alrededor de la medida de tendencia
central,
- tiene un valor grande, los datos no estn concentrados alrededor de la medida de tendencia
central.

Ejercicio 24
Comente en qu situacin le parece importante que exista, mayor o menor, variabilidad
en los casos descritos en la grfica.

Notas importantes
72 Estadstica Descriptiva 201702

Varianza
La varianza es el promedio de los cuadrados de la diferencia de cada dato con la media.
Las unidades de la varianza son las unidades de los datos al cuadrado.

Clculo de la varianza
La frmula para la varianza poblacional es
N

x
2
i
2 i 1

La frmula para la varianza muestral es

Desviacin estndar
La desviacin estndar es la raz cuadrada positiva de la varianza.
La desviacin estndar poblacional se denota por y la muestral por s.
Ejercicio 25
Calcule la desviacin estndar de los siguientes grupos de nmeros.

Grupo 1 1 2 3 4 5 6 7

Grupo 2 1 2 3 4 5 6 700

Qu concluye al calcular dicha medida de dispersin?

Notas importantes
Unidad 2. Medidas descriptivas 73
Caractersticas de la varianza y la desviacin estndar
- La varianza y la desviacin estndar se ven afectadas por valores extremos.
- La varianza y la desviacin estndar son nmeros reales no negativos.
- Se pueden calcular para variables medidas en escala de intervalo o razn.
- La varianza es expresada en unidades cuadrticas a las unidades de los datos, mien-
tras que, la desviacin estndar es expresada en las mismas unidades de los datos.
- Si cada uno de los n valores xi es transformado en yi = a xi + b, siendo a y b constan-
tes, entonces, la varianza de los n valores yi es:
sY2 a2 s2X sY = a s X
Caso Aerolnea Wayra
La empresa Wayra ha decidido hacer dos ofertas a su sindicato sobre el aumento de
sueldo anual a sus trabajadores:

- Aumento general del 4%.

- Aumento del 1,5% ms un bono de 190 soles.

Si la desviacin estndar de los sueldos es de 500 soles, calcule la nueva desviacin es-
tndar de cada oferta.

Ejercicio 26
Calcule la desviacin estndar de los siguientes grupos de nmeros.

Grupo 1 1 2 3 4 5 6 7

Grupo 2 1001 1002 1003 1004 1005 1006 1007

Los dos grupos de datos tienen la misma variabilidad?

Notas importantes
74 Estadstica Descriptiva 201702
Ejercicio 27
Observe las dos imgenes siguientes.

Tomado de http://gastronomiaycia.republica.com/

Complete los siguientes textos, con respecto a la variabilidad de los tamaos de las
manzanas en ambos grupos.
En el grupo de la izquierda hay mayor ... en el peso de las manzanas.
En el grupo de la izquierda hay menor ..... en el peso de las manzanas.
En el grupo de la derecha hay mayor .. en el peso de las manzanas.
En el grupo de la derecha hay menor .... en el peso de las manzanas.

Coeficiente de variacin
El coeficiente de variacin (CV) de un conjunto de datos indica el porcentaje que es la
desviacin estndar en comparacin con la media.

que se expresan en distintas o iguales


por ejemplo,
Es til al comparar la unidades, pero difieren a tal punto que
cuando las medias
variabilidad de dos o una comparacin directa de las
estn muy
ms series de datos respectivas desviaciones estndar no es
distantes.
muy til,

Clculo del coeficiente de variacin



La frmula para el coeficiente de variacin poblacional es CV 100%

s
La frmula para el coeficiente de variacin muestral es CV 100%
x
Ejercicio 28
Seguramente en el grupo de manzanas a la derecha, el coeficiente de variacin del peso
de las manzanas es ..... al coeficiente de variacin del grupo a la izquierda.
Ejercicio 29
Si un grupo de datos tiene un coeficiente de variacin del 10%. Interprete dicho valor.

Notas importantes
Unidad 2. Medidas descriptivas 75
Caractersticas del coeficiente de variacin
- El coeficiente de variacin se calcula en variables medidas en escala de razn.

- Se debe calcular para valores positivos.

Caso Aerolnea Wayra


Objetivo: Analizar si la compra con promociones genera mayor variabilidad de los tiem-
pos de espera en la compra de un pasaje.

Distribucin de pasajeros segn tiempos de espera para adquirir un


boleto por condicin de compra
40%

35% 36.3%
Porcentaje de pasajeros

Sin promocin
30% 30.0%
26.7% Con promocin
25% 23.3% 25.0%

20% 20.0%
17.5%
15%

10% 11.3%

5% 2.5%
3.8% 1.3% 2.5%
0.0%
0%
7.5 12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5 52.5
Tiempos de espera, en minutos
Fuente: Aerolnea Wayra S.A.

Con la siguiente informacin compare la variabilidad en los tiempos de espera en la


compra de un pasaje entre pasajeros que compran con o sin promocin.

Notas importantes
76 Estadstica Descriptiva 201702
Ejemplo 10
Los siguientes datos representan resmenes del nmero de mediciones de resistencia
de cierto artculo que realizaron dos grupos de tcnicos.

Grupo 1: media = 3 y desviacin estndar = 1,10


Grupo 2: media = 5 y desviacin estndar = 1,66

En cul de los grupos el nmero de mediciones es ms disperso?

Solucin
Como los promedios son diferentes, se usa como indicador el coeficiente de variacin:
1,10
CV1 100% 36,67%
3
1,66
CV2 100% 33,20%
5
El nmero de mediciones es ms disperso en el grupo 1.

Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la dife-
rencia entre el dato mayor y el dato menor.

Clculo del rango


Rango = R = Xmax - Xmin

Mnimo valor Mximo valor

Rango = Xmx - Xmn


donde Xmax y Xmin son los valores mximo y mnimo observados de la variable

Caractersticas del rango


- Se puede calcular en variables medidas en escala de intervalo o razn
- Se ve muy afectado por valores extremos.

Notas importantes
Unidad 2. Medidas descriptivas 77

Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.

Clculo del rango intercuartil


Rango intercuartil = RIC = Q3 Q1= P75 P25

25% 50% 25%

P25 P
75
RIC = P75- P25

Caractersticas del rango intercuartil


- Se puede calcular en variables medidas en escala de intervalo o razn.

- No se ve afectado por valores extremos.

Ejercicio 30
Si el rango intercuartil

Ejercicio 31
Calcule la mediana y desviacin estndar muestral de los siguientes grupos de datos.

Grupo 1 1 2 3 4 5 8 8 8 8

Grupo 2 2 2 2 2 5 6 7 8 9

En base a sus resultados, qu puede afirmar sobre los datos de cada grupo?

Notas importantes
78 Estadstica Descriptiva 201702

Medidas de asimetra
Coeficiente de asimetra de Pearson
Mide si los datos aparecen ubicados simtricamente o no respecto de la media.

Clculo del coeficiente de asimetra de Pearson


El coeficiente de asimetra para datos simples o agrupados se calcula con la siguiente
frmula:

x Mediana
As 3
s

Si el coeficiente de simetra As es:

positivo, indica sesgo a la igual a cero la negativo indica sesgo a la


derecha (cola derecha) distribucin es simtrica izquierda (cola izquierda)
alrededor de la media

Ejercicio 32
Complete los siguientes textos:

Si un grupo de datos tiene un coeficiente de asimetra negativo, esto significa que hay
una concentracin de datos en los valores

Si un grupo de datos tiene un coeficiente de asimetra positivo, esto significa que hay
una concentracin de datos en los valores

En un pas como el Per, los sueldos de las personas seguramente tienen un coeficiente
de asimetra ...., porque ..

En un examen de Estadstica, los tiempos que toman los alumnos en resolverlo segura-
mente tienen un coeficiente de asimetra ..., porque
..

Notas importantes
Unidad 2. Medidas descriptivas 79
Ejercicio 33
Observe la imagen siguiente.

Complete los siguientes textos, con respecto a las edades de la poblacin del Per.

En el grupo de los hombres y mujeres existe una mayor concentracin en las edades con
valores ..

En el grupo de los hombres y mujeres existe una menor concentracin en las edades con
valores ..

Seguramente en el grupo de los hombres y mujeres, las edades tiene coeficiente de asi-
metra ..

Notas importantes
80 Estadstica Descriptiva 201702

Diagrama de cajas
Un diagrama de cajas es una grfica que describe la distribucin de un conjunto de datos
tomando como referencia los valores de los cuartiles como medida de posicin y el valor
del rango intercuartil como medida de referencia de dispersin. Adems, nos permite
apreciar visualmente el tipo de distribucin de los datos (simtrica o asimtrica) y la
identificacin de valores extremos (datos atpicos).

Dato atpico
Es un dato inusualmente grande o pequeo con
respecto a los otros datos. Se considera dato atpi-
co a cualquier punto que est:

- a ms de 1,5(RIC) por arriba (o a la derecha)


del tercer cuartil

- a ms de 1,5(RIC) por debajo (o a la izquierda)


del primer cuartil

Pasos para trazar un diagrama de cajas

En la caja se traza una recta


Se traza un rectngulo con los vertical en el lugar de la
extremos en el primer y tercer mediana. As, la lnea de la
cuartil mediana divide los datos en
dos partes iguales

Se ubican los lmites mediante


el rango intercuartil, Se trazan los bigotes desde los
extremos de las cajas hasta los
el lmite superior est a 1,5 RIC
valores mnimo y mximo
arriba (o a la derecha) de Q3
dentro de los lmites inferior y
el lmite inferior est a 1,5 RIC superior
debajo (o ala izquierda) de Q1

Se marcan con un asterisco (*)


las localizaciones de los valores
atpicos

Notas importantes
Unidad 2. Medidas descriptivas 81
Caso Aerolnea Wayra
Objetivo. Comparar el precio de los pasajes segn por promociones.

Complete el diagrama de cajas con la siguiente informacin:

Datos de precios de pasajes de clientes que compraron su pasaje con promocin

45 50 55 55 55 160 160 220 220 360 425 700 1150

Estadsticos Con promocin Sin promocin


Percentil 25 67,5
Percentil 50 355,0
Percentil 75 540,0
Rango intercuartil 472,5
Largo mximo del bigote = 1,5 RIC 708,75
Lmite inferior = P25 1,5 RIC -641;25
Lmite superior = P75 + 1,5 RIC 1248,75
Mnimo 45
Mximo 950

Ttulo: .

La condicin de compra que presenta menor mediana en el precio de los pasajes es


... y este valor es ..
La condicin de compra que presenta mayor variabilidad en el precio del 50% de los va-
lores centrales es .. pues ..
La condicin de compra que presenta valores atpicos en los precios de los pasajes es
... y dichos valores atpicos son ..

Notas importantes
82 Estadstica Descriptiva 201702
Ejemplo 11
Los registros policacos del distrito A muestran los siguientes nmeros de informes de
delitos diarios para una muestra de das durante los meses de invierno y una muestra de
das durante los meses de verano.

Invierno 5 5 6 7 7 8 12 14 15 15 17 17 18 18 20 21 21 21 21 22
Verano 5 5 8 8 9 9 10 12 18 20 20 20 24 24 26 27 27 27 28 28

Construya un grfico que permita comparar, entre invierno y verano, los valores medios,
la variabilidad y encontrar los valores atpicos del nmero de delitos diarios.

Solucin
Se debe calcular los percentiles con datos simples. No calcule la distribucin de fre-
cuencias.

Calculemos los percentiles y los rangos intercuartiles.

Estadsticos Invierno Verano


Percentil 25 7,5 9,0
Percentil 50 16,0 20,0
Percentil 75 20,5 26,5
Rango intercuartil 20,5 7,5=13,0 26,5 9,0=17,5
Largo mximo del bigote = 1,5 RIC 1,5 x 13 = 19,5 1,5 x 17,5 = 26,25
Lmite inferior = P25 1,5 RIC 7,5 19,5 = -12,0 9,0 26,25 = -17,25
Lmite superior = P75 + 1,5 RIC 20,5 + 19,5 = 40 26,5 + 26,25 = 52,75

Para el invierno, de acuerdo con los datos, los bigotes llegan como mnimo a 5 y como
mximo a 22.

Para el verano, de acuerdo con los datos, los bigotes llegan como mnimo a 5 y como
mximo a 28.

No hay valores atpicos, pues ningn est fuera de los lmites.

Notas importantes
Unidad 2. Medidas descriptivas 83
Ejemplo 12
Complete el siguiente cuadro con la mejor respuesta posible de acuerdo a la frase men-
cionada.

Frase Debo calcular o realizar

Calcule el valor ms frecuente de los datos

Determine el grupo que tenga mayor variabili-


dad en el 50% de los valores centrales

Encuentre el grupo que tenga valores concen-


trados en los valores ms pequeos

Determine el grupo que tenga mayor variabili-


dad de los datos

Haga un grfico que muestre la distribucin


porcentual segn la variable 1 por la variable 2

Calcule el valor mnimo para estar en el cuarto


superior de los datos

Calcule la mejor medida de tendencia central


(media o mediana) cuando hay mucha asimetra

Realice un grfico que permita visualizar los


valores atpicos

Calcule el valor para el cual los valores estn


alrededor

Calcular el valor que est en el centro de los


datos

Haga un grfico que muestre que pocos factores


son vitales y muchos son triviales

Calcule el valor mximo para estar en el quinto


inferior de los datos

Calcule un estadstico que se pueda calcular en


todas las escalas de medicin

Haga un grfico que muestre las frecuencias


acumuladas

Realice un grfico adecuado para una variable


ordinal

Notas importantes
84 Estadstica Descriptiva 201702

Ejercicios de la Unidad 2
1. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de
hombres peruanos de 18 aos. Calcule e interprete la media de la estatura de la muestra.

1,67 1,70 1,83 1,65 1,70 1,65 1,60 1,70 1,61 1,69

2. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de


hombres peruanos de 18 aos.

Distribucin de una muestra de peruanos de 18 aos, segn su estatura


Estatura (en metros) fi hi
1,60 50 0,2778
1,63 78 0,4333
1,66 28 0,1556
1,70 14 0,0778
1,75 10 0,0556
Fuente: MINSA

Calcule e interprete la media de la estatura de la muestra.

3. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de


hombres peruanos de 18 aos. Complete la distribucin de frecuencias.

Distribucin de una muestra de peruanos de 18 aos, segn su estatura


Estatura (en metros) Marca de clase fi hi Fi Hi

, 155 0,48

, 0,32

, 167 0,95

, 600
Fuente: MINSA

Calcule e interprete la media de la estatura de la muestra. Use las frecuencias absolutas.

4. Una tienda rebaja los precios, en 12%, a toda su lnea de casacas. Si la media de los pre-
cios de las casacas antes de la rebaja era de 155 nuevos soles. Calcule la nueva media de
los precios.

5. En una empresa el sueldo medio es 2500 nuevos soles. La gerencia, luego de la negocia-
cin con el sindicato, decide realizar un aumento del 3,5% y un bono de 150 nuevos soles
a cada trabajador. Calcule el nuevo sueldo medio.

6. Se registra los tiempos, en minutos, que se demora una cajera en atender a algunos
clientes del supermercado A.

5,3 2,7 10,7 8,2 3,0 5,4 5,6 10,2 11,3 2,6 2,6 5,4 3,5 7,0 11,5

Calcule e interprete el valor de la mediana.

Notas importantes
Unidad 2. Medidas descriptivas 85
7. En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadstica e In-
formtica se pregunt a las madres peruanas que fueron menores de edad cuando naci
su primer hijo(a) nacido vivo, obtenindose los siguientes resultados.

Per. Distribucin de peruanas segn edad al nacer su primer hijo(a) vivo. 2007
Edad de la madre fi hi Fi Hi
12 aos 6,380 0,0054 6,380 0,0054
13 aos 13,840 0,0118 20,220 0,0173
14 aos 62,898 0,0537 83,118 0,0710
15 aos 210,250 0,1795 293,368 0,2505
16 aos 366,822 0,3132 660,190 0,5636
17 aos 511,133 0,4364 1,171,323 1,0000
Fuente: PER, INEI. Censos Nacionales 2007

Calcule e interprete la mediana de la variable en estudio.

8. En una ciudad, se tom una muestra aleatoria de 1000 personas y se les pregunt por su
ingreso mensual, en dlares, obtenindose los siguientes resultados.

Distribucin de personas segn ingreso mensual


Ingreso (en dlares) Marca de clase fi hi Fi Hi
300 , 700 500 104 0,104 104 0,104

700 , 1 100 900 224 0,224 328 0,328

1 100 , 1 500 1 300 437 0,437 765 0,765

1 500 , 1 900 1 700 151 0,151 916 0,916

1 900 , 2 300 2 100 84 0,084 1000 1,000

Fuente: Empresa A

Calcule e interprete la mediana de la variable en estudio.

9. En la empresa A se tom un examen de conocimientos sobre los procesos administrati-


vos. Los resultados se muestran en la siguiente tabla:

Distribucin de trabajadores segn resultados del examen de conocimientos


Puntaje del examen Marca de clase fi hi Fi Hi
20 , 40 30 54 0,3103 54 0,3103
40 , 60 50 60 0,3448 114 0,6552
60 , 80 70 48 0,2759 162 0,9310
80 , 100 90 12 0,0690 174 1,0000
Fuente: Empresa A

Calcule e interprete la moda del puntaje.

10. Complete los siguientes textos:

La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a


dicho conjunto. El .. son menores o igual a la mediana.
Usar la mediana como medida de tendencia central es preferible a usar la media cuan-
do.
Notas importantes
86 Estadstica Descriptiva 201702
11. Calcule e interprete la moda de los siguientes datos, que corresponden al nmero de
errores ortogrficos por correo electrnico que cometen algunos gerentes de una em-
presa en una comunicacin escrita.

2 2 5 2 3 3 2 3 2 1 2 0 0 1 3 0 3 2 1 2
4 2 1 3 1 1 3 3 3 1 2 4 2 0 1 4 2 2 2 2

12. Indique si son verdaderas o falsas las siguientes afirmaciones.

Afirmacin Verdadero Falso

La mediana se puede calcular solo en variables cuantitativas

La media es un valor que siempre est entre el mnimo valor y el


mximo valor de los datos

Si se tienen datos simples se construye la distribucin de frecuen-


cias para calcular la mediana.

La media se puede calcular solo en variables medidas en escala de


razn

13. Los siguientes datos corresponden a consumos, en nuevos soles, de alumnos en la cafe-
tera de una universidad. Calcule la desviacin estndar y la varianza.

3,0 7,5 5,5 12,0 6,5 2,7 2,0 4,5 8,0 4,0 2,5 3,0 1,5 7,0

14. Los datos corresponden a las notas de 327 alumnos en la primera prctica de Estadstica
Descriptiva del ciclo anterior. Calcule la desviacin estndar muestral.

Distribucin de alumnos segn notas de la primera prctica de Estadstica Descriptiva


Nota fi hi Fi Hi
12 110 0,3364 110 0,3364
14 136 0,4159 246 0,7523
15 44 0,1346 290 0,8869
16 37 0,1131 327 1,0000
Fuente: Secretara Acadmica. Universidad A

15. Los datos muestran las ventas de 90 vendedores de una empresa en el ltimo mes.

Distribucin de vendedores segn volumen de venta en el ltimo mes


Ventas, en miles de dlares Marca de clase fi hi Fi Hi
5,0 - 7,8 6,4 13 0,144 13 0,144
7,8 - 10,6 9,2 20 0,222 33 0,367
10,6 - 13,4 12,0 38 0,422 71 0,789
13,4 - 16,2 14,8 19 0,211 90 1,000
Fuente: Empresa A

Calcule la desviacin estndar muestral.

Notas importantes
Unidad 2. Medidas descriptivas 87
16. En una tienda, la desviacin estndar de los precios de los jeans es de 20 nuevos soles,
calcule la nueva desviacin estndar de los precios de los jeans si se realiza:
a. una rebaja del 6% de todos los precios,
b. una oferta y se rebaja ocho soles a cada precio.
17. El siguiente cuadro muestra la distribucin de los sueldos mensuales, en nuevos soles, de
los empleados de las empresas A y B.

Distribucin de empleados segn salario mensual de las empresas A y B


Sueldos Marca de fi Sueldos Marca de fi
Empresa A clase Empresa B clase

[1 500 2 500] 2 000 120 [3 000 3 500] 3 250 150


]2 500 3 500] 3 000 80 ]3 500 4 000] 3 750 120
]3 500 4 500] 4 000 77 ]4 000 4 500] 4 250 45
]4 500 5 500] 5 000 63 ]4 500 5 000] 4 750 55
Fuente: Empresa A Fuente: Empresa B

Cul de los grupos presenta mayor variabilidad de salarios?

Si en la empresa A hay un aumento de sueldo del 6%, mientras que en la empresa B se


da un aumento de sueldo del 4% y una bonificacin de 120 nuevos soles. Luego de los
aumentos, qu grupo presenta mayor variabilidad de salarios?

18. Los siguientes datos representan las notas de la primera prctica de alumnos de Estads-
tica Descriptiva. Calcule e interprete el percentil 25 de los siguientes datos.

Distribucin de alumnos segn notas de la primera prctica de Estadstica Descriptiva


xi fi hi Fi Hi
12 5 0,025 5 0,025
13 46 0,230 51 0,255
14 109 0,545 160 0,800
16 40 0,200 200 1,000
Fuente: Secretara Acadmica. Universidad A

19. Las notas de un curso de capacitacin sobre tributacin se muestran en la siguiente dis-
tribucin de frecuencias.

Distribucin de empleados segn notas del curso de capacitacin. Agosto 2015


Notas Marca de clase fi hi Fi Hi
08 10 9 15 0,1056 15 0,1056
10 12 11 48 0,3380 63 0,4437
12 14 13 60 0,4225 123 0,8662
14 16 15 12 0,0845 135 0,9507
16 18 17 7 0,0493 142 1,0000
Fuente: Empresa A. Gerencia de RRHH

Notas importantes
88 Estadstica Descriptiva 201702
Calcule la nota mnima para estar en el quinto superior.
Calcule la nota mxima para estar en el 10% de las notas ms bajas.
Calcule el porcentaje de personas que tuvo notas menores o iguales a 13.
Calcule el porcentaje de personas que tuvo notas mayores a 12 y menores o iguales a
15,5.
20. Dados los siguientes datos, calcule e interprete el percentil 30 y el percentil 75.

38 45 20 20 10 12 18 28 18 23 11 15 3 5 6 4 3 5 5

21. En el artculo Estudios espaoles de crecimiento 2008. Nuevos patrones antropomtri-


cos se muestra el siguiente grfico:

Tomado de http://www.sciencedirect.com/science/article/pii/S1575092208758455

Qu significa que para las jvenes de 18 aos el percentil 3 del peso sea 44 kilos?

Qu significa que para las jvenes de 19 aos el percentil 50 de la talla es 1,64 metros?

22. El tiempo, en meses, que viene laborando 51 trabajadores en una empresa se registra en
la siguiente tabla.

6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60

Calcule el rango y el rango intercuartil de los datos.

Notas importantes
Unidad 2. Medidas descriptivas 89
23. Indique si son verdaderas o falsas las siguientes afirmaciones.

Afirmacin Verdadero Falso

El percentil 90 es siempre mayor al percentil 10

El cuartil 2 es igual al decil 5

El percentil siempre se expresa en porcentaje

Si todos los pesos son iguales, la media ponderada es igual a la


media aritmtica

La media ponderada no tiene unidades

24. La siguiente tabla muestra informacin de los precios del artculo A (en nuevos soles) en
establecimientos elegidos al azar en el distrito de La Molina.

Distribucin de establecimientos de la Molina segn precios del artculo A


Intervalo de Marca de Frecuencia Frecuencia Frecuencia abso- Frecuencia rela-
clase clase absoluta relativa luta acumulada tiva acumulada
4
0,150
0,300 22
8,35 8
0,900
40
Fuente: Indecopi

Complete la tabla anterior si se sabe que el rango intercuartil es 0,8.

25. De datos sacados de la Intranet de la Universidad A, se desea comparar el resultado de la


primera prctica de tres horarios de un curso de estadstica, para lo cual, se tienen los si-
guientes resultados.

H1 10 11 11 12 12 12 12 13 13 13 14 15 15 16 16 17 18 18 19 19 19 20
H2 4 11 11 11 12 12 13 13 14 14 15 15 16 16 15 16 16 17 17 18
H3 9 9 10 10 10 11 12 12 12 12 13 13 13 13 14 14 15 15 15 17

Construya un diagrama de cajas que permita comparar el resultado de los horarios.

Indique el horario con mayor mediana de notas, el horario con mayor rango intercuartil
y el horario donde existen valores atpicos.

Notas importantes
90 Estadstica Descriptiva 201702
26. Complete el siguiente texto:

Los datos atpicos se define como ...

Se trazan los bigotes desde los ... de las cajas hasta los valores mnimo
y mximo ... de los lmites inferior y superior.

27. Indique si son verdaderas o falsas las siguientes afirmaciones.

Afirmacin Verdadero Falso

El coeficiente de asimetra tiene unidades las mismas unidades


que los datos

Si a cada valor de un grupo de datos se le aumenta en 10%, el


coeficiente de asimetra no vara

Si a cada valor de un grupo de datos se le aumenta 10 unidades, el


coeficiente de asimetra no vara

En un diagrama de cajas siempre se puede conocer el mximo y


mnimo de un grupo de datos

28. En un examen de Estadstica Descriptiva se tom la siguiente pregunta:

Con la intencin de conocer los hbitos y preferencias de los estudiantes acerca de los
productos naturales, se contrat los servicios de la consultora Data Mining Today S.A. la
cual elabor una encuesta para el estudio de mercado y se aplic a 400 estudiantes de
diferentes instituciones educativas. Algunos resultados fueron:

- El 70% de los encuestados prefiere consumir productos naturales enlatados.


- La fruta ms consumida es la manzana, seguida por el pltano y la pera.
- El gasto promedio por semana en productos naturales es de 25 nuevos soles con
una desviacin estndar de 5 nuevos soles.
- El 15% de los encuestados gasta ms de 28 nuevos soles semanales en productos
naturales.
- El 50% de los encuestados tiene una edad superior a 20 aos.
- El nmero promedio de vasos de yogurt consumidos durante la semana es de 6.
En base a esta informacin indique: (1,5 puntos)

Poblacin
Variable cuantitativa continua
Variable cuantitativa discreta

Variable Nombre del estadstico Valor del estadstico


Tendencia central
Dispersin
Posicin

Notas importantes
Unidad 2. Medidas descriptivas 91
Lo siguiente es la respuesta de un alumno, pngale nota.

Poblacin Los 400 estudiantes de diferentes instituciones educativas

Cuantitativa continua Gasto promedio semanal en productos naturales

Nmero promedio de vasos de yogurt consumidos durante


Cuantitativa discreta
la semana

Variable Nombre del estadstico Valor del estadstico

Tendencia Fruta consumida Moda Manzana, pltano y


central pera

Gasto promedio semanal Desviacin estndar 5 soles


Dispersin
en productos naturales
Tipo de producto prefe- Percentil 70
Posicin
rido

29. El salario, en cientos de soles, de los trabajadores una empresa se presenta a continua-
cin:

13 12 13 14 15 15 15 18 23 24 24 25 25 36 42 48 60

Calcule el coeficiente de asimetra de Pearson

30. El siguiente cuadro muestra la distribucin de los sueldos mensuales de los empleados de
las empresas A y B.

Distribucin de empleados segn de sueldos mensuales en la empresa A y B


Sueldos Marca de Sueldos Marca de
fi fi
Empresa A clase Empresa B clase

[1 500 2 500] 2 000 45 [3 000 3 500] 3 250 18


]2 500 3 500] 3 000 148 ]3 500 4 000] 3 750 70
]3 500 4 500] 4 000 60 ]4 000 4 500] 4 250 70
]4 500 5 500] 5 000 15 ]4 500 5 000] 4 750 18
Fuente: Empresa A Fuente: Empresa B

Calcule la asimetra de los dos grupos. Realice una conclusin

Notas importantes
92 Estadstica Descriptiva 201702
31. Indique si son verdaderas o falsas las siguientes afirmaciones.

Afirmacin Verdadero Falso

El coeficiente de variacin se puede calcular en escalas de in-


tervalo y de razn

Si las unidades de los datos son minutos, la varianza se expresa


en minutos al cuadrado

El rango intercuartil se ve muy afectado por valores muy gran-


des o muy pequeos

El coeficiente de variacin tiene las mismas unidades que la


varianza

Notas importantes
Unidad 3 Unidad 3: Teora de la probabilidad

Logro de la unidad 3

Al finalizar la unidad 3,
el estudiante analiza situaciones reales de incertidumbre,
utilizando conceptos relacionados con probabilidades.

Temario
Reglas de conteo y combinaciones
Probabilidad: concepto, experimento aleatorio, espacio muestral y evento
Operaciones con eventos
Probabilidad condicional
Probabilidad total
Teorema de Bayes
Diagrama del rbol
Eventos independientes
Unidad 3. Teora de Probabilidad 95

Experimentos, reglas de conteo y asignacin de probabilidades

La probabilidad mide o cuantifica la posibilidad de ocurrencia de un evento.

La probabilidad es el lenguaje para describir y tratar la incertidumbre.

Ejercicio 34
Marque con un aspa, asignando una opcin a la situacin descrita de acuerdo con su po-
sibilidad de ocurrencia.

Igualmente proba-
Muy poco Poco Bastante Muy
Situacin ble que ocurra o
probable probable probable probable
que no ocurra
Una mujer ser la
prxima presienta
del Per
Aprobar este
curso
Lanzo un dado y
sale un nmero par
El PBI del Per
crecer 4% este
ao
Per se clasificar
al Mundial Rusia
2018

Experimento aleatorio
Es todo proceso que genera dos o ms resultados bien definidos sin que se pueda pre-
decir con certeza cul de ellos ser observado u ocurrir en cada realizacin del proceso.

En cualquier repeticin simple de un experimento, ocurrir uno y solo uno de los posi-
bles resultados experimentales.

Espacio muestral
Es el conjunto de todos los posibles resultados de todos los resultados experimentales.
Se le suele simbolizar por S o .

Evento
Un evento es un subconjunto del espacio muestral.

Al realizar un experimento, diremos que el evento A ha ocurrido si el resultado obtenido


es un elemento del evento A.

Notas importantes
96 Estadstica Descriptiva 201702

Probabilidad de un evento
La probabilidad es una medida numrica de la posibilidad de que ocurra un evento. Por
tanto, la probabilidad es una medida del grado de incertidumbre asociado con un even-
to.

Los valores de la probabilidad siempre se asignan en una escala de 0 a 1.

Una probabilidad cercana a 0 indica que es difcil que el evento ocurra, mientras que,
una probabilidad cercana a 1 indica que es casi seguro que el evento ocurra.

Poca probabilidad Alta probabilidad


de ocurrencia de ocurrencia

0 0,5 1
La ocurrencia del evento es
tan probable como improbable

Ejercicio 35
Complete el siguiente cuadro asignando probabilidades segn su parecer.

Experimento aleatorio Espacio muestral Un evento Probabilidad

Michelle Obama postula a la S = Gana, pierde A = Gana P(A) = 0,3


presidencia de EEUU

PPK termina su mandato presi-


dencial

Se mide la cantidad de alumnos


que aprueban este curso

Sporting Cristal sale campen


este ao

Se condena a altos funcionarios


sobornados por Oderbrecht

Se lanza una moneda dos veces

Notas importantes
Unidad 3. Teora de Probabilidad 97

Definicin clsica de la probabilidad de un evento


Sea un experimento aleatorio cuyo correspondiente espacio muestral S est formado
por un nmero n finito de posibles resultados distintos y con la misma probabilidad de
ocurrir, entonces definimos la probabilidad de un evento como:

nA nmero de casos favorables al evento A


P(A)
nS nmero total de casos

Ejercicio 36
Complete el siguiente cuadro.

Experimento aleato- Espacio muestral Un evento Probabilidad


rio

Lanzar un dado y S = {1 2, 3, 4, 5, 6} A = 1, 3 ,5 P(A) =


anotar el nmero de
puntos de la cara
superior

Lanzar dos dados y S = {(1,1); (1,2); (1,3); A= P(A) =


anotar el nmero de ....; (6,6)}
puntos de cada cara
superior

Se saca una carta de


un mazo de 52 nai-
pes

Notas importantes
98 Estadstica Descriptiva 201702

Algunas relaciones bsicas de probabilidad


Con frecuencia se construyen eventos mediante la combinacin de eventos ms senci-
llos. Es usual emplear la notacin de conjuntos para describir los eventos construidos de
esta forma.

Sea un experimento aleatorio y S el espacio muestral asociado. Si A y B son dos even-


tos definidos en S, se define las siguientes operaciones con eventos.

Complemento (AC)
Para un evento A cualquiera se define su complemento AC como el evento consistente
en todos los puntos de S que no estn en A.

Se tiene que:

P(A) = 1 - P(AC)

AC se expresa como: El evento A no ocurre

Ejercicio 37
Diego invierte en un negocio. Escriba el evento complementario al evento A:= Diego tie-
ne xito en el negocio.

Una gerente toma diez decisiones en su empresa. Escriba el evento complementario al


evento A:= La gerente tiene razn en tres o ms de las decisiones.

Ejercicio 38
Complete los espacios en blanco.

La probabilidad de que una empresa gane una licitacin es 0,60, por lo tanto, la probabi-
lidad de que no la gane .

La probabilidad de que una persona gane la Tinka con una jugada es del 0,0000123%,
por lo tanto, la probabilidad de que no la gane en una jugada es %.

Notas importantes
Unidad 3. Teora de Probabilidad 99

Unin de eventos (A B)
Para dos eventos A y B, la unin del evento A con el evento B es el evento que contienen
todos los puntos de S que pertenecen a A o a B o a ambos.

A B se expresa como: Al menos uno de los eventos A o B ocurre.

Interseccin de eventos (A B)
Para dos eventos A y B, la interseccin de los eventos A y B es el evento que contienen
todos los puntos de S que pertenecen tanto a A como a B.

A B se expresa como: Ambos eventos, A y B ocurren a la vez.

Diferencia de eventos (A - B)
Para dos eventos A y B, la diferencia de los eventos A y B es el evento que contienen to-
dos los puntos de S que pertenecen a A y no pertenecen a B.

A B se expresa como: Ocurre el evento A pero no el evento B

Notas importantes
100 Estadstica Descriptiva 201702

Diferencia simtrica de eventos (A B)


Para dos eventos A y B, la diferencia simtrica de los eventos A y B es el evento que con-
tienen todos los puntos de S que pertenecen solo a A o aquellos que solo pertenecen a
B.

A B se expresa como: Ocurre solamente uno de los eventos A o B

Ejercicio 39
Un financista invierte en fondos mutuos y en la Bolsa de Valores. Se definen los eventos:
A:= que el financista tenga xito en la inversin de fondos mutuos
B:= que el financista tenga xito en la inversin en la Bolsa de Valores.
Escriba los siguientes eventos en funcin de los eventos A y B. Adems, grafique dicho
evento en un diagrama de Venn.
Solucin
Evento Notacin Diagrama de Venn

que el financista tenga xito en las dos


A ... B
inversiones

que el financista no tenga xito en la Bolsa


de Valores

que el financista tenga xito en, al menos


una, de sus inversiones

que el financista tenga xito solamente en


una de sus inversiones

que el financista tenga xito en la Bolsa de


Valores, pero no en los fondos mutuos

Notas importantes
Unidad 3. Teora de Probabilidad 101

Eventos mutuamente excluyentes


Dos eventos son mutuamente excluyentes o disjuntos si no tienen puntos de S en co-
mn. Los eventos A y B son mutuamente excluyentes si y solo si A B = .

Ejercicio 40
Indique si los siguientes eventos son mutuamente excluyentes.

Solucin
A: Estudio mucho el curso Estadstica, B: Desapruebo el curso Estadstica .

A: Apruebo el curso Estadstica, B: Desapruebo el curso Estadstica.................

A: Hoy estudio Administracin y Negocios internacionales en la UPC, B: Hoy estudio Ad-


ministracin y Marketing en la UPC .................

Reglas de conteo y combinaciones

Regla de la adicin
Si A y B son eventos mutuamente excluyentes, entonces

n(A U B) = n(A) + n(B)

Caso Aerolnea Wayra


En un da, una persona puede viajar de Lima a Cusco en cualquiera de los diez vuelos
diarios directos o en cualquiera de los tres vuelos con escala en Ayacucho. De cuntas
maneras diferentes puede viajar una persona de Lima a Cusco por dicha aerolnea?

Notas importantes
102 Estadstica Descriptiva 201702
Regla de la multiplicacin
Si un experimento se realiza por una sucesin de k pasos, en los el primer paso tiene n1
resultados posibles, el segundo tiene n2 resultados posibles y as sucesivamente, enton-
ces el nmero total de resultados del experimento es n1 x n2 x x nk.
Caso Aerolnea Wayra
Un pasajero puede elegir, en el men de primera clase, una de tres entradas diferentes,
uno de cuatro segundos y uno de dos postres. De cuntas maneras diferentes puede
elegir un pasajero su men?

Regla de conteo para combinaciones


La cantidad de formas de seleccionar x objetos de un total de n objetos distinguibles sin
tomar en cuenta el orden es:
n!
C xn
x!n x !
Caso Aerolnea Wayra
En un vuelo, la aerolnea ha sobrevendido pasajes, por lo que tendr que ofrecer pre-
mios a pasajeros para que no viajen en ese vuelo. Si hay 15 pasajeros que viajan solos y
estn dispuestos a no viajar y recibir los premios De cuntas maneras diferentes se
puede elegir a solo ocho de ellos?

Objetivo especfico: Establecer una poltica de inspeccin exhaustiva de pasajeros.


En cada vuelo se elegir al azar al 5% de los pasajeros para realizar una inspeccin ex-
haustiva, la cual detecta si una persona lleva sustancias ilegales. Si en un vuelo de 120
personas, hay tres personas que llevan sustancias ilegales. Calcule la probabilidad de de-
tectar al menos a una de ellas.

Notas importantes
Unidad 3. Teora de Probabilidad 103

Axiomas de la probabilidad
Sea un experimento aleatorio, S el espacio muestral asociado a dicho experimento alea-
torio y A un evento definido en S, entonces la probabilidad del evento A, denotada por
P(A), es aquel nmero que cumple los siguientes axiomas:

Axioma 3
Axioma 1 Axioma 2 Si A y B son dos eventos
mutuamente excluyentes
0 P(A) 1 P(S) = 1
entonces:
P(A B) = P(A) + P(B)

Ley aditiva para eventos cualesquiera


Sean A, B y C tres eventos cualesquiera, se cumple que:
P(A B) = P(A) + P(B) P(A B)

P(A B C)= P(A) + P(B) + P(C) - P(A B) - P(A C) - P(B C) + P(A B C)

Caso Aerolnea Wayra


La probabilidad que la aerolnea Wayra quiebre en los prximos dos aos es de 0,3 y que
su empresa rival quiebre en esos dos aos es de 0,5; mientras que la probabilidad de
que no quiebre ninguna de las dos empresas en esos dos aos es 0,4.

Defina los eventos necesarios para resolver este problema:

A:=

B:=

Notas importantes
104 Estadstica Descriptiva 201702
Calcule la probabilidad de que ocurran los siguientes eventos:
Evento Probabilidad Diagrama de Venn
que quiebre alguna de las dos aerolneas P(A B)=

que quiebre solo una de las aerolneas P(A B)=

que quiebre solo la aerolnea rival de P(A B)=


Wayra

que no quiebre alguna de las dos aerol- P(A B)=


neas

Ejercicio 41
En el presente ao, la probabilidad de que una persona viaje a Miami es 0,40; a Mncora
es 0,5 y Madrid es 0,37. Adems, la probabilidad de viajar a Miami y Mncora es 0,15; a
Miami y Madrid es 0,10 y de Mncora y Madrid es 0,12. Si la probabilidad de que la per-
sona viaje a por lo menos a una ciudad es 0,95; calcule la probabilidad de que la persona
viaje a una sola ciudad.

Solucin
Defina los eventos necesarios para resolver este problema:

A:=

B:=

C:=

Notas importantes
Unidad 3. Teora de Probabilidad 105

Probabilidad condicional
La probabilidad condicional se refiere a hallar la probabilidad de un evento conociendo
cierta informacin (condicin).

P A B
P A B
P B

Ejemplo 13
En un grupo, conformado por hombres y mujeres, existen profesionales y no profesiona-
les de acuerdo con la siguiente tabla.

Hombres (H) Mujeres (M) Total


Profesionales (P) 1 2 3
No profesionales (N) 7 10 17
Total 8 12 20
Si se elige una mujer al azar, calcule la probabilidad de que sea profesional.

Solucin
Primero, definamos los eventos necesarios para resolver este problema:

M:= Que la persona escogida sea mujer

P:= Que la persona escogida sea profesional mujer

Notas importantes
106 Estadstica Descriptiva 201702
Caso Aerolnea Wayra
Objetivo especfico: Analizar el comportamiento de los clientes considerando el destino
de viaje, el tipo de cliente y el modo de compra. Dentro de su proceso de creacin de
reportes, Felipe ha obtenido la siguiente tabla:

Destino de viaje nacional Destino de viaje internacional


Compra Compra por Compra Compra por Total
Tipo de cliente presencial Internet presencial Internet
Premiun 12 28 38 13
Frecuente 8 25 12 23
Ocasional 7 15 9 10
Total

Calcule la probabilidad de que una persona elegida al azar sea un viajero frecuente dado
que tiene un destino de viaje internacional.

Solucin
Defina los eventos necesarios para resolver este problema:

:=

:=

Si se elige al azar a un cliente frecuente, calcule la probabilidad de que compre pasajes


de forma presencial.

Solucin
Defina los eventos necesarios para resolver este problema:

:=

:=

Notas importantes
Unidad 3. Teora de Probabilidad 107
Ejemplo 14
El gerente de Wallmarket al distribuir los productos en las diferentes tiendas toma una
muestra de 250 unidades de los tres productos y en los dos tipos de envases, del alma-
cn con la idea de distribuirlos aleatoriamente en las tiendas. La distribucin de los pro-
ductos es la siguiente:

Tipo de presentacin
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250

Si se elige un producto al azar, para una de las tiendas,


a. Cul es la probabilidad de que sea jugo de maracuy y en frasco?

Lo primero es definir los eventos necesarios.


J:= que el producto elegido sea jugo
F:= que la presentacin elegida sea frasco

En la tabla observamos que lo pedido es:


Tipo de presentacin
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250

( )

b. Cul es la probabilidad de que sea mermelada o el envase sea de sachet?

Sean los eventos


M:= que el producto elegido sea mermelada
S:= que la presentacin elegida sea sachet

En la tabla observamos que lo pedido es:


Tipo de presentacin
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250

( ) ( ) ( ) ( )

Notas importantes
108 Estadstica Descriptiva 201702
c. Si el envase es sachet, cul es la probabilidad de que sea esencia?

Sean los eventos


E:= que el producto elegido sea esencia
S:= que la presentacin elegida sea sachet

En la tabla observamos que lo pedido es:


Tipo de presentacin
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250

( )

Ejemplo 15
La mayora de las estaciones de servicio venden tres tipos de gasolina: 90 octanos, 95
octanos y 97 octanos. Con frecuencia, alguna de cada est enriquecida con un aditivo. La
tabla siguiente ilustra los porcentajes de clientes que prefieren cada tipo.

90 octanos (B) 95 octanos (C) 97 octanos (D) Total


Con aditivo (A) 0,05 0,10 0,05 0,20
C
Sin aditivo (A ) 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00

Se selecciona al azar un cliente que ha comprado uno de estos tipos de gasolina.

Solucin
Cul es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 oc-
tanos?


P A C c PA P C c P A C c 0,20 0,50 (0,05 0,05) 0,60

Si el cliente no compr gasolina de 95 octanos, cul es la probabilidad de que hay com-


prado gasolina de 97 octanos?


P D Cc P(D C c ) 0,30
0,60

P Cc 0,50

Si el cliente no compr gasolina de 90 0ctanos, cul es la probabilidad de que haya


comprado gasolina sin aditivo?

PA Bc
c
0,65
P Ac Bc 0,8125
PB
c
0,80

Notas importantes
Unidad 3. Teora de Probabilidad 109
Ejemplo 16
Los productos de Exprtame, una empresa exportadora de producto agrcolas, tienen
buena acogida en el mercado nacional. El supermercado Sper adquiere un lote pero
conoce que algunos envases estn defectuosos. La distribucin de los productos en el lo-
te se muestra en las siguientes grficas:
Distribucin de productos por tipo

Esencia
28% Jugo
35%

Mermelada
37%
Fuente: Supermercados Sper

La distribucin de los productos en el lote que son defectuosos se muestran en la si-


guiente grfica
Distribucin de porudcutos segn estado del envase por
tipo de producto
100%
80%
Porcentaje

60%
98% 98,5% 96,0%
40% Buen estado
20% Defectuoso
2,0% 1,5% 4,0%
0%
Jugo Mermelada Esencia
Tipo de producto
Fuente: Supermercados Sper

Solucin
a. Si se elige un producto al azar y el porcentaje de envases defectuosos es menor al
4%, el gerente de supermercados Sper decidir adquirir un lote mayor al actual.
Qu decisin tomar el gerente de Sper?
Producto Defectuoso Buen estado Total
Jugo 0,007 0,343 0,35
Mermelada 0,006 0,364 0,37
Esencia 0,011 0,269 0,28
Total 0,024 0,976 1,00
P(defectuoso) = 0,024. El gerente decidir adquirir un lote mayor de productos
b. Si el envase est en buen estado, qu tan probable es que sea de esencia?
P(Esencia /buen estado) = 0,269/0,976 = 0,2756

Notas importantes
110 Estadstica Descriptiva 201702

Ley multiplicativa para eventos cualesquiera


La ley multiplicativa se usa para calcular la probabilidad de una interseccin de eventos.

PA B PAPB / A PBPA / B

Caso Aerolnea Wayra


Un sistema de seguridad en un avin tiene dos componentes. La probabilidad de que el
primer componente falle es 0,5% y la probabilidad de que el segundo componente falle
si el primero ha fallado es 3%. El sistema falla si ambos componentes fallan. Calcule la
probabilidad de que falle el sistema de seguridad.

rbol de probabilidades

Si los eventos Ai y Bi son independientes, el rbol de probabilidades se simplifica dado


que las probabilidades condicionales seran iguales a las probabilidades simples corres-
pondientes.

Notas importantes
Unidad 3. Teora de Probabilidad 111

Particin del espacio muestral


Sean los k eventos A1, A2, A3,..., Ak mutuamente excluyentes y tales que entonces consti-
tuyen una particin del espacio muestral S.

Probabilidad total
Sean los k eventos A1, A2, A3,..., Ak, mutuamente excluyentes y que constituyen una par-
ticin del espacio muestral S, entonces para cualquier evento B de S se cumple:

PB PB A1 PB A2 PB A3 ... PB Ak

Por la ley multiplicativa de eventos cualesquiera, se tiene finalmente que:

PB PA1 PB / A1 PA2 PB / A2 ... PAk PB / Ak

Teorema de Bayes
Si los k eventos A1, A2, A3, ..., Ak, constituyen una particin del espacio muestral S, en-
tonces para cualquier evento B de S tal que P(B) > 0, se cumple:

PAi B
P Ai B
PB

Por definicin de probabilidad condicional y probabilidad total se tiene que:

PAi PB / Ai
PAi B
PA1 PB / A1 PA2 PB / A2 ... PAk PB / Ak

El teorema de Bayes establece una relacin muy importante en la teora de probabilida-


des y es la base para la revisin de la asignacin de probabilidades a la luz de informa-
cin adicional.

Probabilidades Informacin Teorema de Posibilidades


a priori nueva Bayes posteriores

Notas importantes
112 Estadstica Descriptiva 201702
Caso Aerolnea Wayra
Objetivo especfico: Evaluar la situacin de incidentes mecnicos de los aviones y su re-
paracin dentro de las 24 horas con la finalidad de dar un bono de reconocimiento a los
mecnicos.

Se sabe que el 30% de los incidentes mecnicos ocurren con el avin 1, el 50% en el
avin 2 y el resto con el avin 3. Asimismo, la probabilidad que el avin 1 sea reparado
dentro de las 24 horas despus de ocurrido el incidente es 90%, de 73% para el avin 2 y
de 65% para el avin 3.
Si se elige en forma aleatoria un informe por incidente de un avin, cul es la probabili-
dad que el informe indique que el avin logr ser reparado dentro de las 24 horas?
Si el informe dice que el avin no fue reparado dentro de las 24 horas, de cul de los
aviones es ms probable que sea el informe?
Solucin
Los eventos y el rbol de probabilidades necesarios para resolver este problema son:

.:=

.:=

.:=

Si se elige al azar un informe por incidente de un avin, cul es la probabilidad que el


informe indique que el avin logr ser reparado dentro de las 24 horas?

Si el informe dice que el avin no fue reparado dentro de las 24 horas, de cul de los
aviones es ms probable que sea el informe?

Notas importantes
Unidad 3. Teora de Probabilidad 113
Ejemplo 17
El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 1% de las usua-
rias y el 0,8% de los usuarios ha sufrido de algn tipo de robo durante el uso del Metro-
politano.
a. Si se elige un usuario al azar, cul es la probabilidad de que haya sido vctima de ro-
bo?
Sean los eventos
R:= Que el usuario sea vctima de robo
H:= Que el usuario sea hombre.
M:= Que el usuario sea mujer

( ) ( ) ( ) ( ) ( )= 0,0044 + 0,0045 = 0,0089

b. Si se elige un usuario al azar que no ha sido vctima de robo, calcule la probabilidad


de que sea hombre. Indique el resultado con cuatro decimales.

( )

Ejemplo 18
Si Exprtame, una empresa que exporta productos alimenticios, distribuye sus produc-
tos de la siguiente manera: 45% en jugo, 35% en mermelada y el resto en esencia. Ade-
ms, se sabe que la probabilidad de que un jugo est en mal estado es 4%, una merme-
lada es 2% y una esencia es 3%.

a. Si se selecciona un producto al azar, calcule la probabilidad de que el producto est


en mal estado.
Sean los siguientes eventos:
J:= que el producto elegido sea jugo
M:= que el producto elegido sea mermelada
E:= que el producto elegido sea esencia
B:= que el producto elegido est en buen estado
Completemos el cuadro con los datos del problema.
Producto Mal estado Buen estado Total
Jugo 0,018 0,432 0,45
Mermelada 0,007 0,343 0,35
Esencia 0,006 0,194 0,20
Total 0,031 0,969 1,00

b. Si se selecciona un producto al azar, calcule la probabilidad de que est en buen es-


tado.
Para resolver este problema usaremos el teorema de la probabilidad total.
( ) ( ) ( ) ( ) ( ) ( ) ( )

Notas importantes
114 Estadstica Descriptiva 201702
c. Si de los productos en mal estado se selecciona uno al azar, calcule la probabilidad de
que sea jugo.
Para resolver este problema usaremos el teorema de la probabilidad de Bayes.
( ) ( ) ( )
( )
( ) ( ) ( ) ( ) ( ) ( ) ( )

Ejemplo 19
El departamento de crditos de una tienda comercial sabe que sus ventas se pagan con
dinero en efectivo, con cheque o al crdito, con probabilidades respectivas de 0,3; 0;3 y
0,4. La probabilidad de que una venta sea por ms de $50, es igual a 0,2 si sta es en
efectivo, es igual a 0,9 si sta es con cheque y es igual a 0,6 si sta es al crdito.

Cul es la probabilidad de que una persona compre por ms de $50?

Si compra por ms de $50, qu es ms probable que haya pagado en efectivo, con che-
que o al crdito?

Solucin
Sean los eventos:

E: La compra se realiza con dinero en efectivo


CH: La compra se realiza con cheque
C: La compra se realiza al crdito
M: La compra es por ms de $ 50
MC: La compra no es por ms de $ 50
Con la informacin proporcionada, construimos el siguiente diagrama de rbol:

Se pide calcular:

PM 0,30 0,20 0,30 0,90 0,40 0,60 0,57

0,30 0,20 2 0,30 0,90 9


P E / M P CH / M
0,57 19 0,57 19
0,40 0,60 8
P C / M
0,57 19
Se observa que es ms probable la compra se haya hecho con cheque.

Notas importantes
Unidad 3. Teora de Probabilidad 115

Eventos independientes
Si PA 0 , los eventos A y B son independientes si y solo si:

PA B PA

Ley de la multiplicacin para eventos independientes


Si dos eventos A y B son independientes se cumple que

PA B PAPB
Tres eventos A, B y C son independientes si se cumple que:

PA B PAPB
PA C PAPC
PB C PBPC
P(A B C) P(A)P(B)P(C)

Ejercicio 42
Si dos eventos A y B son independientes, indique el diagrama de Venn correspondiente.

Caso Aerolnea Wayra


Objetivo especfico: Hacer un reporte sobre la compra de pasajes usando el canal de In-
ternet considerando diferentes tipos de clientes.

La probabilidad que un cliente premium compre un pasaje usando Internet es 13% y,


que un cliente frecuente haga la compra por esta va es 46%. Si un da cualquiera, dos
clientes (uno de cada tipo) que no se conocen (por lo tanto, la decisin de compra de
uno no influye en el otro), deciden comprar un pasaje.

Cul es la probabilidad que por lo menos uno de los clientes compre su pasaje va In-
ternet?

Notas importantes
116 Estadstica Descriptiva 201702
Si la probabilidad de que exactamente uno de los clientes haya utilizado Internet en su
compra es inferior a 0,30, se rebajar el costo de los pasajes. Qu decisin se tomar?

Si se tiene un grupo de 30 clientes premium que no se conocen entre s, calcule la pro-


babilidad de que al menos uno de ellos compre su pasaje por Internet.

Si se tiene un grupo de 30 clientes premium que no se conocen entre s, calcule la pro-


babilidad de que al menos dos de ellos compren sus pasajes por Internet.

Notas importantes
Unidad 3. Teora de Probabilidad 117

Ejercicios de la Unidad 3
32. Indicar, para cara uno de los siguientes experimentos aleatorios, los respectivos espacios
muestrales: lanzar una moneda, jugar un partido de ftbol, jugar un partido de tenis, lan-
zar un dado, lanzar dos dados.

33. Un experimento consiste en lanzar primero un dado para despus lanzar una moneda,
siempre y cuando el nmero del dado sea par. Si el resultado del dado es impar, la mo-
neda se lanza dos veces. Determine el espacio muestral de este experimento.

34. Se lanzan dos dados, calcule la probabilidad de que la suma de los dos dados sea mayor a
siete. Rpta: 0,4167

35. Un fabricante de telfonos celulares acaba de lanzar dos modelos de smartphones


econmicos: el L720 y el L520. La probabilidad de que el modelo L720 tenga xito es 0,70
y en el modelo L520 es 0,60. La probabilidad de que al menos uno de los modelos tenga
xito es 0,90. Determine la probabilidad de que se tenga xito solo en uno de los
modelos. Rpta: 0,5

36. En un hogar hay diez personas y un encuestador necesita entrevistar a dos de ellas, sin
importar el orden. De cuntas maneras diferentes se puede elegir a esas dos personas?

37. Al fin del ciclo, los 30 alumnos de una seccin deben elegir a tres de ellos al azar para que
organicen un compartir. Cuntos grupos diferentes de tres personas se pueden ele-
gir?

38. De 50 conductores, 9 nueve no tienen los papeles en regla. Si un polica escoge al azar a
cinco conductores y les pide sus papeles,

a. Calcule la probabilidad de que elija a dos que no tengan los papeles en regla.

b. Calcule la probabilidad de que elija al menos un conductor sin papeles en regla.

39. En un lote de polos, hay 70 polos rojos, 150 blancos y 90 azules. Si extrae un polo al azar.

a. Cul es la probabilidad de que el polo sea azul o blanco?

b. Cul es la probabilidad de que no sea azul?

40. Segn el II Censo Universitario, en el ao 2010, 63 900 alumnos ingresaron a las universi-
dades pblicas y 194 151 a las universidades privadas. De ellos, en las universidades p-
blicas, 28 798 ingresantes fueron mujeres, mientras que en las privadas lo fueron 98 942.

Si se elige al azar a una ingresante, calcule la probabilidad de que estudie en una univer-
sidad privada.

Si se elige al azar a un ingresante de universidad privada, calcule la probabilidad de que


sea mujer.

41. En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadstica e In-
formtica se pregunt a todos los peruanos por los servicios de comunicacin con los que
contaba su hogar y su rea de residencia, obtenindose los siguientes resultados:

Notas importantes
118 Estadstica Descriptiva 201702
Servicios con que los cuenta el hogar Urbano Rural Total
Hogares sin ningn tipo de servicio 1 682 454 1 468 889 3 151 343
Solo tienen telfono fijo 480 831 6 170 487 001
Solo tienen telfono celular 1 299 037 138 721 1 437 758
Solo tienen Internet 3 336 275 3 611
Solo tienen TV por cable 56 343 2 688 59 031
Tienen telfono fijo y telfono celular 506 759 2 912 509 671
Tienen telfono fijo e Internet 15 684 31 15 715
Tienen telfono fijo y TV por cable 117 733 186 117 919
Tienen telfono celular e Internet 9 970 84 10 054
Tienen telfono celular y TV por cable 204 563 1 981 206 544
Tienen Internet y TV por cable 1 288 19 1 307
Tienen telfono fijo, telfono celular e Internet 93 103 110 93 213
Tienen telfono fijo, telfono celular y TV por cable 326 181 468 326 649
Tienen telfono fijo, Internet y TV por cable 19 732 9 19 741
Tienen telfono celular, Internet y TV por cable 15 424 49 15 473
Los cuatro servicios 298 911 133 299 044
Total 5 131 349 1 622 725 6 754 074
a. Si se selecciona al azar un hogar de zona urbana, cul es la probabilidad de que
tenga cuatro servicios?

b. Si se selecciona al azar un hogar con tres servicios, cul es la probabilidad de que


sea de zona urbana?

c. Si se selecciona al azar un hogar de zona rural, cul es la probabilidad de que cuen-


te con tres servicios por lo menos?

d. Si se selecciona al azar un hogar de zona urbana, cul es la probabilidad de que no


tenga ningn servicio?

e. Si se selecciona un hogar al azar, cul es la probabilidad de que sea de zona urbana


y los cuatro servicios?

f. Si se selecciona un hogar al azar, cul es la probabilidad de que sea de zona rural o


no cuente con servicio alguno?

42. En una empresa hay 150 trabajadores; 25 de los hombres y 35 de las mujeres realizan ac-
tividades de responsabilidad social en la empresa. El total de mujeres en la empresa es
de 57.

a. Si elegimos al azar a un trabajador hombre, calcule la probabilidad de que realice ac-


tividades de responsabilidad social.

b. Si elegimos al azar a un trabajador que no realice actividades de responsabilidad so-


cial, calcule la probabilidad de que sea mujer.

c. Si elegimos al azar a un trabajador que realice actividades de responsabilidad social


y que sea mujer.

43. Para elegir a una persona entre tres se prepara una bolsa con dos bolas negras y una bola
blanca. Los tres van sacando, por orden, una bola que no devuelven. Quien saque la bola
blanca gana. Quin lleva ms ventaja: el primero, el segundo o el tercero?

Notas importantes
Unidad 3. Teora de Probabilidad 119
44. En una empresa el 35% de los trabajadores son mujeres y el 65% son hombres. Un da ha
llegado tarde a trabajar el 2% de las mujeres y el 4% de los hombres.

a. Si se elige, al azar, a un trabajador calcule la probabilidad de que haya llegado tarde.

b. Si se elige, al azar, a un trabajador que ha llegado tarde, calcule la probabilidad de


que sea elegido una mujer.

45. Una empresa que fabrica polos mediante tres mquinas, A, B y C, producen el 25%, 30%
y 45%, respectivamente, del total de los polos producidos en la fbrica. Los porcentajes
de produccin defectuosa de estas mquinas son del 2%, 4% y 3% respectivamente.

a. Si se elige un polo al azar; calcule la probabilidad de que sea no defectuoso.

b. Tomamos, al azar, un polo y resulta ser defectuoso; calcule la probabilidad de haber


sido producido por la mquina B.

46. Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer
trabajo es del 70% y que sea aceptado en el segundo es del 50%. Si ser aceptado en di-
chos trabajos es independiente entre s.

a. Cul es la probabilidad de que al menos sea aceptado en uno de los trabajos?

b. Cul es la probabilidad de que solamente sea aceptado en uno solo de los trabajos?

47. El pulpo Paul es un octpodo que ha sido empleado como orculo para predecir los re-
sultados de la seleccin alemana de ftbol en el Mundial de Ftbol 2010, acertando los
ocho emparejamientos que se le propusieron, los siete partidos de Alemania en la Copa
Mundial de Ftbol de 2010 y la final entre Espaa y Holanda.

Antes de cada partido, a Paul se le presentaron dos contenedores idnticos con comida:
uno de ellos estaba marcado con una bandera, usualmente la de Alemania y el otro con
la bandera del equipo oponente. La eleccin de Paul se interpretaba como el equipo que
lograra la victoria. Si el pulpo Paul, en realidad, escogi los contenedores al azar, calcule
la probabilidad de acertar en los resultados de los ocho los partidos que le propusieron.
Asuma independencia entre cada eleccin.

48. Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer
trabajo es del 70% y que sea aceptado en el segundo es del 50%. Si ser aceptado en di-
chos trabajos es independiente entre s.

a. Cul es la probabilidad de que al menos sea aceptado en uno de los trabajos?

b. Cul es la probabilidad de que solamente sea aceptado en uno de los trabajos?

49. Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que
en una chica acepte bailar con l es del 4%. Si en una fiesta saca a bailar a 40 chicas.
Asuma independencia entre la decisin de una chica y otra. Calcule la probabilidad de
que baile por lo menos con una de ellas.

Notas importantes
120 Estadstica Descriptiva 201702
50. Indique si son verdaderas o falsas las siguientes afirmaciones.

Afirmacin V F

El teorema de Bayes determina la probabilidad de un determinado evento se deba


V F
a una causa especfica

La probabilidad condicional se refiere a hallar la probabilidad de un evento cono-


V F
ciendo cierta informacin (condicin).


Si PA B 0,3 , entonces, se cumple que P AC B 0,7 V F


Si PA B 0,3 , entonces, se cumple que P A B c 0,7 V F

Si dos eventos son independientes, entonces sern tambin mutuamente excluyen-


V F
tes

Si dos eventos son independientes, entonces P A B P B V F

Si dos eventos son independientes entonces la ocurrencia de uno de ellos no influ-


V F
ye en la ocurrencia del otro evento

Si PA B PA esto implica que A y B son eventos mutuamente excluyentes V F

Si PA B PA esto implica que A y B son eventos independientes V F

El espacio muestral es el conjunto de todos los posibles eventos de un experimento


V F
aleatorio

En un experimento aleatorio nunca aparece un modelo definido de regularidad V F

En algunos casos especiales la probabilidad de un evento podra ser mayor que uno V F

Un evento es un subconjunto del experimento aleatorio. V F

Si dos eventos son mutuamente excluyentes entonces la ocurrencia de uno de ellos


V F
no influye en la ocurrencia del otro

El complemento del evento A no es mutuamente excluyente con el evento A V F

Si dos eventos son mutuamente excluyentes, entonces P(A) + P(B) = 1 V F

Notas importantes
Unidad 4 : Variables aleatorias

Logro de la unidad 4

Al finalizar la unidad 4,
el estudiante toma decisiones responsables
en un escenario real de investigacin,
aplicando conceptos de variable aleatoria, valor esperado y probabilidad.

Temario
Definicin de variable aleatoria discreta y continua.
Funcin de probabilidad de una variable aleatoria discreta.
Funcin de densidad y funcin de distribucin acumulada de una variable aleatoria continua.
Valor esperado y varianza de variables aleatorias discretas y continuas.
Estudio de propiedades de las siguientes distribuciones: binomial, hipergeomtrica, Poisson,
uniforme, continua, normal, t-Student
Unidad 4. Variables aleatorias 123

Variable aleatoria
Se denomina variable aleatoria a una descripcin numrica del resultado de un experi-
mento.

La variable aleatoria
Lo que es aleatorio
atribuye a cada evento
es el experimento
un nmero
sobre cuyo espacio muestral
que no es aleatorio o imprevisible,
se define la variable aleatoria.
sino fijo y predeterminado.

Rango o recorrido de una variable aleatoria


Se llama rango o recorrido de una variable aleatoria X y lo denotaremos RX, al conjunto
de los valores reales que la variable aleatoria puede tomar.

Tipos de variable aleatoria


Una variable aleatoria es discreta si puede asumir un conjunto finito o infinito numera-
ble de valores diferentes.

Una variable aleatoria es continua si puede asumir cualquier valor en un intervalo.

Caso Aerolnea Wayra


Indique el tipo de la variable aleatoria y su rango.

Variable aleatoria Tipo Rango


W = tiempo de vuelo de Lima a Cusco, en
RW =
minutos
X = nmero de maletas que lleva un pasajero
RX =
en la bodega del avin en un vuelo
Y = nmero de pasajeros que piden pollo
RY =
durante un viaje de 100 personas
Z = dinero gastado en las compras a bordo
RZ =
por una persona, en dlares

Evento (X = a)
El evento (X a) se define como ( X a) { w S / X (w) a }

Notas importantes
124 Estadstica Descriptiva 201702

Variable aleatoria discreta


Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad
que se denota P(X = x).

Por ejemplo: nmero de alumnos matriculados por curso, cantidad de preguntas correc-
tamente contestadas en una evaluacin de personal, cantidad de clientes que visitan un
centro comercial en un da determinado.

Distribucin de probabilidad de una variable aleatoria discreta


La distribucin de probabilidad de una variable aleatoria discreta X se describe como
una funcin de probabilidad representada por f(x) que asigna a cada valor de la variable
aleatoria, la probabilidad de que X asuma ese valor, esto es:

f(x) = P(X = x)

Toda funcin de probabilidad debe cumplir que:

- f(x) 0
n
- f (x ) 1
i 1
i

Ejercicio 43
Sea S el espacio obtenido al lanzar una moneda dos veces y observar si sale cara (c) o se-
llo (s) cada vez.

Completar los espacios en blanco.

El espacio muestral es S = {(.. , ..), (.. , ..), (.. , ..), (.. , ..)}.

Sea X el nmero de caras obtenidas, luego el rango de la variable X es RX = {. , ., .}.

El evento (X = 0) = {(.., ..)}

El evento (X = 1) = {(.., ..), (.., ..)}

El evento (X = 2) = {(.., ..)}

Entonces, la probabilidad de cada evento es:

f(0) = P(..) = ..

f(1) = P(..) = ..

f(2) = P(..) = ..

Notas importantes
Unidad 4. Variables aleatorias 125
Ejercicio 44
Indique cules de las siguientes funciones puede ser funcin de probabilidad.

Ejercicio 45
Indique cules de las siguientes funciones puede ser funcin de probabilidad.

x
x 4 , 6, 10
f x 20
0 en otro caso

C x2 p x (1 p)2 x x 0, 1, 2
f x
0 en otro caso

Notas importantes
126 Estadstica Descriptiva 201702
Ejercicio 46
Se lanza un dado, sea la variable aleatoria X igual al nmero de la cara superior del dado.
Determine y grafique la funcin de probabilidad de la variable X.

Ejemplo 20
Calcule a para que la siguiente funcin sea una funcin de probabilidad. Grafique f(x)

f x ax x 10, 15, 20, 25


Solucin
Tiene que cumplir dos condiciones:

La primera condicin, f(x) > 0, se cumple cuando a es mayor que cero, puesto que x > 0.
n
La segunda condicin, f (x ) 1 , se cumple si a10 15a 20a 25a 1 , esto se cum-
i 1
i

ple cuando 70a =1, luego a =1/70

0.5
0.4
0.3
f(x)

0.2
0.1
0.0
0 5
X

Notas importantes
Unidad 4. Variables aleatorias 127
Ejemplo 21
Sea X el nmero de lanzamientos de un dado hasta que salga el primer seis. Determine
la funcin de probabilidad de la variable X y calcule P(X 3)

Solucin
Sea la variable aleatoria X:= nmero de lanzamientos de un dado hasta que salga el pri-
mer seis.

El rango o recorrido de X es RX = {1, 2, 3,} = Z+.

f(1) = P(X = 1) = 1/6


f(2) = P(X = 2) = 5/6 x 1/6
f(3) = P(X = 3) = 5/6 x 5/6 x 1/6

Luego, la funcin de probabilidad de la variable X es:


x 1
5 1
f x P X x ; Rx 1, 2, 3,....
6 6
1 5 25
P( X 3) 1 P( X 3) 1 f (1) f (2) f (3) 1 0,5787
6 36 216

Valor esperado de una variable aleatoria discreta


El valor esperado o esperanza matemtica de una variable aleatoria X o media de una
distribucin de probabilidad de X se denota E(X).
n
X E X x i f x i x1 f x1 x2 f x2 ... x n f x n
i 1

Caso Aerolnea Wayra


Objetivo especfico: Estimar la media del nmero de personas que no se presentan al
vuelo.

El nmero de personas que no se presentan a un vuelo se modela con una variable alea-
toria X con la siguiente funcin de probabilidad.

x 0 1 2 3 4 5 6
f(x) 0,20 0,25 0,22 0,15 0,10 0,05 a

Calcule e interprete la media de X.

Notas importantes
128 Estadstica Descriptiva 201702

Valor esperado de una funcin de variable aleatoria discreta


Sea G(X) una funcin de la variable aleatoria X. El valor esperado de G(X) es:
n
E G X G xi f xi G x1 f x1 G x2 f x2 ... G xn f xn
i 1

Ejemplo 22
La demanda mensual de uno de los productos Exprtame vara grandemente de un mes
a otro. Con base a la informacin de los ltimos 24 meses se estim las probabilidades
para la demanda mensual del producto jugo en frasco.
Nmero de frascos vendidos 80 90 100 120 130 140
f(x) 0,15 0,25 0,35 0,10 0,10 0,05

a. Calcule el valor esperado del nmero de frascos de jugo demandados.


E(X) = 101,5

b. Cada frasco tres soles y lo vende cinco soles. Si en un mes determinado, ha solicitado
al distribuidor 140 frascos. Sea U(X) la utilidad del dueo de la tienda. Calcule la utili-
dad esperada.

x 80 90 100 120 130 140


f(x) 0,15 0,25 0,35 0,10 0,10 0,05
U(x) -20 30 80 180 230 280

E(U(X)) = 87,5

Varianza y desviacin estndar de una variable aleatoria discreta


La varianza V(X) de una variable aleatoria discreta X con distribucin de probabilidad f(x)
se define por:

2

V X E X X x X f x
xRX
2

Se cumple V X E X 2 E X
2

La varianza de la variable aleatoria X, V(X), tambin se denota por X2 , o simplemente


como 2 .
La desviacin estndar de X es la raz cuadra de la varianza de X.

Notas importantes
Unidad 4. Variables aleatorias 129
Ejercicio 47
Se lanza un dado, sea la variable aleatoria X igual al nmero de la cara superior del dado.
Calcule la media y desviacin estndar de X.

Propiedades del valor esperado en variables aleatorias


Si X1 y X2 son dos variables aleatorias, y a1 y a2 son dos constantes, entonces:

E a1 a1

E a1 X1 a2 X2 a1E X1 a2E X2

Si X1, X2, X3, . . ., Xn son n variables aleatorias, y a1, a2, . . ., an son n constantes, entonces:

E a1 X1 a2 X2 an X n a1E X1 a2E X2 anE X n

Si X1, X2, X3, . . ., Xn son n variables aleatorias con la misma funcin de probabilidad, en-
tonces se cumple que E X i y, por lo tanto:

E X1 X2 ... X n n

Propiedades de la varianza en variables aleatorias


Si Y = aX + b, con a y b son constantes, entonces Y2 a2 X2

Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes, y a1, a2, a3, . . ., an son n
constantes, entonces:

V a1 X1 a2 X2 an Xn a12V X1 a22V X2 an2V X n

Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes con la misma funcin de
probabilidad, entonces se cumple que V Xi 2 y, por lo tanto:

V X1 X 2 ... X n n 2

Notas importantes
130 Estadstica Descriptiva 201702
Caso Aerolnea Wayra
Objetivo especfico: Comparar el grado de dispersin del nmero de cancelaciones en
vuelos, tanto nacional e internacional.

La distribucin de probabilidades de las variables X: nmero de cancelaciones en vuelo


nacional e Y: nmero de cancelaciones en vuelo internacional se muestran a continua-
cin:

x 1 2 3 4 5
f(x) 0,25 0,42 0,15 0,10 a

y 0 1 2 3 4
f(y) 0,27 0,37 0,18 0,12 b

La empresa implementar cambios en aquel tipo de vuelo, nacional o internacional, cu-


yo nmero de cancelaciones sea ms variable. En qu tipo de vuelo se harn los cam-
bios?

Ejemplo 23

Sea la variable aleatoria X el nmero de frascos vendidos en un supermercado por se-


mana, con la siguiente funcin de probabilidad:
1
f (x) k (x 3)2 para x 1 ,2 , 3 , 4 , 5 ,6
38
Solucin
a. Calcule el valor de k.
k = 0,25

x 12 24 36 48 60 72
f(x) 0,1447 0,2237 0,25 0,2237 0,1447 0,01316

Notas importantes
Unidad 4. Variables aleatorias 131
b. Calcule la probabilidad de vender por lo menos tres docenas de frascos

P(X 3) =1 - P(X 2) = 1 - 0.36842105 = 0,6316

c. Si la utilidad por docena de frascos vendido (en soles) viene dada por la funcin: U(X)
= 10X 5, expresada en nuevos soles, calcule la utilidad esperada mensual y su va-
rianza?
E(X) = 3,0396
E(U(X)) = E(10X 5) = 10 E(X) - 5 = 25,396

Ejemplo 24
Sea X una variable aleatoria con la siguiente funcin de probabilidad. Calcular el valor
esperado de X2
ax 1, 2, 3, 4, 5
f (x)
0 en otro caso

Solucin
5
Lo primero es determinar a, planteamos que f x 1 , de donde a = 1/15.
i 1
i

Nos piden

E X 2 xi2 f xi 12
5
1 1 1 1 1
22 32 42 52 15
i 1 15 15 15 15 15

Ejemplo 25
Sea X una variable aleatoria con la siguiente funcin de probabilidad. Calcule la varianza
de X.

x
1, 2, 3, 4, 5
f (x) 15
0 en otro caso

Solucin
El esperado de X es
5
1 2 3 4 5 55
E X xi f xi 1 2 3 4 5
i 1 15 15 15 15 15 15

Se tiene que E X 2 15

2
55
Luego se tiene que V X E X 2 E X 15 1,556
2

15

Notas importantes
132 Estadstica Descriptiva 201702
Ejemplo 26
Se define la variable aleatoria X definida como el nmero de recargas de la tarjeta de los
usuarios del Metropolitano a la semana con la siguiente funcin de probabilidad.

X: Nmero de recargas 0 1 2 3 4
f(x) 0,10 4k 0,30 k 0,10

a. Determine el valor de k para que f(x) sea funcin de probabilidad

Para que f(x) sea una funcin de probabilidad debe cumplir que ( )

Por lo tanto, f(0) + f(1) + f(2) + f(3) + f(4) = 0,10 + 4k + 0,30 + k + 0,10 = 1, de donde k=
0,1

b. Calcule la probabilidad de que un usuario, elegido al azar, recargue su tarjeta ms de


una vez a la semana.

Se pide P(2 X 3) = f(2) + f(3) + f(4) =0,3 + 0,10 + 0,10 = 0,5

c. Si un usuario recarg una vez su tarjeta en una semana, calcule la probabilidad de


que dicho usuario recargue su tarjeta por lo menos una vez ms en esa semana.

( )
Se pide ( )
( )

d. Si el costo de una recarga es de cinco soles y el Metropolitano tiene 560 mil usuarios,
determine el monto esperado semanal por recargas.

Tenemos que ( ) ( )

El esperado del monto ser 1,7 x 5 x 560 000 = 4 760 000 nuevos soles

Notas importantes
Unidad 4. Variables aleatorias 133

Distribuciones de probabilidad de variables discretas


Distribucin binomial
Un experimento binomial consiste en una serie de n pruebas o ensayos, donde n se fija
antes de realizar el experimento.

Las pruebas son


Las pruebas son idnticas y
independientes entre s La probabilidad de xito
cada una de ellos puede
por lo que el resultado de un es constante
resultar en uno de dos
intento en particular de una prueba a otra
posibles resultados que
no influye en el resultado de y la denotamos como p.
denotan xito o fracaso.
cualquier otro.

Entonces para n intentos y la probabilidad p de xito en cualquier intento, la probabili-


dad de tener x xitos en los n intentos est dada por:

f x P X x C xn px 1 p
n x
x = 0, 1, 2,..., n

La variable binomial cuenta el nmero de xitos en n repeticiones semejantes e inde-


pendientes con probabilidad de xito constante.

Se dice que la variable aleatoria X sigue una distribucin binomial con parmetros n y p,
se denota X~B (n, p)

Es simtrica si p = 0,5. Para valores de p < 0,5 la distribucin tiene sesgo derecho y para
valores p>0,5 tiene sesgo izquierdo, independientemente de los valores de n.

Para valores de n suficientemente grandes (n > 50), y slo tomando en cuenta los valo-
res relevantes de probabilidad, la distribucin es prcticamente simtrica.

Media E X np

Varianza 2 V X np 1 p

En Excel 2010, use la funcin =DISTR.BINOM.N(Nm_xito, Ensayos, Prob_xito, acu-


mulado)

Notas importantes
134 Estadstica Descriptiva 201702
Caso Aerolnea Wayra
Objetivo especfico: Estimar la probabilidad de tener una emergencia mdica durante el
viaje.

La aerolnea sabe por experiencias pasadas que el 0,5% de los pasajeros tendr alguna
emergencia mdica durante el vuelo.

Si en un vuelo hay 120 pasajeros, calcule la probabilidad de que ningn pasajero tenga
una emergencia mdica durante el viaje. Asuma independencia entre un pasajero y otro.

Solucin

La variable en estudio X es ....

El rango o recorrido de la variable X es .......

La distribucin de la variable es ..

Sus parmetros son .......

La probabilidad pedida es

P(X) = f() = ........ .

Si en un vuelo hay 120 pasajeros, calcule la probabilidad de que, como mximo, un pasa-
jero tenga una emergencia mdica durante el viaje.

Solucin

La probabilidad pedida es

P(X) = ............ .

Si en un vuelo hay 120 pasajeros, calcule la probabilidad de que por lo menos dos pasa-
jeros tengan una emergencia mdica durante el viaje.

Solucin

La probabilidad pedida es

P(X) = .......... .

Calcule el valor esperado del nmero de pasajeros que tengan una emergencia mdica
durante un viaje de 160 pasajeros.

Solucin

El valor pedido es E(X) = .......... .

Notas importantes
Unidad 4. Variables aleatorias 135
Ejemplo 27
En el proceso de control de calidad se analiza 60 envases de los productos de Exprta-
me. Por investigaciones anteriores se sabe que la probabilidad de que un envase est en
mal estado es de 0,01.
Solucin
a. Se rechazarn los 60 productos si la probabilidad de seleccionar ms de dos envases
en mal estado es mayor al 30%, qu decisin se debe de tomar?

Lo primero es definir la variable que nos permitir resolver el problema.


Definamos la variable X:= nmero de envases en mal estado.

La variable X se tiene una distribucin binomial con parmetros: n= nmero de ensa-


yos = 60 y p = probabilidad de xito = 0,01.

El rango de X, es decir todos los valores que puede tomar la variable, es igual 0, 1,
2,, 60. Entonces, X B(n = 60; p = 0,01)
( ) ( )

Como la probabilidad pedida es menor al 30%, entonces los productos no sern re-
chazados.

b. Calcule el valor esperado y varianza del nmero envases en mal estado.

E(X) = n p = 60 x 0,01 = 0,6


V(X) = n p (1-p) = 60 x 0,01 x (1 0,01) = 0,594

Ejemplo 28
El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 1% de las usua-
rias y el 0,8% de los usuarios han sufrido de algn tipo de robo durante el uso del Me-
tropolitano. Si el sistema tiene 560 mil usuarios, calcule el nmero esperado de usuarios
que han sido vctimas de robo durante el uso del Metropolitano. Defina la variable nece-
saria y determine su distribucin.
Solucin
Sean los eventos:
R:= Que el usuario sea vctima de robo
H:= Que el usuario sea hombre
M:= Que el usuario sea mujer
( ) ( ) ( ) ( ) ( )= 0,0044 + 0,0045 = 0,0089

Sea la variable aleatoria Y:= nmero de usuarios que han sido vctima de robo.
Y B(n = 560 000; p = 0,0089)
E(Y) = np = 560 000 x 0,0089 = 4 984 usuarios

Notas importantes
136 Estadstica Descriptiva 201702
Ejemplo 29
Se sabe que el 12% de los usuarios del Metropolitano realizan conexiones de rutas. Si
elegimos al azar 80 usuarios.

a. Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, reali-


cen conexiones. Defina la variable, indique su distribucin, parmetros y rango.

Solucin
Sea X = cantidad de usuarios del Metropolitano que realizan conexiones de rutas en
la muestra
X B(n = 80; p = 0,12)
El rango de X es Rx = {0,1,,80}

P(8 X 9) = f(8) + f(9) = 0,2623

b. Sea la variable Y definida como el nmero de usuarios que realizan conexiones de los
560 mil usuarios. Calcule el valor esperado y varianza de Y.

Solucin
Y B(n = 560 000; p = 0,12)
E(Y) = np = 560 000 x 0,12 = 67 000.
V(Y) = np(1-p) = 59 136

Notas importantes
Unidad 4. Variables aleatorias 137

Distribucin hipergeomtrica
Consideremos N elementos, de los cuales r son considerados xitos y por lo tanto N - r
como fracasos. Como en el caso de la distribucin binomial estamos interesados en sa-
ber la probabilidad de obtener x xitos en una muestra de n elementos.
El experimento hipergeomtrico consiste en extraer al azar y sin sustitucin n elementos
de un conjunto de N elementos, r de los cuales son xitos y N - r son fracasos.

La probabilidad de obtener de x xitos en la muestra de n elementos es:


C xr CnNxr
f ( x) , x max{0, n (N r )},...,min{n, r }
CnN
El rango de X en la mayora de los casos va de 0 a n, pero no siempre, por lo que se debe
analizar en cada caso.
La variable hipergeomtrica cuenta el nmero de xitos en una muestra de tamao n,
tomada de una vez de una poblacin de tamao N donde hay r xitos.

Se dice que la variable aleatoria X sigue una distribucin hipergeomtrica con parme-
tros N, r y n y se denota X ~ H (n, r, N)
r
Media EX n
N
r r N n
Varianza 2 V X n 1
N N N 1

En Excel 2010, use la funcin =DISTR.HIPERGEOM.N(muestra_xito, nm_de_muestra,


poblacin_xito, nm_de_poblacin, acumulado)

Notas importantes
138 Estadstica Descriptiva 201702
Caso Aerolnea Wayra
En un vuelo se van a servir 130 comidas. La oficina de control de calidad de los alimentos
durante el vuelo selecciona al azar cinco de ellas para verificar que en perfecto estado.
Dentro de las 130 comidas, hay seis que no estn en perfecto estado.

Calcule la probabilidad de no detectar a ninguna de las comidas que no estn en perfec-


to estado.
Solucin

La variable en estudio X es ....

El rango o recorrido de la variable X es .......

La distribucin de la variable es ..

Sus parmetros son .......

La probabilidad pedida es

P(X) = f() = ..........

Calcule la probabilidad de detectar a una de las comidas que no estn en perfecto esta-
do.
Solucin

La probabilidad pedida es

P(X) = .......... .

Calcule la probabilidad de detectar a ms de una de las comidas que no estn en perfec-


to estado.
Solucin

La probabilidad pedida es

P(X) = ........... .

Calcule el valor esperado del nmero de comidas que no estn en perfecto estado que
sern detectadas.

Solucin

El valor pedido es E(X) = ......... .

Notas importantes
Unidad 4. Variables aleatorias 139
Ejemplo 30
Luego de embalar un contenedor de envases de productos de Exprtame, se tienen 60
envases, de los cuales 25 son frascos. Si selecciona una muestra aleatoria de 20 envases
para el control de calidad.

a. Calcule la probabilidad de que ocho envases sean de frasco.


Solucin
Definamos la variable X:= nmero de envases de frasco seleccionados.
La variable X se tiene una distribucin hipergeomtrica con parmetros:
N= 60 tamao de la poblacin
r = 25 nmero de xitos en la poblacin
n = 20 tamao de la muestra.

El rango de X, es decir todos los valores que puede tomar la variable, es igual 0, 1,
2,, 20. Entonces, X H(N = 60; r = 25; n = 20) y Rx = {0, 1,,20}
La probabilidad pedida es

( )
b. Calcule la variabilidad relativa de X respecto a la media.
Solucin
Lo que nos piden es calcular el coeficiente de variacin de X. Primero, hallemos el
esperado y la varianza de X.

( )

( ) ( )( ) ( )( )

El coeficiente de variacin de X es
( )
( )
( )
Ejemplo 31
La actriz Magaly Solier es la dcima sptima mujer en denunciar una agresin sexual en
un bus del Metropolitano, desde noviembre del 2012. De las 17 denuncias, solo una est
cerca de recibir sentencia. El agresor podra recibir de dos a cuatro aos de prisin sus-
pendida, cumplir trabajos comunitarios o pagar reparacin civil. Si se eligen al azar tres
de las denuncias de las 17 existentes. Calcule la probabilidad de elegir el caso que est
cerca de recibir sentencia.
Solucin
Sea X = nmero de casos que estn cerca de recibir sentencia
X H(N= 17; n = 3; r = 1) y Rx = {0,1}
P(X = 1) = f(1) = 0,1765

Notas importantes
140 Estadstica Descriptiva 201702

Distribucin de Poisson
El experimento que origina una variable aleatoria que sigue una distribucin de Poisson
se denomina proceso de Poisson y posee las siguientes propiedades:

El nmero de resultados La probabilidad de que ocurra un


que ocurre en un solo resultado durante el intervalo
La probabilidad de
intervalo o regin de muy corto o regin muy pequea
que ocurra ms de un
espacio cualquiera es es proporcional a la longitud del
resultado en tal
independiente intervalo
intervalo corto o caiga
del nmero que ocurre o al tamao de la regin
en tal regin pequea
en cualquier otro y no depende del nmero de
es insignificante.
intervalo o regin del resultados que ocurren fuera del
espacio disjunto. intervalo o regin.

La probabilidad de tener x resultados en un intervalo dado o en una regin especfica es:


e x
f x P X x
x = 0, 1, 2,...
x!
x = nmero de xitos por unidad de tiempo o regin.
= nmero esperado de xitos por unidad de tiempo o regin.
e = 2,71828

0.16
0.14
0.12
0.10
f(x)

0.08
0.06
0.04
0.02
0.00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X

Se dice que la variable aleatoria X sigue una distribucin de Poisson con parmetro y
se denota X~P().
Siempre es una distribucin sesgada a la derecha. A medida que aumenta y tomando
en cuenta slo los valores relevantes de probabilidad, la distribucin tiende a hacerse
simtrica.
Media: EX
Varianza: 2 V X
En Excel 2010, use la funcin =POISSON.DIST(x, media, acumulado)

Notas importantes
Unidad 4. Variables aleatorias 141
Caso Aerolnea Wayra
El nmero de llamadas hacia una azafata por los pasajeros durante un vuelo se modela
con una variable Poisson con una media de 0,5 llamadas cada diez minutos.

Calcule la probabilidad de que una azafata no reciba ninguna llamada durante un viaje
de 50 minutos.
Solucin

La variable en estudio X es ....

El rango o recorrido de la variable X es .......

La distribucin de la variable es ..

Sus parmetros son .......

La probabilidad pedida es P(X) = f() = .........

Calcule la probabilidad de que una azafata reciba ms de una llamada durante un viaje
de 50 minutos.
Solucin

La probabilidad pedida es P(X) = .......... .

Si una azafata ya recibi una llamada durante los primeros minutos del viaje, calcule la
probabilidad de que reciba dos llamadas ms durante dicho viaje de 50 minutos.
Solucin

Calcule la desviacin estndar del nmero de llamadas hacia la azafata en un vuelo de


dos horas.

Solucin

Notas importantes
142 Estadstica Descriptiva 201702
Ejemplo 32
Suponga que el nmero de llamadas que llegan a una central telefnica es 0,5 por mi-
nuto en promedio.
Calcule la probabilidad de que en un minuto no lleguen llamadas
Solucin
X:= nmero de llamadas / minuto = 0,5 llamadas / minuto
e 0.5 0,50
P X 0 0,6065
0!

Calcule la probabilidad de que en un minuto lleguen ms de tres llamadas


Solucin
P(X > 3) = 1 P(X 3) = 1 (0,6065 + 0,3033 + 0,0758 + 0,0126) = 0,9982

Calcule la probabilidad de que en tres minutos lleguen menos de cinco llamadas


Solucin
Y:= nmero de llamadas / 3 minutos = 1,5 llamadas / 3 minutos
P(Y < 5) = 0,2231 + 0,3347 + 0,2510 + 0,1255 + 0,0471 = 0,98142

Calcule la probabilidad de que en cinco minutos lleguen ms de dos llamadas


Solucin
W:= nmero de llamadas / 5 minutos = 2,5 llamadas / 5 minutos
P(W > 2) = 1 P(W 2) = 1 (0,0821 + 0,2052 + 0,2565) = 0,45652

Ejemplo 33
El administrador de un almacn ha observado que en promedio ingresan al estableci-
miento 20 personas cada 30 minutos. Cul es la probabilidad de que en seis minutos
ingresen al almacn a lo ms 5 clientes pero ms de 3?

Solucin
Lo primero es definir la variable adecuada, sea X:= nmero de personas que entren al
establecimiento en un periodo de seis minutos.
Como nos dicen que la variable cuenta las llegadas por unidad de tiempo, se tiene que
X ~ P().
Luego, debemos determinar el valor de , para lo cual vamos a hacer una regla de tres
simple, pues es una propiedad de la distribucin Poisson.
Si en 30 minutos llegan en promedio 20 personas, entonces en 6 minutos llegarn, en
promedio, ,= 4 personas.
Se tiene que X ~ P( = 4)
e 4 44 e 4 45
Nos piden P 3 X 5 P X 4 P X 5 0,3517
4! 5!

Notas importantes
Unidad 4. Variables aleatorias 143

Ejemplo 34
Si se sabe que en cada 100 metros de longitud de un cable hay un promedio de 80 pun-
tos por los cuales este puede ser seccionado. Cul es la probabilidad de que en un
tramo de 13,5 metros se encuentren cinco puntos de seccionamiento?

Solucin
Sea X:= nmero de puntos de seccionamiento. Como nos dicen que la variable cuenta
puntos por unidad de longitud, se tiene que X ~ P().

Luego, debemos determinar el valor de , para lo cual vamos a hacer una regla de tres
simple, pues es una propiedad de la distribucin Poisson.

Si en 100 metros hay en promedio 80 puntos de seccionamiento, entonces en 13,5 me-


tros hay, en promedio, ,= 10,8 puntos.

Se tiene que X ~ P( = 10,8)


e 10.8 10.85
Nos piden P X 5 0,025
5!

Observe que si lambda sale un valor que no es entero, no se debe redondear a un en-
tero.

Ejemplo 35
El nmero de unidades envasados por una persona se modela con una variable Poisson
con un promedio 10 unidades por cada 20 minutos.

a. Cul es la probabilidad de que en 20 minutos se envasen 12 productos?

P(X = 12) = 0,095

b. Si la mquina funciona durante dos horas consecutivas, calcule la probabilidad de


que se hayan envasado 50 productos.

1 = 60 unidades en dos horas


P(X = 50) = 0,0233

Notas importantes
144 Estadstica Descriptiva 201702

Variable aleatoria continua


Es una variable cuyo rango es un conjunto infinito no numerable de valores.
Por ejemplo: peso, en kilos, de una persona, tiempo en resolver la primera pregunta del
examen parcial de un curso o volumen, en decibeles, en una discoteca a una hora de-
terminada.

Funcin de densidad de una variable aleatoria continua


Se denomina funcin de densidad de probabilidad f(x) de una variable aleatoria conti-
nua a la funcin que satisface:
f x 0 para todo x R

f x dx 1

b
Se tiene que P a X b f x dx
a

Ejercicio 48
Una variable aleatoria continua tiene la siguiente funcin de densidad de probabilidad:
ax 0 x 7
f x
0 en otro caso
Determine el valor de a.

Calcule la probabilidad de P(X < 3)

Calcule la probabilidad de P(4 < X < 6)

Notas importantes
Unidad 4. Variables aleatorias 145
Ejemplo 36
Para cierto negocio por correo electrnico la proporcin de los pedidos procesados en
24 horas tiene la funcin de densidad de probabilidad.

f (x) 2(1 x) ; 0 x 1
Compruebe si f(x) es una funcin de densidad.
Solucin
Se debe comprobar que:
- f x 0 para todo x R. Este se cumple pues para 0 x 1 , es f (x) 2 (1 x) 0

- f x dx 1 . Existen dos formas de responder esta pregunta.

Integrando la funcin de densidad f(x) y verificando que el rea es igual a 1 y que cada
f(x) sea positivo
1
x2
f x dx 2 (1 x) dx 2 x 2
1 1

1
2x x 2
0 0 2 0
0

Ahora debemos evaluar en 0 y en 1


2 1 12 2 0 02 1

Calculando el rea del tringulo a partir de la grfica y verificando que el rea es igual a
1 y que cada f(x) sea positivo.
b h 12
rea 1
2 2
Cul es la probabilidad que al menos el 80% de los pedidos sean procesados dentro de
24 horas?
Solucin
Existen dos formas de responder esta pregunta.
Integrando la funcin de densidad f(x) de 0,8 a 1.

2 1 x 2 1 1 2 0,8 0,8 0,04


1
2 2
0,8

Calculando el rea de tringulo desde 0,8 a 1.


b h 1 0,8 2 1 0,8
rea
0,04
2 2
Observe que para la segunda forma de resolucin, se us la funcin de densidad para
hallar la altura del tringulo.

Si el porcentaje de pedidos procesados en 24 horas es mayor al 80%, calcular la probabi-


lidad de que sea mayor a 90%.
Solucin
P(X > 0,9 / X > 0,8) = (0,1 x 0,2 / 2) / (0,2 x 0,4 / 2) = 0,25

Notas importantes
146 Estadstica Descriptiva 201702
Ejemplo 37
La distancia, en metros, que recorre un usuario caminando para llegar a una estacin del
Metropolitano se modela con la variable aleatoria X con la siguiente funcin de densi-
dad.

( ) {

a. Calcule el esperado y la varianza de X.

Solucin
Primero hallemos a

De donde a= 1/250.

Ahora calculemos el esperado y la varianza de X.

( )

( )

b. Calcule la probabilidad de que un usuario camine entre 300 y 700 metros para llegar
a una estacin.

Solucin

( )

Notas importantes
Unidad 4. Variables aleatorias 147

Funcin de distribucin acumulada de probabilidad


La funcin de distribucin acumulada de una variable aleatoria continua X con funcin
de densidad f(x) se define por:
F(x) = P(X x) para - < x < +
Se tiene que:
P(a < X b) = F(b) F(a)
Propiedades
P(a < X < b) = P(a X < b) = P(a < X b) = P(a X b)
dF x
f x
dx
F(x) es una funcin que siempre est entre 0 y 1 (0 F(x) 1), pues es igual a una proba-
bilidad.
F(x) es una funcin que nunca decrece, lim F x 0 y lim F x 1
x x

1.0
F(x)
0.8
0.6
0.4
0.2
0.0
-2 -1 0 1 2 3 4 5

Ejercicio 49
Marque la(s) grfica(s) que pueden ser funciones de distribucin acumulada.

Notas importantes
148 Estadstica Descriptiva 201702
Ejercicio 50
Indique la(s) funciones que pueden ser funcin de distribucin acumulada.
1 x 2

F x x 1 1 x 2
0 x 1

1 x 2
2
F x x 1 1 x 2
0 x 1

Ejercicio 51
Sea X una variable aleatoria con la siguiente funcin de densidad
ax 6 0 x 6
f (x)
0 en otro caso
Determine y grafique la funcin de distribucin acumulada de la variable aleatoria X.

Use la funcin de distribucin acumulada de la variable X para calcular P(3 < X < 5)

Notas importantes
Unidad 4. Variables aleatorias 149
Ejemplo 38
Encuentre el rango intercuartil de X, si X es el tiempo de vida de un sistema es una va-
riable aleatoria, en aos, cuya funcin de distribucin acumulada es:
0 x5

F x 25
1 x 2 x 5

Solucin
Sea X:= tiempo, en aos, de vida de un sistema. Para calcular el rango intercuartil, de-
bemos hallar el cuartil 1 y el cuartil 3, para esto hay dos posibilidades: integrar la funcin
de densidad f(x) o reemplazar en la funcin de distribucin acumulada.

Por definicin de cuartil 3, el 75% de los datos es menor o igual a l, es decir P(X Q3) =
0,75, o lo que es lo mismo F(Q3) = 0,75
25
F Q3 0,75 1 de donde Q3 = 10.
Q32
25
Haciendo lo mismo para el cuartil 1. F Q1 0,25 1 de donde Q1 = 5,77.
Q12
Luego el RIC = Q3 Q1 = 4,23.

Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior,


cul es la probabilidad que pertenezca al quinto superior?
Solucin
Como nos dicen que ya se sabe que est en el cuarto superior, es una probabilidad
condicional.
P X P80 0,20
P X P80 X P75 0,80
P X P75 0,25

Notas importantes
150 Estadstica Descriptiva 201702

Valor esperado de una variable aleatoria continua


El valor esperado o esperanza matemtica de una variable aleatoria X o media de una
variable aleatoria X se denota E(X).

X E X x f x dx

Valor esperado de una funcin de variable aleatoria continua


Sea G(X) una funcin de la variable aleatoria X. El valor esperado de G(X) es:

E G X G x f x dx

Propiedades del valor esperado en variables aleatorias


E(b) = b
Si X1, X2, X3, . . ., Xn son n variables aleatorias, y a1, a2, a3, . . ., an son n constantes, enton-
ces:
E a1 X1 a2 X2 an Xn a1E X1 a2E X2 anE X n

Si X1, X2, X3, . . ., Xn son n variables aleatorias con la misma funcin de densidad, enton-
ces se cumple que E Xi y, por lo tanto:
E X1 X2 ... Xn n

Caso Aerolnea Wayra


El tiempo, en minutos, que se tarda una persona en ser atendido en el counter del aero-
puerto se modela con una variable aleatoria X:
kx 0 x 3

f (x) k6 x 3 x 6
0 en otro caso

Determine la media de la variable aleatoria X.

Notas importantes
Unidad 4. Variables aleatorias 151

Varianza y desviacin estndar de una variable aleatoria continua

X2 V X E X 2 E X
2

La desviacin estndar de X es la raz cuadrada de la varianza de X.

Propiedades de la varianza en variables aleatorias


Si Y = aX + b, con a y b son constantes, entonces Y2 a2 X2

Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes, y a1, a2, a3, . . ., an son n
constantes, entonces:
V a1 X1 a2 X2 an Xn a12V X1 a22V X2 an2V X n

Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes con la misma funcin de
densidad, entonces se cumple que V Xi 2 y, por lo tanto:
V X1 X2 ... Xn n 2

Caso Aerolnea Wayra


El sobrepeso, en kilos, del equipaje de mano de un pasajero se modela con una variable
aleatoria X con la siguiente funcin de densidad de probabilidad:
k8 - x 0 x 8
f ( x)
0 otro caso
Determine la desviacin estndar de la variable aleatoria X.

Notas importantes
152 Estadstica Descriptiva 201702

Distribuciones de probabilidad de variable continua

Distribucin uniforme

Funcin de densidad
1
ax b
f x b a

0 en otro caso

Se dice que X tiene una distribucin uniforme y se denota X ~ U (a, b)


La funcin de distribucin acumulada de una variable uniforme es:
0 x a
x a

F x axb
b a

1 x b

ab
Media:
2
b a
2

Varianza:
2

12

Notas importantes
Unidad 4. Variables aleatorias 153
Caso Aerolnea Wayra
Objetivo especfico: Determinar el nmero esperado de vuelos con retraso.

El tiempo en el que un avin llega a su destino con respecto a su hora programada se


modela con una variable aleatoria uniforme de parmetros -15 y 15. De tal manera que
los valores negativos indican que el avin lleg antes de la hora programada y los valo-
res positivos indican que el avin lleg despus de la hora programada.

Calcule la probabilidad de que un avin llegue con un adelanto mayor a cinco minutos.

Calcule la probabilidad de que la diferencia entre la hora de llegada programada y la ho-


ra de llegada sea mayor a seis minutos.

Use la funcin de distribucin acumulada para calcular la probabilidad de que un avin


llegue con un retraso mximo de ocho minutos.

Si se escoge al azar 20 vuelos, calcule la probabilidad de que, como mximo, se tenga un


vuelo con retraso mayor a ocho minutos.

Notas importantes
154 Estadstica Descriptiva 201702

Ejemplo 39
En ciertos experimentos, el error cometido al determinar la densidad de una sustancia
es una variable aleatoria cuya distribucin es uniforme con a = -0,025 y b = 0,025.
a. Cul es la probabilidad de que tal error est entre 0,010 y 0,015?
Solucin
Sea X:= error al determinar la densidad de una sustancia
La variable X ~ U(a = -0,025, b = 0,025) tiene la siguiente funcin de densidad
1
0,025 x 0,025
f (x) 0,025 (0,025)
0 en otro caso

1
0,025 x 0,025
f (x) 0,05
0 en otro caso

Nos piden P(0,010 X 0,015) . Existen dos formas de calcular esta probabilidad: inte-
grando la funcin de densidad f(x) o calculndola a partir del rea del rectngulo.
0,015
1 1
P(0,010 X 0,015) dx 0,015 0,010 0,10
0,010
0,050 0,050
b. Cul es el error esperado cometido?
Solucin
La variable X ~ U(a = -0,025, b = 0,025) tiene el siguiente nmero esperado de errores


a b 0,025+0,025 0
2 2
Ejemplo 40
La llegada de cada uno de los empleados a su centro de labores se produce indepen-
dientemente, de acuerdo a la distribucin uniforme en el intervalo comprendido entre
las 8:00 y 8:25 am. De una muestra de 10 empleados, calcule la probabilidad de que cua-
tro de ellos hayan llegado entre las 8:15 y 8:20 AM.
Solucin
Sea X:= tiempo, en minutos, desde las 8 AM hasta la hora de llegada de los empleados al
centro de trabajo, luego XU (0, 25)
1
f ( x)
; 0 x 25
25
Se define la variable Y:= nmero de empleados que llegan al centro de trabajo entre
8:15 y 8:20 AM. Debe calcularse la probabilidad de xito p de que un empleado llegue al
centro de trabajo entre 8:15 y 8:20 AM esto es:
20 15
p 0,20
25
Entonces Y B(10; 0,20)
f (y) Cy10 (0,20)y (0,80)10y , y 0,1, ,10
Se pide P(Y 4) f (4) C410 (0,2)4 (0,80)6 0,0881

Notas importantes
Unidad 4. Variables aleatorias 155

Distribucin normal

Funcin de densidad
2
1 x
1
f x e 2

2
Se dice que la variable aleatoria X sigue una distribucin normal con parmetros y .
Se denota X ~ N (, 2)

La funcin de densidad tiene forma de campana y es simtrica, por lo que las medidas
de tendencia central coinciden.
El rango de la variable normal es toda la recta real, esto es, de a + .
En Excel 2010, use la funcin =DISTR.NORM.N(x, media, desviacin estndar, acumula-
do)
En Excel 2010, use la funcin =INV.NORM(Probabilidad, media, desviacin estndar)

Estandarizacin
Se toma como referencia una distribucin normal estndar ( = 0 y 2 = 1). Se trabaja
con la distancia entre x y en funcin de la desviacin estndar, tal como se muestra.
X
Z

Notas importantes
156 Estadstica Descriptiva 201702
Ejercicio 52
Si Z ~ N 0, 2 1 , calcular

P(Z < 1,18) =

P(Z > 0,67) =

P(0,13 < Z < 1,17) =

Hallar c para que P(Z < c) = 0,67003

Tabla de la distribucin normal estndar


z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891

1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147

Notas importantes
Unidad 4. Variables aleatorias 157
Ejercicio 53
La cantidad de dinero destinada al ahorro mensual de los clientes de un banco es una
variable aleatoria que tiene una distribucin normal con una media igual a 400 soles y
una desviacin estndar igual a 50 soles.
Calcule la probabilidad de que un cliente ahorre menos de 430 soles en un mes.

Calcule la probabilidad de que un cliente ahorre ms de 470 soles mensuales.

Calcule la probabilidad que el ahorro mensual de un cliente est entre 460 y 520 soles.

Cul es el ahorro mnimo mensual para estar en el 15% de los clientes que ms aho-
rran?

Notas importantes
158 Estadstica Descriptiva 201702
Cul es el ahorro mximo mensual para estar en el 25% de los clientes que menos aho-
rran?

Si se elige al azar a 3000 clientes, calcule el valor esperado del nmero de clientes que
ahorran ms de 450 soles.

Ejemplo 41
El gasto mensual de un usuario en el Metropolitano se modela con una variable normal
con media de 100 nuevos soles y una desviacin estndar de cinco nuevos soles. Se elige
un usuario al azar.

a. Calcule la probabilidad de que gaste entre 90 y 110 nuevos soles.

Sea X = gasto mensual en nuevos soles. X ~ N(100; 52)

P(90 X 110) = P( X 110) - P(X 90) = 0,9772 0,0228 = 0,9545

b. Cul es la probabilidad de que gaste ms de 105 nuevos soles?


P(X > 105) = 1 - P( X 105) = 1 - 0,8413 = 0,1587

c. Determine el gasto mensual mnimo para que est en 10% de los que ms gastan.
( ) ( ) )

Buscando en la tabla, . Luego, a = 106,4.

Notas importantes
Unidad 4. Variables aleatorias 159
Ejemplo 42
En Buck Caf, la mquina surtidora de refrescos est ajustada de tal forma que sirve en
promedio 250 mililitros por vaso. Si la cantidad de refresco servido en los vasos sigue,
aproximadamente, una distribucin normal con una desviacin estndar de 10 mililitros.
Qu proporcin de los vasos servidos contendrn entre 240 y 255 mililitros de refres-
co?

Solucin
Sea X:= cantidad de refresco servido por vaso, X ~ N( = 250, 2 = 102)

Se pide P(240 X 255). Estandarizando se tiene

240 X 255
P

240 250 255 250
P Z
10 10
P 1 Z 0,5 0,5 1
0,6915 0,1587 0,5328

Ejemplo 43
Se informa que la cantidad X de azcar de los paquetes marcados con un kilo, tiene dis-
tribucin normal con media kilogramos y desviacin estndar 0,02 kilogramos. Hallar
el valor de si la cantidad de azcar que contiene cada paquete es menor o igual a 0,95
kilos con probabilidad 0,102.

Solucin
Sea X:= pesos de los paquetes de azcar, en kilogramoss. X ~ N( , 2 = 0,022)

Se pide P X 0,95 0,102

Estandarizando se tiene

X 0,95
P 0,102

0,95
P Z 0,102
0,02

Usando la tabla normal estndar para calcular el valor z correspondiente.

0,95
1,27 . De donde = 0,9754
0,02

Notas importantes
160 Estadstica Descriptiva 201702

Distribucin exponencial
En variables que representan los tiempos de vida til, tiempos de sobrevivencia, en
tiempos de ocurrencia en procesos de Poisson se suele utilizar la distribucin exponen-
cial.

La variable aleatoria X tiene una distribucin exponencial con parmetro ( > 0) si su


funcin de densidad de probabilidad es:
x
1

f ( x) e ; x0

Se denota X ~ Exp() y se lee que la variable aleatoria X sigue una distribucin exponen-
cial con parmetro .

La probabilidad de que la variable aleatoria X tome valores en el intervalo [c,d] es num-


ricamente igual al rea sombreada, y se calcula de la siguiente manera:

Pc X d
d 1 t

c
1
e dt

Esperanza de X: E X

Varianza de X: 2 V X 2

Ntese que el parmetro es igual a la media de la variable aleatoria.

Funcin de distribucin acumulada de X


t t x
1
F ( x ) P X x e

dt 1 e
; x0
0

Se cumple que:
x

P X x e

P X k t / X k P X t

Notas importantes
Unidad 4. Variables aleatorias 161
Caso Aerolnea Wayra
El tiempo de vida til de tipo de una llanta de avin se modela con una variable aleatoria
con distribucin exponencial, cuya media es 20 das.

Calcule la probabilidad de que la vida til de una llanta sea menor a 15 das.

Calcule la probabilidad de que la vida til de una llanta est entre 15 y 25 das.

Si una llanta ya dur 22 das, calcule la probabilidad de que la vida til de esa llanta sea
menor a 26 das.

Notas importantes
162 Estadstica Descriptiva 201702

Ejercicios de la Unidad 4
51. En un lote de 30 polos hay tres con fallas. Se toma una muestra aleatoria de cinco polos y
se define la variable aleatoria X como el nmero de polos defectuosos en la muestra. De-
termine y grafique la funcin de probabilidad de la variable X.

Calcule la probabilidad de tener dos polos defectuosos en la muestra.

Calcule la probabilidad de tener al menos dos polos defectuosos en la muestra.

52. La demanda diaria de un producto es una variable aleatoria X cuya distribucin de pro-
babilidades es simtrica y est dada por la tabla siguiente:

x 1 2 3 4 5
f(x) a 0,20 b c 0,05

La empresa obtiene por cada unidad demandada de producto 100 soles de utilidad. Si la
cantidad demanda en un da es mayor a dos unidades, se obtiene una utilidad adicional
de 15 soles por unidad demandada de producto.
Calcule el valor de a, b y c.
Determine la probabilidad que la demanda diaria sea de por lo menos tres productos.
Calcule el valor esperado de la utilidad por la demanda diaria de productos.
53. Indique si son verdaderas o falsas las siguientes afirmaciones.

Afirmacin Verdadero Falso

Se denomina variable aleatoria a una descripcin numrica del


resultado de un experimento

El valor esperado es el valor ms probable de ocurrencia

El valor esperado es un valor que puede ser mayor que el mximo


de los valores del rango de la variable aleatoria

El valor esperado es un valor que siempre es igual a uno de los


valores del rango de la variable

Variable aleatoria continua es una variable cuyo rango es un con-


junto infinito numerable de valores

La funcin de distribucin acumulada es siempre mayor a la fun-


cin de densidad para cualquier valor de la variable aleatoria

El esperado de la suma de dos variables aleatorias es igual a la


suma de los dos esperados de las variables aleatorias

La varianza de una variable aleatoria puede ser menor a cero

Notas importantes
Unidad 4. Variables aleatorias 163
54. Un examen de admisin consta de 100 preguntas. Cada una pregunta tiene cinco opcio-
nes para marcar y solamente una respuesta correcta Por cada respuesta correcta se le
otorga al postulante un punto, mientras que si la respuesta es incorrecta al postulante se
le resta un cuarto de punto. Si un postulante contesta todas las preguntas del examen al
azar, calcule el valor esperado del puntaje obtenido.

55. Se lanza un dado una vez, sea la variable aleatoria X igual al nmero de la cara superior.
Calcule la varianza y desviacin estndar de la variable X.

56. Se lanzan dos dados y sea la variable aleatoria X igual a la suma de los nmeros de las ca-
ras superiores. Calcule la varianza de la variable X.

57. Un restaurante pone a la venta diariamente diversas ensaladas. El nmero de ensaladas


demandadas diariamente se modela con una variable aleatoria X que tiene la siguiente
distribucin de probabilidad.

x 12 15 17 18 20 25
f(x) a 0,12 0,35 2a 0,14 0,09

El costo de cada ensalada es de cuatro nuevos soles y las vende a seis soles. Toda ensa-
lada no vendida en el da se desecha. Calcule la media y desviacin estndar de la utili-
dad diaria, si el restaurante prepara 20 ensaladas por da.

58. Una compaa de comida rpida sabe que el 90% de sus tiendas por franquicia tendrn
xito comercial. Si el xito de cada tienda se puede considerar independiente de las de-
ms tiendas. Calcule la probabilidad de que al menos dieciocho tiendas tengan xito, si la
compaa va a instalar 20 tiendas el ao 2015.

59. Segn la Asociacin para el Fomento de la Infraestructura Nacional el 48% de los hogares
de Lima no tienen acceso a agua potable de calidad, por no contar con la dosificacin
adecuada de cloro o comprarla de manera informal a los camiones cisternas. Si se eligen
al azar a diez hogares de Lima, calcule la probabilidad de que cinco de ellos no tengan ac-
ceso agua potable de calidad.

60. La empresa San Fernando ha lanzado su campaa Plato calato no para salvar sus ven-
tas de verano 2013. Si de un total de 60 personas, donde 34 recuerdan la campaa, se
eligen al azar a ocho personas para entrevistarlos, calcule la probabilidad de elegir al me-
nos a tres personas que recuerden la campaa.

61. En una distribuidora hay 25 televisores de los cuales seis son de tecnologa OLED. Si se
seleccionan al azar diez televisores, calcule la probabilidad de que se haya seleccionado
por lo menos dos televisores de tecnologa OLED.
62. Un comerciante recibe un lote de 30 computadoras porttiles. Para protegerse de una
mala remesa, el comerciante revisar diez computadoras y rechazar todo el lote si en-
cuentra una o ms computadoras defectuosas. Si en el lote hay seis computadoras defec-
tuosas, cul es la probabilidad de que rechace el lote?

63. En una pastelera, el nmero demandado de un cierto tipo de torta se modela con una
variable Poisson con una media de tres tortas al da. La pastelera, siempre, produce tres
tortas diarias. Cada torta cuesta producirla 50 nuevos soles y se vende a 80 nuevos soles.
Toda torta no vendida en el da se remata en 20 soles y siempre las compran todas las
tortas a ese precio. Calcule el valor esperado de la utilidad por dicho concepto.
Notas importantes
164 Estadstica Descriptiva 201702
64. Indique si son verdaderas o falsas las siguientes afirmaciones.

Afirmacin Verdadero Falso

El mayor valor del rango de la variable hipergeomtrica es siempre


menor o igual a n

En un proceso de Poisson el nmero de resultados que ocurre en un


intervalo es independiente del nmero que ocurre en cualquier otro
intervalo del espacio disjunto

La variable binomial cuenta el nmero de xitos en n repeticiones


independientes con la misma probabilidad de fracaso en cada repe-
ticin

La variable hipergeomtrica cuenta el nmero de xitos en una


muestra de tamao n de una poblacin N que tiene r xitos y donde
el muestreo es con reemplazo

65. La duracin (en minutos) de una llamada telefnica en la sala de profesores puede mode-
larse por una variable aleatoria X con la siguiente funcin de densidad

a 3 x 0 x 3
f x
0 en otro caso
Determine el valor de a.
Calcule la probabilidad de que una llamada dure menos de un minuto y medio.
Si una llamada ya dur un minuto, calcule la probabilidad de que dure ms de dos minu-
tos.
66. La proporcin de personas que responden a una encuesta enviada por correo electrnico
se modela con una variable aleatoria X con la siguiente funcin de densidad

2x 9
0 x 1
f x 10

0 en otro caso

Determine y grafique la funcin de distribucin acumulada de la variable aleatoria X.


Use la funcin de distribucin acumulada para calcular la probabilidad de que respondan
entre 60% y 80% de las personas a la encuesta.
Use la funcin de distribucin acumulada para calcular la mediana de X.
67. El gerente comercial de la sucursal de Santiago de Surco informa que el gasto mensual,
en cientos de nuevos soles, por la venta de libros a sus clientes es una variable aleatoria
que tiene la siguiente funcin de densidad:

( ) {

Calcule el valor esperado del gasto mensual en libros.

Notas importantes
Unidad 4. Variables aleatorias 165
68. La variable X se distribuye uniformemente con media igual a 24 y varianza igual a 12, cal-
cular los parmetros de la funcin de densidad.

69. La funcin de Excel =ALEATORIO() genera un nmero con distribucin uniforme con pa-
rmetros a igual a cero y b igual a uno. Sea X una variable aleatoria definida como el n-
mero generado por dicha funcin.
Calcule la probabilidad de que la funcin genere un nmero aleatorio entre 0,2 y 0,7.
Use la funcin de distribucin acumulada para calcular P(0,15 < X < 0,55).
70. El tiempo, en minutos, que demora un servicio de delivery en entregar una pizza puede
modelarse por una variable aleatoria uniforme con parmetros 10 y 38. Si la pizza se tar-
da ms de 30 minutos en ser entregada, el cliente no la pagar.

Si una familia pide una pizza, calcule la probabilidad de que le salga gratis.
Si la familia pide una pizza diaria durante diez das seguidos, calcule la probabilidad de
que por lo menos una de ellas le salga gratis.
Una familia pidi una pizza hace 25 minutos y an no ha llegado, cul es la probabilidad
de que le salga gratis?
71. Una compaa ha comprado una prueba para seleccionar personal. Los que han disea-
do la prueba saben que las notas siguen una distribucin normal con una media de 75
puntos y una desviacin estndar de diez puntos. Calcule la probabilidad de que una
persona que rinda esta prueba obtenga una nota superior a 90 puntos.

72. En una ciudad se estima que la temperatura mxima en un da del mes de enero puede
modelarse con una variable normal con media 30C y desviacin estndar 2C.

Si se escoge al azar un da del mes de enero, calcule la probabilidad de que la tempera-


tura mxima sea menor a 31C.
Si se escoge al azar un da del mes de enero, calcule la probabilidad de que la tempera-
tura mxima est entre 28,5 y 32C.
Calcule el nmero esperado de das en el mes de enero en que la temperatura mxima
es mayor a 33C. Asuma independencia entre las temperaturas de un da y otro.
73. Marque la opcin correcta.

La moda de una variable aleatoria normal X es:


a. Igual a cero
b. El esperado de X
c. Aquel valor para el cual f(Me) = 0,5, donde f es la funcin de densidad de X
d. No se puede determinar sin saber la desviacin estndar.
e. Es el valor que acumula ms del 50% del rea
74. La vida til, en meses, de un artefacto elctrico es una variable aleatoria con distribucin
exponencial con parmetro . El fabricante afirma que el 90% de estos componentes
tienen una vida til que supera los 60 meses. Cul es la media de la vida til de estos
componentes?

Notas importantes
166 Estadstica Descriptiva 201702
75. Indique si son verdaderas o falsas las siguientes afirmaciones.

Afirmacin Verdadero Falso

La media de una variable normal puede ser negativa

Si Z es una variable normal estndar P(Z > c) = 0,025, en-


tonces c = -1,96

Si X es una variable normal se cumple que


P(X < c) = P (X c)

Si Z es una variable normal estndar se cumple que


P(Z < -c) = 1 - P (Z < c)

Si X es una variable normal se cumple que


P(X < -c) = 1 - P(X < c)

El rango de toda variable normal es igual a toda la recta


real

La funcin de densidad de la distribucin normal toma su


mayor valor en X =

La funcin de densidad de la distribucin normal en algu-


nos casos no es simtrica

El esperado de una variable normal es siempre igual a

Notas importantes
Unidad 5 : Distribuciones muestrales

Logro de la unidad 5

Al finalizar la unidad 5,
el estudiante toma decisiones frente a situaciones reales de incertidumbre,
utilizando las distribuciones muestrales en el clculo de probabilidades.

Temario

Propiedad reproductiva de la distribucin normal


Distribucin muestral de un promedio
Teorema central del lmite
168 Estadstica Descriptiva 201702

Propiedad reproductiva de la normal


Si X1, X2, X3,..., Xn son n variables aleatorias independientes, tales que Xi ~ N(i, i2), para
cada i = 1, 2, 3,..., n, entonces, la variable aleatoria
S c1 X1 c2 X2 cn X n
donde c1, c2, c3,..., cn son constantes, entonces:

S ~ N c1 1 c2 2 cn n ; c12 12 c22 22 cn2 n2

La suma de
con otra es una
una
variable variable
variable
aleatoria aleatoria
aleatoria
normal normal
normal

Si X1, X2 son dos variables aleatorias normales independientes, tales que



X1 ~ N 1 , 12 ; X2 ~ N 2 , 22 , entonces, S X1 X2 ~ N c1 1 c2 2 ; c12 12 c22 22
Si X1, X2, X3,..., Xk son n variables aleatorias normales independientes, tales que

Xi ~ N , 2 , para i = 1, 2, 3,..., n, entonces, S X1 X2 X n ~ N n ; n 2

Ejercicio 54
Sea X1 ~ N(1 = 7, 12 = 3) y X2 ~ N(2 = 10, 22 = 15) variables aleatorias independientes.
Calcule la distribucin de las siguientes variables:

S = X1 + X2

S = X1 - X2

S = 2X1 - 3X2

Notas importantes
Unidad 5. Distribuciones muestrales 169
Caso Aerolnea Wayra
Objetivo especfico: Analizar el peso de los pasajeros.
El peso de los pasajeros adultos de un avin se modela con una variable normal:
en mujeres, con media 65 kilos y desviacin estndar 15 kilos.
en hombres, con media 80 kilos y desviacin estndar 20 kilos.
Calcule la probabilidad de que 20 pasajeros hombres pesen ms de 1700 kilos.

Calcule la probabilidad de que 10 pasajeras mujeres y 10 pasajeros hombres pesen ms


de 1500 kilos.

Si en un avin donde el 60% de los pasajeros son mujeres, se elige una persona al azar,
calcule la probabilidad de que esta persona pese entre 70 y 80 kilos.

Notas importantes
170 Estadstica Descriptiva 201702
Ejemplo 44
Dos supermercados compiten por tomar el liderazgo del mercado. Un estudio reciente
de una compaa de investigacin de mercados, estim que las ventas diarias (en miles
de dlares) de los dos supermercados se distribuyen normalmente con medias de 15 y
17 y desviaciones estndar de 3 y 4 respectivamente.

Calcule la probabilidad de que el segundo supermercado obtenga mayores ventas que el


primer supermercado en el primer da.
Solucin
Sean las variables:
X: Ventas diarias del primer supermercado
Y: Ventas diarias del segundo supermercado
X N(15, 9); Y N(17, 16)
Se pide: P(Y > X) o su equivalente: P(Y X > 0)

Sea W = Y X, por la propiedad reproductiva de la distribucin normal, se tiene:


W N(17 15, 16 + 9), es decir: W N(2, 25)
P(Y X > 0) = P(W > 0)
W 0 2
P(W 0) P
5
P(W 0) P Z 0,40
P(W 0) 0,6554

Calcule la probabilidad de que la diferencia entre las ventas diarias de ambos supermer-
cados no supere los 1000 dlares.
Solucin
En este caso se pide calcular:
1 2 W 1 2
P W 1 P 1 W 1 P P 0,6 Z 0,2 0,1
5 5
1 2 W 1 2
P W 1 P 1 W 1 P P 0,6 Z 0,2 0,1465
5 5
1 2 W 1 2
W 1 P 1 W 1 P P 0,6 Z 0,2 0,1465
5 5

Notas importantes
Unidad 5. Distribuciones muestrales 171
Ejemplo 45
El peso de un usuario hombre del Metropolitano se modela con una variable normal con
media de 75 kilos y desviacin estndar de 15 kilos, mientras que para una usuaria mu-
jer con media de 60 kilos y desviacin estndar de 10 kilos. Si en un bus hay 50 hombres
y 30 mujeres.
a. Si se elige una persona al azar, calcule la probabilidad de que pese ms de 70 kilos.
Solucin
Sean los eventos
A: = una persona pese ms de 70 kilos
H:= Que el usuario sea hombre.
M:= Que el usuario sea mujer

Sean las variables aleatorias


X = peso de un hombre X ~ N(75; 152)
Y = peso de una mujer Y ~ N(60; 102)
Por teorema de la probabilidad total ( ) ( ) ( ) ( ) ( )
Calculemos cada una de las probabilidades condicionadas
( ) ( ) ( )
( ) ( ) ( )
Luego,

( ) ( ) ( ) ( ) ( )

b. Calcule la probabilidad de que el peso total de los 50 hombres y 30 mujeres supere


5500 kilos
Sea Y := el peso total de los 50 hombres y 30 mujeres

Por propiedad reproductiva de la normal,


( )
es decir,
( ).
Nos piden ( ) ( ) .

Notas importantes
172 Estadstica Descriptiva 201702

Definiciones
Debido a que, muchas veces, es imposible preguntarle o medir a toda la poblacin, un
estudio estadstico se inicia con la seleccin de una muestra.

El muestreo comprende por lo menos dos etapas:


La seleccin de las unidades
El registro de las observaciones

Muestreo con y sin reemplazo

Muestreo sin reemplazo

Las unidades se pueden seleccionar slo una vez.

Muestreo con reemplazo

Las unidades se puede seleccionar ms de una vez.

Poblacin finita e infinita

Muestreo aleatorio simple (poblacin finita)

Una muestra aleatoria simple de tamao n, de una poblacin finita de


tamao N, es una muestra seleccionada de tal manera que cada muestra
posible de tamao n tenga la misma probabilidad de ser seleccionada.

Muestreo aleatorio simple (poblacin infinita)

Una muestra aleatoria simple de tamao n, de una poblacin infinita es


aquella que se selecciona de tal forma que satisface las siguientes
condiciones:
cada elemento seleccionado proviene de la misma poblacin
cada elemento se selecciona de forma independiente.

Distribucin muestral de un estadstico

Es la lista de posibles valores de un estadstico y la probabilidad asociada a cada valor.

Notas importantes
Unidad 5. Distribuciones muestrales 173

Distribucin de la media muestral


Es la lista de todas las medias posibles de tamao n tomadas de una poblacin especfica
y sus probabilidades asociadas.
Se tiene que:
Media EX

2
Varianza V X
n

Factor de correccin por poblacin finita


Si el muestreo es sin reemplazo en poblaciones de tamao finito N, entonces debe usar-
N n
se el factor de correccin por poblacin finita
N 1
2 N n
Varianza V X
n N 1

Distribucin muestral de la media de una poblacin con varianza conocida


Si la poblacin sigue una distribucin normal con media y desviacin estndar en-
tonces:
2
Si el muestreo es con reemplazo X N ,
n
2 N n
Si el muestreo es sin reemplazo X N ,
n N 1
Ejercicio 55
Segn un informe del INEI, en el trimestre julio-agosto-setiembre del 2015, en Lima Me-
tropolitana, el ingreso promedio mensual proveniente del trabajo fue de 1557 nuevos
soles. Por investigaciones anteriores se sabe que la desviacin estndar es de 400 nue-
vos soles. Si se toma una muestra de 1000 personas, calcule la probabilidad de que la
media muestral est entre 1550 y 1590 nuevos soles. Asuma normalidad.

Notas importantes
174 Estadstica Descriptiva 201702

Teorema central del lmite

entonces la variable
Sean n variables aleatoria
aleatorias X1, X2, X3,...Xn independiente-
S = X1 + X2 + X3 +...+ Xn
independientes e mente de la
igualmente distribuidas tiene una distribucin distribucin de la
con media aproximadamente poblacin.
y varianza 2 normal a medida que n
crece,

Por propiedades de esperado y varianza se tiene que:


E S n
V S n 2
Se considera una buena aproximacin a la distribucin normal si n 30.
Del teorema central del lmite, se deduce que la distribucin muestral de la media X se
aproxima a la distribucin normal si n 30.

Caso Aerolnea Wayra


Objetivo especfico: Analizar el peso del equipaje de los pasajeros.

El peso del equipaje de los pasajeros de un avin se modela con una variable uniforme
con parmetros 10 y 30 kilos. Calcule la probabilidad de que el peso total del equipaje
de 500 pasajeros supere los 10050 kilos.

Notas importantes
Unidad 5. Distribuciones muestrales 175
Objetivo especfico: Analizar el tiempo de entrega de alimentos en un avin.

El tiempo, en segundos, que tarda un auxiliar de vuelo, en segundos, en servir las bebi-
das a un pasajero se modela con una variable aleatoria X con la siguiente funcin de
densidad:

a20 x 10 x 20
f x
0 en otro caso

Calcule la probabilidad de que un auxiliar de vuelo se demore ms de 23 minutos al ser-


vir a 100 pasajeros.

Notas importantes
176 Estadstica Descriptiva 201702

Ejemplo 46
El Metropolitano cuenta con una cuenta de correo para cualquier consulta, sugerencia,
queja o reclamo. El nmero de correos electrnicos que llegan a la cuenta de correo se
modela como una variable aleatoria Poisson con una media de ocho correos por da.
Solucin
a. Calcule la probabilidad que en medio da llegue ms de tres correos con consultas,
sugerencias, quejas o reclamos. Defina la variable necesaria y establezca su distribu-
cin, rango y parmetros.

Sea X = nmero de correos electrnicos que llegan a la cuenta de correo del Metro-
politano en medio da
y t = 0,5 da
X ~ P( = 4 correos )

P(X > 3) = 1- P(X 3) = 1 0,4335 = 0,5665

b. Si se eligen al azar 100 das, calcule la probabilidad que la cantidad total de correos
recibidos en esos 100 das est entre 790 y 810.

Sea Xi = nmero de correos electrnicos que llegan a la cuenta de correo del Metro-
politano en el da, i = 1,,100
Sea Y := cantidad total de correos en los 100 das

Por teorema central del lmite, ( ), es decir,


( ).

Nos piden ( ) ( ) .

Tambin se puede calcular usando la distribucin de la media muestral.

Nos piden ( ) ( )

Por teorema central del lmite, ( ), es decir, ( ).

Luego, ( ) ( )

Notas importantes
Unidad 5. Distribuciones muestrales 177
Ejemplo 47
Se define la variable aleatoria X: nmero de das a la semana que un usuario usa el Me-
tropolitano. Esta variable presenta la siguiente funcin de probabilidad.

X: Nmero de das 0 1 2 3 4 5 6 7
f(x) 0,05 0,10 0,15 0,15 0,20 0,25 0,05 0,05

a. Calcule el esperado y la varianza de X.

Usando la calculadora, E(X) = 3,55 y V(X) = 3,1475

b. Si se elige al azar una muestra de 1000 usuarios, calcule la probabilidad de que la


media muestral del nmero de das que usan el Metropolitana est entre 3,5 y 3,6
das.

Por teorema central del lmite, ( ) , es decir,


( ).

Nos piden ( ) ( ) .

Ejemplo 48
El tiempo de espera para tomar un bus de un usuario se modela con una variable uni-
forme con parmetros 0 y 10 minutos.
a. Si se elige un usuario al azar, calcule la probabilidad de que su tiempo de espera sea
mayor a ocho minutos.

X=: tiempo de espera para tomar un bus. X ~ U(0,10)

P(X > 8) = 0,20

b. Si se elige al azar a 500 usuarios, calcule la probabilidad de que la media del tiempo
de espera de esos 500 usuarios est en 4,8 y 5,2 minutos.

= (a+b)/2 = (0+10)/2 = 5
2= (10 - 0)2/12 = 8,3333

Por teorema central del lmite,


( ), es decir, ( )

Nos piden ( ) ( )

Notas importantes
178 Estadstica Descriptiva 201702

Ejercicios de la Unidad 5
76. En un estudio de evaluacin de la atencin de un servicio de cafeteras, los tiempos, en
minutos, que tardan en atender a un cliente las cafeteras A y B se modelaron con las va-
riables aleatorias X ~ N(4,9) y Y ~ N(5,16) respectivamente y de manera independiente.
Si en cada cafetera son atendidas 20 personas, halle la probabilidad de que el tiempo
total de atencin en la cafetera B sea mayor que el de la cafetera A.

77. Lima y El Cairo (Egipto) son las dos principales ciudades del mundo que estn situadas
en zonas desrticas y con extremo estrs hdrico. En Pars, Zurich o Berln, el consumo
promedio por persona de agua bordea los 130 litros por da. Sin embargo, segn una in-
vestigacin del Centro de Investigacin en Geografa Aplicada de la Pontificia Universi-
dad Catlica del Per, en Lima, el consumo promedio por persona asciende a 250 litros
por da. Adems, la desviacin estndar del consumo por persona se estima en 60 litros
por da. Si se toma una muestra aleatoria en Lima de 100 personas, calcule la probabili-
dad de que el consumo total muestral en un da sea menor a 24 mil litros.

78. La cantidad de mango que exporta una empresa mensualmente se modela con una va-
riable aleatoria con media de 25 toneladas y desviacin estndar de cuatro toneladas.
Encontrar la probabilidad de que la cantidad exportada en tres aos sea menor a 920
toneladas. Asuma independencia entre las cantidades mensuales exportadas.

79. El nmero de personas que llega a un concierto se modela con una variable Poisson con
una media de 3,1 personas por minuto. Calcule la probabilidad de que en una hora lle-
guen entre 180 y 190 personas.

80. Una familia tiene tres hijos. El monto de la propina semanal que se le da a cada hijo
puede modelarse como una variable normal. Al menor se le da en media 20 nuevos so-
les por semana con una desviacin estndar de 3 nuevos soles, al segundo hijo se le da
el doble que al menor y al mayor se le da el triple que al menor. Calcular la probabilidad
de que en cuatro semanas la suma total recibida en propinas por los tres sume ms de
500 nuevos soles.

81. Marque la afirmacin correcta.

El teorema del lmite central afirma que:


a. A medida que el tamao poblacional crece, la distribucin de la media poblacional
tiende a una distribucin normal
b. A medida que el tamao poblacional crece, la distribucin de la media muestral tien-
de a una distribucin normal
c. A medida que el tamao muestral crece, la distribucin de la media poblacional tien-
de a una distribucin normal
d. A medida que el tamao muestral crece, la distribucin de la media muestral tiende a
una distribucin normal
82. Marque la afirmacin correcta.

El teorema del lmite central afirma que:


a. La suma de variables aleatorias normales independientes es una variable normal
b. La suma de ms de 30 variables aleatorias normales independientes es una variable
normal

Notas importantes
Unidad 5. Distribuciones muestrales 179
c. La suma de ms de 30 variables aleatorias independientes es una variable normal
d. La suma de ms de 30 variables aleatorias independientes es aproximadamente
una variable normal

83. El nmero de vuelos nacionales cancelados en un da se modela con la siguiente funcin


de probabilidad:

x 0 1 2 3 4 5
f(x) 0,40 0,25 0,15 0,10 0,05 0,05

Se toma una muestra de 100 das, calcule la probabilidad de que se cancelen entre 125 a
135 vuelos nacionales.

Notas importantes
Unidad 6 : Muestreo

Logro de la unidad 6

Al finalizar la unidad 6,
el estudiante analiza situaciones reales, relacionadas con su especialidad,
en donde aplica la teora de muestreo.

Temario

Muestreo: Conceptos y definiciones bsicas: Poblacin, marco muestral, muestra


Censo y muestreo ventajas y desventajas.
Diseo de la encuesta por muestreo.
Tipos de muestreo:
No probabilstico
Probabilstico (aleatorio simple, aleatorio estratificado y sistemtico)
Unidad 6. Muestreo 183

Definiciones

Elemento
Es el objeto sobre el cual se hace la medicin. Tambin llamada unidad
elemental.

Poblacin muestreada
Es la coleccin de todos los elementos posibles que podran extraerse en
una muestra.

Marco muestral
Es una lista de los elementos que estn disponibles para su eleccin en la
etapa de muestreo.

Censo
Es el estudio completo de todos los elementos de la poblacin.

Parmetro
Es un resumen de una caracterstica de una poblacin.

Estadstico
Es un resumen de una caracterstica de una muestra.

Ejemplo 49

Notas importantes
184 Estadstica Descriptiva 201702

Ventajas y desventajas del muestreo frente al censo

Ventajas del muestreo

Ahorro de tiempo, dado que el nmero de


Ahorro de dinero debido a que se consideran
mediciones solo es de una parte
menos unidades para trabajar
representativa de la poblacin

Mayor precisin, la muestra puede ser ms


precisa porque reduce la magnitud de los
errores no muestrales, debido a que:
Existe menos personal necesario para hacer
Conveniencia, es conveniente el uso de una
las mediciones (u observaciones)
muestra si el estudio ocasiona la destruccin
Hay personal con mejor preparacin de la unidad estudiada
Puede variar las condiciones del estudio si
se demora su ejecucin

Desventajas del muestreo

La informacin proveniente de una muestra


Las estimaciones resultantes del muestreo no proporciona informacin tipo inventario
estn afectas al inevitable error de muestreo para cada uno de los elementos de la
poblacin

Las estimaciones no pueden subdividirse para


pequeos dominios de anlisis, considerando Requiere de personal especializado y
que no todos ellos pueden estar experimentado
representados debidamente en la muestra

Notas importantes
Unidad 6. Muestreo 185

Muestreo probabilstico
En el muestreo probabilstico, la seleccin de cada elemento de la muestra se hace si-
guiendo reglas matemticas de decisin. Todos los elementos de la poblacin tienen una
probabilidad real y conocida de ser seleccionados. Existen diversos mtodos de mues-
treo probabilstico como, por ejemplo:

Muestreo aleatorio simple


Se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de muestreo
de una poblacin que contiene un total de N unidades. Se garantiza que cada una de las
muestras posibles tiene la misma probabilidad de ser elegida.

Muestreo sistemtico
Se selecciona un primer elemento aleatoriamente y, luego, los dems elementos que
conformarn la muestra cada cierto intervalo. Este muestreo supone que se cuenta con
una enumeracin completa de los elementos de la poblacin.

Muestreo estratificado
Se selecciona la muestra de los diversos estratos. Un estrato es una parte de la pobla-
cin, cuyos elementos tienen caractersticas similares. El objetivo de estratificar la po-
blacin es buscar homogeneidad entre los estratos.

Notas importantes
186 Estadstica Descriptiva 201702

Muestreo aleatorio simple

En este procedimiento, se selecciona una muestra en forma aleatoria y sin reemplazo a


n unidades de muestreo de una poblacin que contiene un total de N unidades.
Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser
elegida.

Pasos a seguir para seleccionar una muestra simple aleatoria

1. Enumere las unidades del marco muestral con nmeros sucesivos.


2. Seleccione tantos elementos del marco muestral como sea el tamao requerido de
la muestra, usando una tabla de nmeros aleatorios.

El muestreo aleatorio simple presenta dos propiedades:


Representativo: Cada unidad tiene las mismas posibilidades de ser escogida.
Independencia: La seleccin de una unidad no influye en la seleccin de otras unidades.

Pero en el mundo real es difcil encontrar muestras completamente independientes y


representativas. Por ejemplo, hacer una encuesta a los votantes marcando nmeros de
telfono al azar es un mtodo no representativo pues no tiene en cuenta a los votantes
que no disponen de telfono y cuenta varias veces a los que tienen varios nmeros.

Ejercicio 56
Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cua-
dro siguiente, informacin acerca del ingreso mensual (en nuevos soles) y aos cumpli-
dos en la empresa de cada uno de sus trabajadores.
Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las
columnas C4, C8, C11 y C15 de la tabla de nmeros aleatorios.
Seleccione una muestra de diez trabajadores usando muestreo simple aleatorio. Use las
columnas C11, C6, C1 y C9 de la tabla de nmeros aleatorios.

Notas importantes
Unidad 6. Muestreo 187
Trabajadores registrados
Ingreso Ingreso Ingreso Aos en la
N Aos en la empresa N Aos en la empresa N
(en soles) (en soles) (en soles) empresa
1 2300 5 51 2100 13 101 2400 16
2 2800 11 52 2100 9 102 1700 0
3 2400 4 53 1800 1 103 2500 12
4 2500 2 54 2000 9 104 1700 3
5 2300 3 55 2100 10 105 2400 17
6 2100 2 56 1900 4 106 2400 16
7 1700 2 57 2000 10 107 1900 7
8 2000 0 58 2300 11 108 1700 1
9 2200 7 59 2000 7 109 2100 6
10 2100 4 60 1700 1 110 2000 5
11 1700 0 61 1900 6 111 2000 3
12 2500 2 62 2000 9 112 2500 13
13 2800 13 63 2400 17 113 1700 0
14 2400 9 64 1700 0 114 2500 19
15 1700 1 65 1700 2 115 1700 3
16 2400 9 66 2400 17 116 2600 19
17 2200 10 67 2500 13 117 1600 1
18 2200 4 68 2600 16 118 1800 6
19 2300 10 69 2100 14 119 2100 10
20 2800 11 70 1900 7 120 1700 0
21 2100 7 71 2000 9 121 2400 16
22 1700 1 72 1800 7 122 2600 17
23 2500 6 73 2100 10 123 2100 10
24 2400 9 74 2300 12 124 2100 8
25 2700 17 75 2700 20 125 2400 17
26 1700 0 76 2800 20 126 1700 1
27 1600 2 77 1800 3 127 2600 20
28 2600 17 78 1700 5 128 2400 16
29 2500 13 79 1700 4 129 2700 17
30 2500 16 80 1700 0 130 2100 12
31 2700 17 81 1700 1 131 1600 0
32 1700 1 82 2100 6 132 2100 15
33 1600 1 83 2600 17 133 1900 5
34 2400 11 84 2400 9 134 2100 12
35 1900 3 85 2600 19 135 2200 12
36 1800 5 86 1900 7 136 2400 13
37 1800 3 87 1600 0 137 1800 4
38 2400 14 88 1900 3 138 2600 17
39 2600 16 89 2100 14 139 2700 20
40 2700 18 90 1700 0 140 2500 16
41 2100 11 91 2100 15 141 2500 16
42 2300 14 92 1700 1 142 1900 6
43 1700 0 93 2300 14 143 2100 15
44 2200 13 94 2500 16 144 1700 9
45 2900 20 95 2600 18 145 1500 0
46 1800 5 96 1900 3 146 1800 18
47 2100 16 97 2500 19 147 2100 10
48 2000 12 98 1800 6 148 2700 19
49 2000 12 99 1700 2 149 1800 9
50 2900 20 100 2000 10 150 2100 15

Notas importantes
188 Estadstica Descriptiva 201702
Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las
columnas C4, C8, C11 y C15 de la tabla de nmeros aleatorios.
Solucin
Seleccionemos tantos elementos del marco muestral como sea el tamao requerido de
la muestra, usando una tabla de nmeros aleatorios. Como el marco muestral tiene 150
elementos usemos las columnas C4, C5 y C6, para elegir nmeros de tres cifras y luego C8,
C9 y C10.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4

2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Los elementos seleccionados son:
Posicin 114 81 134 148 39 97 105 98 126 64 109 122 142 145 149

Notas importantes
Unidad 6. Muestreo 189
Seleccione una muestra de doce trabajadores usando muestreo simple aleatorio. Use las
columnas C10, C4, C2 y C1 de la tabla de nmeros aleatorios.
Los elementos seleccionados son:
Posicin

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9

Notas importantes
190 Estadstica Descriptiva 201702

Muestreo sistemtico

En el muestreo sistemtico se elige un elemento del marco muestral cada cierto interva-
lo. Este muestreo supone que se cuenta con una enumeracin completa de los elemen-
tos de la poblacin.

Procedimiento para seleccionar una muestra sistemtica


N
1. Calcule el valor de k, donde k . El valor de k se redondea al valor del entero
n
menor.
2. Seleccione aleatoriamente un nmero entero entre 1 y k llamado arranque alea-
torio (A).

3. A partir de este nmero elegido, seleccione el siguiente que ocupa la posicin (A +


k) del listado del marco muestral y as sucesivamente hasta completar la muestra.

Ejemplo 50
Se tiene una poblacin de 12 personas y se desea elegir a cuatro de ellas mediante un
muestreo sistemtico. Cul es el arranque aleatorio para este ejemplo? Use la columna
C3, C6 y C12.

Solucin
N 12
Calculemos el valor de k, donde k 3 . El valor de k se redondea al valor del
n 4
entero menor, luego k = 3.
Seleccionemos aleatoriamente un nmero entero entre 1 y k = 3, llamado arranque
aleatorio (A). Observando la columna C3 de la tabla de nmeros aleatorios tenemos que
A = 2.

Notas importantes
Unidad 6. Muestreo 191
Tabla de nmeros aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4

A partir de este nmero elegido, seleccionemos el dato que ocupa la posicin (A + k), es
decir la quinta posicin (3 + 2 = 5) del listado del marco muestral y as sucesivamente
hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 2, 5, 8 y 11.

Ejemplo 51

Se tiene una poblacin de 15 personas y se desea elegir a seis de ellas mediante un


muestreo sistemtico. Cul es el arranque aleatorio para este ejemplo? Use la columna
C4, C8 y C1.

Solucin
N 15
Calculemos el valor de k, donde k 2,5 . El valor de k se redondea al valor del
n 6
entero menor, luego k = 2.

Seleccionemos aleatoriamente un nmero entero entre 1 y k = 2, llamado arranque


aleatorio (A). Observando la columna C4 de la tabla de nmeros aleatorios tenemos que
A = 1.

Tabla de nmeros aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

A partir de este nmero elegido, seleccionemos el dato que ocupa la posicin (A + k), es
decir la tercera posicin (1 + 2 = 3) del listado del marco muestral y as sucesivamente
hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 1, 3, 5, 7, 9 y
11.

Notas importantes
192 Estadstica Descriptiva 201702
Ejemplo 52
Se tiene informacin de 40 personas de un barrio de Lima Metropolitana. Obtenga una
muestra aleatoria de ocho personas usando el muestreo sistemtico y elabore una tabla
con los elementos seleccionados. Utilice las columnas C8; C10; C11 de la tabla de nmeros
aleatorios.
Individuos registrados
N Sexo Edad Estatura N Sexo Edad Estatura N Sexo Edad Estatura
1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 69
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 76
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 74
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 90
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 164
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 164
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162
Solucin
N 40
Calculemos el valor de k, donde k 5
n 8
El valor de k se redondea al valor del entero menor, luego k = 5.
Seleccionemos aleatoriamente un nmero entero entre 1 y k = 5, llamado arranque
aleatorio (A).
Observando la columna C8 de la tabla de nmeros aleatorios tenemos que A = 5.
Tabla de nmeros aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

A partir de este nmero elegido, seleccionemos el dato que ocupa la posicin (A + k), es
decir la dcima posicin (5+5 = 10) del listado del marco muestral y as sucesivamente
hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 5, 10, 15,
20, 25, 30, 35 y 40.
Los elementos seleccionados son:

Posicin 5 10 15 20 25 30 35 40

Notas importantes
Unidad 6. Muestreo 193
Ejercicio 57
Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en
la tabla que se muestra a continuacin informacin acerca de las variables: ingreso men-
sual (en soles), nivel de educacin y aos cumplidos en la empresa.
Trabajadores registrados
Ingreso Nivel de Aos en Ingreso Nivel de Aos en Ingreso Nivel de Aos en
N N N
(soles) Educacin empresa (soles) Educacin empresa (soles) Educacin empresa
1 2300 Secundaria 5 51 2100 Tcnica 13 101 2400 Tcnica 16
2 2800 Secundaria 11 52 2100 Tcnica 9 102 1700 Tcnica 0
3 2400 Secundaria 4 53 1800 Tcnica 1 103 2500 Tcnica 12
4 2500 Secundaria 2 54 2000 Tcnica 9 104 1700 Tcnica 3
5 2300 Secundaria 3 55 2100 Tcnica 10 105 2400 Tcnica 17
6 2100 Secundaria 2 56 1900 Tcnica 4 106 2400 Tcnica 16
7 1700 Secundaria 2 57 2000 Tcnica 10 107 1900 Tcnica 7
8 2000 Secundaria 0 58 2300 Tcnica 11 108 1700 Tcnica 1
9 2200 Secundaria 7 59 2000 Tcnica 7 109 2100 Tcnica 6
10 2100 Secundaria 4 60 1700 Tcnica 1 110 2000 Tcnica 5
11 1700 Secundaria 1 61 1900 Tcnica 6 111 2000 Superior 3
12 2500 Secundaria 2 62 2000 Tcnica 9 112 2500 Superior 13
13 2800 Secundaria 13 63 2400 Tcnica 17 113 1700 Superior 0
14 2400 Secundaria 9 64 1700 Tcnica 0 114 2500 Superior 19
15 1700 Secundaria 1 65 1700 Tcnica 2 115 1700 Superior 3
16 2400 Secundaria 9 66 2400 Tcnica 17 116 2600 Superior 19
17 2200 Secundaria 10 67 2500 Tcnica 13 117 1600 Superior 1
18 2200 Secundaria 4 68 2600 Tcnica 16 118 1800 Superior 6
19 2300 Secundaria 10 69 2100 Tcnica 14 119 2100 Superior 10
20 2800 Secundaria 11 70 1900 Tcnica 7 120 1700 Superior 0
21 2100 Secundaria 7 71 2000 Tcnica 9 121 2400 Superior 16
22 1700 Secundaria 1 72 1800 Tcnica 7 122 2600 Superior 17
23 2500 Secundaria 6 73 2100 Tcnica 10 123 2100 Superior 10
24 2400 Secundaria 9 74 2300 Tcnica 12 124 2100 Superior 8
25 2700 Secundaria 17 75 2700 Tcnica 20 125 2400 Superior 17
26 1700 Secundaria 0 76 2800 Tcnica 20 126 1700 Superior 1
27 1600 Secundaria 2 77 1800 Tcnica 3 127 2600 Superior 20
28 2600 Secundaria 17 78 1700 Tcnica 5 128 2400 Superior 16
29 2500 Secundaria 13 79 1700 Tcnica 4 129 2700 Superior 17
30 2500 Secundaria 16 80 1700 Tcnica 0 130 2100 Superior 12
31 2700 Secundaria 17 81 1700 Tcnica 1 131 1600 Superior 0
32 1700 Secundaria 1 82 2100 Tcnica 6 132 2100 Superior 15
33 1600 Secundaria 1 83 2600 Tcnica 17 133 1900 Superior 5
34 2400 Secundaria 11 84 2400 Tcnica 9 134 2100 Superior 12
35 1900 Secundaria 3 85 2600 Tcnica 19 135 2200 Superior 12
36 1800 Secundaria 5 86 1900 Tcnica 7 136 2400 Superior 13
37 1800 Secundaria 3 87 1600 Tcnica 0 137 1800 Superior 4
38 2400 Secundaria 14 88 1900 Tcnica 3 138 2600 Superior 17
39 2600 Secundaria 16 89 2100 Tcnica 14 139 2700 Superior 20
40 2700 Secundaria 18 90 1700 Tcnica 0 140 2500 Superior 16
41 2100 Tcnica 11 91 2100 Tcnica 15 141 2500 Superior 16
42 2300 Tcnica 14 92 1700 Tcnica 1 142 1900 Superior 6
43 1700 Tcnica 0 93 2300 Tcnica 14 143 2100 Superior 15
44 2200 Tcnica 13 94 2500 Tcnica 16 144 1700 Superior 9
45 2900 Tcnica 20 95 2600 Tcnica 18 145 1500 Superior 0
46 1800 Tcnica 5 96 1900 Tcnica 3 146 1800 Superior 18
47 2100 Tcnica 16 97 2500 Tcnica 19 147 2100 Superior 10
48 2000 Tcnica 12 98 1800 Tcnica 6 148 2700 Superior 19
49 2000 Tcnica 12 99 1700 Tcnica 2 149 1800 Superior 9
50 2900 Tcnica 20 100 2000 Tcnica 10 150 2100 Superior 15

Notas importantes
194 Estadstica Descriptiva 201702

Aplique el muestreo sistemtico para seleccionar una muestra de ocho empleados. Ela-
bore un listado con el nmero seleccionado. Utilice la columna C3, C9, y C12 de la tabla de
nmeros aleatorios.
Solucin
N
Calculemos el valor de k, donde k ...
n
El valor de k se redondea al valor del entero menor, luego k = ....

Seleccionemos aleatoriamente un nmero entero entre 1 y k, llamado arranque aleato-


rio (A).

Observando la columna C3 y C4 de la tabla de nmeros aleatorios tenemos que A =


.....

Tabla de nmeros aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8

A partir de este nmero elegido, seleccionemos el dato que ocupa la posicin (A + k) del
listado del marco muestral y as sucesivamente hasta completar la muestra.
Los elementos seleccionados son:

Posicin

Notas importantes
Unidad 6. Muestreo 195

Muestreo estratificado

Estratificar significa dividir a la poblacin en varias partes de acuerdo con ciertas carac-
tersticas de sus elementos.
El objetivo de estratificar la poblacin es buscar homogeneidad entre los estratos.

Pasos a seguir para seleccionar una muestra estratificada

1. Divida a la poblacin en estratos que sean mutuamente excluyentes. Esto es, que in-
cluyan a todos los elementos de la poblacin y que cada elemento pertenezca sola-
mente a un estrato.

2. Calcule la cantidad de elementos a seleccionar en cada estrato.

3. Seleccione muestras aleatorias simples para cada uno de los estratos.

Recomendaciones para el uso de muestras estratificadas

Si se tiene que usar ms de una variable para formar los estratos, cuidar que estas no es-
tn relacionadas entre s.

No se deben considerar la formacin de muchos estratos, generalmente se usan entre


tres y ocho estratos.

Los estratos pequeos no contribuyen mucho a la reduccin del error, por lo tanto pue-
den no ser considerados.

Notas importantes
196 Estadstica Descriptiva 201702
Ejemplo 53
La empresa de telecomunicaciones RTV tiene 120 empleados de los cuales tiene infor-
macin de las variables: ingreso en soles, nivel de educacin y aos en la empresa.

Aos
Ingreso Aos Ingreso Ingreso Aos
Nivel de Nivel de cumplidos Nivel de
N (en cumplidos N (en N (en cumplidos
educacin educacin en la empre- educacin
soles) en la empresa soles) soles) en la empresa
sa
1 2300 Secundaria 5 41 2100 Tcnica 13 81 2000 Superior 3
2 2800 Secundaria 11 42 2100 Tcnica 9 82 2500 Superior 13
3 2400 Secundaria 4 43 1800 Tcnica 1 83 1700 Superior 0
4 2500 Secundaria 2 44 2000 Tcnica 9 84 2500 Superior 19
5 2300 Secundaria 3 45 2100 Tcnica 10 85 1700 Superior 3
6 2100 Secundaria 2 46 1900 Tcnica 4 86 2600 Superior 19
7 1700 Secundaria 2 47 2000 Tcnica 10 87 1600 Superior 1
8 2000 Secundaria 0 48 2300 Tcnica 11 88 1800 Superior 6
9 2200 Secundaria 7 49 2000 Tcnica 7 89 2100 Superior 10
10 2100 Secundaria 4 50 1700 Tcnica 1 90 1700 Superior 0
11 1700 Secundaria 0 51 1700 Tcnica 1 91 2400 Superior 16
12 2500 Secundaria 2 52 2100 Tcnica 6 92 2600 Superior 17
13 2800 Secundaria 13 53 2600 Tcnica 17 93 2100 Superior 10
14 2400 Secundaria 9 54 2400 Tcnica 9 94 2100 Superior 8
15 1700 Secundaria 1 55 2600 Tcnica 19 95 2400 Superior 17
16 2400 Secundaria 9 56 1900 Tcnica 7 96 1700 Superior 1
17 2200 Secundaria 10 57 1600 Tcnica 0 97 2600 Superior 20
18 2200 Secundaria 4 58 1900 Tcnica 3 98 2400 Superior 16
19 2300 Secundaria 10 59 2100 Tcnica 14 99 2700 Superior 17
20 2800 Secundaria 11 60 1700 Tcnica 0 100 2100 Superior 12
21 2100 Secundaria 7 61 2100 Tcnica 15 101 1600 Superior 0
22 1700 Secundaria 1 62 1700 Tcnica 1 102 2100 Superior 15
23 2500 Secundaria 6 63 2300 Tcnica 14 103 1900 Superior 5
24 2400 Secundaria 9 64 2500 Tcnica 16 104 2100 Superior 12
25 2700 Secundaria 17 65 2600 Tcnica 18 105 2200 Superior 12
26 1700 Secundaria 0 66 1900 Tcnica 3 106 2400 Superior 13
27 1600 Secundaria 2 67 2500 Tcnica 19 107 1800 Superior 4
28 2600 Secundaria 17 68 1800 Tcnica 6 108 2600 Superior 17
29 2500 Secundaria 13 69 1700 Tcnica 2 109 2700 Superior 20
30 2500 Secundaria 16 70 2000 Tcnica 10 110 2500 Superior 16
31 2100 Tcnica 11 71 2400 Tcnica 16 111 2500 Superior 16
32 2300 Tcnica 14 72 1700 Tcnica 0 112 1900 Superior 6
33 1700 Tcnica 0 73 2500 Tcnica 12 113 2100 Superior 15
34 2200 Tcnica 13 74 1700 Tcnica 3 114 1700 Superior 9
35 2900 Tcnica 20 75 2400 Tcnica 17 115 1500 Superior 0
36 1800 Tcnica 5 76 2400 Tcnica 16 116 1800 Superior 18
37 2100 Tcnica 16 77 1900 Tcnica 7 117 2100 Superior 10
38 2000 Tcnica 12 78 1700 Tcnica 1 118 2700 Superior 19
39 2000 Tcnica 12 79 2100 Tcnica 6 119 1800 Superior 9
40 2900 Tcnica 20 80 2000 Tcnica 5 120 2100 Superior 15

Notas importantes
Unidad 6. Muestreo 197
Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use
como variable de estratificacin el nivel educacional. Elabore un listado identificando el
nmero de dato seleccionado.
Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9,
C10 y C11 y para el estrato 3 use las columnas C4, C3, C5 y C7.

Solucin
Se divide a la poblacin en estratos que sean mutuamente excluyentes, luego los estra-
tos 1, 2 y 3 son: secundaria, tcnica y superior, respectivamente. Para cada uno de los
estratos, seleccionamos muestras aleatorias simples.

Posiciones
Estratos
Nmeros de elementos Cantidad seleccionada por estrato nh Nh n
en el estrato Nh (desde hasta) N
N1 30
1. Secundaria N1 = 30 1 30 n1 n 16 4
N 120
N2 50
2. Tcnica N2 = 50 31 80 n2 n 16 6,67 7
N 120
N3 40
3. Superior N3 = 40 81 120 n3 n 16 5,33 5
N 120
Total N = 120 n = 16

Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las colum-
nas C1, C3 y C5. Observemos que las posiciones de los elementos a elegir estn entre el 1
y el 30.

Tabla de nmeros aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8

Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es:

Estrato Secundaria Posicin 2 16 29 13

Notas importantes
198 Estadstica Descriptiva 201702
Para el estrato Tcnica, realizamos un muestreo aleatorio simple usando las columnas
C8, C9, C10 y C11. Observemos que las posiciones de los elementos a elegir estn entre el
31 y el 80.

Tabla de nmeros aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

Luego, el cuadro con los datos elementos seleccionados para el estrato Tcnica es:

Estrato Tcnica Posicin 54 62 66 77 48 67 44

Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas
C4, C3, C5 y C7. Observemos que las posiciones de los elementos a elegir estn entre el 81
y el 120.

Tabla de nmeros aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4

Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:

Estrato Superior Posicin 114 81 97 105 83

Notas importantes
Unidad 6. Muestreo 199
Ejercicio 58
La siguiente tabla muestra a los 120 alumnos de la especialidad de Administracin, de la
universidad El Saber, a quienes se les pregunt por su emisora radial preferida y por la
cantidad de horas a la semana que la escucha.

Posicin Radio Horas Posicin Radio Horas Posicin Radio Horas


1 Studio 92 6 41 Oxgeno 6 81 Oxgeno 4
2 Studio 92 10 42 Oxgeno 6 82 Oxgeno 3
3 Studio 92 4 43 Oxgeno 8 83 Oxgeno 3
4 Studio 92 2 44 Oxgeno 9 84 Oxgeno 5
5 Studio 92 3 45 Oxgeno 4 85 Oxgeno 5
6 Studio 92 6 46 Oxgeno 6 86 Oxgeno 8
7 Studio 92 7 47 Oxgeno 7 87 Planeta 7
8 Studio 92 6 48 Oxgeno 9 88 Planeta 6
9 Studio 92 8 49 Oxgeno 8 89 Planeta 9
10 Studio 92 9 50 Oxgeno 10 90 Planeta 9
11 Studio 92 11 51 Oxgeno 12 91 Planeta 4
12 Studio 92 3 52 Oxgeno 9 92 Planeta 2
13 Studio 92 4 53 Oxgeno 9 93 Planeta 11
14 Studio 92 2 54 Oxgeno 8 94 Planeta 2
15 Studio 92 6 55 Oxgeno 4 95 Planeta 3
16 Studio 92 4 56 Oxgeno 6 96 Planeta 8
17 Studio 92 9 57 Oxgeno 7 97 Planeta 6
18 Studio 92 5 58 Oxgeno 8 98 Planeta 7
19 Studio 92 2 59 Oxgeno 7 99 Planeta 9
20 Studio 92 7 60 Oxgeno 3 100 Planeta 4
21 Studio 92 4 61 Oxgeno 6 101 Planeta 8
22 Studio 92 6 62 Oxgeno 9 102 Planeta 7
23 Studio 92 7 63 Oxgeno 2 103 Planeta 7
24 Studio 92 8 64 Oxgeno 5 104 Planeta 9
25 Studio 92 9 65 Oxgeno 1 105 Planeta 6
26 Studio 92 10 66 Oxgeno 4 106 Planeta 7
27 Studio 92 5 67 Oxgeno 7 107 Planeta 9
28 Studio 92 4 68 Oxgeno 6 108 Planeta 8
29 Studio 92 7 69 Oxgeno 7 109 Planeta 3
30 Studio 92 8 70 Oxgeno 8 110 Planeta 11
31 Studio 92 4 71 Oxgeno 4 111 Planeta 13
32 Oxgeno 6 72 Oxgeno 5 112 Planeta 14
33 Oxgeno 7 73 Oxgeno 3 113 Planeta 9
34 Oxgeno 5 74 Oxgeno 6 114 Planeta 8
35 Oxgeno 8 75 Oxgeno 5 115 Planeta 6
36 Oxgeno 9 76 Oxgeno 8 116 Planeta 5
37 Oxgeno 4 77 Oxgeno 7 117 Planeta 7
38 Oxgeno 5 78 Oxgeno 9 118 Planeta 3
39 Oxgeno 2 79 Oxgeno 10 119 Planeta 6
40 Oxgeno 9 80 Oxgeno 3 120 Planeta 5

Notas importantes
200 Estadstica Descriptiva 201702

Seleccione una muestra aleatoria de tamao 12 mediante muestreo estratificado. Use la


variable radio de su preferencia como variable de estratificacin.

Elabore un listado con el alumno seleccionado. Para el estrato 1 use las columnas C7, C3
y C1, para el estrato 2 use las columnas C8, C3, C2 y C10 y para el estrato 3 use las colum-
nas C1, C4, C10; C7, C12, y C13.

Posicin Nh
Estrato Nh nh n
(desde hasta) N

Estudio 92 N1= n1=

Oxgeno N2= n2=

Planeta N3= n3=

Total

Estrato 1:
Posicin
Studio 92

Estrato 2:
Posicin
Oxgeno

Estrato 3:
Posicin
Planeta

Notas importantes
Unidad 6. Muestreo 201
Tabla de nmeros aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8

Notas importantes
202 Tablas Estadsticas

Tablas estadsticas
Todas las tablas de este manual han sido calculadas usando el MS Excel.
Tabla de la distribucin normal estndar
rea bajo la curva normal: PZ z
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350

-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275

-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866

-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Tablas Estadsticas 203

Tabla de la distribucin normal estndar


rea bajo la curva normal: PZ z

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891

1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670

2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861

3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
ndice alfabtico

de barras, 25
A de barras agrupadas, 31
de cajas, 80
Axiomas de la probabilidad, 103 de Pareto, 27
Histograma, 43
D Ojiva, 43
Polgono de frecuencias, 43
Deciles, 68
Desviacin estndar, 72
Distribucin
M
binomial, 133 Media, 55
de frecuencias, 20, 35, 37 ponderada, 64
de la media muestral, 173 Mediana, 59
de probabilidad, 123, 124 Moda, 62
hipergeomtrica, 137 Muestreo
normal, 155 aleatorio simple, 186
Poisson, 140 estratificado, 195
uniforme continua, 152 probabilstico, 185
sistemtico, 190
E
Escalas de medicin, 13
P
Espacio muestral, 95 Parmetro, 16
Estadstica Percentiles, 67
Definicin, 9 Poblacin, 11
Subdivisin, 9 Propiedad reproductiva de la normal, 168
estadstico, 16
Estadstico, 16
Evento, 95 T
Complemento, 98 Teorema
Eventos de Bayes, 111
independientes, 115 del lmite central, 174
Interseccin de, 99
mutuamente excluyentes, 101
Unin de, 99 V
Experimento aleatorio, 95 Valor esperado
de una funcin de una variable aleatoria, 128, 150
F Variable, 15
aleatoria continua, 144
Funcin aleatoria discreta, 124
de densidad, 144 Varianza, 72
de distribucin acumulada, 147 de una variable aleatoria, 128, 151

G
Grfico
circular, 25

Вам также может понравиться