Вы находитесь на странице: 1из 172

CAPÍTULO 1

Estadı́stica descriptiva

Contenido
1.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1 Estadı́stica y sus aplicaciones . . . . . . . . . . . . . . . . . . . . 2
1.1.2 Términos comúnmente usados en estadı́stica . . . . . . . . . . . 6
1.1.3 Estadı́sticas descriptiva e inferencial . . . . . . . . . . . . . . . . 7
1.2 Organización de datos . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.1 Organización de datos de acuerdo al tipo . . . . . . . . . . . . . 10
1.2.2 Organización de datos de acuerdo a escalas de medidas . . . . . 11
1.2.3 Organización de datos mediante tablas . . . . . . . . . . . . . . . 13
1.2.4 Organización de datos mediante representaciones gráficas . . . . 22
1.3 Análisis de datos en tablas de frecuencias no agrupadas . . . . 33
1.3.1 Medidas de tendencia central o de centralización . . . . . . . . . 33
1.3.2 Medidas de colocación o de posición relativa . . . . . . . . . . . . 43
1.3.3 Medidas de dispersión o de variabilidad . . . . . . . . . . . . . . 45
1.3.4 Medidas de formas . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Copyright © 2017. Universidad del Norte. All rights reserved.

1.4 Análisis de datos en tablas de frecuencias agrupadas . . . . . . 66


1.5 Análisis exploratorio de datos . . . . . . . . . . . . . . . . . . . . 72
1.6 Uso de Statgraphics en la estadı́stica descriptiva . . . . . . . . 79
1.6.1 Análisis de un solo conjunto de datos . . . . . . . . . . . . . . . . 79
1.6.2 Análisis simultáneo de dos o más conjuntos de datos . . . . . . . 85
1.7 Uso de la calculadora en la estadı́stica . . . . . . . . . . . . . . . 90
✍ Ejercicios complementarios . . . . . . . . . . . . . . . . . . . . . . . 93

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
2 Llinás / Rojas

☞ Objetivos del capı́tulo


1. Presentar una visión amplia sobre el campo de estudio de la estadı́stica y sus aplicaciones.

2. Distinguir entre estadı́stica descriptiva e inferencial.

3. Estudiar los tipos de datos.

4. Mostrar cómo organizar datos.

5. Construir tablas y gráficas para datos numéricos y categóricos.

6. Describir las medidas de tendencia central, de posición relativa, de variación y de forma de


los datos numéricos.

7. Describir las técnicas para realizar un análisis exploratorio de datos.

8. Presentar aplicaciones del uso de Statgraphics y de la calculadora en la estadı́stica.

☞ Empleo de la estadı́stica
La directora de producción de una empresa debe informar a su superior
sobre el número de dı́as promedio que los empleados de la empresa se ausen-
tan del trabajo. Sin embargo, la planta emplea más de dos mil trabajadores,
y la directora de producción no tiene tiempo de revisar los registros persona-
les de cada empleado. Como asistente, usted debe decidir cómo puede ella
obtener la información necesaria. ¿Qué consejo podrı́a darle?

1.1 Introducción

1.1.1 Estadı́stica y sus aplicaciones

¿Qué significa “estadı́stica”?


Copyright © 2017. Universidad del Norte. All rights reserved.

En la vida diaria, los diversos fenómenos de orden económico, social, polı́tico, educacional, e
incluso biológico, aparecen, se transforman y finalmente desaparecen. Para tan abundante
y complejo material es preciso tener un registro ordenado y continuo, a fin de conseguir
en un momento dado los datos necesarios para un estudio de lo que ha sucedido, sucede
o puede suceder. Para ello se requiere contar con un método, con un conjunto de reglas o
principios, que nos permita la observación, el ordenamiento, la cuantificación y el análisis
de dichos fenómenos.

En general, el término “estadı́stica” tiene tres acepciones gramaticales bien definidas:

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 3

1. Estadı́stica, según su acepción más común, es una colección de datos numéricos


ordenados y clasificados según un determinado criterio. Nos referimos a este sig-
nificado cuando hablamos de estadı́sticas de producción, estadı́sticas de cotizaciones
bursátiles, estadı́sticas demográficas, etc.

2. Según una segunda acepción, es la ciencia que, utilizando como instrumento las
matemáticas y el cálculo de probabilidades, estudia las leyes de comportamiento de
aquellos fenómenos que no están sometidos a las leyes fı́sicas y basándose en ellas
predice e infiere resultados. En este caso se la denomina estadı́stica matemática.

3. Finalmente, significa técnica o método cientı́fico usado para recolectar, organizar,


resumir, presentar, analizar, interpretar, generalizar y contrastar los resultados de las
observaciones de los fenómenos reales.

Se considera fundador de la estadı́stica a Godofredo Achenwall (1719-1772;53), profe-


sor y economista alemán, quien siendo profesor de la Universidad de Leipzig (Alemania) es-
cribió sobre el descubrimiento de una nueva ciencia que llamó estadı́stica (palabra derivada
del término alemán Staat, que significa “estado”) y que definió como “el conocimiento
profundo de la situación respectiva y comparativa de cada estado”. Achenwall y sus
seguidores estructuraron los métodos estadı́sticos que se orientaron a investigar, medir y
comparar las riquezas de las naciones. Lo anterior no significa que antes de los estudios de
Achenwall los estados no hubiesen efectuado inventarios de sus riquezas. Estos inventa-
rios se realizaron desde la Antigüedad. Se sabe que 2.000 a 2.500 años antes de Cristo, los
inventarios que hicieron los chinos y los egipcios eran muy elementales.

¿Por qué usted necesita conocer estadı́stica?

En general, el problema que enfrentan las compañı́as e industrias no es la escasez de in-


formación, sino cómo utilizar la información disponible para tomar las decisiones más ade-
cuadas. Por esta razón, desde la perspectiva de una toma de decisiones informada, cabe
preguntarse por qué un ingeniero, un administrador y un economista necesitan saber es-
tadı́stica. Para dar respuesta a esta inquietud podemos decir que éstos deben comprender
la estadı́stica, básicamente, por tres razones fundamentales:
Copyright © 2017. Universidad del Norte. All rights reserved.

1. Presentar y describir la información en forma adecuada.

2. Inferir conclusiones sobre poblaciones grandes basándose solamente en la información


obtenida de subconjuntos de ellas.

3. Utilizar modelos para obtener pronósticos confiables.

1.1. Introducción

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
4 Llinás / Rojas

Presentar y Obtener conclusiones acerca Obtener pronósticos


describir la de poblaciones, basándose so- confiables sobre
información lamente en la información variables de interés
obtenida a partir de subcon-
juntos de ellas
Introducción y Modelos de regresión
recopilación de lineal simple y
datos correlación

Probabilidad básica
Tablas y y distribuciones de Análisis de series
gráficas probabilidad de tiempo

Medidas
estadísticas
Distribuciones Pruebas de
muestrales y hipótesis
estimación

Figura 1.1: Esquema de rutas para aprender estadı́stica

En la figura 1.1 se presenta un esquema general de las rutas que sugerimos tomar desde la
perspectiva de estas tres razones para aprender estadı́stica. En este esquema se observa que
para tener en cuenta la primera razón se abordan los métodos referentes a la recopilación,
descripción y presentación de la información (que corresponde al capı́tulo 1 de este texto).
Para la segunda razón necesitaremos desarrollar los conceptos de distribuciones muestrales,
estimación y pruebas de hipótesis. Debido a que estos temas no hacen parte de los objetivos
de este texto, sólo se desarrollarán los conceptos básicos de probabilidad (capı́tulo 2) y
algunas distribuciones (capı́tulos 3, 4 y 5), temas que sirven como base para desarrollar
lo expresado en la segunda razón. Para la tercera razón sugerimos realizar el enfoque al
análisis de regresión, modelado y análisis de series de tiempo que proporcionan métodos
para hacer pronósticos (temas que tampoco tratamos en este texto).

Algunas aplicaciones de la estadı́stica


Copyright © 2017. Universidad del Norte. All rights reserved.

En esta sección presentaremos ejemplos que ilustran algunas de las aplicaciones de la es-
tadı́stica en la ingenierı́a, en la administración y en la economı́a.

Ingenierı́a

La importancia de la estadı́stica en la ingenierı́a ha sido subrayada por la participación


de la industria en el aumento de la calidad. Muchas empresas se han dado cuenta de que
la baja calidad de un producto (ya sea en la forma de defectos de fabricación, en una
baja confiabilidad en su rendimiento, o en ambos) tiene un efecto muy pronunciado en la

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 5

productividad global de la compañı́a, en el mercado y la posición competitiva y, finalmente,


en la rentabilidad de la empresa. Mejorar estos aspectos de la calidad puede eliminar el des-
perdicio; disminuir la cantidad de material de desecho, la necesidad de volver a maquilar las
piezas, los requerimientos para inspección y prueba y las pérdidas por garantı́a. Además
de mejorar la satisfacción del consumidor y permitir que la empresa se convierta en un
productor de alta calidad y bajo costo en el mercado. En este sentido, la estadı́stica es un
elemento decisivo en el incremento de la calidad, ya que las técnicas estadı́sticas pueden
emplearse para describir y comprender la variabilidad.1

Contabilidad

Las empresas de contadurı́a pública emplean procedimientos estadı́sticos de muestreo para


llevar a cabo auditorı́as a sus clientes. Por ejemplo, supongamos que una empresa de
contadores desea determinar si la cantidad que aparece en las cuentas por cobrar, en el
balance de un cliente, representa fielmente la cantidad real de ese rubro. Normalmente,
la cantidad de cuentas individuales por cobrar es tan grande que serı́a demasiado lento y
costoso revisar y validar cada cuenta. En casos como éste, regularmente se acostumbra que
el personal del auditor seleccione un subconjunto de las cuentas (llamado muestra). Después
de revisar la exactitud de las cuentas muestreadas, los auditores llegan a una conclusión
acerca de si la cantidad que aparece en cuentas por cobrar, en los estados financieros de sus
clientes, es aceptable.

Finanzas

Los asesores financieros recurren a una gama de información estadı́stica para guiarse en sus
recomendaciones de inversión. En el caso de las acciones, revisan una variedad de datos
financieros, que incluyen relaciones de precio a rendimiento y los dividendos. Al comparar
la información de determinadas acciones con la correspondiente acerca de promedios del
mercado accionario, un asesor financiero puede comenzar a sacar conclusiones sobre si esas
acciones están sobre o subevaluadas.
Copyright © 2017. Universidad del Norte. All rights reserved.

Economı́a

Con frecuencia se pide a los economistas su pronóstico acerca del futuro de la economı́a o
de alguno de sus aspectos. Estos recurren a diversas informaciones estadı́sticas para elabo-
rarlo. Ası́, para pronosticar las tasas de inflación usan indicadores como el ı́ndice de precios
al productor, la tasa de desempleo y la ocupación de la capacidad de producción. Muchas
veces, esos indicadores estadı́sticos se introducen en modelos computarizados de pronóstico,
cuyo resultado son predicciones sobre las tasas de inflación.

1
La variabilidad es el resultado de cambios en las condiciones bajo las que se hacen las observaciones.

1.1. Introducción

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
6 Llinás / Rojas

Mercadotecnia

Los escáners en las cajas de los almacenes al detalle se emplean para reunir datos que tienen
muchas aplicaciones de investigación de mercados.

Producción

Con el énfasis actual en la calidad, el control de calidad es una aplicación importante de


la estadı́stica en la producción. Para vigilar el resultado de un proceso de producción se
emplean diversas gráficas de control estadı́stico de calidad, en especial se usa una gráfica
para vigilar el promedio de un producto. Por ejemplo, supongamos que una máquina lle-
na envases con 12 onzas de una bebida muy conocida. Periódicamente se selecciona una
muestra de envases y se le determina su contenido promedio. Este promedio se anota en
una gráfica, a partir de la cual se observa si es necesario ajustar o corregir el proceso de
producción.

Los computadores, la calculadora y la estadı́stica

La mayor parte del análisis estadı́stico se realiza utilizando una biblioteca de programas
estadı́sticos. El usuario introduce los datos y luego selecciona los tipos de análisis y la
presentación de los resultados que le interesan. Los paquetes estadı́sticos están disponibles
para grandes sistemas de cómputo y para computadores personales. Entre los paquetes más
utilizados están SAS (Statistical Analysis System), SPSS (Statistical Package for Social
Sciencies), Statgraphics e, inclusive, Excel. En la sección 1.6 explicaremos cómo utilizar
Statgraphics en la estadı́stica y en la 1.7, cómo emplear la calculadora para hacer cálculos
estadı́sticos.

1.1.2 Términos comúnmente usados en estadı́stica

Definición 1.1.1 Una población es el conjunto total de objetos que son de interés para
Copyright © 2017. Universidad del Norte. All rights reserved.

un problema dado. Los objetos pueden ser personas, animales, producto fabricados, etc.
Cada uno de ellos recibe el nombre de elemento o individuo .

Ejemplo 1.1.2 Todos los niños nacidos en determinado año pueden constituir una población. Si
el director de una gran empresa manufacturera desea estudiar la producción de todas las plantas
de propiedad de la firma, entonces la producción de todas estas plantas es la población. 

Definición 1.1.3 Una muestra es un subconjunto de la población.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 7

Ejemplo 1.1.4 Si todos los niños nacidos en determinado año constituyen una población, en-
tonces los niños nacidos en febrero pueden constituir una muestra. 

Definición 1.1.5 Los datos u observaciones son números o denominaciones que po-
demos asignar a un individuo o elemento de la población.

Ejemplo 1.1.6 Son ejemplos de datos: la edad de una persona, la respuesta a la pregunta “¿Usted
fuma?”, el tipo de sangre, el salario mensual de un trabajador, etc. 

Definición 1.1.7 Un parámetro es cualquier caracterı́stica medible de una población.

Ejemplo 1.1.8 El ingreso promedio de todos los trabajadores de una determinada empresa es
un ejemplo de parámetro, si todos los trabajadores se consideran como una población. 

Definición 1.1.9 Un estadı́stico es cualquier caracterı́stica medible de una muestra.

Ejemplo 1.1.10 El ingreso promedio de todos los asalariados de una determinada sección de la
empresa (viendo a los trabajadores de ésta como una muestra de todos los trabajadores de esta
empresa) es un ejemplo de estadı́stico. 

Definición 1.1.11 Un censo (palabra derivada del latı́n censere, que significa “valuar o
tasar”) es la enumeración completa de la población.

Ejemplo 1.1.12 Según el censo llevado a cabo por el dane (Departamento Administrativo Na-
cional de Estadı́stica), en 1993 Colombia tenı́a 33.109.840 habitantes, de los cuales 16.296.539
eran hombres y 16.813.301 mujeres. 
Copyright © 2017. Universidad del Norte. All rights reserved.

1.1.3 Estadı́sticas descriptiva e inferencial

Los procedimientos y análisis que aparecen en estadı́stica se clasifican en dos categorı́as


generales, estadı́stica descriptiva (o deductiva) y estadı́stica inferencial (o inductiva), de-
pendiendo del propósito del estudio.

Definición 1.1.13 La estadı́stica descriptiva se compone de aquellos métodos que


incluyen técnicas para recolectar, presentar, analizar e interpretar datos.

1.1. Introducción

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
8 Llinás / Rojas

En general, la estadı́stica descriptiva tiene como función el manejo de los datos recopilados
en cuanto se refiere a su ordenación y presentación, para poner en evidencia ciertas carac-
terı́sticas en la forma que sea más objetiva y útil. En este sentido, investiga los métodos
y procedimientos y establece reglas para que el manejo de los datos sea más eficiente y
para que la información entregada resulte confiable, y exprese correctamente ciertos con-
tenidos en un lenguaje que permita que cualquier persona los comprenda y pueda establecer
comparaciones.

Ejemplo 1.1.14 Las siguientes situaciones utilizan estadı́stica descriptiva:

(a) A un empresario le interesa determinar el promedio semanal total de sus gastos en algunos
productos durante un tiempo determinado.

(b) Una entidad quiere calcular la proporción de colombianos encuestados que están a favor de
determinado candidato polı́tico. 

Definición 1.1.15 La estadı́stica inferencial abarca aquellos métodos y conjuntos de


técnicas que se utilizan para obtener conclusiones sobre las leyes de comportamiento de una
población basándose en los datos de muestras tomadas de esa población.

Ejemplo 1.1.16 Las situaciones siguientes, que son paralelas a las situaciones descriptivas dadas
anteriormente, requieren estadı́stica inferencial:

(a) Con base en una muestra de estudiantes, cierta universidad desea determinar el porcentaje
de estudiantes que fuman.

(b) Con base en una encuesta de opinión, a un polı́tico le gustarı́a calcular la opción que tiene
de ser reelegido en las próximas elecciones. 

Definición 1.1.17 Las técnicas y métodos utilizados por la ciencia estadı́stica, tanto en su
parte descriptiva como en la parte inferencial, son los llamados métodos estadı́sticos.
Copyright © 2017. Universidad del Norte. All rights reserved.

✍ Ejercicios de la sección 1.1


1. Describa una posible muestra de tamaño 5 de cada una de las siguientes poblaciones:

(a) Todos los periódicos publicados en Colombia.


(b) Todas las empresas importantes de Colombia.
(c) Todos los estudiantes de su curso.
(d) Todos los promedios de calificaciones de los alumnos de su universidad.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 9

2. Una revista publica datos sobre la clasificación de las 300 corporaciones industriales más
grandes de un paı́s, en términos de ventas y utilidades. En la tabla 1.1 se muestran datos
acerca de una muestra de estas 300 compañı́as.

(a) ¿Cuántos elementos hay en este conjunto de datos?


(b) ¿Cuál es la población?
(c) Calcule las ventas anuales en la muestra.
(d) Con el resultado del inciso (c), ¿cuál es la estimación de las ventas promedio para la
población?

Tabla 1.1: Muestra de 10 empresas que publica una revista


Ventas Utilidades Código del ramo
Compañı́a ($ millones) ($ millones) industrial
Todo Confort 38.420 2.586,0 12
Alles klar 20.847 5.157,0 15
Ramos del Caribe 8.071 234,0 2
Sofort 3.075 212,2 22
Express 8.092 168,7 48
El único 10.272 1.427,0 8
Integer 8.588 213,3 11
Good 6.371 49,7 10
Pueblo City 9.844 580,0 19
Report Info 6.454 87,0 19

3. Una empresa desea probar la eficacia de un nuevo comercial de televisión. Como parte
de la prueba, el comercial se pasa a las 8:30 p.m. en un programa de noticias locales en
cierta ciudad. Tres dı́as después, una empresa de investigación de mercado lleva a cabo una
encuesta telefónica para obtener información sobre la frecuencia de recuerdos (procentaje de
los telespectadores que recuerdan haber visto el comercial) y las impresiones del comercial.
Copyright © 2017. Universidad del Norte. All rights reserved.

(a) ¿Cuáles son la población y la muestra para este estudio?


(b) ¿Por qué se necesita usar una muestra en este caso? Explique su respuesta.

4. El candidato a alcalde de un pueblo pequeño quiere determinar si debe hacer una campaña
más fuerte contra su oponente. Para ello entrevistará a 300 de los 1.700 votantes registrados.
Si los resultados indican que tiene 35% más votos que su oponente, no intensificará sus
esfuerzos de campaña contra éste.

(a) Identifique la población, la muestra, un estadı́stico y un parámetro.


(b) ¿Qué harı́a el candidato si tuviera el 75% de los votos de la muestra?

1.1. Introducción

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
10 Llinás / Rojas

5. Se estableció que el costo promedio de los textos escolares en un colegio pequeño durante
el último año fue de $ 354.400, con base en una inscripción de 1.500 estudiantes. Como
un trabajo de clase en el colegio, un grupo de estadı́stica encuestó a 30 estudiantes para
determinar el promedio del costo de un libro de texto en el último año, y se concluyó que
fue de $ 399.700.

(a) Identifique la población, la muestra, los parámetros y dos estadı́sticos.


(b) ¿Qué podrı́a concluir el grupo de estadı́stica si el costo promedio de un libro para la
muestra de 30 estudiantes fuera de $ 1.050.000?

1.2 Organización de datos


Estudiaremos cuatro formas de organizar los datos: por el tipo de dato, de acuerdo a escalas
de medidas, mediante tablas y mediante representaciones gráficas.

1.2.1 Organización de datos de acuerdo al tipo

Como se ilustra en la figura 1.2, existen dos tipos de datos: categóricos (o cualitativos) y
numéricos (cuantitativos).

Tipos de datos Tipos de pregunta Respuestas

Categóricas ¿Es la Universidad del Norte Sí No


la universidad líder de la Costa?

Discretas ¿Cuántas universidades Número


hay en Barranquilla?

Numéricas

Continuas ¿Cuál es su peso? Kilogramos

Figura 1.2: Tipos de datos


Copyright © 2017. Universidad del Norte. All rights reserved.

1. Los datos categóricos o cualitativos representan categorı́as o atributos (como,


por ejemplo, “sı́” o “no”) que pueden clasificarse como un criterio o cualidad.

2. Los datos numéricos o cuantitativos producen respuestas numéricas, como el


peso en kilogramos o el número de universidades que hay en la Costa Atlántica. Estos
datos son de dos tipos: dicretos y continuos.

• Los datos discretos producen respuestas numéricas que surgen de un conteo.


Ejemplos de datos discretos son la cantidad de universidades que hay en la

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 11

Costa Atlántica, el número de estudiantes en la Universidad del Norte en 2003,


la cantidad de hermanos que tiene un determinado estudiante de administración,
el número de personas en una fila, etc.
• Los datos continuos producen respuestas numéricas que surgen de un proceso
de medición, donde la caracterı́stica de que se mide puede tomar cualquier valor
numérico en un intervalo. Ejemplos datos continuos son el peso (en kilogramos)
de una persona, su estatura (en metros), el tiempo que usted tarda en llegar a
la Universidad del Norte, etc.

1.2.2 Organización de datos de acuerdo a escalas de medidas

Los datos también se pueden clasificar según la escala de medición o el procedimiento que los
generó. Cuatro tipos de escalas de medición usados en estadı́stica son las escalas nominal,
ordinal, de intervalo y de razón.

Datos de nivel nominal

Un dato nominal se crea cuando se utilizan nombres para establecer categorı́as con la
condición de que cada dato pertenezca única y exclusivamente a una de estas categorı́as.
Existen escalas nominales tanto para los datos numéricos como categóricos. Una escala
nominal para datos numéricos asigna números a las categorı́as. Por ejemplo, entre los
datos numéricos que son nominales se incluyen los números en las camisetas deportivas, los
números telefónicos, etc.

Una escala nominal para datos categóricos es un agrupamiento no ordenado de los datos
en categorı́as discretas, donde cada dato puede incluirse solamente en uno de los grupos.
Por ejemplo, los datos nominales que son cualitativos incluyen el género, la raza, el tipo de
sangre y la religión.

Datos de nivel ordinal


Copyright © 2017. Universidad del Norte. All rights reserved.

Los datos medidos en una escala nominal ordenada de alguna manera se denominan datos
ordinales. Una escala ordinal coloca las medidas en categorı́as, cada una de las cuales
indica un nivel distinto respecto a un atributo que se está midiendo. La lista de datos
ordinales comprende:

1. Clasificaciones por letra: a, b, c y d; estos grados indican categorı́as de perfecciona-


miento, ası́ como los niveles alcanzados.

2. Rangos académicos: Doctor, magister, especialista y licenciado.

1.2. Organización de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
12 Llinás / Rojas

3. La evaluación de un maestro: insuficiente, aceptable, bueno y excelente.

4. Los grados de la escuela: primero, segundo, tercero, etc.

No es posible determinar la diferencia o distancia entre los valores medidos en una escala
ordinal. Aun cuando codifiquemos las letras a como 4, b como 3, c como 2 y d como 1,
esto no quiere decir que con a el estudiante sabe el doble que un estudiante con c. Todo
lo que podemos decir es que la calificación A es mejor o de un grado superior a la de C, ya
que una escala ordinal no admite unidad de distancia.

Datos de nivel de intervalo

Los datos medidos en una escala ordinal para los cuales pueden clasificarse las distancias
entre valores se llaman datos de intervalos. La distancia entre dos valores es importante
y los datos de intervalo son numéricos por necesidad; una escala de intervalo no siempre
tiene un punto cero (es decir, un punto que indique la ausencia de lo que se quiere medir).
La lista de datos de intervalo comprenden:

1. Puntajes en las pruebas de inteligencia. Un puntaje de inteligencia de 110 es cinco


puntos superior a uno de 105 (datos ordinales). En este caso, no sólo podemos decir
que un puntaje de 110 es superior a uno de 105, sino que también podemos decir que
es cinco puntos más alto; pero no podemos decir que una persona con un puntaje de
inteligencia de 180 es doblemente inteligente que una persona que tiene uno de 90.

2. Temperaturas Celsius. Una temperatura Celsius de 80◦ es 40◦ más caliente que una de
40◦ , pero no es correcto decir que 80◦ es el doble de caliente que 40◦ . Nótese también
que una temperatura de 0 no implica que la energı́a interna del sistema sea igual a
cero. El punto cero en la escala de temperatura Celsius fue escogido arbitrariamente
como el punto de congelación e indica que está presente algo de calor.

3. Fechas. Supongamos que un determinado joven nació en el 2000, 31 años después de


su padre. Podemos especificar la distancia entre estos dos sucesos ordenados, 31 años,
pero si existiera el año cero no representarı́a la ausencia de tiempo.
Copyright © 2017. Universidad del Norte. All rights reserved.

Datos de nivel de razón

Los datos medidos en una escala de intervalo con un punto cero que significa “ninguno” se
llaman datos de razón. Con datos medidos en una escala de razón podemos determi-
nar cuántas veces es mayor una medida que otra. Las escalas de razón incluyen salarios,
unidades de producción, peso, altura, etc. El dinero nos da una buena ilustración. Si usted
tiene cero pesos, entonces no tiene dinero. El peso es otro ejemplo. Si la aguja marca cero
en la escala, entonces hay una completa ausencia de peso (sin importar si se utiliza distintas

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 13

escalas de razón, como kilogramos, gramos o libras). Las escalas de razón también incluyen
escalas, como, por ejemplo, pies, libras, centı́metros, etc., usadas comúnmente para medir
unidades. Los resultados de contar objetos también son datos de razón, como, por ejemplo,
diez peras es el doble de cinco.

1.2.3 Organización de datos mediante tablas

En esta forma de organización de datos es importante el concepto de frecuencia de un dato.

Definición 1.2.1 La frecuencia (absoluta) de un dato, simbolizado con la letra f , es


el número de veces que aparece ese dato en una colección de datos.

Ejemplo 1.2.2 En el conjunto de datos 4 5 5 3 2 6 7 7 7 2, el cuatro sólo aparece una vez (por
lo tanto, tiene frecuencia f = 1), el cinco aparece dos veces (o sea, frecuencia f = 2), el 7 tiene
frecuencia f = 3, etc. 

Existen dos tipos generales de tablas para reportar datos usando frecuencias: tablas de
frecuencias no agrupadas y tablas de frecuencias agrupadas. Ambas tablas se mencionan
simplemente como tablas de frecuencia.2

Tabla de frecuencias no agrupadas

Son aquellas en donde aparecen básicamente dos informaciones: los datos y sus correspon-
dientes frecuencias. Los datos que organizados en tablas de frecuencias no agrupadas se
denominan usualmente datos no agrupados.

Ejemplo 1.2.3 La tabla de frecuencias (no agrupada) para el conjunto de datos 3 5 7 6 4 3 7 6


6 7 5 7 es:

Dato 3 4 5 6 7
Frecuencia 2 1 2 3 4
Copyright © 2017. Universidad del Norte. All rights reserved.

Tabla de frecuencias agrupadas

Otra posibilidad de organizar datos es agruparlos en intervalos (llamados intervalos de


clase o, simplemente, clases) y determinar la llamada frecuencia de clase de cada
clase, es decir, el total de datos que hay en cada clase. Posteriormente, las clases y las

2
En vez del término “tablas de frecuencia” se utiliza a menudo “distribución de frecuencias”.

1.2. Organización de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
14 Llinás / Rojas

frecuencias de clase se ubican en una tabla que llamaremos tabla de frecuencias


agrupadas. Los datos que organizados en tablas de frecuencias agrupadas se denomi-
nan generalmente datos agrupados.

Ejemplo 1.2.4 La tabla 1.2 es un ejemplo de una tabla de frecuencias agrupada y 10-14 y 15-19
son ejemplos de clases. En ella se presentan las distribuciones de frecuencia para los datos de
tiempo de auditorı́as de fin de año.

Tabla 1.2: Distribución de frecuencias para los datos de tiempo de auditorı́a 


Tiempo de auditorı́a (dı́as) Frecuencia
10 - 14 4
15 - 19 8
20 - 24 5
25 - 29 2
30 - 34 1

Las clases de frecuencias agrupadas poseen lo que se llama lı́mites de clase. Conside-
remos la tabla 1.2. En la clase 10-14, a 10 se le llama lı́mite inferior de clase y a
14, lı́mite superior de clase. La distancia entre cualquiera de dos lı́mites superiores
consecutivos o entre cualquiera de dos lı́mites inferiores consecutivos es llamada amplitud
de clase. La amplitud de cada clase en la tabla 1.2 es 5.

Cada clase en una tabla de frecuencia tiene lı́mites de clases teóricos llamados lı́mites
reales de clase o frontera de clase (término que utilizaremos en el texto). Al
lı́mite superior teórico se le llama frontera superior de clase (o lı́mite real supe-
rior de clase) y al lı́mite inferior teórico de clase se le llama frontera inferior de
clase (o lı́mite real inferior de clase). En general, para una clase dada, cualquier
frontera se calcula de la siguiente manera:
lı́mite inf. de la clase dada + lı́mite sup. de la clase anterior
Frontera inferior =
2
Copyright © 2017. Universidad del Norte. All rights reserved.

Observemos que la frontera inferior de una clase siempre coincide con la frontera superior
de la clase superior. Por ejemplo, para los datos de la tabla 1.2, la frontera inferior para la
tercera clase es 19,5 (que es la misma frontera superior de la segunda clase) y la frontera
superior para esa misma clase es 24,5 (que es la misma frontera inferior de la quinta clase).
Todas estas fronteras aparecen ya calculadas en la segunda columna de la tabla 1.3.
El punto medio de cada clase se denomina marca de clase. Es decir, para una clase
dada, la marca de clase se encuentra usando la fórmula
frontera inferior de clase + frontera superior de clase
Marca de clase =
2

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 15

Tabla 1.3: Distribución de frecuencias para los datos de tiempo de auditorı́a 


Tiempo de auditorı́a (dı́as) Fronteras inferior - superior Frecuencia
10 - 14 9,5 - 14,5 4
15 - 19 14,5 - 19,5 8
20 - 24 19,5 - 24,5 5
25 - 29 24,5 - 29,5 2
30 - 34 29,5 - 34,5 1

Sugerencias para construir una tabla de frecuencias agrupadas

Para construir cualquier tabla de frecuencias agrupadas debe tenerse en cuenta los siguientes
comentarios:

1. En la realidad, se acostumbra siempre agrupar los datos en clases, en donde los


extremos de la clase son las respectivas fronteras, en vez de los lı́mites de clase. De
ahora en adelante, nosotros lo haremos siempre ası́.

2. Para mayor comodidad en el proceso de construcción de las clases, acordaremos que


la primera clase debe contener por lo menos el dato menor (en la realidad, esto no
siempre es ası́).

3. Las clases deben ser mutuamente excluyentes, es decir, cada dato debe quedar exac-
tamente en una sola clase, no en dos al mismo tiempo.

4. Para mayor comodidad en el proceso de construcción de las clases, acordaremos que


todas las clases deben tener la misma amplitud (en la realidad, esto no siempre es ası́).

Determinación de la amplitud de clase. Para determinar la amplitud de clase


en cualquier tabla de frecuencias agrupadas, réstense dos lı́mites superiores de clases
consecutivos o dos lı́mites inferiores de clases consecutivos, o dos fronteras inferiores
Copyright © 2017. Universidad del Norte. All rights reserved.

consecutivas, o dos fronteras superiores consecutivas, o réstese la frontera inferior de


una clase de la frontera inferior superior de dicha clase.

5. Mientras menos clases escojamos será más fácil el trabajo, pero se perderá más in-
formación. Debido a que no hay un acuerdo general entre los estadı́sticos acerca del
número de clases que debe usarse y dado que la elección es arbitraria, para nuestros
fines, escogeremos entre 5 y 20. Una sugerencia útil para el número de clases es la
regla de Sturges.

1.2. Organización de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
16 Llinás / Rojas

Regla de Sturges. Esta establece como número de clases necesario, aproximada-


mente,
c = 3, 3(log n) + 1
donde n es el número de medidas y log n es el logaritmo de n en base 10. El valor de
c es común redondearlo al entero más cercano.

Otra regla razonable para el número de clases es:



c= n

6. Luego, determinar el rango R, que es la diferencia entre las medidas mayor y menor.

7. Posteriormente, la amplitud de clase w se encuentra como se muestra en el siguiente


recuadro:

Amplitud de clase. La amplitud de clase w se determina calculando el cociente


entre el rango R y el número de clases c. Es decir,
R
Amplitud de clase w =
c
El valor de w es común redondearlo al entero siguiente.

8. El dato menor debe caer en la primera clase. Por esta razón, el lı́mite inferior de
la primera clase debe estar en, o un poco antes de, el dato menor. Ası́ que pode-
mos establecer un acuerdo general sobre las clases de nuestras tablas de frecuencias
agrupadas, empezando siempre la primera clase con la frontera inferior, teniendo en
cuenta que el lı́mite inferior coincide con el dato menor. Cuando hacemos esto, el
valor mı́nimo que puede tomar la amplitud de clase se determina redondeando a w al
siguiente valor entero.

Ejemplo 1.2.5 (Primer modelo: Los datos son enteros) Construya una tabla de frecuen-
cias agrupadas considerando los siguientes datos:
Copyright © 2017. Universidad del Norte. All rights reserved.

14 21 23 21 16 19 22 25 16 16 24 24 25 19
16 19 18 19 21 12 16 17 18 23 25 20 23 16
20 19 24 28 15 22 24 20 22 24 22 20

SOLUCIÓN:

Paso 1. Primero determinamos el rango R. Como la medida mayor es 28 y la menor es 12, entonces
el rango es R = 28 − 12 = 16.

Paso 2. El ejemplo no nos dice con cuántas clases debemos construir la tabla de frecuencias agru-
padas. Podemos seleccionar esta cantidad arbitrariamente (entre 5 y 20) o aplicar la regla

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 17

de Sturges (que es la que utilizaremos). Como tenemos n = 40 datos, la regla de Sturges


sugiere usar c = 6 clases, porque el número de clase es

c = (3, 3) log 40 + 1 = (3, 3)(1, 60) + 1 = 6, 2867 ≈ 6

donde ≈ significa “aproximadamente igual que”. Observemos que con la otra regla se obtiene

el mismo resultado porque c = 40 = 6, 324 ≈ 6.

Paso 3. Ahora, determinamos w, la amplitud de cada clase. En este caso,


R 16
w = = = 2, 666
c 6

Como la unidad de precisión para los datos es 1, escogemos el mı́nimo entero mayor que
2,666 como el valor de la amplitud. En este caso, el mı́nimo entero mayor que 2,666 es 3.
Por lo tanto, w = 3.

Paso 4. A continuación se construye la primera clase con un ancho de w = 3. Para ello, primero,
tenemos que encontrar las fronteras inferior y superior de esta clase. Como la unidad de
medida es 1 (porque todos los datos son enteros) y como el “punto medio” de cada unidad
de medida es

Unidad de medida 1
Punto medio de cada unidad de medida = = = 0, 5
2 2
entonces, en este caso, la frontera inferior de la primera clase la hallaremos ası́:

Front. inf. de primera clase = dato menor − punto medio de unidad de medida
= 12 − 0, 5 = 11, 5

Es decir, la frontera superior de la primera clase es 11,5. Como la amplitud es w = 3,


entonces la frontera superior será:

Frontera superior = frontera inferior + amplitud = 11, 5 + 3 = 14, 5

En consecuencia, la primera clase resulta ser el intervalo 11,5 - 14,5.

Paso 5. Para obtener cada una de las clases siguientes a esta primera, tenemos en cuenta que la
Copyright © 2017. Universidad del Norte. All rights reserved.

frontera inferior de la clase siguiente coincide con la frontera superior de la clase anterior
y que la amplitud del intervalo es w = 3. De esta forma, las seis clases resultan ser las
siguientes:

Clase 1: 11,5 - 14,5


Clase 2: 14,5 - 17,5 (Observe: 17, 5 = 14, 5 + 3)
Clase 3: 17,5 - 20,5 (Observe: 20, 5 = 17, 5 + 3)
Clase 4: 20,5 - 23,5 (Observe: 23, 5 = 20, 5 + 3)
Clase 5: 23,5 - 26,5 (Observe: 26, 5 = 23, 5 + 3)
Clase 6: 26,5 - 29,5 (Observe: 29, 5 = 26, 5 + 3)

1.2. Organización de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
18 Llinás / Rojas

Tabla 1.4: Tabla de frecuencia agrupada con 6 clases para 40 datos 


Clase Cuenta Frecuencia
11,5 - 14,5 || 2
14,5 - 17,5 ||||| ||| 8
17,5 - 20,5 ||||| ||||| | 11
20,5 - 23,5 ||||| ||||| 10
23,5 - 26,5 ||||| ||| 8
26,5 - 29,5 | 1

Paso 6. Para determinar la frecuencia de cada clase usamos una columna de marcas de cuenta. Si
uno de los datos cae en una clase, anotamos una marca (|) en la columna correspondiente a
esa clase. La tabla 1.4 contiene la tabla de frecuencias agrupadas para los 40 datos dados.

Ejemplo 1.2.6 (Segundo modelo: Datos con un solo lugar decimal) Forme una distribu-
ción de frecuencias considerando los siguientes datos:

8,9 10,2 11,5 7,8 10,0 12,2 13,5 14,1 10,0 12,2
6,8 9,5 11,5 11,2 14,9 7,5 10,0 6,0 15,8 11,5

SOLUCIÓN:

Paso 1. Como la medida mayor es 15,8 y la menor es 6,0, entonces el rango es:

R = 15, 8 − 6, 0 = 9, 8

Paso 2. Ya que tenemos n = 20 datos, entonces, por la regla de Sturges debemos usar c = 5 clases,
porque el número de clase es:

c = (3, 3) log 20 + 1 = (3, 3)(1, 30) + 1 = 5, 2933 ≈ 5

donde ≈ significa “aproximadamente igual que”.


Copyright © 2017. Universidad del Norte. All rights reserved.

Paso 3. Ahora, determinamos w, la amplitud de cada clase. En este caso,

R 9, 8
w = = = 1, 96
c 5

El mı́nimo entero mayor que 1,96 es 2. Por lo tanto, w = 2.

Paso 4. Como la unidad de medida es 0,1 (por tener los datos un sólo lugar decimal) y como el
“punto medio” de cada unidad de medida es:

Unidad de medida 0, 1
Punto medio de cada unidad de medida = = = 0, 05
2 2

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 19

entonces la frontera inferior de la primera clase es:

Frontera inferior = dato menor − 0, 05 = 6, 0 − 0, 05 = 5, 95

y la frontera superior será:

Frontera superior = frontera inferior + amplitud = 5, 95 + 2 = 7, 95.

En consecuencia, la primera clase es 5,95 - 7,95.

Paso 5. Para obtener cada una de las clases siguientes a esta primera, tenemos en cuenta que la
frontera inferior de la clase precedente coincide con la frontera superior de la clase anterior
y que la amplitud del intervalo es w = 2. De esta forma, las seis clases resultan ser las
siguientes:

Clase 1: 5,95 - 7,95


Clase 2: 7,95 - 9,95 (Observe: 9, 95 = 7, 95 + 2)
Clase 3: 9,95 - 11,95 (Observe: 11, 95 = 9, 95 + 2)
Clase 4: 11,95 - 13,95
Clase 5: 13,95 - 15,95

Paso 6. Para determinar la frecuencia de cada clase usamos una columna de marcas de cuenta. Si
uno de los datos cae en una clase, anotamos una marca (|) en la columna correspondiente a
esa clase. La tabla 1.5 contiene la tabla de frecuencias agrupadas para los 20 datos dados.
Además, allı́ también aparecen las marcas de clase X correspondientes a cada clase. Por
ejemplo, la primera marca de clase se calcula ası́:
6, 0 + 7, 9
X= = 6, 95
2
Cada marca de clase sucesiva se encuentra sumando w = 2 a la marca anterior.

Tabla 1.5: Tabla de frecuencia agrupada con 5 clases para 20 datos 


Clase Cuenta Frecuencia Marcas de clase X
5,95 - 7,95 |||| 4 6,95
7,95 - 9,95 || 2 8,95
9,95 - 11,95 ||||| ||| 8 10,95
Copyright © 2017. Universidad del Norte. All rights reserved.

11,95 - 13,95 ||| 3 12,95


13,95 - 15,95 ||| 3 14,95

Ejemplo 1.2.7 (Tercer modelo: Datos con dos lugares decimales) Forme una distribución
de frecuencias considerando los siguientes datos:

39,78 28,30 28,31 17,95 44,47 46,65 31,47 33,45 29,17


48,39 82,71 43,63 41,17 47,32 52,16 25,94 50,32 35,25
35,70 17,89 60,20 48,14 22,78 38,22 23,25

1.2. Organización de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
20 Llinás / Rojas

SOLUCIÓN:

Paso 1. El rango es R = 82, 71 − 17, 89 = 64, 82.

Paso 2. Aplicando la regla de Sturges obtenemos que el número de clase es:

c = (3, 3) log 25 + 1 = (3, 3)(1, 3979) + 1 = 5, 613 ≈ 6


Observemos que con la otra regla se obtiene c = 25 = 5. Es decir, podemos construir la
tabla con 5 o con 6 clases. Escogeremos c = 6.

Paso 3. Como c = 6 y R = 64, 82, entonces w = R


c = 10, 803. El mı́nimo entero mayor que 10,803
es 11. Por lo tanto, w = 11.

Paso 4. Como la unidad de medida es 0,01 (por tener los datos dos lugares decimales) y como como
el “punto medio” de cada unidad de medida es:

Unidad de medida 0, 01
Punto medio de cada unidad de medida = = = 0, 005
2 2

entonces la frontera inferior de la primera clase es:

Frontera inferior = dato menor − 0, 005 = 17, 89 − 0, 005 = 17, 885

y la frontera superior:

Frontera superior = frontera inferior + amplitud = 17, 885 + 11 = 28, 885

En consecuencia, la primera clase es 17,885 - 28,885.

Paso 5. Para obtener cada una de las clases siguientes a esta primera, tenemos en cuenta que la
frontera inferior de la clase precedente coincide con la frontera superior de la clase anterior y
que la amplitud del intervalo es w = 11. De esta forma, las seis clases son como se muestran
en la tabla 1.6. Allı́ también aparecen las marcas de clase correspondientes a cada clase.

Tabla 1.6: Tabla de frecuencia agrupada con 6 clases para 25 datos 


Copyright © 2017. Universidad del Norte. All rights reserved.

Clase Cuenta Frecuencia Marcas de clase X


17,885 - 28,885 ||||| || 7 23,385
28,885 - 39,885 ||||| || 7 34,385
39,885 - 50,885 ||||| ||| 8 45,385
50,885 - 61,885 || 2 56,385
61,885 - 72,885 0 67,385
72,885 - 83,885 | 1 78,385

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 21

Tabla de frecuencia relativas, de frecuencias acumuladas y de


frecuencias relativas acumuladas

Son tablas de frecuencias agrupadas o no agrupadas en donde adicionalmente aparecen las


frecuencias relativas, las frecuencias acumuladas y/o las frecuencias acumuladas relativas.

Definición 1.2.8 (a) La frecuencia relativa de un dato o de una clase se encuentra


dividiendo la frecuencia de dicho dato (o de la clase) entre el total de datos. Entonces,
a la tabla se le llama tabla de frecuencias relativas.

(b) La frecuencia acumulada de cualquier dato o clase es la suma de la frecuencia de


ese mismo dato o clase con las frecuencias de todos los demás datos o clases anteriores.
A la tabla se le llama tabla de frecuencias acumuladas.

(c) La frecuencia relativa acumulada de un dato o de una clase se obtiene dividiendo


la frecuencia acumulada del dato o de la clase por el número total de datos. A la tabla
que contiene a estas frecuencias se les denomina tabla de frecuencias relativas
acumuladas.

Ejemplo 1.2.9 En la tabla 1.7 se muestra la tabla de frecuencias relativas, de frecuencias acu-
muladas y de frecuencias acumuladas relativas para los 40 datos del ejemplo 1.2.5.

Tabla 1.7: Tabla de frecuencias para las datos del ejemplo 1.2.5. 
Clase Frec. Frec. rel. Frec. acum. Frec. rel. acum.
11,5 - 14,5 2 2/40 = 0,05 ≈ 5% 2 2/40 = 0,05
14,5 - 17,5 8 8/40 = 0,20 ≈ 20% 10 (= 8+2) 10/40 = 0,25
17,5 - 20,5 11 11/40 = 0,275 ≈ 27,5% 21 (= 11+10) 21/40 = 0,525
20,5 - 23,5 10 10/40 = 0,25 ≈ 25% 31 (= 21+10) 31/40 = 0,775
23,5 - 26,5 8 8/40 = 0,20 ≈ 20% 39 (= 8+31) 39/40 = 0,975
26,5 - 29,5 1 1/40 = 0,025 ≈ 2,5% 40 (= 1+39) 40/ 40 = 1,0
Copyright © 2017. Universidad del Norte. All rights reserved.

Tablas de frecuencias bivariadas

Una tabla de frecuencias bivariadas es un arreglo de datos clasificados en dos cate-


gorı́as con sus respectivas frecuencias. Las categorı́as pueden ser números discretos, inter-
valos numéricos o valores cualitativos como género, color de cabello o religión.

Ejemplo 1.2.10 Una encuesta sobre el deporte preferido tuvo los resultados en hombres y mu-
jeres que se muestran en la tabla 1.8. La información que sigue, entre otras, puede leerse fácilmente
de la tabla:

1.2. Organización de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
22 Llinás / Rojas

(a) Se han encuestado en total a 108 personas.

(b) Hay 19 hombres que juegan béisbol.

(c) Hay 40 personas que juegan fútbol.

(d) Hubo 50 mujeres entrevistadas.

Tabla 1.8: Tabla de frecuencias bivariada para el ejemplo 1.2.10. 


Deporte preferido
Béisbol Basquetbol Fútbol Total
Hombres 19 15 24 58
Mujeres 16 18 16 50
Total 35 33 40 108

1.2.4 Organización de datos mediante representaciones gráficas

Hay gráficas de varios tipos, entre los cuales se encuentran los siguientes: el diagrama
circular o de pastel, el pictograma, el diagrama de barras, el diagrama de caja y bigotes,
el histograma, el polı́gono (de frecuencia o de frecuencias relativas), la ojiva (o polı́gono
de frecuencias acumuladas o polı́gono de frecuencias relativas acumuladas) y el diagrama
de tallo y hojas. Explicaremos cada uno de ellos, con excepción del diagrama de caja y
bigotes, que será explicado en la sección 1.5.

Diagramas circulares (o de pastel)

Se utilizan para hacer representaciones porcentuales y se emplean generalmente para datos


categóricos.

Ejemplo 1.2.11 La siguiente tabla presenta los datos sobre la cantidad de refrescos de marca A,
B, C, D y E que se vendieron en una tienda:
Copyright © 2017. Universidad del Norte. All rights reserved.

Refresco Frecuencia Frecuencia relativa


A 19 0,38
B 8 0,16
C 5 0,10
D 13 0,26
E 5 0,10

Esta información se puede presentar a través de un diagrama circular como el que se muestra
en la figura 1.3. Para trazarlo se dibuja primero un cı́rculo. A continuación, con las frecuencias

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 23

relativas, se divide el cı́rculo en sectores o partes que corresponden a la frecuencia relativa de cada
clase. Por ejemplo, como hay 360 grados en un cı́rculo, y como el refresco A tiene 0,38 de frecuencia
relativa, el sector del diagrama circular que le corresponde debe tener (0,38)(360)=136,8 grados.
Se efectúan cálculos semejantes para las demás clases, y se obtiene el diagrama de la figura 1.3.
Los valores numéricos que se ven para cada sector pueden ser frecuencias, frecuencias relativas o
porcentajes.

Figura 1.3: Diagrama de pastel sobre compras de refresco 

Pictogramas o pictógrafos

Un pictograma es la representación de datos estadı́sticos por medio de sı́mbolos que por


su forma sugieren la naturaleza del dato.

Ejemplo 1.2.12 El siguiente pictograma representa una información sobre las casas construidas
en algunos años por una firma constructora. En él se incluyen las siguientes convenciones: Δ
significa 1.000 casas construidas y Λ, 500 casas.

Años Casas construidas


2000 ΔΔΔΔΔ
2001 ΔΔΔΔΔΔΔΛ
Copyright © 2017. Universidad del Norte. All rights reserved.

2002 ΔΔΔΔΔΛ
2003 ΔΔΔΔΔΔΔ

Fácilmente se puede interpretar con base en el diagrama que en el 2000 la firma construyó 5.000
casas y en el 2002, 5.500 casas. 

Diagrama de barras

Es una representación gráfica en la que cada una de las modalidades del aspecto de interés
se representa mediante una barra. En este gráfico se suelen disponer los datos en el primer

1.2. Organización de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
24 Llinás / Rojas

cuadrante de unos ejes coordenados, y se levanta sobre el eje de las abscisas una barra
para cada modalidad del dato observado. La altura de la barra ha de ser proporcional a
la frecuencia absoluta o relativa, que se representa en el eje de las ordenadas. Este tipo de
diagramas se utilizan tanto para datos categóricos como numéricos.

Ejemplo 1.2.13 La figura 1.4 muestra un diagrama de barras sobre los datos del ejemplo 1.2.11.

20
Frecuencia

16
Frecuencia

12

0
A B C D E
Refrescos
Refresco
Figura 1.4: Diagrama de barras para la compra de refrescos 

Histogramas

Los histogramas son una forma de representación gráfica de una distribución de frecuen-
cia que consiste en representar las frecuencias (absolutas, relativas, acumuladas o relativas
acumuladas) por medio de áreas de rectángulos (barras). Cuando utilizamos frecuencias
absolutas, hablamos de histograma de frecuencias; cuando usamos frecuencias relativas,
histogramas de frecuencias relativas, etc. Los histogramas pueden construirse para dis-
tribuciones de frecuencias agrupadas y no agrupadas.

Histogramas para frecuencias no agrupadas

La idea de construir un histograma para frecuencia no agrupada de los datos es representar


Copyright © 2017. Universidad del Norte. All rights reserved.

cada frecuencia por una barra cuya área sea proporcional a ella. Tı́picamente, el ancho de
cada barra se escoge como 1, y ası́ el área de la barra es igual a la frecuencia (absoluta,
relativa, acumulada o relativa acumulada) del dato.

Es importante señalar que aquı́ los datos pueden ser categóricos o núméricos y que éstos
se colocan en el eje horizontal, y sus correspondientes frecuencias (absolutas, relativas,
acumuladas o relativas acumuladas), en el eje vertical del diagrama.

Ejemplo 1.2.14 El diagrama que se muestra en la figura 1.4 es un ejemplo de un histograma


para la frecuencia de los datos de compra de refrescos. 

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 25

Histogramas para frecuencias agrupadas

Para construir un histograma para datos medidos en una escala de intervalo o en una escala
de razón, se acostumbra seguir dos pasos:

• Se organizan los datos en una tabla de frecuencias (absolutas, relativas, acumuladas


o relativas acumuladas) agrupadas.

• Se construye una gráfica de barras usando las fronteras de clase para colocar barras, y
las frecuencias (absolutas, relativas, acumuladas o relativas acumuladas) para indicar
las alturas de las barras.

Ejemplo 1.2.15 La tabla de frecuencias (absolutas, acumuladas y relativas) correspondiente a


los datos del ejemplo 1.2.6 se muestra en la tabla 1.9:

Tabla 1.9: Tabla de frecuencia agrupada para los datos del ejemplo 1.2.6
Clase Frecuencia Frecuencia acumulada Frecuencia relativa
5,95 - 7,95 4 4 0,2
7,95 - 9,95 2 6 0,1
9,95 - 11,95 8 14 0,4
11,95 - 13,95 3 17 0,15
13,95 - 15,95 3 20 0,15

Los histogramas de frecuencias relativas y de frecuencias acumuladas para estos datos son como
se ve en la figura 1.5:
%)

40 20
(en %)

acum.
Frec. acum.
rel. (en

16
30
12
Copyright © 2017. Universidad del Norte. All rights reserved.

Frec.rel.

20
Frec.

8
Frec.

10
4
0 0
5,95 7,95 9,95 11,95 13,95 15,95 5,95 7,95 9,95 11,95 13,95 15,95
Fronteras
Fronteras Fronteras
Fronteras

(a) Histograma de frecuencias (b) Histograma de frecuencias


relativas acumuladas

Figura 1.5: Histogramas para los datos del ejemplo 1.2.6 

1.2. Organización de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
26 Llinás / Rojas

Polı́gonos

Estos gráficos se utilizan para representar series cronológicas y se construye usando una
tabla de frecuencias (absoluta o relativa) agrupadas con marcas de clase. Si se usan fre-
cuencias absolutas, se denomina polı́gono de frecuencias, y si se utilizan frecuencias relativas,
polı́gono de frecuencias relativas.

Ejemplo 1.2.16 Construya un polı́gono de frecuencia para los datos del ejemplo 1.2.6.

SOLUCIÓN:
Consideremos la tabla 1.5, la cual corresponde a la tabla de frecuencias agrupadas para los 20
datos del ejemplo 1.2.6, con sus correspondientes marcas de clase. Ahora construimos el polı́gono
con frecuencias absolutas mostrada en la figura 1.6.

8
Frecuencias

6
Frecuencias

0
4,95 6,95 8,95 10,95 12,95 14,95 16,95
Marcas de
Marcas declase
clase
Figura 1.6: Polı́gono de frecuencias para los datos del ejemplo 1.2.6

Las marcas de clase se colocan en el eje horizontal y las frecuencias en el eje vertical. Notemos
que el polı́gono se “baja” en ambos extremos, colocando el primero y el último punto en puntos
del eje horizontal que distan w = 2 de las marcas de clase más cercanas. 
Copyright © 2017. Universidad del Norte. All rights reserved.

Ojivas

La ojiva, llamada también polı́gono de frecuencias acumuladas (o polı́gono de frecuencias


relativas acumuladas), se construye a partir de tablas de frecuencias (acumuladas o relativas
acumuladas). Las ojivas ofrecen un medio gráfico para interpolar o aproximar el número o
porcentaje de observaciones menores o iguales que un valor especı́fico.

Ejemplo 1.2.17 La figura 1.7 representa una ojiva con frecuencias acumuladas para los datos
del ejemplo 1.2.6. Para su construcción consideramos la tabla 1.9.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 27

Para localizar los puntos de la ojiva usamos las fronteras superiores de cada clase (ubicadas
siempre sobre el eje horizontal) y sus correspondientes frecuencias acumuladas (ubicadas siempre
sobre el eje vertical). Después unimos los puntos consecutivos por segmentos de recta (observe
que la frecuencia acumulada para la frontera inferior de la primera clase es el número 0).

20
acum.
Frec. acum.16

12
Frec.

0
5,95 7,95 9,95 11,95 13,95 15,95
Fronteras superiores
Fronteras superiores
Figura 1.7: Ojiva para los datos del ejemplo 1.2.6 

Diagrama de tallo y hojas

El uso de una tabla de frecuencia agrupada tiene una desventaja bastante obvia: los datos
originales se pierden en el proceso de agrupamiento. Para solucionar esta limitación puede
usarse el llamado diagrama de tallo y hojas. Estos diagramas fueron creados por el
estadı́stico John Tukey y ofrecen una forma novedosa y rápida de presentar información
numérica: si un numeral tiene dos o más dı́gitos, entonces se puede descomponer en un tallo
y una hoja. Un tallo es el primer dı́gito o parte del numeral, mientras que una hoja está
formada por el o los dı́gitos restantes. Por ejemplo, el numeral 534 se puede descomponer
en dos formas:

5 | 34 53 | 4
↑ ↑ ↑ ↑
Copyright © 2017. Universidad del Norte. All rights reserved.

tallo hoja tallo hoja

La presentación gráfica de datos es muy fácil de realizar usando tallos y hojas; cada dato
aporta una hoja de algún tallo.

Ejemplo 1.2.18 Los datos de abajo muestran el número de anuncios radiofónicos de 30 segundos
pagados el año pasado por cada uno de los 45 miembros de una empresa. Organice los datos en un
diagrama de tallo y hojas y determine la forma que toma este diagrama. ¿Alrededor de qué valores
tiende a acumularse el número de anuncios? ¿Cuál es el menor número de anuncios pagados por
un comerciante? ¿El mayor número pagado?

1.2. Organización de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
28 Llinás / Rojas

96 93 88 117 127 95 113 96 108 94 148 156 139 142 94


107 125 155 155 103 112 127 117 120 112 135 132 111 125 104
106 139 134 119 97 89 118 136 125 143 120 103 113 124 138

SOLUCIÓN:
En el conjunto de datos observamos que el menor número de anuncios pagados es 88. De manera
que el valor del primer tallo será 8. El número más grande es 156. Entonces, los valores de los
tallos empezarán en 8 e irán hasta 15. El primer número en los datos es 96, que tendrá como
tallo 9 y como hoja 6. Moviéndose por el renglón superior, el segundo valor es 93 y el tercero 88.
Después de tomar los tres primeros valores del conjunto de datos, su diagrama es:

8 8
9 6 3
10
11
12
13
14
15

Después de organizar todos los datos, el diagrama de tallo y hojas resultante será:

8 8 9
9 6 3 5 6 4 4 7
10 8 7 3 4 6 3
11 7 3 2 7 2 1 9 8 3
12 7 5 7 0 5 5 0 4
13 9 5 2 9 4 6 8
14 8 2 3
15 6 5 5

Lo que solemos hacer es ordenar los valores de las hojas de menor a mayor y, en este caso, el
diagrama final quedará ası́:

8 8 9
Copyright © 2017. Universidad del Norte. All rights reserved.

9 3 4 4 5 6 6 7
10 3 3 4 6 7 8
11 1 2 2 3 3 7 7 8 9
12 0 0 4 5 5 5 7 7
13 2 4 5 6 8 9 9
14 2 3 8
15 5 5 6

Del diagrama de tallos y hojas se pueden sacar varias conclusiones, como, entre otras, las siguientes:

• Primero, el menor número de anuncios comprados es 88 y el mayor es 156.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 29

• Dos comerciantes compraron menos de 90 anuncios, y tres, más de 150.

• Puede observarse, por ejemplo, que hay tres comerciantes que compraron más de 150 co-
merciales.

• La mayor concentración del número de comerciales está entre 110 y 130.

• Hubo 9 comerciantes que compraron entre 110 y 119 anuncios y 8, entre 120 y 129.

• También podemos decir que dentro del grupo de 120 a 129, el número de anuncios comprados
se repartió uniformemente.

• Dos comerciantes compraron 120; uno, 124; tres, 125 y dos, 127.

Para concentrarnos en la forma que toma el diagrama de tallos y hojas, coloquemos un rectángulo
para representar la “cantidad de hojas” de cada tallo. Al hacerlo obtenemos la siguiente repre-
sentación:

8 8 9
9 3 4 4 5 6 6 7
10 3 3 4 6 7 8
11 1 2 2 3 3 7 7 8 9
12 0 0 4 5 5 5 7 7
13 2 4 5 6 8 9 9
14 2 3 8
15 5 5 6

Si giramos la página 90 grados en el sentido de las manecillas del reloj, obtenemos una imagen de
los datos que se parece mucho a la de un histograma con clases de 80 a 90, 90 a 100, 100 a 110,
etc. Aunque el diagrama de tallos y hojas parece ofrecer la misma información que un histograma,
tiene dos ventajas principales:

1. Es más fácil de construir.

2. Dentro de un intervalo de clase, el diagrama de tallo y hojas da más información que un


histograma porque muestra los valores reales. 
Copyright © 2017. Universidad del Norte. All rights reserved.

✍ Ejercicios de la sección 1.2


6. Clasifique los datos siguientes en cuantitativos (numéricos) y cualitativos (categóricos). En
caso de ser numérico, como discretos o continuos:

(a) Estaturas en centı́metros de cuatro jugadores de fútbol.


(b) El número de goles anotados por un futbolista en toda su carrera deportiva.
(c) Los sueldos ganados por unos profesores universitarios.

1.2. Organización de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
30 Llinás / Rojas

(d) Las temperaturas promedios diarias en el último mes.


(e) Clasificación étnica de 30 empleados.
(f) Números telefónicos de ciertas personas.
(g) Calificaciones del primer parcial de Estadı́stica de unos estudiantes universitarios.
(h) Distancia (en metros) recorrido por un atleta en una temporada.
(i) Peso perdido (en kilogramos) por 10 personas debido a una dieta.
(j) Fecha de cumpleaños de determinadas personas.
(k) Calificaciones (E, S, A, D, I) de unos estudiantes de bachillerato.
(l) Rango militar.

7. Diga la clase de gráficas que son apropiadas para datos (a) cualitativos, (b) cuantitativos y
(c) nominales.

8. La tabla siguiente contiene la distribución de vehı́culos que hay en un parqueadero:

Clase Tipo de vehı́culo Cifra registrada


1 Taxi 30
2 Camioneta 20
3 Motocicleta 35
4 Bicicleta 40

(a) Identifique los datos de cada una de las tres columnas como cuantitativos o cualitativos.
(b) Identifique los datos de la tercera columna como discretos o continuos.
(c) Determine los datos de cada una de las tres columnas como nominales, ordinales, de
intervalo o de razón.

9. A continuación se presenta una escala numérica para medir la efectividad de la tecnologı́a


en la enseñanza de una determinada asignatura: 1, si necesita mejorarse; 3, si es efectiva y
competente; y 5, si es verdaderamente extraordinaria.

(a) Identifique el tipo de escala de medición.


Copyright © 2017. Universidad del Norte. All rights reserved.

(b) Suponga que 20 estudiantes usan esta escala para evaluar a su maestro de estadı́stica.
¿Será más fácil interpretar esos resultados que los que se obtendrı́an si los 20 estudiantes
evaluaran a su maestro mediante una opinión escrita de respuesta libre? Explique.

10. Los siguientes datos representan los totales, en miles de pesos, gastados en fotocopias por
una muestra de 25 estudiantes durante un semestre:

29 89 77 72 39 47 64 84 88 57 28 63 38
42 36 72 69 68 41 52 39 84 45 52 72

Construya una tabla de frecuencias agrupadas usando la regla de Sturges.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 31

11. Los datos adjuntos representan una muestra del aumento de precios (en pesos) de la gasolina
extra en una cierta ciudad a lo largo de un año en particular:

123,9 127,9 130,9 121,9 132,9 120,8 115,9 117,9 131,9


121,9 126,9 122,8 126,9 137,9 115,9 115,9 121,9
126,9 119,9 118,9 119,8 116,9 129,9 122,8 119,9

Mediante cinco clases construya una tabla de frecuencias relativas acumuladas agrupadas.

12. Se clasificó a los estudiantes de un programa universitario de acuerdo con el semestre que
cursan y sus preferencias deportivas. Los resultados están registrados en la siguiente tabla:

Primero Segundo Tercero Cuarto


Fútbol 15 14 5 9
Béisbol 12 22 6 6
Voleibol 5 5 9 5
Basquetbol 26 7 6 7
Natación 7 8 4 2

(a) ¿Qué porcentaje de los estudiantes de primer semestre prefieren el fútbol?


(b) ¿Qué porcentaje de los aficionados a la natación son de segundo semestre?
(c) ¿Qué porcentaje del total de los estudiantes prefieren el basquetbol?
(d) ¿Qué porcentaje de los estudiantes son de cuarto semestre?
(e) ¿Qué porcentaje del total de estudiantes son de tercero o cuarto semestre?
(f) ¿Qué porcentaje prefiere la natación, el voleibol o el béisbol?

13. Los siguientes datos representan las cuentas telefónicas mensuales, en miles de pesos, de 25
residentes de un pequeño pueblo:

21,48 21,15 25,12 23,47 27,81 19,80 36,05 28,50 26,66


20,35 30,22 25,49 20,80 23,83 25,35 23,48 25,81 21,07
26,83 30,96 33,38 20,77 19,98 35,87 22,02

(a) ¿Qué porcentaje del grupo pagó más de 21.000 pesos?


Copyright © 2017. Universidad del Norte. All rights reserved.

(b) ¿Qué porcentaje pagó más de 22.000 pesos pero menos de 27.000 pesos?

14. Considere la siguiente distribución de frecuencias:

Clase 20-40 40-60 60-80 80-100 100-120


Frecuencia 14 23 15 20 28

Trace un histograma de frecuencias relativas, un histograma de frecuencias relativas acu-


muladas, un polı́gono de frecuencias absolutas y una ojiva de frecuencias acumuladas para
estos datos.

1.2. Organización de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
32 Llinás / Rojas

15. Los datos que se indican a continuación representan el costo (en miles de pesos) de la
energı́a eléctrica durante un determinado mes del año para una muestra aleatoria de 50
apartamentos en cierta ciudad importante:

128 144 168 109 167 141 149 206 175 123
153 197 127 82 96 171 202 178 147 102
135 191 137 129 158 108 119 183 151 114
111 148 213 130 165 157 185 90 116 172
143 187 166 139 149 95 163 150 154 130

(a) Obtenga una tabla de frecuencias con 7 intervalos de clase.


(b) Grafique el correspondiente histograma de frecuencias, el polı́gono de frecuencias rela-
tivas y la ojiva con frecuencias acumuladas relativas.
(c) ¿Alrededor de qué cantidad parece concentrarse el costo mensual de energı́a eléctrica?
(d) Según su opinión, ¿cuál de las gráficas representa mejor la distribución de los costos de
energı́a eléctrica?

16. Se les pidió a 20 personas que identificaran su preferencia religiosa. Los resultados son:

C P P J J A J C P P C J J C P P A P C J

donde C denota católico; P, protestante; J, judı́o y A, ateo. Construya una tabla de fre-
cuencias (absolutas, relativas, acumuladas y acumuladas relativas), un diagrama de barras,
uno circular y un pictograma.

17. Los siguientes datos presentan los porcentajes de rentabilidad de las acciones de 25 empresas:

30,8 20,3 24,0 29,6 19,4 38,0 24,5 21,5 25,6


30,8 32,9 30,3 39,5 13,3 28,0 19,9 24,6 32,3
30,7 20,3 24,7 18,7 36,8 31,2 50,9

Construya un diagrama de tallo y hojas, una tabla de frecuencias agrupadas usando la


fórmula de Sturges y con ayuda de esta tabla responda las preguntas que se formulan en los
siguientes incisos:

(a) ¿Qué porcentaje de empresas tienen el porcentaje de rentabilidad de las acciones mayor
Copyright © 2017. Universidad del Norte. All rights reserved.

que 34,25%?
(b) ¿Cuántas empresas tienen el porcentaje de rentabilidad de las acciones menor que
27,25% o mayor que 41,25%?

18. Según un estudio reciente, en cierto paı́s mueren cada año 40.000 mujeres a causa del cáncer
de mama y 85.000 por diabetes. Dibuje un diagrama de barras y un pictograma que repre-
sente esta información.

19. En 1986 se produjeron 50,2 nacimientos por cada mil mujeres con edad entre 15 y 19 años.
En 1991, el número de nacimiento fue de 62,1 por cada mil mujeres de la misma edad.
Dibuje un diagrama de barras que represente esta información.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 33

20. De las pelı́culas que están en cartelera en una gran ciudad, el 30% son dramas, el 35%
comedias, un 15% pelı́culas de acción, otro 6% de ciencia ficción, el 10% policiacas y el 4%
de terror. Construya un diagrama circular que represente esta información.

21. La siguiente tabla se refiere a los usos más comunes citados en una encuesta realizada
a usuarios de computadores de pequeñas y medianas empresas. Construya un diagrama
circular para representar esta información:

Área Respuestas (%)


Contabilidad 22
Procesadores de texto 12
Hojas de cálculo 16
Bases de datos 13
Puntos de venta 1
Telecomunicaciones 4
Otros 32

22. Un reporte sobre galletas reportó las siguientes calificaciones para varias marcas:

32 53 50 65 45 40 56 44 62 32
Integral
30 40 50 56 30 22 56 68 41
47 40 34 62 52 62 53 75 42
No integral
75 80 47 56 62 50 34 42 36

Construya una presentación comparativa de tallo y hoja, ponga en una lista los tallos (en el
centro de la página), las hojas integrales a la derecha y las hojas no integrales a la izquierda.
Describa las similitudes y diferencias para los dos tipos.

1.3 Análisis de datos en tablas de frecuencias


no agrupadas
A continuación estudiaremos las medidas que describen el comportamiento de un conjunto
de datos. Estas medidas son: las de tendencia central (o de centralización), las de colocación
Copyright © 2017. Universidad del Norte. All rights reserved.

(o de posición relativa), las de dispersión (o de variabilidad ) y las de forma. Estas se pueden


visualizar intuitivamente en las siguientes gráficas de la figura 1.8 (que corresponde a las
gráficas de los llamados histogramas suavizados).

1.3.1 Medidas de tendencia central o de centralización

Al estudiar la información estadı́stica mediante su representación gráfica, se puso en evi-


dencia un significativo comportamiento de los datos en cuanto a la frecuencia con que se
presentan los valores: algunos de estos valores son más frecuentes que otros. Además, se

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
34 Llinás / Rojas

Figura 1.8: Ilustración de las medidas estadı́sticas

observó una clara tendencia de agrupación en el vecindario de los valores más frecuentes,
lo cual hace que las gráficas representativas adquieran formas especiales. Por lo general,
la mayor densidad de frecuencia está en la parte central de las gráficas; de aquı́ deriva el
nombre de medidas de tendencia central que se da a la media, la mediana, la moda,
el rango medio, la media geométrica, la media armónica y la media cuadrática. En esta
sección estudiaremos estas medidas de tendencia central.

Media

Definición 1.3.1 La media aritmética de cierto conjunto de números se encuentra


sumando los números y dividiendo después entre la cantidad de datos. En otras palabras,
si x1 , . . . , xn son números, entonces la media aritmética de este conjunto de números está
dada por
x 1 + · · · + xn
Media aritmética =
n
Copyright © 2017. Universidad del Norte. All rights reserved.

En estadı́stica se habla de media aritmética poblacional, y se simboliza por μ, cuando el conjunto


de datos corresponden a los de la población; y de media aritmética muestral, y se simboliza por x,
cuando se tienen en cuentan los datos de una muestra.

Ejemplo 1.3.2 Supongamos que tenemos la muestra siguiente de edades en año de principiantes
de una universidad: 18, 18, 18, 18, 19, 19, 19, 20, 20, 21. Entonces, la media aritmética de estos
datos es:
18 + 18 + 18 + 18 + 19 + 19 + 19 + 20 + 20 + 21
x = = 19 
10

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 35

Generalmente, para calcular la media de un conjunto de datos es más cómodo utilizar la


llamada media aritmética ponderada, la cual es un caso especial de la media aritmética.
Esta se puede utilizar cuando se tienen varias observaciones con un mismo valor, lo que
puede ocurrir si se han organizado los datos en una tabla de frecuencias.

Definición 1.3.3 Sea dada siguiente tabla de frecuencias no agrupadas:

Dato x1 x2 ... xn
Frecuencia f1 f2 ... fn

en donde fi es la frecuencia del dato xi . Entonces, la media aritmética ponderada o,


simplemente, media artimética, de los datos x1 , . . . , xn se define como
x1 f1 + · · · + xn fn
Media aritmética =
f1 + · · · + fn

Ejemplo 1.3.4 La media aritmética de los datos del ejemplo 1.3.2 la podemos calcular con ayuda
de la llamada media aritmética ponderada. Para ello, organizamos estos datos en una tabla de
frecuencias no agrupadas, tal como

Dato 18 19 20 21
Frecuencia 4 3 2 1

Luego, aplicamos la definición 1.3.3 y hallamos la media de los datos de la siguiente manera:

(18)(4) + (19)(3) + (20)(2) + (21)(1)


x = = 19 
4+3+2+1

Desventaja de la media

La media tiene una seria desventaja: se ve afectada por los valores extremos del final de
una distribución. Como depende del valor de cada medida, los valores extremos pueden
llevarla a representar defectuosamente los datos.
Copyright © 2017. Universidad del Norte. All rights reserved.

Mediana y moda

La mediana y la moda son medidas de tendencia central que no tienen propiedades que
les permitan intervenir en desarrollos algebraicos como la media aritmética, por eso tienen
menor importancia teórica que aquélla. Sin embargo, poseen propiedades que ponen en
evidencia ciertas cualidades de un colectivo, cosa que no ocurre con la media aritmética,
que promedia todos los valores igualando en un justo reparto todas las observaciones, es
decir, suprimiendo sus individualidades. En cambio, la mediana y la moda destacan los

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
36 Llinás / Rojas

valores individuales, de lo que se desprende su utilidad e importancia en cierto tipo de


análisis.

Mediana

Definición 1.3.5 Para datos medidos en al menos una escala de intervalo, la mediana
es el puntaje medio ordenado.

Para determinar la mediana de n datos, hay que realizar los siguientes pasos:

• Ordene los datos de menor a mayor con ayuda de un diagrama de tallo y hojas ordenado.
• El valor de la mediana dependerá del hecho de que n sea par o impar:

– Si n es impar, entonces la mediana será el dato en el centro, es decir, la mediana es el dato


que se encuentra en el lugar n+1
2 ;
– si n es par, entonces la mediana es la media de los dos datos que ocupan posiciones centrales,
es decir, la mediana es el promedio de las datos que se encuentran en los lugares n2 y n2 + 1.

Nótese que, por ejemplo, n+1


2 no representa uno de los datos, sino el número de valores que deben
contarse para llegar a la mediana.

Ejemplo 1.3.6 El conjunto de números 3, 4, 4, 5, 6, 8, 8, 8 y 10 tiene mediana 6, puesto que ya


los datos están ordenados, el número de datos es 9 (impar) y, en este caso, el 6 está ubicado en el
centro (en el cuarto lugar). 

Ejemplo 1.3.7 El conjunto de números 5, 5, 7, 9, 11, 12, 15 y 18 tiene mediana 12 (9 + 11) = 10,
puesto que ya los datos están ordenados, el número de datos es 8 (par), el 9 y el 11 son los dos
datos que ocupan posiciones centrales y 10 es el promedio de estos dos datos. 

Ejemplo 1.3.8 Encuentre la mediana para los datos organizados en la siguiente tabla de frecuen-
cias:

Dato 0 1 2 3 4
Frecuencia 10 10 8 4 8
Copyright © 2017. Universidad del Norte. All rights reserved.

SOLUCIÓN:
Como los datos se presentan en una tabla de frecuencias no agrupadas, para calcular la mediana
es conveniente determinar las frecuencias acumuladas de los datos. Estas se encuentran en la tabla
1.10:
Como el total de datos es n = 40 (par), entonces la mediana es el promedio de las medidas que
están en las posiciones n2 = 20 y n2 + 1 = 21. Para encontrar la mediana recomendamos contar los
datos en dirección de la medida menor a la mayor. En la tabla es fácil ver que el dato en lugar 20
es 1 y que el dato en la posición 21 es 2. Por tanto, la mediana es:
dato en la posición 20 + dato en la posición 21 1+2
Mediana = = = 1, 5 
2 2

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 37

Tabla 1.10: Tabla de frecuencia acumulada para los datos del ejemplo 1.3.8
Dato Frecuencia Frecuencia acumulada
0 10 10
1 10 20
2 8 28
3 4 32
4 8 40

Ventajas y desventajas de la mediana

El uso de la mediana para datos de intervalo posee tanto ventajas como desventajas. Una
ventaja consiste en que la mediana no se ve afectada por valores extremos al final de la
distribución. Su desventaja reside en que no es fácilmente determinable si el conjunto
de datos es grande, puesto que las medidas deben ordenarse primero y ponerse en orden
numérico de menor a mayor o al contrario.

Moda

Definición 1.3.9 La moda, si se da, es el dato con mayor frecuencia.

Ejemplo 1.3.10 El conjunto 2, 2, 5, 7, 9, 9, 9, 11 tiene moda 9 porque este valor es el dato con
mayor frecuencia. 

Ventajas y desventajas de la moda

• Tiene dos ventajas: Para ciertas muestras pequeñas, se le determina fácilmente y,


en general, no se ve afectada por los valores extremos al final de un conjunto de
datos ordenados. Cuando se analizan datos categóricos, la moda es el único dato
de tendencia central que puede utilizarse. Además, la moda puede usarse como una
Copyright © 2017. Universidad del Norte. All rights reserved.

medida de tendencia central para datos numéricos empleados en sentido categórico.


Una moda para datos en una tabla de frecuencia se encuentra localizando el valor de
frecuencia máxima, si no todas las frecuencias son iguales. El dato que corresponde
al valor de frecuencia máxima se toma como la moda.

Ejemplo 1.3.11 Para los datos del ejemplo 1.2.11, el refresco más popular es el A (es decir,
la moda es el refresco A), puesto que es el que más se compra. 

• La moda tiene varias desventajas como medida de tendencia central: una de ellas
consiste en que para un cierto conjunto de datos no puede haber moda. Esta situación

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
38 Llinás / Rojas

surge cuando todos los datos tienen la misma frecuencia. Otra desventaja reside en
que la moda puede existir pero no ser única.

Ejemplo 1.3.12 (a) El conjunto 3, 3, 5, 5, 7 y 7 no tiene moda.

(b) El conjunto 3, 3, 5, 5, 5, 7, 7, 7, y 9 tiene dos modas: el 5 y el 7. 

Rango medio

Definición 1.3.13 El rango medio de un conjunto de datos es el promedio de las medi-


das mayor y menor.

Ejemplo 1.3.14 El rango medio del conjunto de datos 32, 38, 45, 44, 27, 36, 40 y 38 está dado
por
27 + 45
Rango medio = = 36
2

ya que 45 y 27 son los datos mayor y menor respectivamente. 

Ventajas y desventajas del rango medio

Con cierta frecuencia, el rango medio se utiliza como una medida de resumen tanto para
análisis financiero como para reportes metereológicos, porque puede proporcionar una me-
dida adecuada, rápida y sencilla que caracteriza a todo el conjunto de datos. A pesar de
estas ventajas y de su sencillez, el rango medio se debe utilizar con cuidado. Como sólo
incluye la observación más pequeña y la más grande en un conjunto de datos, el rango
medio es una medida modificada de tendencia central si está presente un valor extremo.
En estas situaciones, el rango medio no es apropiado.
Copyright © 2017. Universidad del Norte. All rights reserved.

Media geométrica

La media geométrica es útil para encontrar los cambios procentuales en una serie de
números positivos, inclusive, para encontrar el promedio de proporciones, ı́ndices, o tasas
de crecimiento. Tiene mucha aplicación en el comercio y en la economı́a porque nos interesa
encontrar el cambio porcentual en las ventas, salarios o datos económicos, tales como el
producto nacional bruto.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 39

Definición 1.3.15 La media geométrica de un conjunto de n números enteros positivos


se define como la n-ésima raı́z del producto de los n valores. Es decir, la media geométrica
de los n números positivos x1 , . . . , xn se calcula a través de la fórmula

Media geométrica = (x1 · · · xn )1/n

Si estos números positivos x1 , . . . , xn tienen frecuencias (ponderaciones o pesos) f1 , . . . , fn ,


respectivamente, entonces la media geométrica (ponderada) de estos números viene
dada por la (f1 + · · · + fn )-ésima raı́z del producto de los valores, elevando cada uno a su
respectiva frecuencia, es decir,
 1/(f1 +···+fn )
Media geométrica = xf11 · · · xfnn

La media geométrica siempre será menor que la media aritmética, salvo en el extraño caso en el que todos
los incrementos porcentuales sean iguales. Si esto último sucede, las dos medias serán iguales.

Ejemplo 1.3.16 Dos pueblos determinados tienen un 48 y un 34%, respectivamente, de población


masculina. Discutir la mayor conveniencia de la media geométrica para promediar porcentajes.

SOLUCIÓN:
La media aritmética para estos porcentajes es:
48% + 34%
x = = 41%
2

y la media geométrica: √
G = 48% · 34% = 40, 4%

Ahora, la media aritmética de los porcentajes recı́procos es:


1 1
+ 0, 0208 + 0, 0294
x = 48% 34%
= = 0, 0251
2 2

y la media geométrica es:



1 1 
Copyright © 2017. Universidad del Norte. All rights reserved.


G = · = 0, 0208 · 0, 0294 = 0, 0247
48% 34%

Debido a que
1
= 0, 02439 = 0, 0251 = x
x
y, en cambio,
1 1
= = 0, 0247 = G
G 40, 4%

Debido a que x1 = x y a que G1 = G , podemos afirmar que la media geométrica es mejor que la
media artimética para promediar porcentajes y proporciones. 

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
40 Llinás / Rojas

Ejemplo 1.3.17 El director ejecutivo de una empresa desea determinar la tasa de crecimiento
promedio en los ingresos con base en las cifras dadas en la tabla 1.11. Si la tasa de creciemiento
promedio es menor que el promedio industrial del 10%, se comenzará una nueva campaña publi-
citaria.

Tabla 1.11: Ingresos para una empresa


Año Ingreso (en dólares) Porcentaje del año anterior
1992 50.000 ––
1993 55.000 55/50 = 1, 10
1994 66.000 66/55 = 1, 20
1995 60.000 60/66 = 0, 91
1996 78.000 78/60 = 1, 30

SOLUCIÓN:
Primero es necesario determinar el porcentaje que los ingresos de cada año representan respecto
de los obtenidos el año anterior. En otras palabras, ¿qué porcentaje del ingreso de 1992 es el
ingreso en 1993? Esto se encuentra dividiendo los ingresos de 1992 entre los de 1993. El resultado
1,10 revela que los ingresos de 1993 son 110% de los ingresos de 1992. También se calculan los
porcentajes para los tres años restantes. Tomando la media geométrica de estos porcentajes da:
Media geométrica = [(1, 10)(1, 2)(0, 91)(1, 3)]1/4 = 1, 1179

Restando 1 para convertirlo a un incremento anual promedio da 0,1179, o un incremento promedio


de 11,79% para el promedio de cinco años. Por otro lado, la media aritmética es:
1, 1 + 1, 2 + 0, 91 + 1, 3
x = = 1, 1275
4
o un cambio promedio de 12,75%. Se divide por 4, ya que se presentaron cuatro cambios durante
el periodo de cinco años. Sin embargo, si un incremento promedio de 12,75%, basado en la media
aritmética, se aplica a la serie que comienza con 50.000 dólares, los resultados son:
50.000 dólares × 1, 1275 = 56.375 dólares
56.375 dólares × 1, 1275 = 63.563 dólares
63.563 dólares × 1, 1275 = 71.667 dólares
Copyright © 2017. Universidad del Norte. All rights reserved.

71.667 dólares × 1, 1275 = 80.805 dólares

Ya que 80.805 dólares excede los 78.000 que la empresa en realidad ganó, el incremento del 12,75%
es obviamente muy alto. Si se utiliza la tasa de crecimiento de la media geométrica del 11,79%,
se obtiene:
50.000 dólares × 1, 1179 = 55.895 dólares
55.895 dólares × 1, 1179 = 62.485 dólares
62.485 dólares × 1, 1179 = 69.852 dólares
69.852 dólares × 1, 1179 = 78.088 ≈ 78.000 dólares

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 41

Esto da un valor de 78.088 dólares, lo que está mucho más cerca al ingreso real de 78.000 dólares.

Como interpretación final podemos decir lo siguiente: La media geométrica representa el cambio
promedio con el tiempo. Debido a que la tasa de crecimiento supera el promedio de la industria
del 10%, la nueva campaña publicitaria no se llevará a cabo. 

A continuación se presenta un ejemplo que ilustra el cálculo de la media geométrica de un


conjunto de datos que aparecen en una tabla frecuencias no agrupadas.

Ejemplo 1.3.18 La media geométrica de la distribución de frecuencias que aparece en la tabla

Dato 1 3 4 6
Frecuencia 3 2 3 5

viene dada por


 3 2 3 5 1/13
Media geométrica = 1 ·3 ·4 ·6 ≈ 3, 248 

Media armónica

Definición 1.3.19 La media armónica es el recı́proco de la media aritmética de los


recı́procos de los datos. Es decir, la media armónica de los datos x1 , x2 , . . . , xn está dada
por
n
Media armónica = 1
x1
+ x2 + · · · + x1n
1

Si estos datos x1 , . . . , xn tienen frecuencias (ponderaciones o pesos) f1 , . . . , fn , respectiva-


mente, entonces la media armónica (ponderada) de estos datos viene dada por

f1 + f2 + · · · + fn
Media armónica = f1
x1
+ xf22 + · · · + xfnn

Ejemplo 1.3.20 Una ama de casa ha ido comprando durante cuatro años arroz a distintos pre-
Copyright © 2017. Universidad del Norte. All rights reserved.

cios:

• El primer año a $ 1.200 el kilogramo.

• El segundo año a $ 1.400 el kilogramo.

• El tercer año a $ 1.600 el kilogramo.

• El cuarto año a $ 1.700 el kilogramo.

Halle el costo promedio del arroz durante estos cuatro años, suponiendo que

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
42 Llinás / Rojas

(a) El número promedio de kilos consumidos al año por el ama de casa es constante.

(b) La cantidad de dinero gastado al año es constante.

SOLUCIÓN:
Aquı́ nos piden calcular el cociente:
Costo total
T := Costo promedio =
Cantidad total comprada

(a) Si K representa al número de kilos consumidos cada año, entonces el costo promedio T será:

$ 1.200K + $ 1.400K + $ 1.600K + $ 1.700K


T =
4K
$ 1.200 + $ 1.400 + $ 1.600 + $ 1.700
= = $ 1.475 por kilogramo,
4
lo cual no es más que la media aritmética de los precios.

(b) Ahora, sea D la cantidad de dinero gastado por año. Entonces, en este caso, el costo promedio
T será:
4D
T = D D D D
$ 1.200 + $ 1.400 + $ 1.600 + $ 1.700
4 $4
= 1 1 1 1 = = $ 1.449, 27 por kilogramo,
$ 1.200 + $ 1.400 + $ 1.600 + $ 1.700
0, 00276

lo cual no es más que la media armónica de los precios. 

La media armónica también es útil para promediar velocidades desarrolladas en distancias


iguales, como se ilustra en el siguiente

Ejemplo 1.3.21 Una persona viaja en auto de Barranquilla a Cartagena con una velocidad me-
dia de 60 kilómetros por hora y regresa (por la misma vı́a) a una velocidad media de 120 kilómetros
por hora. Halle su velocidad media en el viaje completo.

SOLUCIÓN:
Sea D la distancia recorrida por el auto de Barranquilla a Cartagena (que es la misma que recorre
el auto de Cartagena a Barranquilla). Entonces,
Copyright © 2017. Universidad del Norte. All rights reserved.

D
Tiempo para ir de Barranquilla a Cartagena =
60km/h
D
Tiempo para ir de Cartagena a Barranquilla =
120km/h

Por consiguiente,
distancia total 2D
Velocidad media del viaje total = = D D
tiempo total 60km/h + 120km/h
2D
= D D
= 80km/h
60km/h + 120km/h

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 43

que corresponde3 a la media armónica de 60 km/h y 120 km/h. Notemos que hubiéramos estado
tentado a calcular la media aritmética de 60 km/h y 120 km/h, obteniendo 45 km/h, lo cual es
incorrecto. 

1.3.2 Medidas de colocación o de posición relativa

Definición 1.3.22 Una medida de colocación o de posición relativa para una dis-
tribución de frecuencias es aquel valor para el cual una porción especı́fica de la distribución
queda en o debajo de él.

La mediana, los percentiles, deciles y cuartiles son ejemplos de medidas de posición relativa.

Percentiles

Definición 1.3.23 El p-ésimo (punto) percentil es un valor tal que a lo más un p%


de los datos tienen dicho o menos de ese valor y, al menos, un (100 − p)% de los datos
tienen este valor o más.

Para calcular el p-ésimo (punto) percentil de un conjunto de n datos, es importante que tengamos
en cuenta los siguientes pasos:
• Ordenemos los datos de manera ascendente.
• Calculemos un ı́ndice i a través de la fórmula i = np/100, siendo p el percentil de interés y n, la
cantidad de datos.
• Decidamos de acuerdo a uno de los dos casos:

– Si el ı́ndice i no es entero, redondeamos al entero siguiente. Este valor aproximado de i indica


la posición del p-ésimo percentil.
– Si i es entero, el p-ésimo percentil es el promedio de los valores de los datos ubicados en las
posiciones i y i + 1.
Copyright © 2017. Universidad del Norte. All rights reserved.

Ejemplo 1.3.24 Calcule (a) el 85-ésimo punto percentil y (b) el 50-ésimo punto percentil de
los siguientes datos que representan los salarios (en millones de pesos) de 12 empleados en una
empresa:
2, 350 2, 450 2, 550 2, 380 2, 255 2, 210 2, 390 2, 630 2, 440 2, 825 2, 420 2, 380
SOLUCIÓN:
Como primer paso fundamental debemos ordenar los datos de manera ascendente (preferiblemente

3
Si las distancias recorridas no son iguales, se llega a una media armónica ponderada, en donde las
ponderaciones o pesos son las distancias.

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
44 Llinás / Rojas

con ayuda de un diagrama de tallo y hojas):

2, 210 2, 255 2, 350 2, 380 2, 380 2, 390 2, 420 2, 440 2, 450 2, 550 2, 630 2, 825

(a) Para determinar el 85-ésimo punto percentil, calculemos el ı́ndice i = np/100, con p = 85 y
n = 12. Al reemplazar obtenemos que i = 10, 2. En este caso, como i = 10, 2 no es entero,
entonces redondeamos a 11. Por lo tanto, el lugar del 85-ésimo percentil es el lugar 11. En
nuestros datos ordenados corresponde a 2,630. Esto quiere decir que el 85% de los empleados
de la empresa ganan $2.630.000 o menos de este valor y que el 15% de estos empleados ganan
$2.630.000 o más que este valor.

(b) En este caso, p = 50. Con ello y con n = 12 obtenemos que i = 6 (que es un número entero).
Es decir, el 50% percentil es el promedio de los valores sexto (2,390) y séptimo (2,420), o
sea, 2,405. Observemos que este valor coincide con la mediana del conjunto de datos. En
conclusión, podemos decir que el 50% de los empleados tienen un salario menor o igual (o
mayor o igual) que $2.405.000. 

Cuartiles

Como veremos en la siguiente definición, los cuartiles son casos particulares de los per-
centiles.

Definición 1.3.25 Los cuartiles son las medidas de posición relativa correspondiente a
un conjunto ordenado de datos divididos en cuatro partes (iguales) y se definen ası́:

• Q1 = primer cuartil o 25-ésimo percentil.

• Q2 = segundo cuartil o 50-ésimo percentil o también mediana.

• Q3 = tercer cuartil o 75-ésimo percentil.

Ejemplo 1.3.26 Calcule todos los cuartiles del conjunto de datos del ejemplo 1.3.24.
Copyright © 2017. Universidad del Norte. All rights reserved.

SOLUCIÓN:
Como Q2 coincide con la mediana, entonces Q2 = 2, 405. Calculando los percentiles como en el
ejemplo 1.3.24 podemos verificar que
2, 350 + 2, 380 2, 450 + 2, 550
Q1 = = 2, 365 y Q3 = = 2, 500
2 2

Estos resultados se interpretan de la siguiente manera: el valor del primer cuartil significa que el
25% de los empleados gana al menos $2.365.000 o el 75% gana más de este salario, y el valor del
tercer cuartil significa que el 75% de los empleados gana al menos $2.500.000 o el 25% gana más
de este salario. 

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 45

Deciles

Al igual que los cuartiles, los deciles también son casos particulares de los percentiles.

Definición 1.3.27 Los deciles son las medidas de posición relativa correspondiente a
un conjunto de datos (ordenado ascendentemente) que está dividido en diez partes, de tal
forma que cada parte contiene aproximadamente 10% de las medidas.

Hay nueve deciles, denotados por D1 , D2 , . . . y D9 . Si Dn es el n-ésimo decil, entonces cada


punto decil corresponde a un punto percentil. Por ejemplo, D4 es el 40-ésimo punto percentil, D7 es
70-ésimo punto percentil, etc.

1.3.3 Medidas de dispersión o de variabilidad

Los datos que se presentan en la tabla 1.12 muestran los salarios anuales de siete supervisores
de ventas de una empresa y los de siete de otra empresa. Observemos que ambos conjuntos
de datos tienen la misma media (33.500 dólares) y la misma mediana (33.800 dólares).

Tabla 1.12: Salarios anuales (en dólares) de la plantilla de supervisores de ventas de dos
empresa
Empresa 1 34.500 30.700 32.900 36.000 34.100 33.800 32.500
Empresa 2 34.000 27.500 31.600 39.700 35.300 33.800 31.700

Por tanto, si nos limitásemos a fijarnos en las medidas de centralización, no tendrı́amos


base alguna para distinguir entre la distribución de los salarios en las dos empresas.
Copyright © 2017. Universidad del Norte. All rights reserved.

(a) En la primera empresa

(b) En la segunda empresa

Figura 1.9: Dispersión de los salarios anuales de los empleados de dos empresas (compárese
con los datos de la tabla 1.12)

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
46 Llinás / Rojas

Sin embargo, estas dos distribuciones son muy diferentes, como podemos apreciar en la
figura 1.9. Evidentemente que los datos del segundo conjunto están mucho más dispersos
que los del primero. Una medida de centralización casi nunca es suficiente por sı́ sola
para analizar adecuadamente las caracterı́sticas de un conjunto de datos. Por lo general,
necesitaremos, además, una medida de la dispersión o variación de los datos. Entre las
que analizaremos se encuentran el rango o recorrido, el rango intercuartil, la desviación, la
varianza, la desviación estándar y el coeficiente de variación.

Rango o recorrido

Es la medida de dispersión más simple. Esta medida ya ha sido explicada en algunos ejem-
plos de las secciones anteriores.

Definición 1.3.28 Se define el rango o recorrido de un conjunto de datos (numéricos)


como la diferencia entre el dato más alto y el más bajo.

Su ventaja consiste en que es fácil de calcular y su desventaja reside en que considera sólo dos de
la gran cantidad de datos que hay en un conjunto (de datos) e ignora el resto.

Ejemplo 1.3.29 El rango R del conjunto de datos del ejemplo 1.3.24 es:

R = $2.825.000 − $2.210.000 = $615.000 

Rango intercuartil

Una medida de dispersión que elimina la influencia de los valores extremos de los datos es
el rango intercuartil.

Definición 1.3.30 El rango intercuartil, simbolizado por R.I, es la diferencia entre


Copyright © 2017. Universidad del Norte. All rights reserved.

el tercero y el primer cuartil. Es decir,

R.I = Q3 − Q1

El rango intercuartil contiene el 50% de los datos, dejando a la izquierda el 25% inferior de los datos y a
la derecha el 25% superior.

Ejemplo 1.3.31 Halle el rango intercuartil del conjunto de datos de la empresa 1 de la tabla 1.12.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 47

SOLUCIÓN:
Para estos datos, el primer cuartil es 32.500 dólares y el tercero 34.500 dólares. Por lo tanto,

Rango intercuartil = 34.500 − 32.500 = 2.000 dólares. 

Desviación

Definición 1.3.32 La desviación de un dato se define como la diferencia entre el dato


y la media del conjunto de datos de donde proviene dicho dato. Es decir, sean dados los
datos x1 , . . . , xn . Entonces, la desviación del dato xi se define como

Desviación del dato xi = xi − x


Una desviación positiva para una medida indica que la medida está por encima de la media, mientras que
una desviación negativa nos señala que está por debajo de la media. Una desviación 0 para un dato indica
que el dato es igual a la media.

Ejemplo 1.3.33 Calcule la desviación de los puntajes para los datos siguientes, que representen
el número de defectos encontrados por un inspector de automóviles en una lı́nea de ensamblaje
en los últimos cinco automóviles producidos: 1, 4, 6, 6 y 8.

SOLUCIÓN:
Podemos determinar que la media muestral es x = 5. Las desviaciones de los valores las presen-
tamos en la tabla siguiente:

x x−x
1 1-5 = -4
4 4-5 = -1
6 6-5 = 1
6 6-5 = 1
8 8-5 = 3
Copyright © 2017. Universidad del Norte. All rights reserved.

Podemos observar que

1. Las medidas 6 y 8 están arriba de la media y sus desviaciones son positivas.

2. Las medidas 1 y 4 están debajo de la media y sus desviaciones son negativas.

3. La suma de las desviaciones es 0. 

Una propiedad importante que podemos resaltar con respecto la desviación de un dato es
la siguiente:

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
48 Llinás / Rojas

Teorema 1.3.34 La suma de las desviaciones de los valores para cualquier conjunto de
números x1 , . . . , xn es igual a cero. Esto es, (x1 − x) + · · · + (xn − x) = 0.

La desviación de los valores puede usarse para describir la dispersión de una distribución
dada de datos cuantitativos. Recordemos que la desviación de un valor representa la dife-
rencia entre un dato y la media del conjunto de datos del cual proviene. En consecuencia,
podrı́amos pensar que el promedio de todas las desviaciones de los valores proporciona una
medida de la dispersión de todos los valores, pero eso no ocurre, pues ya se ha dicho en el
teorema 1.3.34 que la suma de todas las desviaciones de los valores es 0.

Varianza y desviación estándar (o tı́pica)

Aunque el rango es una medida de dispersión total y el rango intercuartil es una medida
de la dispersión de la media, ninguna de estas medidas de variación toma en cuenta cómo
se distribuyen o se agrupan las observaciones. Dos medidas de uso común que sı́ toman
en cuenta la distribución de los valores de los datos son la varianza y su raı́z cuadrada, la
desviación estándar o tı́pica. Estas medidas evalúan la manera en que fluctúan los valores
respecto a la media.

Definición 1.3.35 La varianza de una población de valores se define como el prome-


dio de los cuadrados de las desviaciones de los valores, y se denota por σ 2 (léase “sigma
cuadrada”). La varianza de la población de valores x1 , . . . , xn está dada por la fórmula

(x1 − μ)2 + (x2 − μ)2 + · · · + (xn − μ)2


σ2 =
n
La desviación estándar (o tı́pica) poblacional de un conjunto de datos, simbolizada
por σ, se define como la raı́z cuadrada de la varianza poblacional de los datos. Es decir,

σ = Varianza poblacional.

Por razones de comodidad en los cálculos, para determinar la varianza de la población se


Copyright © 2017. Universidad del Norte. All rights reserved.

usa normalmente la fórmula que aparece en el siguiente

Teorema 1.3.36 La varianza de la población de valores x1 , . . . , xn está dada por

x21 + x22 + · · · + x2n


σ2 = − μ2
n
Esta fórmula es equivalente a la que se introdujo en la definición 1.3.35 y puede recordarse fácilmente
mediante la espresión: “ la media de los cuadrados menos el cuadrado de la media”.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 49

Ejemplo 1.3.37 Encuentre la varianza y desviación de los datos 62, 80, 83, 72 y 73 si éstos
constituyen una población.

SOLUCIÓN:
La media de estos datos es μ = 74. Por lo tanto, la varianza poblacional está dada por

(62 − 74)2 + (80 − 74)2 + (83 − 74)2 + (72 − 74)2 + (73 − 74)2 266
σ2 = = = 53, 2
5 5

La desviación estándar de estos datos es σ = 53, 2 = 7, 29. 

Definición 1.3.38 La varianza de una muestra con valores x1 , . . . , xn se denota por


s2 y se define por
(x1 − x)2 + (x2 − x)2 + · · · + (xn − x)2
s2 =
n−1
La desviación estándar (o tı́pica) muestral de un conjunto de datos, denotada
por √
s, se define como la raı́z cuadrada de la varianza muestral de los datos. Es decir,
s = Varianza muestral.

Al igual que la varianza poblacional, la varianza muestral la podemos calcular de otra ma-
nera como se ilustra en el siguiente

Teorema 1.3.39 La varianza muestral de un conjunto de datos x1 , . . . , xn la podemos cal-


cular por
(x21 + x22 + · · · + x2n ) − nx2
s2 =
n−1

Ejemplo 1.3.40 Encuentre la varianza y desviación estándar de los datos del ejemplo 1.3.37 si
éstos constituyen una muestra de una población.
Copyright © 2017. Universidad del Norte. All rights reserved.

SOLUCIÓN:
Nuevamente, x = 74. Por lo tanto, la varianza muestral está dada por

(62 − 74)2 + (80 − 74)2 + (83 − 74)2 + (72 − 74)2 + (73 − 74)2 266
s2 = = = 66, 5
5−1 4


y la desviación muestral por s = 66, 5 = 8, 15. Observemos cómo cambia el valor de la varianza
(y, por consiguiente, también la desviación muestral) al considerar los datos como una muestra o
como una población. 

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
50 Llinás / Rojas

Desviación media

Otro tipo de medida de dispersión es la que se define a continuación.

Definición 1.3.41 La desviación media de un conjunto de datos es la media de las


desviaciones de cada dato. Es decir, la desviación media de los datos x1 , . . . , xn se define
como
|x1 − x| + |x2 − x| + · · · + |xn − x|
DM =
n
La definición es análoga para datos poblacionales. Observemos que la desviación media está medida en las
mismas unidades que la de los datos.

Ejemplo 1.3.42 Para la población 2, 2, 4, 5 y 2 de las edades (en años) de cinco casas, la media
es x = 3, con lo que la desviación media es DM = 6/5 = 1, 2 años. Ası́, la edad de cada casa
difiere de la media de la población en un promedio de 1,2 años. 

Ventajas y desventajas de la varianza, la desviación estándar


y la desviación media

Si la varianza se usa por sı́ misma como medida descriptiva de la dispersión, es difı́cil
interpretarla, porque las unidades de la varianza son el cuadrado de las unidades de me-
dida. En otras palabras, la desviación estándar se mide con las mismas unidades que las de
los datos originales. Por esta razón, la desviación estándar se compara con más facilidad
con el promedio y otros estadı́sticos que tienen las mismas unidades que los datos originales.

A la hora de elegir una medida que describa la cantidad de dispersión de un conjunto


de datos, la desviación media tiene dos ventajas frente a la desviación tı́pica. En primer
lugar, es más fácil de interpretar conceptualmente. Es más sencillo conceptuar “el promedio
de las desviaciones respecto de la media” que “la raı́z cuadrada del promedio del cuadrado
de las desviaciones respecto de la media”. En segundo lugar, dado que en el cálculo de
Copyright © 2017. Universidad del Norte. All rights reserved.

la varianza y de la desviación tı́pica se elevan al cuadrado las desviaciones individuales,


estas dos medidas se verán más influenciadas por observaciones extremadamente grandes o
extremadamente pequeñas que la desviación media. A pesar de sus ventajas, la desviación
media se emplea con poca frecuencia en la práctica, debido a las complicaciones que pueden
surgir si se usa para hacer inferencias sobre una población a partir de las observaciones de
una muestra.

La varianza y la desviación estándar tienen una limitación seria: pueden verse afectadas
en presencia de valores extremos, pues ambas dependen de la media, que se modifica por
las medidas extremas. Cuando en un conjunto de datos están presentes valores extremos y

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 51

requerimos una medida resistente a ellas, debemos utilizar el rango intercuartil.

Varianza y desviación tı́pica para datos en tablas de frecuencia

A menudo tendremos ocasión de encontrar la varianza y la desviación estándar para datos


desplegados en una tabla de frecuencia.

Definición 1.3.43 Las varianzas poblacional y muestral (ponderadas) de un


conjunto de datos x1 , . . . , xn con frecuencias f1 , . . . , fn se calculan mediante las siguientes
fórmulas:

f1 (x1 − μ)2 + · · · + fn (xn − μ)2 f1 (x1 − x)2 + · · · + fn (xn − x)2


σ2 = s2 =
f1 + · · · + fn (f1 + · · · + fn ) − 1
Estas medidas las podemos calcular, equivalentemente, de la siguiente manera:
 
f1 x21 + · · · + fn x2n f1 x21 + · · · + fn x2n − (f1 + · · · + fn )x2
σ2 = − μ2 s2 =
f1 + · · · + fn (f1 + · · · + fn ) − 1
respectivamente.

Ejemplo 1.3.44 Dados los siguientes datos de una población, hallar la media, varianza y desviación
estándar.

Dato 28 31 34 37 40 43 46
Frecuencia 1 10 14 33 14 7 3

SOLUCIÓN:
Primero construimos la tabla 1.13, que nos ayudará en los cálculos:

Tabla 1.13: Tabla de frecuencias para el ejemplo 1.3.44


Dato x Frecuencia f fx x−μ (x − μ)2 f (x − μ)2
Copyright © 2017. Universidad del Norte. All rights reserved.

28 1 28 -9 81 81
31 10 310 -6 36 360
34 14 476 -3 9 126
37 33 1.221 0 0 0
40 14 560 3 9 126
43 7 301 6 36 252
46 3 138 9 81 243
Sumas 82 3.034 1.188

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
52 Llinás / Rojas

Se encuentra que la media poblacional es:



fx 3.034
μ =  = = 37
f 82

Además, 
f (x − μ)2 1.188
σ 2
=  = = 14, 4878
f 82

y de esta forma σ = 14, 4878 = 3, 806. 

Aplicaciones de la desviación estándar poblacional

Hasta ahora hemos visto que la varianza y la desviación estándar son muy útiles para com-
parar la dispersión de dos poblaciones. Pero también podemos interpretar la desviación
de una única población. Concretamente, puede usarse esta cantidad para estimar el por-
centaje de valores de la población que se encontrarán a menos de una distancia especı́fica de
la media. Para construir tales estimaciones utilizaremos dos reglas: la regla de Tchebychev
(válida para cualquier población) y la empı́rica.

Teorema 1.3.45 (Regla de Tchebychev) Para cualquier población con media μ y


desviación estándar σ, por lo menos el 100(1 − 1/k 2 )% de los valores de la población se
encuentran a una distancia de la media menor que k veces la desviación estándar, para
cualquier número k > 1. En otras palabras, dentro del intervalo que va desde μ − kσ hasta
μ + kσ se encuentra por lo menos el 100(1 − 1/k 2 )% de los valores de la población.

Para ver cómo funciona la regla de Tchebychev en la práctica, hemos construido la siguiente
tabla:

k 1,5 2 2,5 3 3,5 4


100(1 − 1/k )% 55,6%
2
75% 84% 88,9% 91,18% 93,7%

Es decir, de acuerdo con la regla de Tchebychev, al menos el 55,6% de los valores de la


Copyright © 2017. Universidad del Norte. All rights reserved.

población se encuentran a una distancia de la media menor que 1,5 veces de la desviación
tı́pica. O, dicho de otra forma, dentro del intervalo [μ − 1, 5σ; μ + 1, 5σ] encontramos por
lo menos el 55, 6% de los valores de la población. Esta situación se ilustra en la figura 1.10.

Ejemplo 1.3.46 Consideremos los datos de la empresa 1 de la tabla 1.12(a), que tenı́a una media
de 33.000 dólares y una desviación estándar de 1.554 dólares. La regla de Tchebychev nos dice
que, para esta población, al menos el 55% de los salarios deben estar a una distancia de la media
menor que (1,5)(1.554)=2.331 dólares. En otras palabras, dentro del intervalo que va desde 31.169
a 35.831 dólares están por lo menos el 55,6% de los salarios. Analogamente, dentro del intervalo
que va desde 30.392 a 36.608 dólares se encuentran por lo menos el 75% de los salarios. 

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 53

0,7
0,6
0,5 Por lo menos 55,6%
de los datos están
0,4 en el rango de la
1s sombreada
región
0,3
0,2
0,1
0
0 1
μ - 1,5s μ 2 μ + 1,5s
3 4 5

Figura 1.10: Ilustración de la regla de Tchebychev

Ejemplo 1.3.47 Un inspector de control de calidad selecciona aleatoriamente 14 clavos de una


caja de 100 clavos de 1 pulgada (una pulg.=2,54 cm). Las longitudes, en cm, son:

2, 54 2, 55 2, 50 2, 60 2, 51 2, 52 2, 70 2, 40 2, 36 2, 53 2, 54 2, 52 2, 51 2, 55

Si el inspector decide excluir los clavos que están fuera del intervalo x ± 2s, ¿cuál es el porcentaje
de clavos excluidos? ¿Se verifica la regla de Tchebychev?

SOLUCIÓN:
Vemos que x = 2, 52 y s = 0, 07. Como deseamos desechar los clavos que están fuera del intervalo
x ± 2s, es decir, [2, 38; 2, 66], observamos que dos clavos no pertenecen a ese intervalo (los de
longitud 2,70 y 2,36) que corresponde al 14, 28% de la muestra. La regla de Tchebychev afirma
que por lo menos el 75% de los clavos deberán estar en el intervalo x ± 2s, es decir, a lo más el
25% estarán fuera de dicho intervalo, lo cual verifica la regla de Tchebychev. 

La ventaja de la regla de Tchebychev consiste en que se puede aplicar a cualquier población.


Pero tiene un serio inconveniente. Para muchas poblaciones, el porcentaje de valores que
se encuentran de un intervalo determinado es mucho mayor que el mı́nimo asegurado por la
regla de Tchebychev. Para poblaciones que tengan forma acampanada, es posible establecer
una regla empı́rica que proporcione estimaciones fiables.
Copyright © 2017. Universidad del Norte. All rights reserved.

Teorema 1.3.48 (Regla empı́rica) Para las poblaciones que tengan forma acampanada,
aproximadamente el 68% de los valores de la población se encuentran a una distancia de la
media menor que una desviación estándar, y aproximadamente el 95% están a una distancia
de la media menor que dos veces la desviación tı́pica (compárese con la figura 1.11).

Ejemplo 1.3.49 Supongamos que tenemos una población de salarios que tienen forma acam-
panada con una media de 33.500 dólares y una desviación estándar de 1.554 dólares. La regla

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
54 Llinás / Rojas

empı́rica estimarı́a que aproximadamente el 68% de los salarios estarán dentro del intervalo que
va desde 31.946 a 35.054 dólares y que aproximadamente el 95% estará dentro del intervalo que
va desde 30.392 a 36.608 dólares. 

(a) Porcentaje de datos en (μ − 1σ, μ + 1σ)

(b) Porcentaje de datos en (μ − 2σ, μ + 2σ)

Figura 1.11: Ilustración de la regla empı́rica


Copyright © 2017. Universidad del Norte. All rights reserved.

El coeficiente de variación de Pearson

Para comparar las dispersiones de dos o más conjuntos de valores no podemos confrontar
simplemente las varianzas o las desviaciones estándar respectivas, puesto que estos coe-
ficientes de dispersión vienen afectados por la escala de medida del respectivo valor. Es
necesario, por tanto, eliminar esa influencia convirtiendo dichos valores en números sin
unidades de medidas. Una medida que cumple perfectamente con este cometido es el lla-
mado coeficiente de variación de Pearson.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 55

Definición 1.3.50 El coeficiente de variación de Pearson de un conjunto de datos,


simbolizado por CV , es igual a la desviación estándar dividida entre la media, multiplicada
por 100 por ciento. Es decir,

desviación estándar de los datos


CV = · 100%
media aritmética de los datos

Observemos que al dividir la desviación estándar por la media aritmética se elimina la in-
fluencia de la escala de medida, convirtiéndose ası́ el coeficiente de variación en una medida
útil para comparar conjuntos de datos con diferentes unidades de medida. El inconveniente
de este coeficiente radica en que deja de ser utilizable cuando la media es igual a cero.

El siguiente ejemplo ilustra el cálculo del coeficiente de variación.

Ejemplo 1.3.51 Los siguientes datos representan el promedio de millas por galón diario por
cinco dı́as para un determinado auto: 20, 25, 30, 15, 35. Encuentre el coeficiente de variación e
interprete su respuesta.

SOLUCIÓN:
La media y desviación estándar de millas por galón están dadas por x = 25 y s = 7, 9 respectiva-
mente. Por tanto, el coeficiente de variación de estos datos es:
s

7, 9
CV = · 100% = · 100% = 31, 6%
x 25

Por consiguiente, el tamaño relativo de la “dispersión media alrededor de la media” con relación
a la media es 31,6%. 

Como medida relativa, el coeficiente de variación resulta especialmente útil cuando se com-
para la variabilidad de dos o más conjuntos de datos, que se expresan en diferentes unidades
de medidas. Esto se muestra en el siguiente ejemplo.

Ejemplo 1.3.52 El gerente de operaciones de un servicio de paqueterı́a desea adquirir una nueva
flota de autos. Cuando los paquetes se guardan con eficiencia en el interior de los autos (durante la
Copyright © 2017. Universidad del Norte. All rights reserved.

preparación de las entregas), se deben considerar dos restricciones principales: el peso (en libras)
y el volumen (en pies cúbicos) de cada paquete. Ahora, en una muestra de 200 paquetes, el peso
promedio es 26 libras, con una desviación estándar de 3,9 libras. Además, el volumen promedio
de cada paquete es 8,8 pies cúbicos, con una desviación estándar de 2,2 pies cúbicos. ¿Cómo se
puede comparar la variación del peso y del volumen?

SOLUCIÓN:
Como las unidades de medida difieren para las restricciones de peso y volumen, si el gerente
de operaciones desea comparar las fluctuaciones en estas medidas, debe considerar la variabi-
lidad relativa en ambos tipos de medidas. Para el peso, el coeficiente de variación es CV =

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
56 Llinás / Rojas

(3, 9/26)100% = 15%; para el volumen, el coeficiente de variación es CV = (2, 2/8, 8)100% = 25%.
Entonces, con relación a la media, el volumen de un paquete es mucho más variable que su peso
porque el coeficiente de variación del peso es menor que el del volumen. 

El coeficiente de variación es muy útil cuando se comparan dos o más conjuntos de datos
que se miden con las mismas unidades, pero son tan diferentes que una comparación directa
de las desviaciones estándar respectivas no ayuda mucho. Esto se ilustra en el siguiente

Ejemplo 1.3.53 Un inversionista potencial piensa adquirir acciones en una de dos compañı́as A
o B, listadas en la Bolsa de Valores de Nueva York. Si ninguna de las compañı́as ofrece dividendos
a sus clientes y ambas tienen igual clasificación (según varios servicios de inversión) en términos
de crecimiento potencial, el posible inversionista quizás considere la volatilidad (variabilidad) de
ambas acciones para ayudar en la decisión de inversión. En los últimos meses, el precio promedio
de las acciones en la compañı́a A fue de 50 dólares, con una desviación estándar de 10 dólares.
Además, durante el mismo periodo, el precio promedio de las acciones en la compañı́a B fue de
12 dólares, con una desviación estándar de 4 dólares. ¿Cómo puede determinar el inversionista
cuáles acciones son más variables?

SOLUCIÓN:
En términos de la desviación estándar, el precio de las acciones de A parece más volátil que el de
las acciones de B. Sin embargo, como los precios promedio por acción de las dos compañı́as son
tan diferentes, serı́a conveniente que el inversionista potencial considere la variabilidad en precio
respecto al promedio a fin de examinar la volatilidad/estabilidad de ambas acciones.

Para la compañı́a A, el coeficiente de variación es CV = (10/50)100% = 20%; para la compañı́a


B, el coeficiente de variación es CV = (4/12)100% = 33, 3%. Entonces, en relación con la media,
el precio de las acciones B es mucho más variable que el de las acciones A. 

1.3.4 Medidas de formas


Copyright © 2017. Universidad del Norte. All rights reserved.

Una vez iniciado el análisis estadı́stico de sintetización de la información, para lo cual hemos
estudiado las medidas de tendencia central, de posición relativa y de dispersión de un con-
junto de datos, necesitamos conocer más sobre el comportamiento de tales datos. Para ello
estudiaremos las medidas de forma, las cuales nos proporcionan información sobre cómo se
distribuyen los datos.

Las medidas de forma se clasifican en medidas de asimetrı́a (o coeficiente de sesgo) y


medidas de curtosis (o de apuntamiento). A continuación explicaremos cada una de ellas.
Antes estudiaremos los conceptos de simétrı́a y asimétrı́a.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 57

Simetrı́a y asimetrı́a

Una distribución de frecuencias será simétrica o asimétrica según lo sea su representación


gráfica.

Definición 1.3.54 Decimos que una distribución de frecuencias es simétrica cuando lo


es su representación gráfica, es decir, los datos equidistantes a una medida central de la
misma tienen frecuencias iguales. Esta medida central coincide con la mediana y la media.
Una distribución de frecuencias que no es simétrica se denomina asimétrica. La asimetrı́a
se puede presentar a la derecha ( asimetrı́a positiva) o a la izquierda ( asimetrı́a nega-
tiva) si la representación gráfica está más “estirada” hacia la derecha o hacia la izquierda
respectivamente.

Los conceptos explicados en la definición se ilustran en la figura 1.12:

(a) Distribución simétrica (b) Distribución simétrica


unimodal bimodal
Copyright © 2017. Universidad del Norte. All rights reserved.

(c) Distribución asimétrica a (d) Distribución asimétrica


la derecha a la izquierda

Figura 1.12: Comparación de cuatro distribuciones cuya forma difiere

Ahora consideremos los siguientes comentarios para el caso en que la distribución de fre-
cuencias tiene una sola moda::

• En una distribución simétrica, la media, la mediana y la moda siempre coinciden


(compárese con la figura 1.13a). Es decir, se cumple la relación

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
58 Llinás / Rojas

Media = mediana = moda

En este tipo de distribuciones, los datos se encuentran repartidos a lo largo del re-
corrido, de forma que todas las medidas de tendencia central están justo en el centro
del conjunto de datos.

• Si la distribución es asimétrica a la derecha, el orden en que aparecen las medidas de


tendencia central es moda-mediana-media (compárese con la figura 1.13b). Es decir,
se cumple la relación

Moda < mediana < media

Esto es ası́ porque es en el lado derecho donde se concentra la mayor frecuencia de


los datos, por lo tanto, observamos una cola larga a la derecha de la distribución.

• Si la distribución es asimétrica a la izquierda, el orden en que aparecen es media-


mediana-moda (compárese con la figura 1.13c). Es decir, se cumple la relación

Media < mediana < moda

En este caso, la mayor frecuencia de los datos se concentra en el lado izquierdo. Por
lo tanto, observamos una cola larga hacia la izquierda de la distribución.

Consideremos el caso en que la distribución no es unimodal :

• Para distribuciones que no tengan moda, si la media es igual a la mediana, entonces


la representación gráfica de la distribución es simétrica.

• Para distribuciones que tengan más de una moda, la media es igual a la mediana si y
Copyright © 2017. Universidad del Norte. All rights reserved.

sólo si la representación gráfica de la distribución es simétrica.

Medidas de asimetrı́a

Las medidas de asimetrı́a o coeficientes de sesgo tienen como finalidad elaborar un


indicador que permita establecer el grado de simetrı́a (o asimetrı́a) que presenta una dis-
tribución, sin necesidad de llevar a cabo su representación gráfica. La medida de asimetrı́a
más utilizada en la práctica es el llamado coeficiente de asimetrı́a de Pearson.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 59

(a) Simétrica (b) Asimétrica a la derecha

(c) Asimétrica a la izquierda

Figura 1.13: Comparación de tres distribuciones unimodales cuya forma difiere

Definición 1.3.55 El coeficiente de asimetrı́a de Pearson, simbolizado por Ap , se


define como la diferencia entre la media aritmética y la mediana dividida por la desviación
estándar. Es decir,
Media aritmética − Moda
Ap =
Desviación estándar
Cuando Ap = 0, se dice que la distibución es simétrica; cuando Ap < 0, se dice que la distribución es
sesgada negativamente o a la izquierda, y cuando Ap > 0, se dice que la distribución es sesgada
positivamente o a la derecha.

Consideremos la figura 1.13, en donde mostramos la forma de tres conjuntos de datos:


Copyright © 2017. Universidad del Norte. All rights reserved.

• Los datos en la figura 1.13(a) son simétricos. Por esta razón, el coeficiente de sesgo
es cero.

• Los datos de la figura 1.13(b) están sesgados a la derecha. Por lo tanto, el coeficiente
de sesgo es positivo.

• Los datos de la figura 1.13(c) están sesgados a la izquierda. Por consiguiente, el el


coeficiente de sesgo es negativo.

Ahora bien, por diversas razones, el coeficiente de asimetrı́a de Pearson tan sólo es aplicable

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
60 Llinás / Rojas

en las distribuciones de forma acampanada y unimodales. En distribuciones de otro tipo


se puede utilizar, entre otros, los llamados coeficiente de asimetrı́a de Fisher y coeficiente
de asimetrı́a de Fisher estandarizado.

Definición 1.3.56 Los coeficientes de asimetrı́a de Fisher (simbolizado por g1 ) y


de Fisher estandarizado (simbolizado por gs ) de un conjunto de datos x1 , . . . , xn con
frecuencias f1 , . . . , fn se definen, respectivamente, como

(x1 − x)3 f1 + · · · + (xn − x)3 fn g1


g1 = , gs = 
s3 n 6/n
Si g1 = 0 la distribución es simétrica; si g1 > 0, la distribución es sesgada positivamente, y si g1 < 0, la
distribución es sesgada negativamente. Interpretaciones análogas se tienen con el valor de gs .

Relación empı́rica entre media, mediana y moda

El siguiente teorema fue encontrado empı́ricamente por Pearson. Allı́ se puede observar
claramente una relación empı́rica entre la media, la mediana y la moda.4

Teorema 1.3.57 Para distribuciones campanoides (es decir, con forma de campana), uni-
modales y moderadamente asimétricas se cumple aproximadamente la relación empı́rica

Media − Moda ≈ 3(Media aritmética − Mediana)

Con lo anterior, el coeficiente de asimetrı́a de Pearson lo podemos calcular también a través


de la fórmula
3(Media aritmética − Mediana)
Ap =
Desviación estándar
Copyright © 2017. Universidad del Norte. All rights reserved.

Medidas de curtosis o de apuntamiento

Las medidas de curtosis estudian la distribución de frecuencias en la zona central de la


misma. Como ya sabemos, la mayor o menor concentración de frecuencias alrededor de la
media y en la zona central de la distribución dará lugar a una distribución más o menos
apuntada. Por esta razón, a las medidas de curtosis se aplican a distribuciones campani-
formes, es decir, unimodales simétricas o con ligera asimetrı́a. Para estudiar la curtosis de

4
Téngase en cuenta que en las distribuciones moderadamente asimétricas, la mediana siempre se sitúa
entre la media y la moda.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 61

una distribución es necesario definir previamente una distribución tipo, que vamos a tomar
como modelo de referencia. Esta distribución es la normal, que sólo estudiaremos en la
sección 4.4. Por esta razón, aplazaremos nuestro estudio de la curtosis de una distribución
para más adelante, una vez que hayamos introducido la distribución normal.

✍ Ejercicios de la sección 1.3


23. Responda las siguientes preguntas. Justifique sus respuestas.

(a) ¿Qué escala de medida se requiere para la mediana? ¿Y para la moda?


(b) ¿En qué condiciones coinciden la media, la mediana y la moda de una muestra?
(c) ¿En qué caso será demasiado grande la diferencia entre la media y la mediana?
(d) ¿Cuándo aumenta el tamaño de la muestra, también aumenta la varianza?

24. Supongamos que en un conjunto de 10 observaciones la media es 20 y la mediana es 15. Si


hay en ese conjunto dos seis, y todos los otros valores son diferentes, ¿cuál es la moda?

25. Veintiún personas en un salón de clase tienen altura promedio de 168 centı́metros. Si al
salón entra una persona adicional, entonces ¿cuál es la altura que debe tener esta persona
para que la altura promedio se incremente en un centı́metro?

26. Una empresa de servicio eléctrico de una ciudad le realiza la lectura del contador de luz a
un usuario, y se obtienen los siguientes datos:

Fecha Lectura
27 de agosto 00553 Kwh
30 de agosto 00571 Kwh
4 de septiembre 00605 Kwh

El recibo de pago le llegó al usuario con lectura de 00638 Kwh, realizada el 9 de septiembre,
pero la empresa no dejó constancia de lectura, hecho que motivó el reclamo del usuario,
quien alegó que le estaban cobrando de más. ¿Tiene la razón el usuario? Explique.
Copyright © 2017. Universidad del Norte. All rights reserved.

27. Un piloto A de la Fórmula 1 ganó 60 carreras de las 152 en las cuales participó, mientras
que otro piloto B ganó 52 carreras de las 115 en las que participó. ¿Cuál de los dos es mejor
piloto? Explique su respuesta.

28. El peso medio de los 45 productos de una determinada empresa es de 215 libras. Si ninguno
de los productos pesa menos de 170 libras, ¿cuántos de ellos, como máximo, pueden pesar
250 libras?

29. Un elevador de un edificio de oficinas está diseñado para soportar una carga máxima de
1.000 kilogramos. ¿Está sobrecargado si lleva a nueve mujeres con un peso medio de 61,5
kilogramos y cinco hombres de 87 kilogramos? ¿Por qué?

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
62 Llinás / Rojas

30. Una cadena de grandes almacenes tiene diez establecimientos. Se analiza el volumen de
ventas durante el perı́odo de Navidad y se comparan con las obtenidas en el mismo perı́odo
del año anterior. Los porcentajes de incrementos de ventas en dólares de los diez estableci-
mientos fueron:

10,2 3,1 5,9 7,0 3,7 2,9 6,8 7,3 8,2 4,3

Halle la media, la mediana, la varianza muestral, la desviación tı́pica, el rango y el rango


intercuartil del porcentaje de incremento de ventas en dólares. Interprete sus respuestas.

31. Los neumáticos de cierta marca tiene una duración de vida con media de 29.000 kilómetros
y desviación tı́pica de 3.000 kilómetros.

(a) Encontrar un intervalo en el que se pueda garantizar que se encuentra por lo menos el
75% de los tiempos de vida de los neumáticos de esta marca.
(b) Usando la regla impı́rica y suponiendo que la población tiene forma acampanada, en-
contrar un intervalo en el cual se estime que se encuentra aproximadamente el 95% de
los tiempos de vida de los neumáticos de esta marca.

32. Se ha estimado que la media de la cantidad de dinero que gastan en ropa las mujeres
colombianas es de 500.000 pesos, mientras que para los hombres la media es de 350.000
pesos. Dibuje un diagrama de barras que represente esta información.

33. Considere las siguientes observaciones de resistencia al corte (en megapascales) de una unión
pegada de cierta manera:

73,7 36,6 109,9 4,4 33,1 66,7 30,0 81,5 22,2 40,4 16,4

Determine el valor de la media y mediana muestrales. ¿Por qué la mediana es tan diferente
de la media?

34. Los valores de presión sanguı́nea se reportan a veces a los 5 mm Hg más cercanos (100,
105, 110, etc.). Suponga que los valores reales de presión sanguı́nea para nueve individuos
seleccionados al azar son:

130,0 113,7 122,0 108,3 131,5 133,2 118,6 127,4 138,4


Copyright © 2017. Universidad del Norte. All rights reserved.

(a) ¿Cuál es la mediana de los valores reportados de presión sanguı́nea?


(b) Suponga que la presión del octavo individuo es 127,6 en lugar de 127,4 (un pequeño
cambio en su valor). ¿Cómo afectarı́a esto a la mediana de los valores reportados? ¿Qué
dice esto sobre la sensibilidad de la mediana para redondear o agrupar los datos?

35. La propagación de grietas por fatiga en diversas partes de aeronaves ha sido objeto de
profundo estudio en años recientes. Los datos que aparecen a continuación constan de
tiempo de propagación (horas de vuelo/104 ) para llegar a un tamaño de grieta dado en
agujeros sujetadores que se usan en aeronaves militares:

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 63

0,915 0,937 0,983 1,007 0,736 0,863 0,865 0,913


1,132 1,140 1,153 1,253 1,394 1,011 1,064 1,109

(a) Calcule los valores de la media y mediana muestrales.


(b) ¿En cuánto se puede reducir la observación muestral más grande, sin afectar el valor de
la mediana?

36. Una manifestación interesante de la variación surge cuando se efectúan los análisis de emisión
de gases en los vehı́culos automotores. Los requisitos de costo y tiempo del procedimiento
federal de prueba (PFT) en cierto pais evitan la difusión de su uso en los programas de
inspección vehicular. Como resultado, muchas agencias han desarrollado análisis menos
costosos y más rápidos con la esperanza de reproducir los resultados. Según un artı́culo
de una prestigiosa revista, se dice que la aceptación del PFT como patrón de excelencia
ha conducido a la creencia de que las mediciones repetidas en el mismo vehı́culo darán
resultados idénticos (o casi). Los autores del artı́culo aplicaron el PFT a siete vehı́culos
caracterizados como “grandes emisores”. Los resultados de uno de esos vehı́culos son los
siguientes:

HC (g/mi) 32,2 32,5 13,8 18,3


CO (g/mi) 232 236 118 149

(a) Calcule las desviaciones estándar muestrales de las observaciones de HC y CO. ¿Parece
justificada la creencia general?
(b) Compare los coeficientes de variación de cada conjunto de datos para determinar cuáles
presentan mayor o menor variación.

37. Los puntajes finales de 20 alumnos en un curso de Estadı́stica son:

50 55 61 60 71 73 53 54 67 67
54 77 72 76 81 83 87 44 48 67

¿Qué proporción de estos puntajes cae

(a) dentro de ±1 desviación estándar de la media?


(b) dentro de ±2 desviaciones estándar de la media?
Copyright © 2017. Universidad del Norte. All rights reserved.

(c) dentro de ±3 desviaciones estándar de la media?

38. Un taller de mecánica acepta una orden por 10.000 ruedas de 2 pulgadas de diámetro. Las
especificaciones de tamaño del producto podrán ser mantenidas sólo si el diámetro medio
es de 2 pulgadas y la desviación estándar es muy pequeña. En este caso, ¿cuál es el margen
de tolerancia permitido para la desviación estándar?

39. Un profesor cuenta el examen final de un curso como el triple de cada uno de los tres
exámenes de una hora. ¿Cuál es la calificación promedio de un estudiante que obtuvo las
calificaciones 72, 86 y 80 en los tres exámenes de una hora y 90 en el examen final?

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
64 Llinás / Rojas

40. Millones de habitantes de un cierto paı́s se levantan cada mañana y trabajan en sus propias
casas. Se sugiere que el uso creciente de computadoras es una de las razones por las que
las personas pueden trabajar en empresas caseras. A continuación vemos una muestra de
datos sobre las edades de esas personas:

57 31 30 41 22 58 24 50 29 52
37 32 44 49 29 44 40 46 29 31

(a) Calcule la media y la moda.


(b) Suponga que se sabe que la mediana de edad de la población de todos los adultos es
de 35,1 años. Use la mediana de la edad de los datos anteriores para comentar si los
trabajadores en casa tiende a ser más jóvenes o más viejos que la población de todos
los adultos.
(c) Calcule el primero y el tercer cuartil y el 42% percentil. Interprete sus resultados.

41. En una prueba de rendimiento y consumo de gasolina se probaron 13 autos, durante 400
millas, en condiciones de tránsito en ciudad y en el campo; de lo anterior se obtuvieron los
siguientes datos en millas por galón:

14,4 13,2 15,3 16,8 16,2 16,7 15,9


Ciudad
16,0 15,3 16,2 16,1 15,3 15,2
18,3 18,6 19,2 17,4 19,4 20,6 17,2
Campo
18,6 18,5 18,7 19,0 21,1 19,4

Para llegar a una conclusión sobre la diferencia de rendimiento en la ciudad y en el campo,


use la media, la mediana y la moda.

42. Si s es la desviación estándar de una muestra, podemos demostrar que




R R n
≤ s ≤
2(n − 1) 2 n−1

donde n es el tamaño de la muestra y R es el rango. Los siguientes datos representan los


niveles de colesterol en la sangre para una muestra de ocho personas: 239, 218, 227, 357,
161, 286, 310 y 245.
Copyright © 2017. Universidad del Norte. All rights reserved.

(a) Encuentre cotas superiores e inferiores para s.


(b) Estime s usando el punto medio del intervalo determinado por el resultado anterior.
(c) Calcule el valor de s y compare el resultado con el valor estimado en el inciso (b).

43. Una profesora borra accidentalmente la calificación de uno de sus seis estudiantes; las cinco
calificaciones restantes son 3,8; 4,3; 2,2; 4,5 y 3,3; y la media de las seis calificaciones es 3,5.
Encuentre la calificación que borró la profesora.

44. En un esfuerzo por reducir su consumo de cigarillo, un trabajador de oficina registra los
números siguientes de cigarillos fumados durante un periodo de 21 dı́as:

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 65

5 6 5 8 4 0 2 3 7 5 6 4 5 3 6 7 1 2 3 0 3

¿Qué la medida de tendencia central le servirá mejor para su propósito? ¿Cuál es su valor
numérico?

45. La tabla siguiente contiene los salarios (en miles de pesos) de 30 trabajadores:

Salario anual 550 600 700 800 3.000


Frecuencia 8 6 7 5 4

(a) Determine la moda, la media, la mediana, el rango medio y el sesgo.


(b) ¿Cuál medida de tendencia usarı́a para determinar el valor central? Explique.
(c) ¿Cuál es el primer cuartil, el tercer cuartil y el sexto decil?
(d) Encuentre el rango, la desviación estándar y el rango intercuartil.

46. Una maestra hizo un examen con el mismo grado de dificultad en cada uno de sus tres
grupos. Con los resultados determinó las tres medianas y las promedió para estimar el
punto central de su habilidad profesional. ¿Puede engañarse al hacer esto? Diga por qué.

47. Suponga que una muestra tiene media 26 y desviación estándar 3,1.

(a) Determine un intervalo que contenga al menos 95% de las medidas de las muestras.
(b) ¿Cuál es el mı́nimo porcentaje de la muestra que está contenido en el intervalo 18 - 34?

48. Suponga que una muestra tiene media 542 y desviación estándar 10,4.

(a) Determine un intervalo que contenga al menos 93% de las medidas de las muestras.
(b) ¿Cuál es el mı́nimo porcentaje de la muestra que está contenido en el intervalo 523,22
- 567,22?

49. La tabla siguiente da una muestra de los tiempos de recorrido (en minutos) de un camino
de 2,5 millas para el carro de José y el de Mariela:

José 0,8 0,9 1,0 0,9 1,0 1,0 0,9 1,0


Mariela 1,1 0,9 1,4 1,3 1,3 1,3 1,0 0,9

(a) Encuentre el promedio de los tiempos de recorrido para cada uno de los carros.
Copyright © 2017. Universidad del Norte. All rights reserved.

(b) Calcule la varianza de los tiempos de recorrido para cada uno de los carros respectiva-
mente.
(c) ¿Qué auto tuvo un desempeño más consistente, si la consistencia se mide con la va-
rianza?
(d) Encuentre el coeficiente de variación para cada carro y comente al respecto.

50. Una gran lecherı́a vigila continuamente el nivel de contenido de grasa en su producto. El
porcentaje de grasa no debe desviarse mucho del 1% de la leche, siendo aceptable una
desviación estándar del 8%. Se obtuvo una muestra de 20 cartones de leche y se registró el
porcentaje grasa en cada uno. Los resultados se anotan a continuación:

1.3. Análisis de datos en tablas de frecuencias no agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
66 Llinás / Rojas

1,97 1,80 2,05 2,23 1,65 1,86 1,85 2,25 2,01 1,90
2,14 1,93 2,08 2,17 1,91 1,93 2,02 2,09 2,04 2,07

Calcule la media y la desviación estándar para la muestra de contenidos de grasa. ¿Hay


evidencia de que el contenido de grasa es demasiado alto? Explique.

1.4 Análisis de datos en tablas de frecuencias


agrupadas
Es posible calcular las medidas de tendencia central y dispersión para datos exhibidos en una
tabla de frecuencia agrupada, pero sus valores no son exactos sino únicamente aproximados.
Eso se debe al desconocimiento de las medidas en grupo, las cuales se han colocado en
intervalos de clase. En esta sección describiremos procedimientos para calcular medidas
numéricas que resuman la información cuando sólo disponemos de datos agrupados.

Media para datos agrupados

Si debemos encontrar la media para datos proporcionados en tablas de frecuencia agrupada,


usamos marcas de clase para representar las medidas para cada clase. De esta forma, usamos
la fórmula conocida de la media aritmética para determinar la llamada media muestral
aproximada xa , puesto que los datos originales se desconocen y cada observación está
representada por su marca de clase.

Ejemplo 1.4.1 Los datos siguientes representan el número de personas que han entrado a un
establecimiento diariamente durante un periodo de 25 dı́as:

60 36 61 56 19 35 51 42 21 28 33 67 30
49 57 54 59 28 63 38 15 24 35 46 53

Los datos han sido agrupados en la tabla de frecuencias agrupadas 1.14 usando la fórmula c = n
para el número de clases.
Copyright © 2017. Universidad del Norte. All rights reserved.

Tabla 1.14: Tabla de frecuencias agrupadas para el ejemplo 1.4.1


Número de personas Número de dı́as
14,5 - 25,5 4
25,5 - 36,5 7
36,5 - 47,5 3
47,5 - 58,5 6
58,5 - 69,5 5

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 67

(a) Calcule la media x del número de personas que entran por dı́a.

(b) Calcule la media aproximada xa del número de personas que entran por dı́a.

SOLUCIÓN:

(a) Se puede comprobar que la media de los datos es x = 42, 4.

(b) Primero debemos calcular la marca de cada clase (recordemos que una marca de clase es el
punto medio de cada intervalo de clase). Cada marca de clase se multiplica por su frecuencia
correspondiente, como se muestra en la tabla 1.15.

Tabla 1.15: Tabla de frecuencias para el ejemplo 1.4.1


Número de personas Número de dı́as f Marca de clase X fX
14,5 - 25,5 4 20 80
25,5 - 36,5 7 31 217
36,5 - 47,5 3 42 126
47,5 - 58,5 6 53 318
58,5 - 69,5 5 64 320
Sumas 25 1.061

Por consiguiente, la media aproximada es:



fx 1.061
xa =  = = 42, 44
f 25

el cual es sólo un valor aproximado para la media de las 25 medidas muestrales originales. La
aproximación se considera buena comparada con el valor exacto x = 42, 40, obtenido en la
parte (a). 

Mediana para datos agrupados

Si se han registrado datos en una tabla de frecuencias, no pueden colocarse en un arreglo


Copyright © 2017. Universidad del Norte. All rights reserved.

ordenado para calcular la mediana. A manera de ilustración presentamos la tabla de fre-


cuencias 1.16.
Primero hallamos la clase de la mediana de la distribución de frecuencia. La clase me-
diana es la mı́nima clase cuya frecuencia acumulada es mayor o igual a n/2, siendo n el
número total de datos. Debido a que n es igual a 50, se necesita localizar la primera clase
que tenga una frecuencia acumulada de 25 o más. En este caso, la tercera clase es la clase
mediana porque tiene una frecuencia acumulada de 28. La mediana la podemos determinar
entonces como

n/2 − F
Mediana = Lmed + ·w
fmed

1.4. Análisis de datos en tablas de frecuencias agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
68 Llinás / Rojas

Tabla 1.16: Distribución de frecuencia


Clase Frecuencia Frecuencia acumulada
49,5 - 59,5 3 3
59,5 - 69,5 7 10
69,5 - 79,5 18 28
79,5 - 89,5 12 40
89,5 - 99,5 8 48
99,5 - 109,5 2 50

en donde

• Lmed es la frontera inferior de la clase de la mediana (de la tabla, es 69,5)

• F es la frecuencia acumulada de la clase que antecede a la clase de la mediana (en este


caso, es la frecuencia acumulada correspondiente a la segunda clase, o sea F = 10)

• fmed es la frecuencia de la clase de la mediana (en este caso, f = 18)

• w es la amplitud del intervalo de clase de la clase de la mediana (w = 10).

Es decir,

25 − 10
Mediana = 69, 5 + · 10 = 77, 83
18

Moda para datos agrupados

Una desventaja de usar la moda con una distribución de frecuencia agrupada radica en que
el valor de la moda a menudo depende del agrupamiento arbitrario de los datos. La clase
que contiene al mayor número de datos suele denominarse clase modal o moda cruda.

Para estimar la moda en el caso de datos agrupados, se utiliza la siguiente fórmula:


Copyright © 2017. Universidad del Norte. All rights reserved.

Da
Moda = Lmod + ·w
Db + Da

en donde

• Lmod es la frontera inferior de la clase modal (por ejemplo, de la tabla 1.16, tenemos
que Lmod = 69, 5)

• Da es la diferencia entre la frecuencia de la clase modal y de la clase que la antecede


(por ejemplo, de la tabla 1.16, Da = 18 − 7 = 11)

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 69

• Db es la diferencia entre la frecuencia de la clase modal y de la clase que le sigue (por


ejemplo, de la tabla 1.16, Db = 18 − 12 = 6)

• w es el ancho del intervalo de clase de la clase modal (por ejemplo, de la tabla 1.16,
w = 10).

Respecto a la tabla 1.16, la moda es:


11
Moda = 69, 5 + · 10 = 75, 97
6 + 11

Rango medio para datos agrupados


Para datos organizados en una tabla de frecuencias agrupadas, el rango medio es aproxi-
madamente el promedio de la frontera inferior de clase de la primera clase y la frontera
superior de clase de la última clase.

Ejemplo 1.4.2 El rango promedio aproximado para los datos del ejemplo 1.4.1 es:
14, 5 + 69, 5
Rango promedio = = 42 
2

Puntos de posición para datos de una tabla de frecuencia agrupada

Supongamos que queremos encontrar el sexagésimo punto percentil de los datos que pre-
sentamos en la tabla 1.16. Para ello, primero debemos hallar la clase del sexagésimo punto
percentil de la distribución de frecuencias. En general, la clase del p-ésimo punto
percentil es la mı́nima clase cuya frecuencia acumulada es mayor o igual a p%n, siendo
n el número total de datos. Como n = 50 y p = 60, entonces necesitamos localizar la
primera clase que tenga una frecuencia acumulada de (60%)(50)=30 o más. En este caso,
la cuarta clase es la clase donde se encuentra el sexagésimo punto percentil de los datos
porque tiene una frecuencia acumulada de 40. Entonces, el sexagésimo punto percentil
puede determinarse como

Copyright © 2017. Universidad del Norte. All rights reserved.

p%n − F
p-ésimo punto percentil = Lp + ·w
fp

en donde

• Lp es la frontera inferior de la clase del p-ésimo punto percentil (de la tabla, es 79,5)

• F es la frecuencia acumulada de la clase que antecede a la clase del p-ésimo punto


percentil (en este caso, es la frecuencia acumulada correspondiente a la tercera clase,
o sea F = 28)

1.4. Análisis de datos en tablas de frecuencias agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
70 Llinás / Rojas

• fp es la frecuencia de la clase del p-ésimo punto percentil (en este caso, fp = 12)

• w es la amplitud del intervalo de clase de la clase del p-ésimo punto percentil (w = 10).

Es decir,

30 − 28
Sexagésimo punto percentil = 79, 5 + · 10 ≈ 81, 16
12

Varianza y desviación tı́pica

Las marcas de clase se usan tı́picamente para representar medidas que caen en las clases
de una tabla de frecuencia agrupada cuando se necesita obtener la varianza o la desviación
estándar aproximadas de los datos. Al hacer esto usamos las fórmulas análogas para cal-
cular la varianza y la desviación estándar, para el caso de distribuciones de frecuencias no
agrupadas.

Ejemplo 1.4.3 Calcularemos la varianza y desviación estándar de los datos agrupados que se
muestran en la tabla 1.17. Como antes, primero debemos encontrar las marcas de clase m, y con
ello completamos la tabla 1.17, siendo μa la media poblacional aproximada de los datos.

Tabla 1.17: Tabla de frecuencias para el ejemplo 1.4.3


Clase m f f m m − μa (m − μa )2 f (m − μa )2
26,5 - 29,5 28 1 28 -9 81 81
29,5 - 32,5 31 10 310 -6 36 360
32,5 - 35,5 34 14 476 -3 9 126
35,5 - 38,5 37 33 1.221 0 0 0
38,5 - 41,5 40 14 560 3 9 126
41,5 - 44,5 43 7 301 6 36 252
44,5 - 47,5 46 3 138 9 81 243
Sumas 82 3.034 1.188
Copyright © 2017. Universidad del Norte. All rights reserved.

Se encuentra que la media poblacional aproximada es:



fm 3.034
μa =  = = 37
f 82

Además, la varianza poblacional aproximada es:



f (m − μa )2 1.188
σa2 =  = = 14, 4878
f 82

y de esta forma la desviación poblacional aproximada será σa = 14, 4878 = 3, 806. 

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 71

✍ Ejercicios de la sección 1.4


51. Situémonos en el contexto del ejercicio 17, en el que se recogı́an los porcentajes de rentabi-
lidad de las acciones de 25 empresas:

(a) A partir de la agrupación de datos usada para construir el histograma, estime la media,
la mediana, la desviación tı́pica y el rango intercuartil de los porcentajes de rentabilidad.
(b) Calcule directamente la media y la desviación tı́pica a partir de las 25 observaciones y
compárelas con las obtenidas en el apartado (a).

52. Se toma una muestra de 20 estudiantes. La tabla siguiente muestra la cantidad de tiempo
(en horas) empleado por cada uno de estos estudiantes de dicha muestra en preparar un
examen:

Tiempo de estudio (horas) 0-3 3-6 6-9 9-12 12-15


Número de estudiantes 2 6 7 4 1

(a) Halle las frecuencias relativas y las frecuencias relativas acumuladas.


(b) Estime la media, la mediana, la moda y la desviación tı́pica del tiempo de estudio.

53. Durante una epidemia de gripe, los tiempos de espera en cierto centro de salud fueron más
largos de lo habitual. La siguiente tabla resume la distribución de los tiempos de espera
para una muestra de 24 pacientes que visitaron el centro de salud durante este perı́odo:

Tiempo de espera (horas) 0-1 1-2 2-3 3-4


Número de pacientes 7 10 5 2

(a) Halle las frecuencias acumuladas, relativas y relativas acumuladas.


(b) Dibuje un histograma, un polı́gono y una ojiva.
(c) Estime la media, la mediana, la moda, la varianza y la desviación tı́pica del tiempo de
espera.
(d) Estime el rango intercuartil.

54. Se dispone de la siguiente información acerca de las rentas familiares (en millones de pesos)
en los hogares de cierta ciudad:
Copyright © 2017. Universidad del Norte. All rights reserved.

Renta familiar 1,5-2,0 2,0-2,5 2,5-3,0 3,0-3,5 3,5-4,0 4,0-4,5 4,5-5,0


Frec. relativa 0,10 0,20 0,22 0,12 0,13 0,08 0,15

Estime la media y la desviación tı́pica poblacional de la renta familiar.

55. Las ayudas concedidas, en miles de euros, por cierto gobierno a 60 proyectos empresariales
innovadores, se presentan en la siguiente tabla:

Importe de la ayuda 0-600 600-1.200 1.200-1.800 1.800-2.400


No de proyectos 10 15 20 15

1.4. Análisis de datos en tablas de frecuencias agrupadas

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
72 Llinás / Rojas

(a) Calcule la ayuda media y ver si este valor es representativo.


(b) Calcule la ayuda máxima concedida al 70% de los proyectos menos favorecidos en el
reparto.
(c) Calcule la ayuda mı́nima concedida al 65% de los proyectos más favorecidos.
(d) Si se aumenta posteriormente las ayudas en once mil euros a cada proyecto, ¿cómo
afecta a los incisos anteriores?
(e) Si para el año siguiente las ayudas aumentan un 5% sobre el valor inicial, manteniéndose
el criterio del reparto, ¿cuál será ahora la ayuda media? ¿Sigue siendo representativa?

56. A continuación se presentan algunas medidas estadı́sticas (mediana, primero y tercer cuartil)
y una tabla de frecuencia agrupada, para las edades de un grupo de personas que hay en
una sala de concierto. Con base en estos datos responda las preguntas que aparecen abajo.
Mediana = 20, primer cuartil = 17,5 y tercer cuartil = 23.

Frecuencia Frecuencia Frec. acum.


Edades Frecuencia relativa acumulada relativa
11,5 - 14,5 2 0,0500 2 0,0500
14,5 - 17,5 8 0,2000 10 0,2500
17,5 - 20,5 11 0,2750 21 0,5250
20,5 - 23,5 10 0,2500 31 0,7750
23,5 - 26,5 8 0,2000 39 0,9750
26,5 - 29,5 1 0,0250 40 1,0000

(a) ¿Cuál era el número exacto de personas que habı́a en la sala del concierto?
(b) ¿Cuál es la media aproximada de las personas que asistieron al concierto?
(c) ¿Qué edad tienen el 77,5% de las personas?
(d) ¿Qué porcentaje de personas tienen una edad entre 11,5 y 20,5? ¿Mayor que 23,5?
(e) ¿Cuántas personas tienen una edad entre 17,5 y 20,5? ¿Mayor que 14,5?
(f) ¿Qué interpretación tiene el valor de la mediana y el de los cuartiles?

1.5 Análisis exploratorio de datos


Copyright © 2017. Universidad del Norte. All rights reserved.

Una vez que hemos estudiado las cuatro propiedades más importantes de los datos numéricos
(tendencia central, posición relativa, dispersión y forma), es importante identificar y des-
cribir las caracterı́sticas principales de los datos en forma resumida. Un enfoque a este
análisis exploratorio de datos5 consiste en desarrollar un resumen de cinco números
y construir un diagrama de caja y bigotes.

5
En general, las técnicas del análisis exploratorio de datos consisten en operaciones aritméticas
sencillas y representaciones fáciles de trazar, que pueden emplearse para resumir con rapidez los datos.
Muchos autores consideran el diagrama de tallo y hoja como técnica del análisis exploratorio de datos.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 73

Resumen de cinco números

Definición 1.5.1 Un resumen de cinco números consiste en cinco cantidades que se


emplean para resumir los datos: valor mı́nimo, primer cuartil (Q1 ), mediana (Q2 ), tercer
cuartil (Q3 ) y valor máximo.

Con base en el resumen de cinco números se pueden obtener, entre otras, dos medidas
de tendencia central (la mediana y el rango medio) y dos medidas de variación (el rango
intercuartil y el rango) para tener una mejor idea de la forma de la distribución. Si la dis-
tribución es simétrica, la relación entre las diversas medidas nos la da el siguiente teorema:

Teorema 1.5.2 (Situaciones para reconocer la simetrı́a de los datos) Si la distri-


bución es simétrica:

• La distancia de Q1 a la mediana es igual a la distancia de la mediana a Q3 . Además,


la distancia del valor mı́nimo a Q1 es igual a la distancia de Q3 al valor máximo.

• La mediana y el rango medio son iguales. (Estas medidas son iguales a la media de
los datos.)

Por otra parte, si se trata de distribuciones no simétricas, la relación de las diversas medidas
se expresan en el siguiente teorema:

Teorema 1.5.3 (Situaciones para reconocer a los datos no simétricos) Si la dis-


tribución no es simétrica:

• En las distribuciones sesgadas a la derecha, la distancia de Q3 al valor máximo excede


la distancia del valor mı́nimo a Q1 . Además, la mediana es menor que el rango medio.

• En las distribuciones sesgadas a la izquierda, la distancia del valor mı́nimo a Q1


Copyright © 2017. Universidad del Norte. All rights reserved.

excede la distancia de Q3 al valor máximo. Además, el rango medio es menor que la


mediana.

Ejemplo 1.5.4 Utilice el resumen de cinco números para estudiar la forma de la distribución de
los datos del ejemplo 1.3.24.

SOLUCIÓN:
En el ejemplo 1.3.26 calculamos que el primer cuartil es 2,365; la mediana 2,405 y el tercer cuartil

1.5. Análisis exploratorio de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
74 Llinás / Rojas

2,500. Por tanto, el resumen de cinco números es:

2, 210 2, 365 2, 405 2, 500 2, 825

De los teoremas 1.5.2 y 1.5.3 se puede afirmar que los salarios están sesgados a la derecha, porque
la distancia del valor mı́nimo a Q1 (es decir, 0,155) es bastante menor que la distancia de Q3
al valor máximo (es decir, 0,325). Además, si se compara la mediana (2,405) y el rango medio
(2,5175), se observa que el rango medio se mueve debido al valor extremo 2,825, y es, por tanto,
la más grande de estas medidas de resumen (compárese con la figura 1.14).

2
Frecuencias
Frecuencias

0
2,210

2,350

2,390

2,440

2,550

2,825
Salarios
2,255

2,380

2,420

2,450

2,630
Salarios

Dato Primer Mediana Tercer Dato


menor cuartil cuartil mayor

Figura 1.14: Diagrama de barras para los datos del ejemplo 1.5.4 

Diagrama de caja y bigotes

El diagrama de caja y bigotes, como el que se muestra en la figura 1.15, proporciona


una representación gráfica de los datos mediante el resumen de cinco números.

Diagrama de caja y bigotes


Copyright © 2017. Universidad del Norte. All rights reserved.

Mediana

Valor atípico
(moderado)
1,5 R.I 1,5 R.I
+ + +

Media Valores atípicos


3 R.I (extremos)

Primer
2200
2,200 2,400 Tercer 2600
2400 2,600 2800
2,800 3000
3,000
cuartil cuartil
Salarios mensuales
Figura 1.15: Diagrama de caja y bigotes

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 75

Esta herramienta de análisis exploratorio de datos permite estudiar la simetrı́a de los datos,
detectar los valores atı́picos y vislumbrar un ajuste de los datos a una distribución de
frecuencias determinada. El diagrama de caja y bigotes divide los datos en cuatro áreas de
igual frecuencia, una caja central dividida en dos áreas por una lı́nea vertical y otras dos
áreas representadas por dos segmentos horizontales (bigotes) que parten del centro de cada
lado de la caja. La caja central encierra el 50% de los datos. En el interior de caja central
se acostumbra a representar la media con un signo más y se dibuja la mediana como una
lı́nea vertical en el interior de la caja (compárese con la figura 1.15). Si esta lı́nea está en el
centro de la caja, no hay asimetrı́a en los datos. Los lados verticales están situados en los
cuartiles inferior y superior de los datos. Partiendo del centro de cada lado vertical de la
caja se dibujan los dos bigotes, uno hacia la izquierda y el otro hacia la derecha, teniendo
en cuenta lo siguiente:

• El bigote de la izquierda tiene un extremo en el primer cuartil Q1 y el otro en el


valor dado por el primer cuartil menos 1,5 veces el rango intercuartil R.I, esto es,
Q1 − 1, 5R.I.

• El bigote de la derecha tiene un extremo en el tercer cuartil Q3 y el otro en el valor


dado por el tercer cuartil más 1,5 veces el rango intercuartil R.I, esto es, Q3 + 1, 5R.I.

Si hay datos que se encuentran a la izquierda del bigote izquierdo y a la derecha del bigote
derecho, se les denomina valores atı́picos.

Definición 1.5.5 Todo valor que está más alejado del 1,5R.I del cuarto más cercano se
dice que es atı́pico. Un valor atı́pico es extremo si está a más de 3R.I del cuarto más
cercano, y es moderado en otro caso.

En el diagrama de caja, los valores atı́picos moderados se representan mediante un pequeño cuadrado, y
los extremos, con un pequeño cuadrado con un signo más en su interior.

Un valor atı́pico puede ser un elemento para el cual se haya anotado su valor en forma
errónea. Si es ası́, puede corregirse antes de proseguir con el análisis. También, un valor
Copyright © 2017. Universidad del Norte. All rights reserved.

atı́pico puede ser uno que por error se incluyó en el conjunto de datos y, en estos casos, debe
eliminarse. Por último, puede ser tan sólo un elemento poco común que se haya anotado en
forma correcta y que sı́ pertenece al conjunto de datos. En estos casos ese elemento debe
mantenerse.

Ejemplo 1.5.6 Construya un diagrama de caja y bigotes para los datos del ejemplo 1.5.4.

SOLUCIÓN:
Tenemos que el rango intercuartil es R.I = 2, 500 − 2, 365 = 0, 135, de donde se obtiene que la
longitud de los bigotes es 1, 5R.I = 0, 2025. Ahora

1.5. Análisis exploratorio de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
76 Llinás / Rojas

• El bigote de la izquierda tiene un extremo en el primer cuartil Q1 = 2, 365 y el otro en el


valor Q1 − 1, 5R.I = 2, 1625.

• El bigote de la derecha tiene un extremo en el tercer cuartil Q3 = 2, 500 y el otro en el valor


Q3 + 1, 5R.I = 2, 7025.

Diagrama de caja y bigotes


Mediana = 2,405

Valor atípico
(moderado)
1,5 R.I 1,5 R.I
+
0,2025 0,2025
Media

2,1625
2200 2,365
2400 2,5002600
2,7025 2800
2,825 3000
Salarios mensuales
Salarios mensuales
Figura 1.16: Diagrama de caja y bigotes para los datos del ejemplo 1.5.4

La figura 1.16 es el diagrama de caja y bigotes pedido. En el diagrama podemos observar que hay
un valor atı́pico (el valor 2,825) porque éste se encuentra por fuera de los bigotes. Debido a que
Q3 + 3R.I = 2, 905, este valor atı́pico es moderado, porque 2,825 es menor que 2,905. Además,
podemos afirmar que la distribución de frecuencias está sesgada a la derecha, porque el área del
rectángulo a la izquierda de la mediana es menor que el del rectángulo a la derecha de la mediana.
Esto también se puede concluir al tener en cuenta que media es mayor que la mediana. 

Diagramas de cajas múltiples (o comparativos)

Un diagrama de caja múltiple (o comparativo) es una forma muy eficaz de mostrar


semejanzas y diferencias entre dos o más conjuntos de datos.
Copyright © 2017. Universidad del Norte. All rights reserved.

Ejemplo 1.5.7 La figura 1.17 contiene los diagramas de caja de las calificaciones en un examen
de matemáticas para quince estudiantes de primer curso de primaria, quince de segundo y quince
de tercero. En el diagrama puede apreciarse que no hay valores atı́picos en ninguno de los tres
grupos. Los estudiantes del tercer curso consiguieron la mejor mediana, pero sus calificaciones
tienen una variabilidad considerablemente mayor que la de los otros grupos. Otro hecho que llama
la atención es la gran cantidad de calificaciones bajas obtenidas por los estudiantes de primer curso.
Finalmente, podemos afirmar que las distribuciones de frecuencias de los tres conjuntos de datos
están sesgadas a la izquierda.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 77

Primero

Segundo

Tercero

40 50 60 70 80 90 100
Calificaciones
Calificaciones
Figura 1.17: Diagrama de caja y bigotes de las calificaciones en un examen 

✍ Ejercicios de la sección 1.5


57. Un fabricante de baterı́as para linternas tomó una muestra de 13 baterı́as de un dı́a de
producción y las usó hasta que se agotaron. Las horas que funcionaron hasta fallar son:

166 342 426 492 562 298 264 631 451 1.049 317 545 512

Proporcione el resumen de cinco números, construya el diagrama de caja y bigotes, deter-


mine en cada caso si hay valores atı́picos y haga un análisis exploratorio de cada conjunto
de datos.

58. Los siguientes datos muestran las yardas acumuladas durante la temporada de fútbol ame-
ricano colegial para una muestra de 20 receptores:

451 1.023 852 809 596 744 652 576 1.112 971
1.278 820 511 907 1.251 941 975 400 711 1.174

Haga el resumen de cinco números, trace un diagrama de caja e indentifique en él el o los
valores atı́picos.

59. Los siguientes datos representan los rendimientos porcentuales anuales en cuentas de mer-
cado de dinero de una muestra de 15 bancos comerciales en el área metropolitana de una
Copyright © 2017. Universidad del Norte. All rights reserved.

ciudad a una determinada fecha:

Nombre del banco Rendimiento Nombre del banco Rendimiento


Banco su cuenta 3,10 Banco el Paı́s 2,28
The Bank 2,63 Banco la Clave 3,01
Mein Bank 2,79 Banco del Norte 2,53
Your Bank 3,25 Banco del Sur 2,00
El Banco del pueblo 1,90 Banco Nacional 3,05
Aero Bank 2,79 Nuestro Banco 2,02
Union Bank 2,90 Banco el dinero 3,05
Bank del cliente 2,73

1.5. Análisis exploratorio de datos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
78 Llinás / Rojas

(a) Proporcione el resumen de cinco números.


(b) Construya el diagrama de caja y bigotes y describa la forma.
(c) Si alguien le dijera:“los rendimientos del mercado de dinero no varı́an mucho de un
banco a otro”, con base en estos datos, ¿qué dirı́a?

60. Una de las metas de toda administración es ganar lo más posible en relación con el capital
invertido en la empresa. Una medida del éxito en alcanzarla es el retorno sobre la aportación,
que es la relación de la ganancia neta entre el valor de las acciones. A continuación se
muestran los porcentajes de ganancia sobre las acciones para 25 empresas:

11,4 15,8 52,7 17,3 12,3 9,0 19,6 22,9 41,6


5,1 17,3 31,1 6,2 19,2 14,7 9,6 8,6 11,2
16,6 5,0 30,3 12,8 12,2 14,5 9,2

Haga el resumen de cinco números, trace un diagrama de caja y bigotes y determine si hay
valores atı́picos. ¿Cómo podrı́a un analista financiero usar esta información?

61. Una revista publica regularmente las clasificaciones de funcionamiento y de calidad para
muchos productos de consumo. Se publicaron calificaciones generales de una muestra de 16
televisores de precio intermedio en esta revista. Las marcas y las calificaciones aparecen en
la tabla siguiente:

Fabricante Calificación Fabricante Calificación Fabricante Calificación


PCG 73 Rernat 72 Katze 81
Monch 89 Kuril 77 Sheck 76
RMA 79 Tosh 79 Fish 77
Cuark 75 Pate 78 Karl 79
Magnifon 80 Wand 78 Wind 90
Sodium 86

(a) Determine la calificación promedio y haga el resumen de cinco números.


(b) Una evaluación similar de radios proporcionó calificaciones que tuvieron una media de
82,56, una desviación estándar 6,39 y un resumen de cinco números 75, 77, 82, 86 y
93. Compare los datos de calificaciones de la revista de televisores con los del radio.
Trace los diagramas de caja de ambos.
Copyright © 2017. Universidad del Norte. All rights reserved.

(c) ¿Hay valores atı́picos en los datos de televisores? Explique su respuesta.

62. Dos modos que usan las empleados para ir a trabajar diariamente son el transporte público
y el automóvil. A continuación vemos unas muestras de tiempos de cada modo. Las cifras
son minutos:

Transporte público 25 29 32 41 34 28 29 32 37 33
Automóvil 30 31 32 35 33 29 31 33 32 34

(a) Calcule la media y la desviación estándar de la muestra del tiempo que se lleva en
cada modo de transporte.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 79

(b) Con base en los resultados del inciso (a), ¿qué modo de transporte debe preferirse?
Explique sus razones.
(c) Trace un diagrama de caja para cada modo. Al comparar los diagramas de caja, ¿se
respalda la conclusión del inciso (b)?

1.6 Uso de Statgraphics en la estadı́stica descriptiva


A continuación presentaremos una breve descripción de la forma cómo se utiliza Statgra-
phics en el análisis descriptivo de uno o más conjuntos de datos.

1.6.1 Análisis de un solo conjunto de datos

En esta sección trabajaremos con los datos que aparecen en el archivo calles.sf3. Este
contiene las variables longitud, anchura y nombre, que son la longitud, anchura y el
nombre de 112 calles del antiguo casco de Madrid (España). Utilizando este archivo y con
ayuda de Statgraphics realizaremos un análisis de la variable longitud. Al abrir el archivo
calles.sf3 sale la ventana de hojas de cálculos que mostramos en la figura 1.18. El acceso a
todas las opciones analı́ticas y gráficas que necesitamos en cualquier práctica la realizamos
de la misma manera:
Copyright © 2017. Universidad del Norte. All rights reserved.

Figura 1.18: Aspecto de la ventana de hojas de cálculos

• Seleccionamos Describe . . . Numeric Data . . . One-Variable Analysis y aparecen todas


las variables que contiene el archivo.

1.6. Uso de Statgraphics en la estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
80 Llinás / Rojas

• Con el ratón se elige la variable deseada (que en nuestro caso será la variable lon-
gitud), aparecerá resaltada, y a continuación pulsamos el botón Data, aparece el
nombre de dicha variable como variable activa. Dicha ventana tiene la opción or-
denar (sort) las variables alfabéticamente. Los botones que aparecen en la parte
inferior permiten realizar el análisis, cancelar el análisis, transformar los datos y con-
sultar la ayuda. Pulsamos la opción OK para realizar el análisis y aparece la llamada
ventana del análisis, que da informaciones estadı́sticas acerca del conjunto de datos
con el que estamos trabajando (véase la figura 1.19).

Figura 1.19: Aspecto de la ventana del análisis

Los ı́conos principales que hay en la barra de herramientas de esta ventana son los cuatro
de la izquierda (los restantes los activamos en algunas opciones gráficas):

• El primer ı́cono (Input dialog, ı́cono de diálogos) permite la selección (o cambio) de


variables dentro del archivo y análisis seleccionado. Por ejemplo, dentro del archivo
calles.sf3 podemos cambiar la variable longitud por la variable anchura utilizando
Copyright © 2017. Universidad del Norte. All rights reserved.

este ı́cono.

• El segundo ı́cono (Tabular options, ı́cono de opciones tabulares) permite seleccionar


opciones analı́ticas.

• El tercer ı́cono (Graphical options, ı́cono de opciones gráficas) permite seleccionar


diferentes opciones de gráficos.

• El cuarto ı́cono (Save results, ı́cono de salvar resultados) permite salvar los resultados
del análisis para tratarlos posteriormente o para imprimirlos.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 81

Opciones numéricas

Al marcar el segundo ı́cono (Tabular options) de la barra de herramientas de la ventana del


análisis podemos seleccionar las siguientes opciones:

• Analysis Summary (Resumen de procedimiento)


Presenta una información muy general del análisis (nombre de la variable, número de
datos que ella tiene, datos mayor y menor, etc.).

• Summary Statistics (Resumen estadı́stico)


Esta opción nos permite obtener algunas medidas estadı́sticas. Por defecto, ofrece el
número de datos, la media, varianza, desviación tı́pica, valores máximo y mı́nimo, los
coeficientes de asimetrı́a y apuntamiento estandarizados y la suma de los valores de
las observaciones. Para obtener un número mayor o menor de medidas, es suficiente
con pulsar el botón derecho del ratón y seleccionar Pane options, con lo que aparece
una ventana con un amplio conjunto de medidas.

• Percentiles
Permite el cálculo simultáneo de hasta 10 percentiles a voluntad del usuario. Si,
estando situado sobre esta salida, pulsamos el botón derecho del ratón y elegimos
Pane options, introducimos los percentiles que deseemos calcular.

• Frequency Tabulation (Tabla de frecuencia)


Permite resumir la distribución de los datos en una tabla de frecuencias absolutas,
relativas, absolutas acumuladas y relativas acumuladas. Si, estando situados sobre
esta salida, pulsamos el botón derecho del ratón y elegimos Pane options, obtenemos
la ventana de diálogo Frequency Tabulation Options, en donde tenemos los siguientes
campos:

– Number of Classes (Número de clases)


Aquı́, introducimos el número de intervalos de clase para agrupar los datos de
la distribución.
– Lower Limit (Lı́mite inferior )
En él introducimos el lı́mite inferior para la primera clase.
Copyright © 2017. Universidad del Norte. All rights reserved.

– Upper Limit (Lı́mite superior )


En este campo introducimos el lı́mite superior para la última clase.
– Hold (Mantener )
Lo señalamos cuando queremos mantener la definición actual de clase para la
siguiente tabla de frecuencias que realicemos.

• Stem-and-Leaf Display (Diagrama de tallo y hojas)


Esta opción permite mostrar el diagrama de tallo y hojas. En este caso, el diagrama
de tallo y hojas para la variable longitud está formado por cuatro tallos. Los valores

1.6. Uso de Statgraphics en la estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
82 Llinás / Rojas

que están a la izquierda de cada tallo son la frecuencia absoluta acumulada de los
tallos, donde dicha frecuencia se comienza a contar tanto por arriba como por abajo,
a excepción de valor que aparece entre paréntesis, que corresponde al tallo donde
se encuentra la mediana. Si, estando situados sobre esta opción, pulsamos el botón
derecho del ratón y elegimos Pane options, obtenemos la ventana de diálogo Stem-
and-Leaf Display Options, cuyo campo Flag Outliers (Valores Anómalos) permite
marcar valores atı́picos en el diagrama. Como podemos observar, el diagrama de tallo
y hojas de la variable longitud presenta cuatro valores atı́picos.

• Las otras dos opciones, Confidence Intervals (Intervalos de confianza) y Hypothesis


Tests (Pruebas de hipótesis), corresponden a conceptos de la estadı́stica inferencial.

Opciones gráficas

Al marcar el tercer ı́cono (Graphical options) de la barra de herramientas de la ventana del


análisis podemos seleccionar las siguientes opciones:

• Scatterplot (Gráfico de dispersión)


Presenta un diagrama de dispersión para la variable en el que se muestran sus va-
lores mediante puntos no conectados a lo largo de un eje horizontal agrupados por
intervalos.

• Box-and-Whisker Plot (Gráfico de cajas y bigotes)


Permite realizar diagramas de cajas y bigotes. Si, estando situados sobre esta salida,
pulsamos el botón derecho del ratón y elegimos Pane options, obtenemos la ventana
de diálogo Frequency Tabulation Options, que ofrece los siguientes campos:

– Direction (Dirección)
Podemos elegir Vertical u Horizontal para orientar el diagrama en el sentido que
deseemos.
– Features (Aspectos)
Esta opción permite señalar o no en el gráfico la media (Mean Marker ), los
Copyright © 2017. Universidad del Norte. All rights reserved.

valores atı́picos (Outlier Symbols) y muescas sobre la mediana (Median Nocht).

• Frequency Histogram (Histograma de frecuencia)


Esta opción permite realizar histogramas y polı́gonos de frecuencias absolutas y rela-
tivas, que también pueden ser acumulados.6 Si, estando situados sobre el gráfico del
histograma, pulsamos el botón derecho del ratón y elegimos Pane options, obtenemos
la ventana de diálogo Frequency Plot Options con las siguientes opciones:

6
Recordemos que los polı́gonos acumulados o acumulados relativos son las llamadas ojivas.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 83

– En los campos Number of Classes, Lower Limit y Upper Limit podemos definir
el número de clases deseado, el lı́mite inferior de la primera clase y el lı́mite
superior de la última clase respectivamente.
– El campo counts permite seleccionar frecuencias relativas (Relative) y acumu-
ladas (Cumulative).
– El campo Hold (Mantener ) permite mantener la escala actual para los gráficos
siguientes.
– El histograma de frecuencias absolutas lo obtenemos señalando el botón His-
togram del campo Plot Type y dejando en blanco los dos botones del campo
Counts; el de frecuencias relativas, señalando el botón Histogram del campo
Plot Type y el botón Relative del campo Counts; el de frecuencias acumuladas,
señalando el botón Histogram del campo Plot Type y el botón Cumulative del
campo Counts; el de frecuencias acumuladas, señalando el botón Histogram del
campo Plot Type y los botones Cumulative y Relative del campo Counts.
– El polı́gono de frecuencias absolutas lo obtenemos señalando el botón Polygon
del campo Plot Type y dejando en blanco los dos botones del campo Counts; el
de frecuencias relativas, señalando el botón Polygon del campo Plot Type y el
botón Relative del campo Counts.
– La ojiva de frecuencias acumuladas la obtenemos señalando el botón Polygon
del campo Plot Type y el botón Cumulative Relative del campo Counts; la de
frecuencias acumuladas relativas, señalando el botón Polygon del campo Plot
Type y los botones Relative y Cumulative del campo Counts.

• Density Trace (Gráfico de densidad )


Esta opción permite visualizar en cierta forma el histograma suavizado.

• Symmetry Plot (Gráfico de simetrı́a)


Este gráfico permite analizar el grado de simetrı́a de un conjunto de datos. En el eje
de las abscisas se representan las distancias de los datos a la mediana que quedan por
debajo de ella. Si la simetrı́a fuese perfecta, el conjunto de puntos resultante serı́a la
diagonal principal. Mientras más se aproxime la gráfica a la diagonal, más simetrı́a
Copyright © 2017. Universidad del Norte. All rights reserved.

existirá en la distribución de los datos.

Conclusiones sobre la variable longitud

Tiene especial interés la comparación de la media (Average) y la mediana (Median), donde


observamos que la media es mayor que la mediana en 40 unidades. Esto indica cierta
asimetrı́a en los datos, que debe concordar con un coeficiente de asimetrı́a grande y positivo.

En el histograma observamos asimetrı́a, con mayor concentración de datos en la parte

1.6. Uso de Statgraphics en la estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
84 Llinás / Rojas

izquierda. Es recomendable modificar el número de clases del histograma, para ası́ observar
las variaciones que se producen en éste.

El diagrama de caja de la variable longitud pone claramente de manifiesto la asimetrı́a de


los datos, con mayor concentración en la parte izquierda que en la derecha, y la presencia
de valores atı́picos. La caja está delimitada por el primero y tercer cuartil, con valores
respectivos de 89 y 210. La lı́nea que separa la caja en dos partes es la mediana, con
magnitud igual a 135. El valor mı́nimo es 25, y no se observan valores atı́picos en la parte
izquierda de los datos. En la parte derecha aparecen varios valores atı́picos.

Si deseamos obtener una distribución simétrica y con probable desaparición de ciertos va-
lores atı́picos, recomendamos realizar una transformación.

Transformación de la variable longitud

Las cuatro transformaciones más habituales para resolver este tipo de problemas son: lo-
garitmo, raı́z cuadrada, inversa y cuadrado.

Los comandos que representan estas tres transformaciones son:

• LOG(nombre variable) para el logaritmo neperiano

• SQRT(nombre variable) para la raı́z cuadrada

• y 1/(nombre variable) para la inversa.

Para trabajar con la variable transformada es suficiente con escribir en lugar del nombre
de la variable la transformación adecuada. Por ejemplo, si quisiéramos trabajar con el
logaritmo de la variable, escribimos LOG(longitud) en vez de longitud. Otro método
para escribir la transformación adecuada es desde la opción de One Variable Analysis;
en la parte inferior de la ventana activar el botón Transform, lo que nos permite acceder
a los diferentes operadores (Operators), entre los que se encuentran las transformaciones
Copyright © 2017. Universidad del Norte. All rights reserved.

antes mencionadas. De las estas transformaciones, la que ofrece una distribución más
simétrica es el logaritmo. A continuación presentamos las conclusiones obtenidas del estudio
descriptivo (medidas caracterı́sticas, diagrama de tallo y hojas, caja e histograma) de la
variable LOG(longitud).

Conclusiones sobre el logaritmo de la variable longitud

Repetimos todo el análisis realizado para la variable longitud, pero ahora con la variable
transformada (LOG(longitud)). Como consecuencia de la transformación realizada obte-

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 85

nemos un comportamiento simétrico, aunque detectamos la presencia de un valor atı́pico


correspondiente a la calle Atocha de 1260 metros.7

1.6.2 Análisis simultáneo de dos o más conjuntos de datos

Mediante la opción Compare . . . Two Samples . . . Two Sample Comparison . . . podemos


analizar dos conjuntos de datos simultáneamente (véase el ejercicio 68).

Para obtener diagramas de cajas múltiples para dos o más conjuntos de datos, una alter-
nativa es mediante las opciones Compare . . . Multiple Samples . . . Multiple-Sample Com-
parison . . . Multiple Data Columns . . . Ok . . . Samples= (en esta última opción mencionar
los datos que queremos comparar).

Statgraphics también habilita la subopción Plot . . . Exploratory Plots . . . Multiple Box-


and-Whishker Plot . . . Data=distancia . . . Level codes=year . . . para obtener diagramas de
cajas múltiples de varios conjuntos de datos con respecto diferentes grupos en que podemos
dividir los conjuntos de datos (véase el ejercicio 64c).

✍ Ejercicios de la sección 1.6


 63. Considere la variable anchura que contiene el conjunto de datos que encontramos en el
archivo calles.sf3 y que corresponde al ancho de 112 calles de Madrid (España).

(a) Obtenga la media y la mediana, la moda, el primero y tercer cuartil, el segundo y octavo
decil, los percentiles 35, 66, 81 y 93, el sesgo y el coeficiente de variación. Interprete
cada uno de sus resultados.
(b) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera frontera
inferior sea 0 y la última frontera superior sea 40. Con base en ella, responda las
siguientes preguntas:
i. ¿Cuántas calles tienen un ancho entre 5 y 25 kilómetros?
ii. ¿Qué porcentaje de calles tienen un ancho entre 10 y 30 kilómetros?
Copyright © 2017. Universidad del Norte. All rights reserved.

iii. ¿Cuántas calles tienen un ancho mayor que 20 kilómetros?


iv. ¿Qué porcentaje de calles tienen un ancho mayor que 25 kilómetros?
v. ¿Cuántas calles tienen un ancho menor que 15 kilómetros?
vi. ¿Qué porcentaje de calles tienen un ancho menor que 35 kilómetros?

7
La presencia de este valor atı́pico la podemos explicar acudiendo a razones históricas. Por ejemplo, la
calle Atocha está ubicada entre la Plaza de Santa Cruz y el Paseo del Prado,que data de 1589, al igual que
las calles de su entorno. Una explicación de su carácter peculiar (atı́pico) es su función como unión entre
Madrid capital y el Hospital General (inicialmente en la periferia).

1.6. Uso de Statgraphics en la estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
86 Llinás / Rojas

(c) Con 8 clases (en donde la primera frontera inferior sea 0 y la última frontera superior
sea 40) construir los histogramas de frecuencias absolutas y de frecuencias absolutas
acumuladas, los polı́gonos de frecuencia y de frecuencias relativas y las ojivas de fre-
cuencias acumuladas y de frecuencias relativas acumulada. A partir de estos gráficos
responda las siguientes preguntas:
i. ¿Aproximadamente cuántas calles tienen un ancho mayor que 16,9 kilómetros?
ii. ¿Aproximadamente cuántas calles tienen un ancho menor que 12,5 kilómetros?
iii. ¿Qué porcentaje aproximado de calles tienen un ancho mayor que 7,7 kilómetros?
iv. ¿Qué porcentaje aproximado de calles tienen un ancho menor que 13,8 kilómetros?
(d) Estudie la simetrı́a de la distribución de los datos.
(e) ¿Existen valores atı́picos? ¿Cuántos? ¿Cuáles?
(f) ¿Existe alguna transformación que mejora la simetrı́a? ¿Y la presencia de valores
atı́picos? Indique en caso positivo la transformación seleccionada.

 64. En el archivo de datos autos.sf3 mostramos las distancias recorridas (dadas en millas por
galón) de 154 modelos de automóviles sacados al mercado entre los años 1978 y 1982 por
diferentes fabricantes: americanos (origen=1), europeos (origen=2) y japoneses (origen=3).
También aparecen los respectivos cilindrajes de los autos, las potencias, etc.

(a) Construya un diagrama de caja y bigotes para los datos de la distancia recorrida, y con
base en él responda las siguientes preguntas: ¿Entre cuáles valores varı́a la distancia
recorrida? ¿Cuánto recorre el 50% central de los autos? ¿Hay valores atı́picos? ¿Es
simétrica o asimétrica la distribución de los datos? En caso de ser asimétrica, ¿es
asimétrica a la izquierda o a la derecha? ¿Cuáles son los valores de la media y de la
mediana?
(b) Estudie el grado de simetrı́a de los datos de la distancia recorrida de cuatro maneras
diferentes (compare sus respuestas):
i. Utilizando las medidas estadı́sticas (media, mediana, moda, sesgo, etc.).
ii. Construyendo un histograma de frecuencias con 5 clases.
iii. Construyendo un histograma con 13 clases. ¿Porqué este histograma resulta más
adecuado que el que construyó con 5 clases?
iv. Construyendo un gráfico de simetrı́a con la opción graphical options . . . symmetry
Copyright © 2017. Universidad del Norte. All rights reserved.

plot de Statgraphics.
(c) Considere ahora por separado los conjuntos de distancias recorridas de los modelos de
cada uno de los cinco años.
i. Analice gráfica y numéricamente cada uno de estos conjuntos.
ii. Utilizando la opción Plot . . . Exploratory Plots . . . Multiple Box-and-Whishker
Plot . . . Data=distancia . . . Level codes=year . . . obtenga los diagramas de ca-
jas (múltiples) de los cinco conjuntos de distancias recorridas con respecto a cada
uno de los años. ¿Qué se observa? ¿Conoce alguna razón que pueda explicar lo que
resulta de los análisis numéricos y de la observación de los diagramas de cajas?

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 87

(d) Ahora construya el diagrama de caja múltiple de la distancia recorrida de los automó-
viles según su cilindrada.
i. Teniendo en cuenta cada uno de los diagramas responda las preguntas formuladas
en la parte (a).
ii. Compare entre sı́ los distintos diagramas y responda las siguientes preguntas:
¿Dónde es más fuerte la asimetrı́a? ¿Dónde es menor? ¿Dónde no existe? ¿Varı́a
bastante los valores de la media y de la mediana para los diferentes grupos?
(e) Construya el diagrama de caja múltiple de la potencia de los automóviles según su
origen y responda las preguntas formuladas en el inciso anterior.

 65. Se han medido los diámetros (en milı́metros) de 50 tornillos y se han obtenido los resultados
que mostramos en el archivo tornillos.sf3.

(a) Obtenga la mediana, la moda, el primero y tercer cuartil, el sexto y séptimo decil y los
percentiles 54, 47, 82. Interprete cada uno de sus resultados.
(b) Forme la tabla de frecuencias con 6 clases para los datos, y con base en ella responda
las siguientes preguntas:
i. ¿Cuántos tornillos tienen un diámetro entre 29 y 32 milı́metros?
ii. ¿Qué porcentaje de tornillos tienen un diámetro entre 30 y 34 milı́metros?
iii. ¿Cuántos tornillos tienen un diámetro mayor que 32 milı́metros?
iv. ¿Qué porcentaje de tornillos tienen un diámetro mayor que 34 milı́metros?
v. ¿Cuántos tornillos tienen un diámetro menor que 31 milı́metros?
vi. ¿Qué porcentaje de tornillos tienen un diámetro menor que 33 milı́metros?
(c) Con 6 clases construir los histogramas de frecuencias absolutas y de frecuencias abso-
lutas acumuladas, los polı́gonos de frecuencia y de frecuencias relativas y las ojivas de
frecuencias acumuladas y de frecuencias relativas acumulada. Con base en estos gráficos
responda las siguientes preguntas:
i. ¿Aproximadamente cuántos tornillos tienen un diámetro mayor que 34,4 milı́metros?
ii. ¿Aproximadamente cuántos tornillos tienen un diámetro menor que 32,2 milı́metros?
iii. ¿Qué porcentaje aproximado de tornillos tienen un diámetro mayor que 31,6 milı́-
metros?
iv. ¿Cuántos tornillos tienen un diámetro menor que 32,8 milı́metros?
Copyright © 2017. Universidad del Norte. All rights reserved.

(d) Estudie la simetrı́a de la distribución de los datos.

 66. Los datos del archivo fotocopia.sf3 muestran el gasto en fotocopias (en miles de pesos) de
70 estudiantes universitarios durante un determinado año.

(a) Obtenga la media y la mediana, la moda, el primero y tercer cuartil, el segundo y octavo
decil, los percentiles 33, 67, 84 y 93, el sesgo y el coeficiente de variación. Interprete
cada uno de sus resultados.
(b) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera frontera
inferior sea 0 y la última frontera superior sea $ 1.400.000. Con base en ella responda
las siguientes preguntas:

1.6. Uso de Statgraphics en la estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
88 Llinás / Rojas

i. ¿Cuántos estudiantes han gastando entre $ 175.000 y $ 525.00 en el año?


ii. ¿Qué porcentaje de estudiantes han gastando entre $ 700.000 y $ 1.225.000 en el
año?
iii. ¿Cuántos estudiantes han gastando más de $ 1.050.000 en el año?
iv. ¿Qué porcentaje de estudiantes han gastando más de $ 350.000 en el año?
v. ¿Cuántos estudiantes han gastando menos de $ 875.000 en el año?
vi. ¿Qué porcentaje de estudiantes han gastando menos de $ 525.000 en el año?
(c) Con 8 clases (en donde la primera frontera inferior sea 0 y la última frontera superior
sea $ 1.400.000) construya los histogramas de frecuencias absolutas y de frecuencias
absolutas acumuladas, los polı́gonos de frecuencia y de frecuencias relativas y las ojivas
de frecuencias acumuladas y las de frecuencias relativas acumuladas. Teniendo en cuenta
estos gráficos responda las siguientes preguntas:
i. ¿Aproximadamente cuántos estudiantes han gastando más de $ 767.810 en el año?
ii. ¿Aproximadamente cuántos estudiantes han gastando menos de $ 391.821 en el
año?
iii. ¿Qué porcentaje aproximado de estudiantes han gastando más de $ 601.583 en el
año?
iv. ¿Cuántos estudiantes han gastando menos de $ 1.104.220 en el año?
(d) Estudie la simetrı́a de la distribución de los datos.
(e) ¿Existen valores atı́picos? ¿Cuántos? ¿Cuáles?
(f) Realice una transformación logarı́tmica de los datos e interprete los resultados. Comente
las diferencias con los datos sin transformar.

 67. En el archivo de datos doscientos.sf3 proporcionamos las sesenta y nueve mejores marcas
de todos los tiempos en la prueba de 200 metros lisos masculinos (las marcas se dan en
segundos), ası́ como el nombre del atleta y la fecha en que se consiguió la marca.

(a) Obtenga la media y la mediana, la moda, el primero y tercer cuartil, el segundo y octavo
decil, los percentiles 42, 53, 76 y 89, el sesgo y el coeficiente de variación. Interprete
cada uno de sus resultados.
Copyright © 2017. Universidad del Norte. All rights reserved.

(b) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera frontera
inferior sea 19,2 segundos y la última frontera superior sea 20,2 segundos. Con base en
ella responda las siguientes preguntas:
i. ¿Cuántos atletas han recorrido entre 19,325 y 19,7 segundos?
ii. ¿Qué porcentaje de atletas han recorrido entre 19,45 y 19,95 segundos?
iii. ¿Cuántos atletas han recorrido más de 19,7 segundos?
iv. ¿Qué porcentaje de atletas han recorrido más de 19,45 segundos?
v. ¿Cuántos atletas han recorrido menos de 19,95 segundos?
vi. ¿Qué porcentaje de atletas han recorrido menos de 19,825 segundos?

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 89

(c) Con 8 clases (en donde la primera frontera inferior sea 19,2 segundos y la última frontera
superior sea 20,2 segundos) construya los histogramas de frecuencias absolutas y de
frecuencias absolutas acumuladas, los polı́gonos de frecuencia y de frecuencias relativas
y las ojivas de frecuencias acumuladas y de frecuencias relativas acumuladas. A partir
de estos gráficos responda las siguientes preguntas:
i. ¿Aproximadamente cuántos atletas han recorrido más de 19,818 segundos?
ii. ¿Qué porcentaje aproximado de atletas han recorrido más de 19,845 segundos?
iii. ¿Qué porcentaje aproximado de atletas han recorrido más de 19,782 segundos?
iv. ¿Aproximadamente cuántos atletas han recorrido menos de 20,03 segundos?
(d) Estudie la simetrı́a de la distribución de los datos.
(e) ¿Se detecta algo peculiar en la distribución de estos datos?
(f) ¿Se detecta algún valor potencialmente atı́pico? ¿Cuál es?

 68. En el archivo de datos gemelos.sf3 mostramos los resultados de tests de inteligencia rea-
lizados a parejas de gemelos monozigóticos. Los gemelos monozigóticos se forman por la
división en dos de un mismo óvulo ya fecundado y, por tanto, tienen la misma carga genética.
Al mismo tiempo, por razones obvias, es muy frecuente que compartan el entorno vital y es
difı́cil separar ambos factores. En el conjunto de datos, los de la columna A corresponden
al gemelo criado por sus padres naturales, los de la columna B al criado por un familiar u
otra persona. Mediante la opción Compare . . . Two Samples . . . Two Sample Comparison
. . . Sample 1=A . . . Sample 2=B . . . Ok, resuelva lo siguiente:

(a) Compare la simetrı́a de los datos de la columna A y B.


(b) Construya un diagrama de caja múltiple para los datos de la columna A y B y describa
sus interesantes propiedades.
(c) ¿Cómo interpreta el coeficiente de variación de ambos conjuntos de datos?

 69. En el archivo de datos Cavendish.sf3 presentamos 29 medidas de la densidad de la Tierra


obtenidas por Henry Cavendish en 1798 empleando una balanza de torsión. La densidad de
la Tierra se proporciona como un múltiplo de la densidad del agua.

(a) Utilice los diagramas de tallo y hojas y de cajas para determinar si existe algún valor
Copyright © 2017. Universidad del Norte. All rights reserved.

atı́pico.
(b) Proponga, razonando la respuesta, un valor para la densidad de la Tierra.

 70. En 1893 Lord Rayleigh investigó la densidad del nitrógeno empleando en su obtención dis-
tintas fuentes. Previamente habı́a comprobado la gran diferencia existente entre la densidad
del nitrógeno producido tras la eliminación del oxı́geno del aire y el nitrógeno producido
por la descomposición de ciertos compuestos quı́micos. Los datos del archivo Rayleigh.sf3
muestran esta diferencia de forma clara. Esto llevó a Lord Rayleigh a investigar detenida-
mente la composición del aire libre de oxı́geno y al descubrimiento de un nuevo elemento
gaseoso, el argón.

1.6. Uso de Statgraphics en la estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
90 Llinás / Rojas

(a) Analice numérica y gráficamente estos datos. Preste especial atención a los diagramas
de tallo y hojas y al diagrama de cajas. ¿Hay alguna peculiaridad de la población de
pesos que se manifieste en un diagrama y no en el otro?
(b) Realice diagramas de cajas dividiendo los datos en los pesos obtenidos con base aire y
los obtenidos con base en compuestos quı́micos del nitrógeno. ¿Qué se observa?

 71. Una de las medidas de seguridad de los reactores nucleares frente a desajustes en el proceso
de generación de energı́a o de extracción de ésta es el disparo del reactor. Esta medida
consiste en la detención del proceso de fusión mediante la inserción en el núcleo del reactor
de venenos neutrónicos. El número de disparos no previstos de un reactor en un periodo es
un indicador de problemas de comportamiento y de fiabilidad en la planta. En el archivo
de datos disparos.sf3 proporcionamos, para dos años diferentes (1984 y 1993), el número
de disparos no previstos en sesenta y seis reactores nucleares de los Estados Unidos de
Norteamérica.

(a) Analice numérica y gráficamente, por separado, el número de disparos de reactor en


cada uno de los dos años considerados.
(b) Compare gráficamente las distribuciones de ambas variables ¿Se aprecian diferencias
importantes entre ellas? ¿Qué conclusiones le sugiere esta comparación?

1.7 Uso de la calculadora en la estadı́stica


El objetivo de esta sección es ilustrar en forma breve el manejo de la calculadora como
herramienta de ayuda en los cálculos estadı́sticos, pero utilizando directamente las funciones
estadı́sticas que están incorporadas en ella. En particular, las explicaciones las basaremos
en la utilización de las calculadoras Casio fx-82MS, fx-83MS, fx-85MS, fx-270MS, fx-300MS
y fx-350MS.

Cálculos estadı́sticos

Para realizar cálculos estadı́sticos en la calculadora, tenga en cuenta los siguientes comen-
Copyright © 2017. Universidad del Norte. All rights reserved.

tarios:

• Utilice las teclas mode 2 para ingresar el modo SD cuando desea realizar cálculos
estadı́sticos con ayuda de las funciones estadı́sticas que hay incorporadas en la calcu-
ladora.

• El ingreso de datos comienza siempre con shift clr 1 = para borrar la memoria
de estadı́sticas.

• Ingrese los datos usando la secuencia de tecla siguiente: <Dato> dt .

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 91

• Los datos ingresados los usamos para calcular los valores para n (el total de datos),
  2
x (la suma de todos los datos), x (la suma de los cuadrados de los datos), x (la
media), σn (la desviación estándar poblacional) y σn−1 (la desviación estándar mues-
tral), que pueden llamarse usando las operaciones de tecla indicados a continuación:

Para llamar este tipo de valor: Realice esta operación:


 2
x shift s-sum 1

x shift s-sum 2
n shift s-sum 3
x shift s-var 1
σn shift s-var 2
σn−1 shift s-var 3

 
Ejemplo 1.7.1 Calcule n, x, x2 , x, σn y σn−1 para los datos siguientes: 55, 54, 51, 55, 53,
53, 54 y 52.

SOLUCIÓN:

• Primero, ingresamos al modo SD con las teclas mode 2 .

• Luego, borramos la memoria con la secuencia de teclas shift clr 1 = .

• Posteriormente, ingresamos los datos: 55 dt 54 dt 51 dt 55 dt 53 dt 53 dt 54 dt


52 dt

• Por último, calculamos las medidas estadı́sticas pedidas:

 2
Suma de los cuadrados de los valores x = 22.805 shift s-sum 1 =

Suma de valores x = 427 shift s-sum 2 =
Número de datos n = 8 shift s-sum 3 =
Media aritmética x = 53, 375 shift s-var 1 =
Desviación estándar poblacional σn = 1, 316956719 shift s-var 2 =
Desviación estándar muestral σn−1 = 1, 407885953 shift s-var 3 =
Copyright © 2017. Universidad del Norte. All rights reserved.

Precauciones con el ingreso de datos

• dt dt ingresa el mismo dato dos veces.

• También puede ingresar múltiples entradas del mismo dato usando shift ; . Por
ejemplo, para ingresar el dato 110 diez veces presiones 110 shift ; 10 dt .

1.7. Uso de la calculadora en la estadı́stica

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
92 Llinás / Rojas

• Mientras ingresa datos o después de completar el ingreso de datos, puede usar las
teclas
y ∇ para ir visualizando a través de los datos que ha ingresado. Si ingresa
múltiples ingresos del mismo dato usando shift ; para especificar la frecuencia de
datos (número de ı́temes de datos) como se describe anteriormente, pasando a través
de los datos muetra el ı́tem de dato y una pantalla separada para la frecuencia de
datos (freq).

• Los datos visualizados pueden editarse, si ası́ lo desea. Ingrese el valor nuevo y presione
la tecla = para reemplazar el valor antiguo por el valor nuevo. Esto también significa
que si desea realizar alguna otra operación (cálculo, llamada de resultados de cálculos
estadı́sticos, etc.), siempre deberá presionar primero la tecla ac para salir de la
presentación de datos.

• Presionando la tecla dt , en lugar de = , después de cambiar un valor sobre la


presentación, registra el valor que ha ingresado como un elemento de dato nuevo, y
deja el valor antiguo tal como está.

• Puede borrar el valor del dato visualizado usando


y ∇ , y luego presionando
shift cl . Borrando un valor de dato ocasiona que todos los valores siguientes se
desplacen hacia arriba.

• Después de ingresar los datos estadı́sticos en el modo SD no podrá visualizar o editar


más los datos ı́temes de datos individuales, después de cambiar a otro modo.

✍ Ejercicios de la sección 1.7


72. Una determinada persona es propietario de 12 terrenos cuyos tamaños (en kilómetros
cuadrados) son:

21 22 27 36 22 29 22 23 22 28 36 33

Halle la media y la desviación tı́pica directamente de la calculadora.

73. Los porcentajes de rentabilidad de los fondos de inversión de diez grandes empresas fueron:
Copyright © 2017. Universidad del Norte. All rights reserved.

17,6 26,6 15,6 12,4 22,9 25,0 22,4 18,5 27,9 11,6

Halle la media y la desviación tı́pica directamente de la calculadora.

74. Directamente de la calculadora, halle la media y la desviación tı́pica de los datos del ejercicio
45.

75. Sea dada la siguiente tabla de frecuencias. Halle la media y la desviación tı́pica directamente
de la calculadora.
Dato 5,0 2,5 3,2 2,0
Frecuencia 8 2 6 3

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 93

✍ Ejercicios complementarios
76. Diga si la afirmación dada es verdadera o falsa. Justifique siempre su respuesta. En caso
que sea falsa, dé un contraejemplo.

(a) La suma de las desviaciones de los valores respecto a la media para cualquier conjunto
de datos es uno.
(b) Si la desviación estándar de un conjunto de datos es 0, entonces los datos son iguales.
(c) El valor de la desviación estándar es menor que el de la varianza.
(d) No existen datos de tal forma que sean iguales el rango y la desviación estándar.
(e) No existen datos de tal forma que sean iguales el rango y la varianza.
(f) Si el ingreso medio de 25 trabajadores es de $ 2.500.000, entonces el ingreso total es de
$ 10.000.000.
(g) Si 10 calificaciones tienen una media de 2,0 y 27 calificaciones una media de 3,0, entonces
la media del grupo total de 37 calificaciones es 2,5.
(h) Existen datos con desviación estándar negativa.
(i) En una distribución simétrica, la media, la mediana y la moda son iguales.
(j) En una distribución positivamente sesgada, la mediana es mayor que la media.
(k) La desviación estándar está dada por las mismas unidades que la media.
(l) Toda información numérica proporciona datos cuantitativos.
(m) Toda información no numérica ofrece datos cuantitativos.
(n) Cuando todos los datos son categóricos, la moda es la única medida de tendencia central
que se puede utilizar.
(o) Si el primer cuartil en el primer examen de estadı́stica fue de 3,0, entonces este valor
indica que el 25% de los estudiantes ganaron el examen.
(p) Si x es un dato de una muestra y s2 es la varianza de esa muestra, entonces la expresión
x − s2 carece de sentido.
(q) Si un conjunto de datos no es asimétrico, entonces su coeficiente de sesgo es 1.

77. Un determinado reporte presenta las siguientes observaciones de resistencia de vigas (los
Copyright © 2017. Universidad del Norte. All rights reserved.

datos están en megapascales):

6,8 7,0 7,6 6,8 5,9 7,2 7,3 6,3 8,1 11,6 9,0 11,8 10,7 11,3
6,5 7,0 6,3 7,9 8,2 8,7 7,8 9,7 7,7 9,7 7,8 7,7 7,4

(a) Construya un diagrama comparativo de tallo y hojas de los datos. ¿Cuál parece ser
un valor representativo de la resistencia? ¿Parecen estar las observaciones muy concen-
tradas cerca del valor representativo o sólo están dispersas?
(b) ¿Parece ser razonablemente simétrico el diagrama respecto a un valor representativo o
describirı́a su forma de otra manera?

Cap. 1. Ejercicios complementarios

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
94 Llinás / Rojas

(c) ¿Parece haber algún valor extraño o atı́pico?


(d) ¿Qué proporción de observaciones de resistencia fueron mayores que 10 megapascales?

78. El reporte del ejercicio 77 también presenta las siguientes observaciones de resistencia de
cilindros:

9,2 6,6 8,3 7,0 8,3 6,1 5,8 7,8 7,1 7,2
9,8 9,7 14,1 12,6 11,2 7,8 8,1 7,4 8,5 8,9

(a) Construya un diagrama comparativo de tallo y hojas de los datos para vigas y para
cilindros y a continuación conteste las preguntas de la parte (b) a (d) de aquel ejercicio,
sobre las observaciones con cilindros.
(b) ¿En qué aspectos se parecen los dos lados del diagrama? ¿Hay diferencias obvias entre
las observaciones para vigas y para cilindros?

79. Según un diario, en Colombia la donación y disponibilidad de sangre es muy baja, tomando
en cuenta que la captación anual es tan sólo de 485 mil unidades, lo que equivale al 1 por
ciento de la población. ¿Cuál es el promedio de unidades de sangre para 1.000 personas?

80. Un multicentro ha vendido el 70 por ciento de sus metros cuadrados por un valor de 399
millones de dólares. Si el multicentro tiene 190 mil metros cuadrados, ¿cuál es el precio
promedio por metro cuadrado? ¿Cuánto recibirá aproximadamente la cadena por la venta
de todos los locales del multicentro?

81. Si cada colombiano consume cien botellas de 8 onzas de una marca de gaseosa al año,
¿cuánto consume de dicha gaseosa diariamente en botellas y en onzas?

82. Una revista efectuó una encuesta para estudiar sus suscriptores en ciertos paı́ses. Una de
las preguntas pedı́a el valor del portafolio del suscriptor (acciones, bonos, fondos hipoteca-
rios y certificados de depósitos). La siguiente distribución de frecuencias porcentuales fue
preparada con las respuestas:

Inversión (dólar ) Frecuencia porcentual


Menos de 15.000 27
15.000 - 40.000 7
Copyright © 2017. Universidad del Norte. All rights reserved.

40.000 - 90.000 10
90.000 - 240.000 18
240.000 - 490.000 5
490.000 - 990.000 13
990.000 y más 20

(a) ¿Qué porcentaje de suscriptores tienen inversiones menores que 90.000 dólares?
(b) ¿Qué porcentajes de suscriptores tienen inversiones en el intervalo de 40.000 a 490.000
dólares?
(c) ¿Qué porcentajes de suscriptores tienen inversiones de 490.000 dólares o más?

Cap. 1. Ejercicios complementarios

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 95

(d) La distribución porcentual de frecuencias se basa en 816 respuestas. ¿Aproximadamente


cuántos encuestados dijeron tener inversiones entre 40.000 y 990.000 dólares?
(e) Estime la cantidad de encuestados que aseguran tener inversiones menores que 90.000
dólares.

83. De todos los anuncios de bebidas alcohólicas en vallas publicitarias, el 60% son de cerveza,
el 30% de licores con alto contenido de alcohol, el 6% sobre vino, y el 4% restante de
bebidas con bajo contenido de alcohol. Construya un diagrama de barras y uno de pastel
que represente esta información.

84. Una sucursal bancaria localizada en la zona comercial de una ciudad desarrolló un proceso
para atender a sus clientes durante la hora pico de almuerzo, de 12:00 p.m. a 1:00 p.m.
Se registró el tiempo de espera en minutos (definido como el tiempo desde que el cliente
se forma en la cola hasta que lo atienden) para todos los clientes que asisten a esta hora
durante una semana. Se seleccionó una muestra aleatoria de 15 clientes y los resultados
fueron:

2,34 3,02 3,54 3,20 5,13 4,21 5,55 4,77


4,50 6,10 6,19 3,79 5,12 6,46 0,38

(a) Calcule la media, la mediana, la moda, el rango medio, los tres cuartiles, el rango, el
rango intercuartil, la varianza, la desviación estándar y el coeficiente de variación.
(b) ¿Están los datos sesgados? Si es ası́, ¿cómo?
(c) Un cliente entra en la sucursal a la hora del almuerzo y pregunta cuánto tiempo tendrá
que esperar. Y él mismo se responde: “es casi seguro que no tendré que esperar más de
cinco minutos”. Evalúe esta afirmación según los resultados obtenidos en el inciso (a).

85. Un auditor ha comprobado que el valor de la facturas pagadas por cierta empresa norte-
americana tiene una media de 300 dólares y una desviación tı́pica de 65 dólares. Halle un
intervalo en el cual se pueda garantizar que se encuentra por lo menos (a) 60%, (b) 80% de
estos valores.

86. Los siguientes tiempos fueron registrados por corredores de cuarto de milla de un equipo
universitario de pista (tiempos en minutos):
Copyright © 2017. Universidad del Norte. All rights reserved.

Tiempos en el cuarto de milla 1,04 0,90 0,99 0,92 0,98


Tiempos en la milla 4,60 4,70 4,50 4,52 4,35

Después de ver esta muestra de tiempos, uno de los entrenadores comentó que los corredores
de cuarto de milla corrı́an con más consistencia. Emplee la desviación estándar y el coe-
ficiente de variación para resumir la variabilidad de los datos. ¿El coeficiente de variación
indica que es cierta la afirmación del entrenador?

87. La máxima temperatura registrada durante el verano en una ciudad europea durante los
últimos 8 años son: 25; 24; 23,2; 25,5; 24,8; 23,6; 26 y 35 ◦ C. ¿Se puede considerar la última
temperatura como fuera de lo normal? Justifique.

Cap. 1. Ejercicios complementarios

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
96 Llinás / Rojas

88. Dos poblaciones constan de n datos cada una. La media de estas dos poblaciones es la
misma, y también lo son sus desviaciones tı́picas. Si (a) n = 2, (b) n = 3, ¿son necesaria-
mente iguales los valores numéricos de los datos de las dos poblaciones?

 89. Sean dados los datos x1 , . . ., xn .


n
(a) ¿Para qué valor de c la cantidad i=1 (xi − c)2 es minimizada?
n
(b) Mediante el resultado del inciso (a), ¿cuál de las dos cantidades i=1 (xi − x)2 y
n
i=1 (xi − μ) será menor que la otra (suponiendo que x = μ)?
2

 90. Supongamos que a cada dato de un conjunto de datos se le suma una constante c, es decir,
supongamos que se agrega una constante c a cada xi en una muestra, y se obtiene yi = xi +c.

(a) Demuestre que la media del nuevo conjunto de datos es igual a la media de los datos
originales más la constante. Es decir, y = x + c.
(b) Demuestre que la mediana del nuevo conjunto de datos es igual a la mediana de los
datos originales más la constante. Es decir,

(Mediana de los yi ) = (Mediana de los xi ) + c

(c) Demuestre que la varianza del nuevo conjunto de datos es igual a la varianza de los
datos originales. Es decir,

(Varianza de los yi ) = (Varianza de los xi )

(d) Demuestre que la desviación estándar del nuevo conjunto de datos es igual a la desviación
estándar de los datos originales. Es decir,

(Desviación estándar de los yi ) = (Desviación estándar de los xi )

 91. Supongamos que a cada dato de un conjunto de datos se le multiplica una constante, es
decir, supongamos que se multiplica una constante k a cada xi en una muestra, y se obtiene
yi = kxi .

(a) Demuestre que la media del nuevo conjunto de datos es igual a la media de los datos
Copyright © 2017. Universidad del Norte. All rights reserved.

originales multiplicada por la constante. Es decir, y = kx.


(b) Demuestre que la mediana del nuevo conjunto de datos es igual a la mediana de los
datos originales multiplicada por la constante. Es decir,

(Mediana de los yi ) = k (Mediana de los xi )

(c) Demuestre que la varianza del nuevo conjunto de datos es igual a la varianza de los
datos originales por la constante al cuadrado. Es decir,

(Varianza de los yi ) = k 2 (Varianza de los xi )

Cap. 1. Ejercicios complementarios

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 97

(d) Demuestre que la desviación estándar del nuevo conjunto de datos es igual a la desviación
estándar de los datos originales multiplicada por el valor absoluto de la constante . Es
decir,

(Desviación estándar de los yi ) = |k| (Desviación estándarde los xi )

Aplique los resultados de los ejercicios 90 y 91 para resolver los problemas 92 y 93.

92. (a) Una muestra de temperatura para iniciar cierta reacción quı́mica dio una media mues-
tral de 87, 3◦ C y una desviacón estándar muestral de 1, 04◦ C. ¿Cuál son la media y
desviación estándar muestrales medidas en ◦ F ? (Sugerencia: F = 95 C + 32.)
(b) Si se suma 5 a cada dato en un conjunto de diez que tiene una desviación estándar de
7, ¿cuál es la desviación estándar del nuevo conjunto de datos?
(c) Suponga que 3,0 es la media de una muestra de cuatro calificaciones.
i. Si se suma 5 décimas a cada calificación, ¿cuál es la media del nuevo conjunto?
ii. Si cada calificación se multiplica por 1,5 puntos, ¿cuál será la media?

93. El propietario de una pequeña empresa gana un sueldo de 3.910 euros mensuales. Los
salarios de los empleados aparecen a continuación:

480 510 739 883 859 499 505 1.106 980


1.172 853 487 553 944 920 1.713 1.893 595

(a) ¿Cuál es el salario medio de todos los que trabajan en la empresa, incluyendo al propie-
tario? ¿Cuál es la desviación estándar?
(b) Si se decide aumentar el salario a cada uno en 20 euros, ¿cómo varı́a la media? ¿Y la
desviación estándar?
(c) Si se aumenta sólo el sueldo del dueño en 600 euros, ¿qué ocurre con la media?
(d) Halle la mediana. ¿Cómo varı́a la mediana si se aumentan todos los sueldos en 300
euros? ¿Y si sólo se aumenta el salario del director en 1.200 euros?

 94. Se pidió a los alumnos de la facultad de Administración de Empresas de una prestigiosa


universidad llenar un cuestionario de evaluación del curso final del mismo. Consiste en una
diversidad de preguntas cuyas respuestas se clasifican en cinco categorı́as: mala, regular,
Copyright © 2017. Universidad del Norte. All rights reserved.

buena, muy buena, excelente. Una de las preguntas es: En comparación con otros cursos
que has estudiado, ¿cuál es la calidad general de éste? En una muestra de 60 alumnos
que terminaron un curso de estadı́stica durante un determinado semestre de cierto año se
obtuvieron las respuestas que se presentan a continuación (para facilitar el procesamiento
de los resultados del cuestionario en el computador, se usó una escala numérica en la que
1 = mala, 2 = regular, 3 = buena, 4 = muy buena, 5 = excelente):

5 2 4 5 4 4 3 3 4 4 5 1 5 4 3 5 4 5 4 3
2 5 4 2 4 4 4 4 5 5 4 4 4 5 1 5 3 3 4 3
3 4 5 4 3 5 4 5 5 3 4 5 5 2 4 5 3 4 4 3

Cap. 1. Ejercicios complementarios

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
98 Llinás / Rojas

(a) Comente por qué estos datos son cualitativos.


(b) Elabore un diagrama de frecuencias y una distribución de frecuencias relativas de los
datos.
(c) Trace un resumen de los datos en forma de gráfica de barras y de diagrama circular.
(d) Con base en sus resúmenes haga comentarios sobre la evaluación general del curso por
parte de los alumnos.

 95. En el archivo de datos bombeo.sf3 se proporcionan los nombres y potencias instaladas


(en megawatios) de las veinticuatro centrales españolas de bombeo en funcionamiento en el
2000. Se desea analizar numérica y gráficamente este conjunto de datos.

 96. Una de las principales atracciones turı́sticas del Parque Nacional de Yellowstone (Estado de
Wyoming, Estados Unidos de Norteamérica) es el géiser Old Faithful, cuyo nombre procede
del hecho de que sus erupciones siguen una pauta bastante estable a lo largo del tiempo.
En el archivo de datos parque.sf3 se proporcionan los lapsos de tiempo transcurridos
entre sucesivas erupciones (variable Lapso) y las duraciones de esas erupciones (variable
Duración). Ambas variables se dan en minutos. Estudie numérica y gráficamentre ambas
variables. ¿Se observa alguna peculiaridad en ellas?

 97. En el archivo de datos pi.sf3 se proporcionan los 200 primeros dı́gitos del número π. Analice
numérica y gráficamente este conjunto de datos.

 98. En el archivo de datos sismo.sf3 se muestran el tiempo transcurrido (dado en dı́as) entre
sismos sucesivos acaecidos en el mundo. Todos los sismos considerados o tuvieron una
intensidad de al menos 7,5 en la escala de Richter o produjeron más de 1.000 vı́ctimas
mortales. Los sismos registrados ocurrieron entre el 16 de diciembre de 1902 y el 4 de marzo
de 1977. Estudie numérica y gráficamente estos datos.
Copyright © 2017. Universidad del Norte. All rights reserved.

Cap. 1. Ejercicios complementarios

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
CAPÍTULO 2

Conceptos básicos de la probabilidad

Contenido

2.1 Experimentos, espacios muestrales y eventos . . . . . . . . . . . 100


2.2 Modelo de urnas y técnicas de conteo . . . . . . . . . . . . . . . 113
2.2.1 Modelos de urnas . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
2.2.2 El conteo por enumeración de elementos . . . . . . . . . . . . . . 115
2.2.3 El conteo a través de diagramas de árbol . . . . . . . . . . . . . 117
2.2.4 Teorema fundamental del conteo . . . . . . . . . . . . . . . . . . 118
2.2.5 El principio de adición . . . . . . . . . . . . . . . . . . . . . . . . 120
2.2.6 Permutación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
2.2.7 Combinación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
2.3 Introducción a la probabilidad . . . . . . . . . . . . . . . . . . . 135
2.3.1 Definición matemática de “probabilidad” . . . . . . . . . . . . . 135
2.3.2 Probabilidad empı́rica . . . . . . . . . . . . . . . . . . . . . . . . 137
Copyright © 2017. Universidad del Norte. All rights reserved.

2.3.3 Definición clásica de “probabilidad” . . . . . . . . . . . . . . . . 139


2.3.4 Probabilidad subjetiva o personal . . . . . . . . . . . . . . . . . . 145
2.4 Probabilidades condicionales . . . . . . . . . . . . . . . . . . . . . 152
2.5 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
✍ Ejercicios complementarios . . . . . . . . . . . . . . . . . . . . . . . 175

99

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
100 Llinás / Rojas

☞ Objetivos del capı́tulo


1. Describir y aplicar algunas técnicas de conteo en la solución de problemas.

2. Desarrollar la comprensión de los conceptos básicos de probabilidad.

3. Definir y aplicar el concepto de probabilidad condicional.

4. Aplicar el teorema de Bayes en el cálculo de probabilidades.

5. Definir y aplicar el concepto de independencia entre eventos.

☞ Empleo de la estadı́stica
En una encuesta hecha a estudiantes de nuevo ingreso a la universidad
se encontró que, entre todos los estudiantes admitidos, el 55% no tienen
problemas de ningún tipo, el 25% sienten que fueron mal orientados en
cuanto a la carrera elegida y el 20% tienen problemas de tipo económico. La
misma encuesta muestra que de los que no tienen ningún tipo de problema
solamente el 1% no regresa al segundo semestre; que la probabilidad de que
los que fueron mal orientados no continúen en el segundo semestre es de
0,7 y la probabilidad de que los que tienen problemas económicos continúen
es de 0,05. Si se elige al azar un alumno del segundo semestre, ¿cuál es la
probabilidad de que él sea uno de los que a pesar de no estar en la carrera
de su vocación haya continuado?

2.1 Experimentos, espacios muestrales y eventos

Experimentos determinı́sticos y aleatorios

En este texto utilizaremos el término experimento para describir virtualmente cualquier


acción o proceso que genera observaciones.
Copyright © 2017. Universidad del Norte. All rights reserved.

Definición 2.1.1 Un experimento es cualquier acción o proceso que genera observa-


ciones.

La validez de la mayorı́a de las teorı́as cientı́ficas está basada, en gran parte, en que los
experimentos, sobre los cuales se fundamentan las teorı́as, suministran esencialmente el
mismo resultado cuando estos experimentos se repiten. Este tipo de experimentos se lla-
man determinı́sticos.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 101

Definición 2.1.2 Un experimento determinı́stico es cualquier experimento que, al


repetirse bajo las mismas condiciones, genera siempre los mismos resultados.

Un ejemplo, en fı́sica, que es un experimento determinı́stico es la ley de la caı́da libre.

Sin embargo, hay experimentos cuyos resultados no son predecibles con certeza si las condi-
ciones de los experimentos se mantienen constante. Estos se llaman experimentos aleatorios
o estocásticos.

Definición 2.1.3 Un experimento aleatorio (o estocástico) es cualquier experi-


mento que, al repertirse bajo las mismas condiciones, no genera siempre los mismos resul-
tados.

Ejemplos familiares de estos experimentos son los juegos de suerte, como dados, lanzamiento
de monedas o juegos de cartas. Sin embargo, hay otros tipos de ejemplos de experimentos
aleatorios, como los siguientes:

(1) Semillas de igual estado que producen plantas de diferentes tamaños.

(2) Una máquina de coser alarga a veces una puntada sin un motivo claro.

(3) La duración de vida de las personas que viven bajo condiciones semejantes varı́a y no
se puede predecir.

(4) El sexo de un recién nacido.

Espacio muestral, evento y evento elemental

El primer paso para analizar un determinado experimento consiste en definir con cuidado los
resultados experimentales. Cuando hayamos definido todos los resultados posibles, habre-
mos identificado el llamado espacio muestral del experimento.
Copyright © 2017. Universidad del Norte. All rights reserved.

Definición 2.1.4 Supongamos que se realiza un experimento aleatorio. El conjunto de


todos los posibles resultados de ese experimento se denomina espacio muestral ( o de
resultados). Cualquier subconjunto del espacio muestral se llama evento. Si un evento
tiene un solo elemento se llama evento elemental.

El espacio muestral se simbolizará con la letra griega Ω (leı́da “omega”) y los eventos con las letras
mayúsculas A, B, C, etc. “El evento A ha sucedido” significa que el resultado observado del experimento
está en A.

2.1. Experimentos, espacios muestrales y eventos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
102 Llinás / Rojas

Ejemplo 2.1.5 Consideremos los siguientes experimentos aleatorios:

1. El lanzamiento de una moneda

• Los posibles resultados son cara (C) o sello (S). Por tanto, Ω = {C, S}.
• {C} =“la moneda señala cara” es un evento elemental.
• “La primera moneda muestra sello” = {(S, S), (S, C)} es un evento.

2. Lanzamiento de dos monedas

a) Dos monedas diferentes se lanzan al mismo tiempo.


• El espacio muestral correspondiente está dado por

Ω = {(C, C), (C, S), (S, C), (S, S)} = {C, S} × {C, S}

y en este caso (C, S) = (S, C).


• {(C, C)} =“las monedas muestran cara” es un evento elemental.
• “ambas monedas muestran el mismo lado” = {(S, S), (C, C)} es un ejemplo de
un evento.
b) Dos monedas que no se pueden distinguir entre sı́ se lanzan al mismo tiempo.
• En esta situación, Ω = {(C, C), {C, S}, (S, S)}. Aquı́, (C, S) = (S, C).

• {C, S} =“las monedas muestran diferentes lados” es un evento elemental.
• Un evento es “ambas monedas muestran el mismo lado” = {(S, S), (C, C)}.

3. Una moneda se lanza hasta que aparezca una cara (C)

• Se observa el número de lanzamientos que muestran sello (S) antes de que aparezca
una cara. Por tanto, Ω = {0, 1, 2, . . . , ∞}.
• En este caso, “{3} = C aparece por primera vez en el cuarto lanzamiento” es un evento
elemental y “{∞}” es el evento elemental de que la moneda nunca muestre a C.
• “C aparece no antes del séptimo lanzamiento” = {6, 7, 8, . . . , ∞} es un evento.
Copyright © 2017. Universidad del Norte. All rights reserved.

4. Duración de la vida humana

• Se observa la edad en la que diferentes personas mueren. De esta forma, Ω es el


conjunto de todos los números reales menores o iguales que k, donde k es la edad de
la persona que más años ha vivido en la tierra.
• “{59,7}” es el evento elemental de que una determinada persona murió a la edad de
59,7 anõs.
• “Alguien muere con edad entre 60 y 70 años” = [60, 70] es un ejemplo de un evento
de Ω. 

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 103

Eventos seguro e imposible

En especial, el conjunto vacı́o ∅ y Ω son eventos. El conjunto Ω es el llamado evento


seguro, que siempre sucede, y ∅ es el llamado evento imposible, que nunca puede
suceder (por ejemplo, que se obtenga un 7 en el lanzamiento de un dado, siempre y cuando
se use un dado corriente en el sentido de que sus caras están marcadas del 1 al 6).

Operaciones entre eventos

En muchas aplicaciones, estamos interesados simultáneamente en uno o más eventos. Por


ejemplo, si se lanza un dado, dos eventos que podrı́an considerarse son “el número resul-
tante es un múltiplo de 2” y “el número resultante es por lo menos 5”. Una posibilidad es
que todos los eventos de interés podrı́an ocurrir; éste serı́a el caso si el resultado básico del
experimento aleatorio pertenece a todos estos eventos. El conjunto de resultados básicos
que pertenece a todos los eventos de un grupo se denomina intersección.

Definición 2.1.6 Sean A y B dos eventos de un espacio muestral Ω. Su intersección,


simbolizada por A ∩ B, es el conjunto de todos los resultados posibles en Ω que pertenecen
a A y a B. Por tanto, la intersección A ∩ B ocurre si y sólo si tanto A como B ocurren.

De manera más general, dado n eventos A1 , A2 , . . . , An de un espacio muestral Ω, su intersección


A1 ∩ A2 ∩ · · · ∩ An es el conjunto de todos los resultados posibles de Ω que pertenecen a todos los Ai
(i = 1, 2, . . . , n).
Copyright © 2017. Universidad del Norte. All rights reserved.

(a) A ∩ B es el área som- (b) A y B son mutuamente


breada excluyentes

Figura 2.1: Diagramas de Venn para la intersección de los eventos A y B

Un instrumento útil para pensar en intersecciones y otras relaciones de conjuntos es el dia-


grama de Venn. En la figura 2.1 se muestran diagramas para pares de conjuntos A y B.
En la parte (a) de la figura, el rectángulo Ω representa el espacio muestral, mientras que

2.1. Experimentos, espacios muestrales y eventos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
104 Llinás / Rojas

las dos circunferencias representan los dos eventos, A y B.

Ası́, por ejemplo, un resultado básico perteneciente a A estará dentro del cı́rculo corres-
pondiente. El área sombreada donde se cruzan las dos figuras es A ∩ B. Claramente, un
resultado básico estará en A ∩ B si y sólo si está tanto en A como en B. De esta manera, al
lanzar un dado, los resultados 3 y 5 pertenecen a los dos eventos A =“se obtiene un número
impar” y B =“se obtiene por lo menos 3”.
Es posible que los eventos A y B no tengan resultados en común, en cuyo caso las figuras no
se cruzarán como en la parte (b) de la figura 2.1. Tales eventos se dice que son mutuamente
excluyentes (o disyuntos). Por ejemplo, si al lanzar un dado, los eventos A =“se obtiene
un número par” y B =“se obtiene un número impar” son mutuamente excluyentes.

Definición 2.1.7 Sean A y B dos eventos de un espacio muestral Ω. Si los sucesos A y


B no tienen en común resultados de Ω, se denominan mutuamente excluyentes (o
disyuntos) y su intersección A ∩ B es el conjunto vacı́o. De esto se deduce que el evento
A ∩ B no puede ocurrir.

De manera más general, decimos que n eventos A1 , A2 , . . . , An de un espacio muestral Ω son mu-
tuamente excluyentes si todo par de estos eventos es mutuamente excluyente.

Cuando se consideran varios eventos conjuntamente, otra posibilidad de interés es que por
lo menos uno de ellos ocurra. Esto sucederá si el resultado del experimento pertenece al
menos a uno de los eventos. El conjunto de resultados pertenecientes por lo menos a uno
de los eventos se denomina unión. Por ejemplo, en el experimento del lanzamiento de un
dado, los resultados 2, 4, 5 y 6 pertenecen por lo menos a uno de los eventos A =“se obtiene
un número par” o B =“se obtiene por lo menos 4”.

Definición 2.1.8 Sean A y B dos eventos de un espacio muestral Ω. Su unión, simboli-


zada por A ∪ B, es el conjunto de todos los resultados posibles en Ω que pertenecen por lo
menos a uno de estos eventos. Por tanto, la unión A ∪ B ocurre si y sólo si por lo menos
Copyright © 2017. Universidad del Norte. All rights reserved.

alguno de estos dos eventos, A o B, ocurre.

De manera más general, dado n eventos A1 , A2 , . . . , An de un espacio muestral Ω, su unión A1 ∪A2 ∪· · ·∪An
es el conjunto de todos los resultados posibles de Ω que pertenecen por lo menos a uno de estos n eventos.

La unión de un par de eventos se ilustra en el diagrama de Venn de la figura 2.2a, donde


claramente se observa que un resultado estará en A ∪ B si y sólo si está en por lo menos
alguno de estos dos eventos, A o B.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 105

(a) A ∪ B es el área som- (b) A − B es el área som-


breada breada

Figura 2.2: Diagramas de Venn para la unión y diferencia de los eventos A y B

Ahora, cuando se consideran dos eventos conjuntamente, otra situación que interesa es
que uno de ellos ocurra pero el otro no. Esto ocurre cuando el resultado del experimento
pertenece a uno de ellos pero no al otro. El conjunto de resultados que pertenecen a un
evento pero no a otro otro se denomina diferencia entre ambos eventos. Por ejemplo, los
resultados 2 y 4 pertenecen al evento A =“se obtiene un número par estrictamente menor
que 6” pero no al evento B =“se obtiene por lo menos 5”.

Definición 2.1.9 Sean A y B dos eventos de un espacio muestral Ω. La diferencia


entre A y B, simbolizada por A − B, es el conjunto de todos los resultados posibles en Ω
que pertenecen a A pero no a B. Por tanto, la diferencia A − B ocurre si y sólo si A ocurre
pero B no.

La diferencia entre un par de eventos se muestra en el diagrama de Venn de la figura 2.2b,


donde se observa que un resultado estará en A − B si y sólo si está en A pero no en B.

A continuación, sea A un evento, y supongamos que nuestro interés es que A no ocurra.


Esto sucederá si el resultado del experimento aleatorio se encuentra en Ω (como debe ser)
pero no en A. El conjunto de resultados pertenecientes al espacio muestral, y que no
Copyright © 2017. Universidad del Norte. All rights reserved.

pertenecen a determinado evento, se denomina complemento de ese conjunto.

Definición 2.1.10 Sea A evento de un espacio muestral Ω. Su complemento, sim-


bolizado por A, es el conjunto de todos los resultados posibles en Ω que no pertenecen a A.
Por tanto, el complemento A de A ocurre si y sólo si A no ocurre.

Claramente, los eventos A y A son mutuamente excluyentes. El complemento del evento A


se ilustra en la figura 2.3a.

2.1. Experimentos, espacios muestrales y eventos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
106 Llinás / Rojas

(a) A es el área sombreada (b) Partición de Ω

Figura 2.3: Diagrama de Venn para el complemento de A y partición de Ω a través de


A1 , A2 , A3 , . . . , An

Un caso de especial interés lo constituye una colección de varios eventos cuya unión es la
totalidad del espacio muestral Ω. Dado que todo resultado pertenece a Ω, se deduce que
todo resultado de un experimento aleatorio estará al menos en una clase de estas colec-
ciones de eventos. Estos eventos se denominan colectivamente exhaustivos. Por ejemplo, si
se lanza un dado, los sucesos “el resultado es por lo menos 3” y el resultado es a lo más
6” son colectivamente exhaustivos (al menos uno de estos eventos debe ocurrir). Pero, si
adicionalmente estas colecciones de eventos son mutuamente excluyentes, entonces se dice
que estos eventos forman una partición de Ω.

Definición 2.1.11 Sean A1 , A2 , . . . , An eventos de un espacio muestral Ω.

(a) Si se cumple que A1 ∪ A2 ∪ · · · ∪ An = Ω, entonces estos n eventos se denominan


colectivamente exhaustivos.

(b) Decimos que estos n eventos forman una partición de Ω si ellos son colectivamente
exhaustivos y mutuamente excluyentes.

Una representación gráfica de esta situación se observa en la figura 2.3b. Observemos que
todos los eventos elementales forman una partición del espacio muestral correspondiente.
Copyright © 2017. Universidad del Norte. All rights reserved.

Ejemplo 2.1.12 Sea Ω = {1, 2, 3, 4, 5} el espacio muestral correspondiente a un experimento


aleatorio dado. Además, sean A = {2}, B = {1, 4}, C = {3, 5} y D = {2, 3, 4, 5}. Entonces (ver
figura 2.4),

• A, B y C es una partición de Ω porque A ∪ B ∪ C = Ω y A ∩ B = ∅, A ∩ C = ∅, B ∩ C = ∅.

• B y D son colectivamente exhaustivos pero no forman una partición de Ω porque B ∩ D =


{4} = Ω.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 107

• A, C y D no son colectivamente exhaustivos (y, por tanto, tampoco forman una partición
de Ω) porque 1 ∈ A ∪ C ∪ D.

Figura 2.4: Diagrama de Venn para el ejemplo 2.1.12 

Hemos presentado cuatro conceptos de mucha importancia (intersección, unión, diferen-


cia y complemento). Todos ellos serán relevantes en nuestro estudio subsiguiente de la
probabilidad. Los siguientes ejemplos ilustran estas operaciones entre eventos.

Ejemplo 2.1.13 Se lanza un dado. Sea A el evento “se obtiene un número impar” y B el evento
“se obtiene por lo menos 3”. Entonces,

• Los complementos de estos eventos son, respectivamente,

A = “se obtiene un número par” = {2, 4, 6}


B = “se obtiene máximo un 2” = {1, 2}.

• La intersección de A y B es el evento

A ∩ B = “se obtiene un número impar distinto de 1” = {3, 5}.

• La unión de A y B es el evento

A ∪ B = “se obtiene un número distinto de 2” = {1, 3, 4, 5, 6}.


Copyright © 2017. Universidad del Norte. All rights reserved.

• La diferencia de A y B es el evento

A − B = “se obtiene el número 1” = {1}.

• La diferencia de B y A es el evento

B − A = “se obtiene un número par distinto de 2” = {4, 6}.

Observemos también que los eventos A y A son mutuamente excluyentes, dado que su intersección
es el conjunto vacı́o, y colectivamente exhaustivos, dado que su unión es el espacio muestral Ω.
En otras palabras, A y A forman una partición de Ω. 

2.1. Experimentos, espacios muestrales y eventos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
108 Llinás / Rojas

Algunas propiedades relacionadas con eventos

A continuación presentamos algunas de las propiedades básicas que debemos tener en cuenta
cuando trabajamos con eventos.

Teorema 2.1.14 Sean A y B eventos de un espacio muestral Ω. Entonces, son válidas


las siguientes afirmaciones:

(a) Ω = ∅ (b) ∅ = Ω (c) A = A

(d) A ∩ ∅ = ∅ (e) A ∪ ∅ = A (f ) A ∩ A = ∅

(g) A ∪ A = Ω (h) A ∩ B = A ∪ B (i) A ∪ B = A ∩ B

Los resultados (h) e (i) son las llamadas leyes de De Morgan.

Presentamos ahora dos resultados más que incluyen uniones e intersecciones. Serán em-
pleados más adelante para desarrollar algunas reglas de probabilidad.

Teorema 2.1.15 Sean A, A1 , . . ., An y B eventos de un espacio muestral Ω. Entonces,


son válidas las siguientes afirmaciones.

(a) Los eventos A ∩ B y A ∩ B son mutuamente excluyentes y su unión es igual al evento


B, es decir, forman una partición de B (ver figura 2.5a).

(b) Si A1 , . . ., An forman una partición de Ω, entonces los eventos A1 ∩ B, . . ., An ∩ B


son mutuamente excluyentes y su unión es B, es decir, forman una partición de B.
Copyright © 2017. Universidad del Norte. All rights reserved.

(a) Diagrama de Venn para (b) Diagrama de Venn para


los eventos A ∩ B y A ∩ B A1 ∩ B, A2 ∩ B, . . . y An ∩ B

Figura 2.5: Diagramas de Venn para diferentes intersecciones

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 109

Para comprender lo expuesto en el teorema 2.1.15b, consideraremos el diagrama de Venn


de la figura 2.5b. El rectángulo grande es el espacio muestral Ω y está subdividido en partes
más pequeñas que representan los n eventos A1 , A2 , . . ., An , que forman la partición de
Ω. El evento B viene representado por la región sombreada. Se observa que los eventos
comprendidos en la interseción de B y cada uno de los eventos Ai forman una partición de
B, es decir, son mutuamente excluyentes y su unión es B.

Ejemplo 2.1.16 Consideremos el lanzamiento de un dado. Verificaremos los dos resultados que
se presentan en el teorema 2.1.15.

(a) Sean A = {1, 3, 5} y B = {3, 4, 5, 6}. Entonces, los eventos A ∩ B = {3, 5} y A ∩ B = {4, 6}
son mutuamente excluyentes y su unión es B (ver figura 2.6a). De esta forma queda verificada
la parte (a) del teorema.

(b) Sean B = {3, 4, 5, 6}, A1 = {1, 3}, A2 = {2, 4, 6} y A3 = {5}. Observemos que los eventos A1 ,
A2 y A3 forman una partición de Ω. ¿Por qué? Ahora, claramente podemos observar que los
eventos A1 ∩ B = {3}, A2 ∩ B = {4, 6} y A3 ∩ B = {5} son mutuamente excluyentes y su
unión es B (ver figura 2.6b), verificándose, de esta manera, la parte (b) del teorema.

(a) Los eventos A ∩ B y (b) A1 ∩ B, A2 ∩ B y


A ∩ B son mutuamente ex- A3 ∩ B son mutuamente ex-
cluyentes y su unión es B cluyentes y su unión es B

Figura 2.6: Diagramas de Venn para diferentes intersecciones 

Ejemplo 2.1.17 Un problema al que se enfrenta frecuentemente la investigación de mercados


Copyright © 2017. Universidad del Norte. All rights reserved.

lo constituye el hecho de que algunas preguntas que nos gustarı́a hacer son tan delicadas que
muchas personas se negarán a contestarlas o darán una respuesta falsa. Una manera de atacar
este problema es utilizar el método de la respuesta aleatorizada1 . Esta técnica consiste
en acompañar la pregunta delicada con otra pregunta normal. Por ejemplo, podrı́amos tener el
siguiente par de preguntas:

(a) ¿Ha hurtado en almacenes intencionalmente en los últimos doce meses?

1
Ver, por ejemplo, M. D. Geurts, “Using a randomized response research design to eliminate nonresponse
biases in business research”, Journal of Academy of Marketing Science, 8 (1980), 83-90.

2.1. Experimentos, espacios muestrales y eventos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
110 Llinás / Rojas

(b) ¿Ha realizado una compra por catálogo en los últimos doce meses?

A los encuestados se les pide que lancen una moneda y que contesten a la pregunta (a) si se
obtiene “cara” y a la (b) en otro caso. Dado que el encuestador no puede saber a qué pregunta se
contesta, se espera que se obtengan de esta manera respuestas verdaderas. Para las preguntas que
acompañan a la de interés, el investigador cuenta ya con información sobre la población sujeta a
estudio. De este modo, en nuestro ejemplo, el investigador sabe qué proporción de la población
realizó una compra por catálogo en los últimos doce meses.

Definamos ahora los siguientes eventos:

B : El encuestado responde “sı́”.

A1 : El encuestado responde a la pregunta delicada.

A2 : El encuestado responde a la pregunta normal.

Claramente, los eventos A1 y A2 son mutuamente excluyentes y colectivamente exhaustivos. De


este modo, se cumplen las condiciones de la parte (b) del teorema 2.1.15 y se tiene que los eventos

A1 ∩ B = El encuestado responde “sı́” y lo hace a la pregunta delicada


A2 ∩ B = El encuestado responde “sı́” y lo hace a la pregunta normal

son mutuamente excluyentes. Además, su unión es el evento B, como se puede verificar. 

✍ Ejercicios de la sección 2.1


1. En un concurso de televisión, el ganador puede elegir tres de cinco personas diferentes: A,
B, C, D y E.

(a) Enumere los elementos del espacio muestral correspondientes.


(b) ¿Cuántos elementos hay en el espacio muestral correspondientes a una selección que
incluye a A?
Copyright © 2017. Universidad del Norte. All rights reserved.

(c) ¿Cuántos elementos hay en el espacio muestral correspondientes a una selección que
incluye a A y a B?
(d) ¿Cuántos elementos hay en el espacio muestral correspondientes a una selección que
incluye a A o a B?

2. La gerencia de producción de una corporación realizó un estudio para determinar el tiempo,


en minutos, necesario para que un técnico ejecute cierta tarea relacionada con el montaje
de sus televisores.

(a) Describa el espacio muestral correspondiente a este estudio.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 111

(b) Describa el evento E de que un técnico tarde tres minutos o menos para realizar la
tarea.
(c) Describa el evento F de que un técnico tarde más de tres minutos para realizar la tarea.

3. Como parte de un procedimiento de control de calidad, un inspector de una granja seleccionó


10 adornos al azar de cada lote que recibe y registra el número de adornos defectuosos.

(a) ¿Cuál es el espacio muestral adecuado para cada lote?


(b) Describa el evento F de que a lo más cuatro adornos estén rotos.
(c) Describa el evento G de que al menos siete adornos estén rotos.
(d) Describa los eventos F ∩ G y F ∪ G.
(e) Describa el evento H de que diez adornos estén rotos.
(f) Determine si la proposición dada es verdadera o falsa. Si es verdadera, explique por
qué, y si es falsa, construya un contraejemplo (es decir, un ejemplo para mostrar que es
falsa): “Si E y F son eventos mutuamente excluyentes y E y G son eventos mutuamente
excluyentes, entonces F y G son mutuamente excluyes”.

4. En un campeonato de fútbol participan cuatro universidades: Uninorte, Uniatlántico, Uni-


autónoma y la Cuc. En la primera vuelta, Uninorte jugará contra Uniatlántico y Uni-
autónoma contra la Cuc. Los dos ganadores jugarán por el campeonato y subcampeonato
y los perdedores, por el tercero y cuarto puesto. Un posible resultado definitivo puede re-
presentarse por la tupla (Uninorte, Uniautónoma, Uniatlántico, Cuc), en donde se indica
que Uninorte fue el campeón, Uniautónoma el subcampeón, Uniatlántico quedó de tercero
y la Cuc, de cuarto.

(a) Enumere todos los posibles resultados de Ω.


(b) Sea A el evento en que Uninorte gana el torneo. Haga una lista de los elementos de A.
(c) Sea B el evento en que Uniatlántico llega a la final. Haga una lista de los elementos de
B.
(d) ¿Cuáles son los resultados en A ∪ B y en A ∩ B? ¿Cuáles son los resultados en A?

5. En el departamento de recaudos se acaba de terminar una votación secreta para elegir el


nuevo jefe de ese departamento. La urna de votos contiene tres papeletas con votos para
Marta, uno de los dos candidatos, y dos papeletas con votos para Julio, el otro candidato.
Copyright © 2017. Universidad del Norte. All rights reserved.

Supongamos que las papeletas se sacan de la caja una por una.

(a) ¿Cuántos resultados disponibles hay? ¿Cuáles son?


(b) Suponga que se realiza un conteo a medida que se sacan las papeletas. Si la última
papeleta sacada es la de Julio, ¿cuáles son los diferentes resultados?

6. Una familia formada por Juana, Pedro y Jorge asisten a una clı́nica que siempre tiene un
médico en cada una de las oficinas 1, 2 y 3. Durante cierta semana, cada miembro de la
familia visita una vez la clı́nica y se le asigna al azar un médico: el experimento consiste en
registrar el número de la oficina asignada a cada miembro de la familia. Un resultado de
(3, 2, 2) es: para Juana la oficina 3; Pedro, oficina 2, y Jorge, oficina 2.

2.1. Experimentos, espacios muestrales y eventos

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
112 Llinás / Rojas

(a) Elabore una lista de los 27 resultados del espacio muestral.


(b) Haga una lista de todos los resultados del evento en el cual las tres personas de la familia
vayan a la misma oficina.
(c) Efectúe una lista de todos los resultados del evento en el cual todos los miembros de la
familia vayan a diferentes oficinas.
(d) Realice una lista de todos los resultados del evento en el cual ningún miembro de la
familia vaya a la oficina 2.

7. Sea Ω = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} el espacio muestral correspondiente a un experimento


aleatorio dado. Sean A, B, C y D eventos de Ω definidos por

A = {0, 1, 2, 3}, B = {4, 5, 6, 7}, C = {2, 4, 6}, D = {1, 8, 9}

Liste los elementos de los conjuntos que corresponden a los siguientes eventos: (a) A ∪ D;
(b) B ∩ C; (c) D; (d) (D ∩ A) ∪ C; (e) Ω ∩ B; (f) B ∩ C ∩ D.

8. Señale la región de la figura de abajo que representa a cada evento: (a) A ∪ B ∪ C, (b)
A ∩ B ∩ C, (c) A ∩ B ∩ C, (d) A ∩ B ∩ C, (e) A ∩ B ∩ C, (f) (A ∪ B) ∩ C, (g) A ∪ (B ∩ C),
(h) A ∪ B ∪ C.

9. Sean Ω el evento de todos los turistas que visitaron a Barranquilla durante un fin de semana,
y A, B y C los eventos formados por los turistas que visitaron el Museo Romántico, el
Zoológico y Bocas de Cenizas respectivamente. Exprese con palabras las regiones indicadas
a continuación teniendo en cuenta la figura de abajo: (a) Región 1, (b) Regiones 1 y 4
juntas, (c) Regiones 4, 5, 7 y 8 juntas, (d) Regiones 5, 6 y 7.

A B
Copyright © 2017. Universidad del Norte. All rights reserved.

7 3 6

1
4 2

5 8
C

10. En una encuesta realizada en un colegio de la ciudad a un total de 150 alumnos se encontró:
54 estudian álgebra; 89, inglés; 80, ciencias naturales; 60, ciencias naturales e inglés; 10, sólo
álgebra; 20, álgebra y ciencias naturales; 15, las tres materias simultáneamente. Determine
el número de alumnos que conforman los siguientes eventos:

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 113

(a) Estudian álgebra e inglés pero no ciencias naturales.


(b) Estudian sólo una materia.
(c) Estudian a lo sumo dos materias.

11. Una universidad realiza tres tipos de pruebas a 100 aspirantes y obtiene los siguientes
resultados: 2 fracasaron en las tres pruebas; 7, en la primera y en la segunda; 8, en la
segunda y en la tercera; 10, en la primera y en la tercera; 25, en la primera; 30, en la
segunda; 25, en la tercera. Determine el número de aspirantes que conforman los siguientes
eventos:

(a) Fracasaron exactamente en una prueba.


(b) Aprobaron las tres pruebas.
(c) Fracasaron en la primera y en la tercera pero no en la segunda.
(d) Fracasaron en la segunda y en la tercera pero no en la primera.
(e) Fracasaron en al menos una prueba.
(f) Aprobaron al menos una prueba
(g) Aprobaron la segunda o la tercera pero no la primera.

12. Un equipo de fútbol ha determinado contratar un futbolista de talla internacional para el


próximo campeonato. Sean A, B y C eventos que representan el hecho de que el futbolista
contratado ha jugado en el Real Madrid, en el Milan y en el Bayern de Munich respecti-
vamente. Utilice las operaciones de unión, intersección y complemento para describir, en
términos de A, B y C, dibuje un diagrama de Venn y sombree la región correspondiente a
cada uno.

(a) Por lo menos el futbolista ha jugado en uno de los tres equipos mencionados.
(b) El futbolista ha jugado en los tres equipos mencionados anteriormente.
(c) El futbolista ha jugado en el Real Madrid y no en el Milan.
(d) El futbolista sólo ha jugado en el Bayern de Munich.
(e) El futbolista ha jugado exactamente en uno de los tres equipos mencionados.
Copyright © 2017. Universidad del Norte. All rights reserved.

2.2 Modelo de urnas y técnicas de conteo


A pesar de la complejidad de muchos procedimientos avanzados, proporcionados por la
tecnologı́a moderna, el simple proceso de contar resultados de un experimento aleatorio
continúa jugando un papel importante en problemas prácticos de la vida cotidiana. Tenemos
que contar, por ejemplo, el número de alumnos por grupo, el número de llamadas recibidas
en una oficina por dı́a, el número de accidentes ocurridos en los fines de semana, etc. Pero,
en muchos problemas, como, por ejemplo,

2.2. Modelo de urnas y técnicas de conteo

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
114 Llinás / Rojas

• calcular de cuántas formas podemos sentar 10 personas, una al lado de la otra para
una foto;

• o determinar cuántos números de tres cifras se pueden formar con los dı́gitos del 1 al
9 si no se pueden repetir los dı́gitos,

la tarea no resulta ser fácil si no se desarrollan técnicas especiales de conteo. Debido


a que frecuentemente es necesario determinar cantidades como éstas para poder calcular
probabilidades2 , entonces se hace obligatorio para nosotros estudiar algunas técnicas. Las
técnicas especiales de conteo que estudiaremos, y que son fundamentales para el cálculo de
algunas probabilidades, son: el conteo por enumeración de elementos, el conteo a través de
diagramas de árbol, el teorema fundamental del conteo, el principio de adición, el conteo de
permutaciones y el conteo de combinaciones.

2.2.1 Modelos de urnas

Antes de comenzar a introducir los conceptos y propiedades básicas que caracterizan a cada
una de las técnicas mencionadas anteriormente, consideraremos importante enfatizar que
muchos experimentos aleatorios pueden describirse por medio de los llamados modelos de
urnas, los cuales se caracterizan por los siguientes dos hechos:

1. En una urna hay bolas distinguibles (por ejemplo, numeradas), no distinguibles (por
ejemplo, rojas) o mixtas. Estas bolas se consideran como una población.

2. De esta urna se quiere sacar una o más bolas, al mismo tiempo o no, reemplazando o no
las bolas seleccionadas antes de seleccionar nuevamente otra(s) bola(s) y observando
el orden o no de las bolas extraı́das. Las bolas extraı́das se consideran como una
muestra. Para obtener estas muestras, podemos distinguir los siguientes casos:

(a) Seleccionar sin reemplazo


Cada bola seleccionada se deposita fuera de la urna, y por eso puede seleccionarse
una sola vez.
(b) Seleccionar con reemplazo
Copyright © 2017. Universidad del Norte. All rights reserved.

Cada bola seleccionada se reemplaza en la urna, y por eso puede seleccionarse


varias veces.
(c) Seleccionar considerando el orden
Se selecciona cierta cantidad de bolas, una tras otra, y se considera el orden
obtenido. En este caso, las bolas seleccionadas se pueden considerar como tuplas
ordenadas.3

2
Concepto que veremos más adelante.
3
Por una tupla ordenada se entiende una expresión, por ejemplo, de la forma (a, b, c, d, e, . . . , z), en
donde el orden de estas letras es importante. Por ejemplo, para el caso de tener sólo dos letras, a y b, no

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 115

(d) Seleccionar sin considerar el orden


Se selecciona cierta cantidad de bolas a la vez (o también una tras otra), pero sin
que interese el orden de las bolas extraı́das.

Los cuatro casos se pueden combinar: las bolas se seleccionan con o sin reemplazo
y con o sin orden. Inclusive, podemos identificar otros tipos de modelo de urna con
base en las situaciones anteriores, como, por ejemplo,

(e) Seleccionar formando una partición


Seleccionar grupos de bolas sin importar el orden y cada grupo se guarda, por
ejemplo, en gavetas numeradas. Esto se hace hasta que no queden bolas en la
urna.

Ahora procederemos a explicar las mencionadas técnicas de conteo.

2.2.2 El conteo por enumeración de elementos

Nuestra primera regla es tratar de enumerar todos los elementos de un espacio muestral
y luego contarlos. Esta técnica es adecuada cuando el número de resultados posibles no
es muy grande. Para ilustrar esto consideremos los siguientes ejemplos. Observe que a la
mayorı́a de ellos los hemos identificados con un modelo de urna.4

Ejemplo 2.2.1 (Selección con reemplazo y con orden) Una urna contiene 4 fichas: una
azul, una verde, una roja y una negra. ¿Cuáles son las distintas maneras de seleccionar dos
fichas con reemplazo?

SOLUCIÓN:
Abreviaremos el color de las fichas con su correspondiente letra inicial: A, V, R y N. Como la
selección es con reemplazo, entonces se selecciona un ficha y se vuelve a introducir en la urna antes
de seleccionar la segunda. Por lo tanto, los elementos del espacio muestral son:
AA, VA, AR, RA, AN, NA, VR, RN,
VN, NV, RN, NR, AA, VV, RR, NN

En este ejemplo, el orden es importante, por eso aparecen AV y VA como dos elementos distintos
Copyright © 2017. Universidad del Norte. All rights reserved.

del espacio muestral. 

Ejemplo 2.2.2 (Selección sin reemplazo y sin orden) ¿De cuántas maneras se puede armar
un grupo de 2 de entre 4 personas (digamos Marta, Juliana, Manuel y Luis)?

es lo mismo (a, b) que (b, a). A la tupla con dos elementos se le llama par ordenado; a la de tres elementos,
tripleta ordenada, etc.
4
A los que no hemos identificado con un modelo de urna, significa que el ejemplo no se puede clasificar
directamente como uno de los modelos de urna descritos anteriormente. En realidad, hay otros tipos de
modelos de urna.

2.2. Modelo de urnas y técnicas de conteo

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
116 Llinás / Rojas

SOLUCIÓN:
En esta situación, el orden no interesa (por eso no se utilizan paréntesis al identificar cada se-
lección del grupo). Es como si colocáramos los nombres de estas cuatro personas en una bolsa y
sacáramos dos de ellas al mismo tiempo. Observe que, en este caso, da lo mismo la posibilidad
“Marta, Juliana” que “Juliana, Marta” (por eso, sin orden). Además, la posibilidad de obtener
un grupo conformado por “Marta, Juliana” no existe (por eso, sin reemplazo).

Al tener en cuenta lo anterior encontramos que los posibles grupos de dos personas que se pueden
escoger son:

Marta, Juliana, Marta, Manuel, Marta, Luis,


Juliana, Manuel, Juliana, Luis, Manuel, Luis

Es decir, en total hay 6 maneras posibles de seleccionar un grupo de 2 personas, sabiendo que hay
4 disponibles. 

Ejemplo 2.2.3 (Selección sin reemplazo y con orden) ¿De cuántas maneras se pueden sen-
tar Gabriela, Jeniffer, Alberto y Hernán en un sofá que sólo tiene disponible dos puestos?

SOLUCIÓN:
En este ejemplo, el orden es importante, porque no es lo mismo, por ejemplo, que Gabriela se
siente en el primer puesto y Jeniffer en el segundo que lo contrario. Por eso utilizaremos parejas
ordenadas para enumerar los posibles resultados. Ahora, es obvio que Gabriela no puede aparecer
sentada en el primer puesto y en el segundo puesto al mismo tiempo (por eso, sin reemplazo). Es
decir, no existe la posibilidad que aparezca el resultado (Gabriela, Gabriela).

Con lo anterior, fácilmente podemos determinar que las posibles maneras en que se sienten dos
personas en el sofá son:

(Gabriela, Jeniffer), (Gabriela, Alberto), (Gabriela, Hernán), (Jeniffer, Gabriela)


(Jeniffer, Alberto), (Jeniffer, Hernán), (Alberto, Gabriela), (Alberto, Jeniffer)
(Alberto, Hernán), (Hernán, Gabriela), (Hernán, Jeniffer), (Hernán, Alberto)

Es decir, en total hay 12 maneras posibles de que dos de las cuatro personas se sienten en el sofá

Copyright © 2017. Universidad del Norte. All rights reserved.

de dos puestos.

Ejemplo 2.2.4 (Selección con reemplazo y con orden) ¿De cuántas formas pueden acomodarse
3 libros iguales de matemáticas (M) y 2 libros iguales de fı́sica (F) en un estante que tiene sólo 5
puestos disponibles?

SOLUCIÓN:
Como los libros, digamos, de matemáticas son iguales, entonces no importa el orden en que se
coloquen en el estante (por eso, sin orden). Además, los libros de matemáticas están repetidos
(por eso, con reemplazo). Igual sucede con los de fı́sica. Las posibles organizaciones de los 5 libros
en el estante son:

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 117

MMMFF, FFMMM, MMFFM, MMFMF, MFMFM,


MFMMF, MFFMM, FMFMM, FMMFM, FMMMF

Es decir, en total hay 10 maneras posibles de organizar los 5 libros en el estante. 

Ejemplo 2.2.5 (Partición de un espacio muestral) Supongamos que se dispone de una habitación
triple y de una habitación sencilla. ¿De cuántas maneras diferentes pueden acomodarse cuatro
personas (digamos, Margarita, Diana, Rodrigo y Felipe) en dichas habitaciones?

SOLUCIÓN:
En este ejemplo, se debe dividir a las cuatros personas en grupos de dos (por eso, una partición),
donde un grupo tendrá 3 personas (que son las que dormirán en la habitación triple) y el otro
grupo, 1 persona (que dormirá en la habitación sencilla). Por otra parte, la pareja (Margarita-
Rodrigo-Diana, Felipe) significa que las 3 primeras personas dormirán en la habitación triple y la
última, en la sencilla.

Teniendo en cuenta lo anterior, las posibles reparticiones de las cuatro personas son:

(Margarita-Rodrigo-Diana, Felipe), (Margarita-Rodrigo-Felipe, Diana),


(Margarita-Felipe-Diana, Rodrigo), (Felipe-Diana-Rodrigo, Margarita)

Es decir, en total hay 4 maneras posibles de repartir a 3 personas en una habitación triple y 1 en
la sencilla. 

Ejemplo 2.2.6 Una joven tiene tres blusas (de marcas A, B y C), dos faldas (de colores azul
y roja) y dos pares de zapatos (de cuero y plástico). Utilizando estas siete prendas de vestir,
¿cuántos juegos de ropa diferentes podrı́a ponerse?

SOLUCIÓN:
Como podemos ver, los posibles juegos de ropa que la joven podı́a ponerse son los siguientes:

(A, azul, cuero), (A, azul, plástico), (A, rojo, cuero), (A, rojo, plástico)
(B, azul, cuero), (B, azul, plástico), (B, rojo, cuero), (B, rojo, plástico)
(C, azul, cuero), (C, azul, plástico), (C, rojo, cuero), (C, rojo, plástico)
Copyright © 2017. Universidad del Norte. All rights reserved.

O sea que en total ella podrı́a ponerse 12 juegos. 

2.2.3 El conteo a través de diagramas de árbol

Cuando el número de posibilidades no es demasiado grande, se puede utilizar una repre-


sentación gráfica que se conoce con el nombre de diagrama de árbol, para mostrar todas
las secuencias posibles de tales operaciones. Un diagrama de árbol consta de una serie de
“ramas” que corresponden a cada una de las formas en que se pueden realizar la operación.
Ilustraremos este diagrama a través de un solo ejemplo.

2.2. Modelo de urnas y técnicas de conteo

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
118 Llinás / Rojas

Ejemplo 2.2.7 (Selección sin reemplazo y con orden) ¿De cuántas formas distintas se pueden
organizar las letras A, B, C?

SOLUCIÓN:
El diagrama de árbol correspondiente a esta situación se presenta en la figura 2.7. Como puede
verse, las diferentes posibilidades se pueden enumerar teniendo en cuenta las últimas ramas del
diagrama. Allı́ vemos que hay en total seis ramas. Es decir, hay 6 maneras diferentes de organizar
las letras dadas.

Figura 2.7: Diagrama de árbol para el ejemplo 2.2.11 

2.2.4 Teorema fundamental del conteo

El siguiente teorema será básico para todo nuestro trabajo:

Teorema 2.2.8 (Teorema fundamental del conteo) Si r experimentos se ejecutan de


tal manera que el primero puede resultar en n1 posibles resultados y si para cada uno de
estos n1 posibles resultados hay n2 posibles resultados del segundo experimento y si para cada
Copyright © 2017. Universidad del Norte. All rights reserved.

uno de los posibles resultados de los dos primeros experimentos hay n3 posibles resultados
del tercer experimento y si . . ., entonces hay un total de n1 · n2 · · · nr posibles resultados de
los r experimentos.

Para resolver cualquier problema de conteo, sugerimos realizar siempre los siguientes pasos:

• Primer paso:
Determine cuántos eventos hay en el problema, y si es necesario identifique cada uno de ellos.

• Segundo paso:
Calcule de cuántas formas puede ocurrir cada uno de estos eventos.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 119

• Tercer paso:
Por último aplique el teorema fundamental del conteo (teorema 2.2.8).

Ejemplo 2.2.9 Un dado se lanza dos veces. Determine el número de formas en que podemos
obtener los números del dado en los dos lanzamientos.

SOLUCIÓN:
Como los dos dados no están relacionados en forma alguna cuando los lanzamos y como cada uno
puede caer de seis formas distintas, el número total de formas en que pueden caer, uno después
del otro, es 6 · 6 = 36, por el teorema fundamental del conteo (teorema 2.2.8), que son:

Ω = (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),
(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),
(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),
(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6),
(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6),

(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6) 

Ejemplo 2.2.10 Para el ejemplo 2.2.6 pueden ocurrir tres eventos, uno después del otro: Escoger
una de las 3 blusas, escoger una de las 2 faldas y escoger uno de los dos pares de zapatos. El
primer evento puede ocurrir de 3 formas; el segundo, de 2 formas, y el tercero, de 2 formas. Por
tanto, por el teorema fundamental del conteo (teorema 2.2.8), los cuatros eventos, uno seguido
del otro, pueden ocurrir en 3 · 2 · 2 = 12 maneras distintas. 

Ejemplo 2.2.11 (Selección sin reemplazo y con orden) En la situación del ejemplo 2.2.7
hay tres eventos que debemos considerar: el de escoger la letra A, el de escoger la B y el de
escoger la C. Por otra parte, para la primera posición hay 3 posibilidades de escoger la primera
letra. Si se selecciona una, en la segunda posición habrá dos posibilidades, y si selecciona otra,
en la última habrá una posibilidad. Por tanto, por el teorema fundamental del conteo (teorema
2.2.8), el total de formas para organizar las tres letras es 3 · 2 · 1 = 6, como se obtuvo en el ejemplo
2.2.7. 

Ejemplo 2.2.12 (Selección sin reemplazo y con orden) Hay cuatro facturas diferentes que
un gerente quiere ordenar, de izquierda a derecha, en cuatro lugares distintos de su escritorio. ¿De
cuántas maneras puede él hacerlo?
Copyright © 2017. Universidad del Norte. All rights reserved.

SOLUCIÓN:
Hay dos formas de analizar este ejemplo: como un problema de colocación y como un problema
de selección.

• Un problema de colocación
Los cuatro eventos son:

A = Colocar la primera factura en uno de los cuatro espacios.


B = En seguida, colocar la segunda factura en uno de los tres espacios restantes.

2.2. Modelo de urnas y técnicas de conteo

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
120 Llinás / Rojas

C = De los dos espacios aún vacı́os, uno será para la tercera factura.
D = La última factura va en el único lugar disponible.

• Un problema de selección
Los cuatro eventos son:

A = Seleccionar una factura para el primer lugar.


B = Después de llenar el primer espacio, se elige la segunda factura de entre las tres
restantes
C = Luego de ocupar tres espacios, se selecciona la tercera factura de entre las que quedan.
D = Colocar la cuarta factura en el último espacio.

En cualquiera de las dos situaciones, A puede hacerse de 4 maneras; B, de tres; C, de dos, y D,


de una sola manera. Por consiguiente, por el teorema fundamental del conteo (teorema 2.2.8), el
número total de formas posibles en que el gerente puede ordenar sus facturas es 4 · 3 · 2 · 1 = 24. 

Ejemplo 2.2.13 (Selección sin reemplazo y con orden) Considere la situación del ejemplo
2.2.3. El primer puesto hay 4 maneras de que se siente una persona. Sentada una allı́, quedarán
disponibles 3 personas para el segundo puesto. Por tanto, por el teorema fundamental del conteo
(teorema 2.2.8) hay 12 = 4 · 3 maneras posibles de que dos de las cuatro personas se sienten en el
sofá de dos puestos. 

Sin embargo, hay situaciones en las que no se puede aplicar (o no se puede aplicar fácilmente)
el teorema fundamental del conteo (teorema 2.2.8), en especial cuando el orden no importa.
Algunos ejemplos son los siguientes:

Ejemplo 2.2.14 Cuando la selección es

(a) sin reemplazo y sin orden, como en el ejemplo 2.2.2;

(b) con reemplazo y sin orden, como en el ejemplo 2.2.4;

(c) a través de la partición de un espacio muestral, como en el ejemplo 2.2.5

el teorema fundamental del conteo (teorema 2.2.8) no es aplicable (directamente). En los dos
Copyright © 2017. Universidad del Norte. All rights reserved.

primeros casos porque no importa el orden, y en el tercero, por la estructura del modelo de urna.


2.2.5 El principio de adición

Consideremos el siguiente ejemplo:

Ejemplo 2.2.15 Cinco empresas de transporte terrestre tienen servicio diario entre Barranqui-
lla y Bogotá. Tres empresas de aviación tienen vuelo diario entre Barranquilla y Bogotá. En
consecuencia, hay 5 + 3 maneras de ir de Barranquilla a Bogotá en avión o en bus. 

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 121

En el ejemplo anterior vemos que no es posible aplicar el teorema fundamental del conteo
(teorema 2.2.8). Para resolver este tipo de problemas es importante considerar el siguiente
teorema:

Teorema 2.2.16 (Principio de adición) Si los eventos A1 , A2 , . . ., Ak tienen n1 , n2 ,


. . ., nk elementos, respectivamente, y si son mutuamente excluyentes (véase la definición
2.1.7), entonces el evento A1 ∪ A2 ∪ · · · ∪ Ak tiene n1 + n2 + · · · + nk elementos.

Ejemplo 2.2.17 En el lanzamiento de dos dados, ¿de cuántas formas se puede obtener que la
suma de los números sea un siete o un ocho?

SOLUCIÓN:
Sean A y B los eventos “obtener un siete” y “obtener un ocho” respectivamente. Entonces, A ∪ B
será el evento “obtener un siete o un ocho”. Debido a que

A = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)} y B = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)}

entonces A y B pueden ocurrir de 6 y 5 formas distintas respectivamente, y, además, son mutua-


mente excluyentes. Por consiguiente, por el principio de adición (teorema 2.2.16), el evento A ∪ B
ocurrirá de 6 + 5 = 11 maneras distintas. 

Ejemplo 2.2.18 Consideremos el experimento de lanzar una moneda al aire tres veces. ¿De
cuántas formas se puede obtener una, dos o tres caras?

SOLUCIÓN:
Sean A, B y D los eventos “obtener una cara ” y “obtener dos caras”, “obtener tres caras”
respectivamente. Entonces, A ∪ B ∪ D será el evento “obtener una, dos o tres caras”. Como

A = {(C, S, S), (S, C, S), (S, S, C)}, B = {(S, C, C), (C, S, C), (C, C, S)} y D = {(C, C, C)}

entonces A, B y D pueden ocurrir de 3, 3 y 1 formas distintas. Obsérvese, además, que son


mutuamente excluyentes. Por lo tanto, por el principio de adición (teorema 2.2.16), el evento
A ∪ B ∪ D ocurrirá de 3 + 3 + 1 = 7 maneras diferentes. 
Copyright © 2017. Universidad del Norte. All rights reserved.

2.2.6 Permutación

Definición 2.2.19 Una permutación es un arreglo ordenado de una cantidad finita de


objetos distintos.

Es importante tener en cuenta que toda permutación se puede identificar como una muestra selec-
cionada sin o con reemplazo, pero siempre con orden.

2.2. Modelo de urnas y técnicas de conteo

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
122 Llinás / Rojas

Ejemplo 2.2.20 (Permutaciones de 3 letras, sin reemplazo) ACB es un ejemplo de una


permutación de las letras A, B y C. Hay en total 6 permutaciones de estas letras (compárese con
el ejemplo 2.2.7): ABC, ACB, BCA, BAC, CBA y CAB. 

Ejemplo 2.2.21 (Permutaciones de 4 letras tomándolas de 2 en 2, sin reemplazo) AC


es un ejemplo de una permutación de las letras A, B, C y D, pero tomado solamente dos de ellas.
Hay en total 12 permutaciones de estas cuatro letras, tomándolas de 2 en 2:

AB AC AD BA BC BD CA CB CD DA DB DC 

Ejemplo 2.2.22 (Permutaciones de 4 letras si hay letras iguales, con reemplazo) CAC
es un ejemplo de una permutación de las letras A, C y C. En total hay 3 permutaciones de estas
letras: ACC, CAC y CCA. 

En la mayor parte de los casos, el total de permutaciones de un conjunto de objetos lo


podemos calcular siempre a través del teorema fundamental del conteo (teorema 2.2.8). De
todas formas, para situaciones especiales hay fórmulas (obtenidas del teorema fundamental
del conteo) que también nos permiten calcular la cantidad de permutaciones. Las situa-
ciones especiales (relacionadas con permutaciones) que explicaremos a continuación son las
siguientes:

• Permutaciones sin repetición de n objetos tomados todos a la vez y tomados de k en


k (k ≤ n).

• Permutaciones circulares.

• Permutaciones con repetición de n objetos tomados de k en k (k es cualquier número


natural).

• Permutaciones de n objetos de los cuales hay n1 de un primer tipo, n2 de un segundo


tipo, . . ., nk de un k-ésimo tipo, donde n1 + n2 + · · · + nk = n.

• Maneras de hacer una partición de un conjunto.

Permutaciones sin repetición de n objetos tomados todos a la vez


Copyright © 2017. Universidad del Norte. All rights reserved.

Estas permutaciones se pueden considerar como muestras seleccionadas sin reemplazo.

Teorema 2.2.23 El número de permutaciones de un conjunto de n elementos distintos es


igual a n! := 1 · 2 · · · (n − 1) · n, siendo 0! := 1.

El sı́mbolo “!” se conoce con el nombre de factorial. Cuando escribamos, por ejemplo, 5! leere-
mos “5 factorial”. Algunos valores factoriales son los siguientes:

1! = 1, 2! = 2 · 1 = 2, 3! = 3 · 2 · 1 = 6, 4! = 4 · 3 · 2 · 1 = 24, etc.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 123

Ejemplo 2.2.24 (Permutaciones de 4 objetos, sin reemplazo) El ejemplo 2.2.12 se puede


resolver también aplicando el teorema 2.2.23 porque el gerente quiere ordenar sus cuatro facturas
disponiendo sólo de cuatro espacios posibles. Aplicando este teorema tenemos que el gerente puede
ordenar sus facturas de 4! = 4 · 3 · 2 · 1 = 24 maneras, que fue el resultado obtenido aplicando el
teorema fundamental del conteo (teorema 2.2.8). 

Ejemplo 2.2.25 (Permutaciones de 8 objetos, sin reemplazo) Suponga que una empresa
dispone de ocho máquinas atornilladoras y de ocho espacios en el área de producción. ¿De cuántas
maneras diferentes se pueden acomodar estas ocho máquinas en los ocho espacios disponibles?

SOLUCIÓN:
Podemos aplicar directamente el teorema 2.2.23, puesto que tenemos un total de n = 8 objetos
que queremos ordenar entre sı́. Es decir, hay 8! = 40.320 maneras de ordenar las ocho máquinas
en los ocho espacios disponibles. 

Ejemplo 2.2.26 (Permutaciones de 5 objetos, sin reemplazo) Si se le pide a un consumi-


dor que ordene, por orden de preferencia, el sabor de cinco marcas de cerveza, entonces el número
de permutaciones que resultan será 5! = 120. 

Ejemplo 2.2.27 (Permutaciones de 12 objetos, sin reemplazo) Cuatro libros distintos de


matemáticas, seis diferentes de fı́sica y dos diferentes de quı́mica se colocan en un estante. ¿De
cuántas formas distintas es posible ordenarlos si (a) los libros de cada asignatura deben estar todos
juntos, (b) solamente los libros de matemáticas deben estar juntos?

SOLUCIÓN:

(a) Los libros de matemáticas pueden ordenarse de 4! formas, los de fı́sica de 6! formas, los de
quı́mica de 2! formas y los tres grupos de 3! formas. Por consiguiente,

número de ordenaciones pedido = 4! 6! 2! 3! = 207.360.

(b) Considerar los cuatro libros de matemáticas como un solo libro. Entonces, se tienen 9 libros
que pueden ordenarse de 9! formas. En todos estos casos, los libros de matemáticas están
juntos, pero pueden ordenarse de 4! formas. Por consiguiente,
Copyright © 2017. Universidad del Norte. All rights reserved.

número de ordenaciones pedido = 9! 4! = 8.709.120. 

Permutaciones sin repetición de n objetos tomados de k en k (k ≤ n)

Hay situaciones en las que podemos hallar las permutaciones de n objetos distintos tomándolos
de k en k, como se ilustró en el ejemplo 2.2.21. Para calcular el número de permutaciones
de este tipo, podemos tener en cuenta el siguiente teorema:

2.2. Modelo de urnas y técnicas de conteo

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
124 Llinás / Rojas

Teorema 2.2.28 El número de permutaciones de un conjunto de n elementos distintos


n!
tomados de k en k es igual a (n−k)! .

Las permutaciones de este tipo también se pueden considerar como muestras seleccionadas sin reemplazo.
Además, obsérvese que cuando k = n, este resultado coincide siempre con el del teorema 2.2.23.

Ejemplo 2.2.29 (Permutaciones de 2 en 2, sin reemplazo) Por el teorema 2.2.28, el número


4!
de permutaciones de las letras A, B, C y D, tomadas de dos en dos es igual a (4−2)! = 12
(compaárese con el ejemplo 2.2.21). 

Ejemplo 2.2.30 (Permutaciones de 5 en 5, sin reemplazo) ¿De cuántas formas diferentes


se pueden sentar 8 alumnos en una oficina con sólo 5 sillas?

SOLUCIÓN:
Por el teorema 2.2.28, el número de formas en que se pueden sentar 8 alumnos en una oficina con
8!
5 sillas es igual a (8−5)! = 6.720. 

Ejemplo 2.2.31 (Permutaciones de 3 en 3, sin reemplazo) ¿Cuántos números de 3 cifras


sin repetición se pueden formar con los dı́gitos 8, 2, 5, 4 y 7?

SOLUCIÓN:
Nuevamente, por el teorema 2.2.28, esto se puede hacer de 5!
(5−3)! = 60 formas. 

Ejemplo 2.2.32 (Permutaciones de 4 en 4, sin reemplazo) Una sección de maquinaria de-


terminada consta de cuatro piezas y puede ser ensamblada poniendo las piezas en cualquier orden.
Supóngase que se decide estudiar el tiempo de ensamblaje para esta sección de maquinaria mi-
diendo el tiempo que requiere para cada uno de los ensamblajes resultantes de tomar las piezas
en distinto orden. ¿Cuántas de estas mediciones habrá que hacer?

SOLUCIÓN:
Por el teorema 2.2.28, el número total de mediciones es 4!
(4−4)! = 24. 
Copyright © 2017. Universidad del Norte. All rights reserved.

Permutaciones circulares

Ahora estudiaremos algunas situaciones de arreglos circulares. Para ello consideremos el


siguiente ejemplo:

Ejemplo 2.2.33 (Permutación circular) Sabemos que si queremos sentar a Greyci, Jeniffer,
Brian y Humberto, una al lado de la otra en fila, el número de arreglos que podemos hacer es
4! = 24. Ahora bien, si los queremos sentar alrededor de una mesa circular, ¿de cuántas maneras
lo podemos hacer?

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 125

SOLUCIÓN:
Al considerar a una persona en un lugar fijo (digamos Greyci) y acomodar a las otras tres personas
en 3! formas diferentes, se encuentra que hay 6 arreglos distintos alrededor de la mesa circular
(compárese con la figura 2.8).

Figura 2.8: Permutación de 4 personas en una mesa circular 

Este ejemplo también se puede resolver directamente aplicando directamente el siguiente


teorema:

Teorema 2.2.34 El número de permutaciones de n objetos distintos acomodados en un


cı́rculo es (n − 1)!.

Ejemplo 2.2.35 (Permutación circular) ¿De cuántas formas pueden sentarse Greyci, Jenif-
fer, Brian y Humberto alrededor de una mesa circular si Greyci y Humberto no deben estar una
al lado de la otra?
Copyright © 2017. Universidad del Norte. All rights reserved.

SOLUCIÓN:
Considérense las dos personas que no deben ir juntas como una sola.
Por lo tanto, hay 3 personas para sentarse en la mesa circular, que lo pueden hacer de 2! formas.
Pero las dos personas consideradas como una sola se pueden ordenar de 2! maneras. Por consi-
guiente, el número de permutaciones de 3 personas alrededor de una mesa circular, si dos de ellas
pueden estar juntas, es 2! 2! = 4, que son las “mesas no sombreadas” de la figura 2.9. Entonces,
el número total de formas en que Greyci, Jeniffer, Brian y Humberto pueden sentarse alrededor
de una mesa circular, si Greyci y Humberto no deben estar una al lado de la otra, es 4 − 2 = 2
formas, que corresponden a las “mesas sombreadas” de la figura 2.9. 

2.2. Modelo de urnas y técnicas de conteo

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
126 Llinás / Rojas

Figura 2.9: Las mesas sombreadas son las permutaciones en que Greyci, Jeniffer, Brian y
Humberto se pueden organizar si Greyci y Humberto no deben estar juntas

Permutaciones con repetición de n objetos tomados de k en k


(k es cualquier número natural)

Veamos otra aplicación del teorema fundamental del conteo (teorema 2.2.8).

Ejemplo 2.2.36 (Permutaciones de 2 en 2, k > n, con reemplazo) Supongamos que tene-


mos 3 niños de un colegio de primaria y 2 sabores de helados disponibles (digamos, fresa y mango).
¿De cuántas maneras diferentes podemos servir un helado a los 3 niños?

SOLUCIÓN:
Al primer niño le podemos servir uno de los 2 sabores, al segundo también le podemos servir de los
2 sabores, y al tercero también uno de los 2 sabores. Por consiguiente, por el teorema fundamental
del conteo (teorema 2.2.8), hay 2 · 2 · 2 = 23 = 8 maneras diferentes de servir un helado a los 3
niños. Estas posibilidades son las siguientes:

(fresa, fresa, fresa), (fresa, fresa, mango), (fresa, mango, fresa),


(fresa, mango, mango), (mango, fresa, fresa), (mango, fresa, mango),
(mango, mango, fresa), (mango, mango, mango),
Copyright © 2017. Universidad del Norte. All rights reserved.

en donde, por ejemplo, la tripleta (fresa, mango, mango) significa que el primer niño pidió un
helado de fresa, el segundo, de mango, y el tercero, de mango. 

Este ejemplo se puede categorizar como un modelo de urna en el que las muestras son
seleccionadas con orden y con reemplazo. En este tipo de situaciones se están considerando
aquellas permutaciones con repetición de n objetos distintos tomándolos de k en k, y en
donde k es cualquier número natural. Aplicando el teorema fundamental del conteo (teo-
rema 2.2.8) obtenemos el siguiente teorema:

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 127

Teorema 2.2.37 Sea k cualquier número natural. Entonces, el número de permutaciones


con repetición de n objetos distintos tomándolos de k en k es igual a nk .

Las permutaciones de este tipo se pueden considerar como muestras seleccionadas con reemplazo.

Ejemplo 2.2.38 (Permutaciones de 3 en 3, k < n, con reemplazo) ¿Cuántos números de


2 cifras con repetición se pueden fomar usando todos los siguientes dı́gitos: 5, 2 y 3?

SOLUCIÓN:
Por el teorema 2.2.37, hay 32 = 9 números de dos cifras con repetición y son 55, 52, 53, 25, 22,
23, 35, 32 y 33. 

Ejemplo 2.2.39 (Permutaciones de 4 en 4, k>n, con reemplazo) ¿De cuántas formas pode-
mos contestar un examen con 10 preguntas de selección múltiple si cada pregunta tiene 4 posibi-
lidades de respuesta?

SOLUCIÓN:
Por el teorema 2.2.37, hay 410 = 1.048.576 formas de responder las 10 preguntas si cada una de
ellas tiene cuatro posibilidades de respuesta. 

Ejemplo 2.2.40 (Permutaciones de 5 en 5, k = n, con reemplazo) Un ladrón quiere abrir


una caja fuerte. Observa que para abrirla debe manipular un dispositivo de seguridad formado
por cinco anillos y cada uno marcado con los dı́gitos 1, 2, 3, 4 y 5, pero no sabe la combinación
correcta. ¿Cuál es el número máximo de intentos incorrectos que puede realizar antes de encontrar
la combinación correcta?

SOLUCIÓN:
En cada uno de los 5 anillos pueden ponerse los 5 dı́gitos. Ası́ que, por el teorema 2.2.37 con
n = k = 5, hay 55 = 3.125 posibilidades de escoger una clave. Pero como una de estas 3.125 es la
correcta, el número máximo de intentos incorrectos es 3.124. 
Copyright © 2017. Universidad del Norte. All rights reserved.

Permutaciones de n objetos en donde hay n1 de un primer tipo, n2 de un segundo


tipo, . . ., nk de un k-ésimo tipo, con n1 + n2 + · · · + nk = n

Ahora consideraremos algunas permutaciones de n objetos en donde algunos grupos de


objetos son iguales entre sı́, como podemos observar en los ejemplos 2.2.4 y 2.2.22. Para
calcular permutaciones de este tipo se puede aplicar el siguiente teorema:

2.2. Modelo de urnas y técnicas de conteo

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
128 Llinás / Rojas

Teorema 2.2.41 El número de permutaciones de n objetos en donde hay n1 de un primer


tipo, n2 de un segundo tipo, . . ., nk de un k-ésimo tipo, con n1 + n2 + · · · + nk = n, es
n!
n1 ! n2 ! · · · nk !
donde n1 , . . . , nk son números naturales.

Ejemplo 2.2.42 (Permutación con 7 grupos de objetos iguales) ¿Cuántas palabras distin-
tas se pueden formar con las letras de la palabra “estadı́stica”? (También cuentan palabras sin
sentido como, por ejemplo, “setadı́stica”).

SOLUCIÓN:
Obsérvese que en la palabra “estadı́stica” hay n = 11 letras, distribuidas ası́: 1 “e”, 2 “s”, 2 “t”, 2
“a”, 1 “d”, 2 “i” y 1 “c”. Por tanto, aplicando el teorema 2.2.41, se concluye que podemos formar
11!
= 2.494.800
1! 2! 2! 2! 1! 2! 1!
palabras distintas con las letras de la palabra mencionada anteriormente. 

Ejemplo 2.2.43 (Permutación con 2 grupos de objetos iguales) ¿Cuántas señales diferen-
tes se pueden hacer con 5 banderas de las cuales 2 son azules y 3, rojas?

SOLUCIÓN:
De acuerdo al teorema 2.2.41, hay 5!
2! 3! = 10 señales que se pueden hacer. 

Maneras de hacer una partición de un conjunto

A menudo interesa determinar el número de formas en que se pueden repartir n objetos


en k subconjuntos (llamados celdas5 ), como sucede en la situación del ejemplo 2.2.5. En
general, este número de formas lo podemos calcular directamente con ayuda del siguiente
teorema:
Copyright © 2017. Universidad del Norte. All rights reserved.

Teorema 2.2.44 El número de formas de partir n objetos distintos en donde en k celdas


con n1 objetos en la primera celda, n2 en la segunda tipo, . . ., nk en la k-ésima celda, con
n1 + n2 + · · · + nk = n, es

n n!
=
n1 , n2 , . . . , nk n1 ! n2 ! · · · nk !
No importa el orden de los objetos dentro de cada celda.

5
En el ejemplo 2.2.5 se han considerado 2 celdas: las habitaciones triple y sencilla.
Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 129

Ejemplo 2.2.45 (Partición en 3 celdas) Doce estudiantes van a viajar en carros distintos a
cierta ciudad. Si 3 de ellos van en un carro, 4 en otro carro y 5 en el otro, ¿de cuántas maneras
se pueden acomodar si cualquiera puede conducir?

SOLUCIÓN:
Por el teorema 2.2.44, hay

12 12!
= = 27.720
3, 4, 5 3! 4! 5!

formas en que los 12 estudiantes se pueden acomodar en los tres carros, viajando 3, 4 y 5 estu-
diantes en carros distintos. 

2.2.7 Combinación

Cuando tratamos con permutaciones de objetos, el orden de escogencia o de colocación es


importante. Hay ocasiones en que no nos interesa considerar conjuntos de objetos donde el
orden no es importante. Cuando esto ocurre, la escogencia se llama combinación.

Definición 2.2.46 Una escogencia de k objetos de un conjunto de n objetos distintos, sin


importar el orden en que los k objetos son escogidos, se llama combinación.

Una combinación puede ser con repetición o sin repetición.

Ejemplo 2.2.47 (Combinaciones tomadas de 2 en 2, sin repetición) Todas las posibles com-
binaciones de las n = 5 letras A, B, C, D y E, tomadas de dos en dos (o sea, k = 2) sin repetición
son:

AB, AC, AD, AE, BC, BD, BE, CD, CE, DE

Es decir, en total hay 10 posibles formas de escoger dos letras de un total de 5, cuando el orden
no importa y la selección es sin repetición. Obsérvese que, en este caso, da lo mismo escoger AB
y BA (es decir, no importa el orden). 
Copyright © 2017. Universidad del Norte. All rights reserved.

Ejemplo 2.2.48 (Combinaciones tomadas de 2 en 2, con repetición) Todas las posibles


combinaciones de las n = 5 letras A, B, C, D y E, tomadas de dos en dos (o sea, k = 2) con
repetición son:

AB, AC, AD, AE, BC, BD, BE, CD


CE, DE, AA, BB, CC, DD, EE

Es decir, en total hay 15 posibles formas de escoger dos letras, de un total de 5, cuando el orden
no importa y la selección es con repetición. 

2.2. Modelo de urnas y técnicas de conteo

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
130 Llinás / Rojas

Ejemplo 2.2.49 (Diferentes problemas con combinaciones) Otros casos en los que se pre-
sentan problemas con combinaciones son los siguientes:

(a) En una caja hay n = 5 fichas numeradas y se sacan k = 3 fichas, una detrás de otra, sin
reponer y sin importar el orden.

(b) Se reparten n = 10 fichas diferentes y numeradas sobre k = 6 puestos no numerados, de tal


forma que en cada puesto haya exactamente una ficha.

(c) Repartir k = 7 fichas iguales no numeradas sobre n = 9 puestos numerados, de tal forma que
en cada puesto haya a lo más una ficha. 

Pero, ¿cómo calculamos el número de combinaciones de un conjunto de objetos sin enu-


merar tales combinaciones? El siguiente teorema nos da la respuesta:

Teorema 2.2.50 El número de combinaciones de k objetos seleccionados, sin repetición,


de un conjunto de n elementos, es

n n! n
:= , siendo := 1
k k!(n − k)! 0

Y el número de combinaciones de k objetos seleccionados con repetición, de un conjunto de


n elementos, es


n n+k−1 (n + k − 1)! n
:= = , siendo := 1
k r k k!(n − 1)! 0
 
Los números nk se conocen con el nombre de coeficiente binomial porque aparecen como coeficientes
de ak bn−k , con 0 ≤ k ≤ n, en el desarrollo binomial de (a + b)n como se muestra a continuación:
n

n k n−k
(a + b)n = a b , para todo a, b ∈ R.
k
k=0

Ejemplo 2.2.51 (Combinaciones tomadas de 4 en 4, sin repetición) Una pieza de un ra-


dio puede ser comprado de cualquiera de cinco proveedores. ¿De cuántas maneras se pueden
Copyright © 2017. Universidad del Norte. All rights reserved.

escoger cuatro de los cinco proveedores?

SOLUCIÓN:

Por el teorema 2.2.50, esto se puede hacer de 54 = 5 maneras. 

Ejemplo 2.2.52 (Combinaciones tomadas de 2 en 2, con repetición) Por el teorema 2.2.50,


el número de las posibles combinaciones de las n = 5 letras A, B, C, D y E, tomadas de dos en

dos (o sea, k = 2), con repetición, es igual a 52 r = 15 (compárese con el ejemplo 2.2.48). 

Debido a que las combinaciones con repetición son poco usuales en la práctica, de ahora en
adelante todas las combinaciones que se seleccionen serán sin repetición.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 131

Ejemplo 2.2.53 (Combinaciones tomadas de 8 en 8) Por el teorema 2.2.50, un comité de



k = 3 mujeres de un grupo de n = 8, se puede escoger de 83 = 56 maneras. 

Ejemplo 2.2.54 (Combinaciones tomadas de 5 en 5) De un total de 5 matemáticos y 7


fı́sicos se forma un comité de 2 matemáticos y 3 fı́sicos. ¿De cuántas maneras puede formarse si
(a) puede pertenecer a él cualquier matemático y fı́sico, (b) un fı́sico determinado debe pertenecer
al comité, (c) dos matemáticos determinados no pueden pertenecer al comité?

SOLUCIÓN:


(a) 2 matemáticos, de un total de 5, pueden elegirse de 52 = 10 maneras. Ahora, 3 fı́sicos de

un total de 7 pueden elegirse de 73 = 35 maneras. Por consiguiente,

número total de selecciones posibles = 10 · 35 = 350.


(b) 2 matemáticos, de un total de 5, pueden elegirse de 52 = 10 maneras. Ahora, 2 fı́sicos
6
restantes, de un total de 6, pueden elegirse de 2 = 15 maneras. Por consiguiente,

número total de selecciones posibles = 10 · 15 = 150.


(c) 2 matemáticos, de un total de 3, pueden elegirse de 32 = 3 maneras. Ahora, 3 fı́sicos, de
7
un total de 7, pueden elegirse de 3 = 35 maneras. Por consiguiente,

número total de selecciones posibles = 3 · 35 = 105. 

El número de combinaciones de n objetos tomados de k en k está relacionado con el número


de permutaciones de n objetos tomados de k en k. Observemos que cada combinación puede
arreglarse de k! maneras distintas. Si aplicamos el teorema fundamental del conteo (teo-
rema 2.2.8), el número total de permutaciones de n objetos distintos tomados de k en k es
igual al producto de k! y al número de combinaciones de n objetos distintos tomados de k
 
en k, o sea, igual a k! nk . Esto se puede resumir en el siguiente teorema:
Copyright © 2017. Universidad del Norte. All rights reserved.

Teorema 2.2.55 El número total de permutaciones de n objetos distintos tomados de k en


k es igual al producto de k! y al número de combinaciones de n objetos distintos tomados
 
de k en k, o sea, igual a k! nk .

Ejemplo 2.2.56 (Permutaciones de 5 en 5) Por el teorema 2.2.28, el número de formas en



que se pueden sentar 8 alumnos en una oficina con 5 sillas es igual a 5! 85 = 6.720, que coincide
con el resultado obtenido en el ejemplo 2.2.30. 

2.2. Modelo de urnas y técnicas de conteo

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
132 Llinás / Rojas

✍ Ejercicios de la sección 2.2


13. En un reinado mundial de la belleza, el jurado debe elegir, de un total de cinco finalistas,
a la nueva reina. ¿De cuántas formas se puede seleccionar (a) reina y virreina? (b) reina,
virreina y primera princesa? (c) dos candidatas para ser reina?

14. En un estudio médico, los pacientes se clasifican de acuerdo a su peso (liviano, normal, pe-
sado) y estatura (medio bajo, bajo, alto y medio alto). Enumere las diferentes posibilidades
en las que un paciente se puede clasificar. ¿Cuántas posibilidades hay?

15. Si un experimento consiste en lanzar un dado, luego, lanzar una moneda y después es-
coger al azar una letra de nuestro alfabeto, ¿cuántos elementos tiene el espacio muestral
correspondiente? (Suponga que nuestro alfabeto tiene 27 letras).

16. Los estudiantes de un curso de estadı́stica se clasifican como estudiantes de administración,


economı́a o ingenierı́a; como repitente o no repitente y también como hombre o mujer.
Encuentre el número total de clasificaciones posibles para los estudiantes de dicho curso.

17. Dados los dı́gitos 0, 2, 4, 5, 6, 8 y 9. Si no se aceptan repeticiones,

(a) ¿cuántos números de tres dı́gitos se pueden formar?


(b) ¿cuántos de esos números son múltiplos de 5?

18. En un determinado almacén, ciertas lámparas se venden en cuatro estilos diferentes, con
cada estilo disponible en cinco colores diferentes. Si el almacén desea mostrar lámparas que
muestren la totalidad de los diversos estilos y colores, ¿cuántas lámparas diferentes tendrı́a
que mostrar?

19. ¿De cuántas maneras diferentes se puede responder un cuestionario de falso-verdadero que
tiene 10 preguntas?

20. Un medicamento para problemas renales es fabricado por seis laboratorios diferentes en
forma de jarabe, tabletas, cápsulas o inyección, todas de concentración alta o baja. ¿De
cuántas maneras diferentes puede un doctor recetar el medicamento a un paciente que tenga
problemas renales?
Copyright © 2017. Universidad del Norte. All rights reserved.

21. Supongamos que 7 personas se quieren organizar en una fila.

(a) ¿De cuántas maneras diferentes pueden hacerlo?


(b) ¿De cuántas maneras diferentes pueden hacerlo si una de ellas no debe estar al comienzo
de la fila?

22. En un concurso nacional de canto, los seis finalistas son 3 hombres y 3 mujeres. Encuentre
el número de ordenamientos posibles al final del concurso para (a) los seis finalistas, (b) las
tres primeras posiciones.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 133

23. Una persona ha visto un accidente de tránsito cuyo culpable huyó. A pesar de esto le dice
a la Policı́a que la placa del carro en el que viajaba el culpable tenı́a tres letras (de las
cuales las dos primeras eran C y A) y tres dı́gitos (de los cuales el último era 0). Encuentre
el número máximo de placas de carro que la Policı́a debe verificar bajo cada una de las
siguientes condiciones (nuestro alfabeto tiene 27 letras):

(a) Las tres letras son diferentes y los tres dı́gitos también.
(b) Las tres letras son diferentes y los dos dı́gitos que faltan son diferentes entre sı́.
(c) La letra que hace falta es diferente de la A y los dı́gitos que hacen falta son diferentes
e impares.

24. La mayor accionista de una determinada empresa decide que en el futuro se divida el pre-
supuesto de publicidad entre tres agencias. Seis son las agencias que están siendo conside-
radas para este trabajo. ¿Cuántas son las posibles elecciones de tres agencias?

25. Supongamos que se quieren formar números de tres dı́gitos con los dı́gitos 0, 2, 4, 5, 7, 8 y
9.

(a) ¿Cuántos números resultan si los dı́gitos pueden estar repetidos?


(b) ¿Cuántos números resultan si cada dı́gito puede usarse sólo una vez?
(c) ¿Cuántos números resultan si los números resultantes son impares y si los dı́gitos pueden
estar repetidos?
(d) ¿Cuántos números resultan si los números resultantes son pares y si cada dı́gito puede
usarse sólo una vez?
(e) ¿Cuántos números son menores que 440 y si los dı́gitos pueden estar repetidos?
(f) ¿Cuántos números resultan si el primer dı́gito es 5 y si cada dı́gito puede usarse sólo
una vez?

26. ¿De cuántas maneras se pueden parquear siete carros, de modelos distintos, en una calle si
hay tres zonas disponibles en un lado de la calle y cuatro en el lado opuesto?

27. ¿De cuántas maneras pueden sentarse tres hombres y tres mujeres en una fila con seis puestos
si se deben alternar?

28. ¿Cuáles y cuántas son las muestras ordenadas, con reemplazo, de tamaño dos de la población
Copyright © 2017. Universidad del Norte. All rights reserved.

consistente en (a) tres valores, 2, 4 y 6; (b) cuatro valores, 0, 2, 4 y 6.

29. Tres parejas de casados han comprado boletas para el cine y se sientan en una fila formada
por seis asientos. Supongamos que se sientan al azar. Determine el número de formas
diferentes en que se pueden sentar teniendo en cuenta cada una de las siguientes situaciones:

(a) No hay restricción alguna.


(b) Todos los hombres se sientan juntos a la izquierda de todas las mujeres.
(c) Exactamente una pareja (digamos, Luis y Matilde) está sentada en los dos asientos del
extremo derecho.

2.2. Modelo de urnas y técnicas de conteo

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
134 Llinás / Rojas

(d) Luis y Matilde están sentados uno junto a la otra.


(e) Luis y Matilde están sentados juntos en el extremo izquierdo y otra pareja (digamos,
Jorge y Nubia) está sentada junta en el medio.
(f) Jorge y Nubia están sentados juntos en el medio y los otros dos esposos (digamos,
Luis, Ricardo) están sentados junto a sus respectivas esposas (Matilde y Ana respecti-
vamente).
(g) Todos los esposos están sentados junto a sus respectivas esposas.

30. ¿De cuántas maneras se pueden llenar las 11 posiciones inciales de un equipo de fútbol con
17 jugadores que pueden jugar en cualesquiera de las posiciones?

31. ¿De cuántas maneras se pueden sembrar seis árboles diferentes en un cı́rculo si (a) no hay
restricción alguna, (b) hay dos en especial que deben estar juntos, (c) hay dos en especial
que no deben estar juntos?

32. ¿Cuántas palabras diferentes se pueden formar con la palabra “Barranquilla” (las palabras
no necesariamente deben tener sentido) si (a) no hay restricción alguna, (b) la primera letra
debe ser una “q” y la última una “a”.

33. ¿De cuántas maneras se pueden permutar tres focos rojos, cuatro bolas blancas y dos fichas
amarillas si los objetos del mismo tipo (a) se pueden distinguir, (b) no se pueden distinguir.

34. Catorce personas deciden ir a ver un partido de fútbol en cuatro carros que llevan dos, tres,
cuatro y cinco personas respectivamente. ¿De cuántas maneras es posible transportar a las
catorce personas hasta el estadio si cualquiera puede conducir?

35. Dados los dı́gitos 0, 1, 3, 6, 8 y 9. Si no se aceptan repeticiones,

(a) ¿cuántos números de cuatro dı́gitos se pueden formar?


(b) ¿cuántos de esos números son pares?
(c) ¿cuántos son impares?
(d) ¿cuántos de los números obtenidos en (a) son mayores de 3.000?

36. ¿De cuántas maneras se pueden repartir dos contratos a tres empresas, A, B y C, si cada
empresa puede tener 0, 1 o 2 contratos? Descrı́balas.
Copyright © 2017. Universidad del Norte. All rights reserved.

37. Si una prueba de opción múltiple consiste en cuatro preguntas cada una con tres respuestas
posibles, de las que sólo una es correcta.

(a) ¿De cuántas maneras diferentes puede elegir un estudiante una respuesta a cada pre-
gunta?
(b) ¿De cuántas maneras puede escoger un estudiante una respuesta a cada pregunta y
tener todas las respuestas incorrectas?
(c) ¿De cuántas maneras puede escoger un estudiante una respuesta a cada pregunta y
tener por lo menos una respuesta correcta?

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 135

38. Las placas para autos en Barranquilla antes tenı́an dos letras y cuatro números. El sistema
de nomenclatura cambió y ahora son de tres letras y tres números. Con el sistema actual,
¿aumentó o disminuyó el número de placas que se pueden emitir? ¿En qué porcentaje?

2.3 Introducción a la probabilidad


Antes de señalar cómo se utilizan las probabilidades, es necesario conocer de cierta manera
de dónde provienen. Básicamente, explicaremos 4 formas de calcular o estimar la probabi-
lidad: mediante los siguientes métodos (que se relacionan todos entre sı́): axiomático, de
la frecuencia relativa, clásico y subjetivo.

2.3.1 Definición matemática de “probabilidad”

Al igual que la geometrı́a, el álgebra y otras disciplinas matemáticas, también la teorı́a de


la probabilidad se construye a través de axiomas, los cuales se enumeran a continuación:

Axioma 2.3.1 Sean Ω = ∅ un espacio muestral y F un conjunto de eventos de Ω. Una


función P : F −→ R se llama una probabilidad si se cumplen los siguientes 3 axiomas:

(a) La probabilidad de cualquier evento debe ser siempre mayor o igual que cero, es decir,
P (A) ≥ 0, para todo A ∈ F.

(b) La probabilidad del espacio muestral siempre es uno, es decir, P (Ω) = 1.

(c) Para cada sucesión de eventos A1 , A2 , . . . ∈ F son mutuamente excluyentes (véase la


definición 2.1.7), entonces se cumple que

∞  ∞
P An = P (An )
n=1 n=1

A la tripleta (Ω, F, P ) se le llama espacio de probabilidad.


Copyright © 2017. Universidad del Norte. All rights reserved.

La serie que aparece en (c) existe (converge) porque el primer axioma asegura que P (An ) ≥ 0 y el segundo,
que


P( An ) ≤ P (Ω) = 1
n=1

Es decir,


∞ 
P (An ) = P An ≤ 1 < ∞
n=1 n=1

2.3. Introducción a la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
136 Llinás / Rojas

Es importante enfatizar que el conjunto F, mencionado en la definición anterior, debe estar construido de
tal manera que cumpla las siguientes propiedades:

(a) Ω siempre debe estar en F.


(b) Si A está en F, entonces el complemento A de A también debe estar en F.


(c) Si A1 , A2 , . . . están en F, entonces An también debe estár en F.
n=1

El axioma (a) refleja la noción intuitiva de que la probabilidad de que ocurra cualquier
evento A debe ser por lo menos 0, ası́ que las probabilidades negativas no se permiten. El
axioma (b) señala que la probabilidad máxima posible de 1 se asigna al espacio muestral
Ω. El axioma (c) formaliza la idea de que si deseamos la probabilidad de que ocurra por
lo menos uno de varios eventos y no pueden ocurrir dos de estos eventos simultáneamente,
entonces la probabilidad de que ocurra al menos uno es la suma de las probabilidades de
los eventos individuales.

Teniendo en cuenta el axioma 2.3.1, se demuestran las siguientes propiedades:

Teorema 2.3.2 Para eventos A, B, C de un espacio muestral Ω = ∅ se tiene:

(a) P (∅) = 0

(b) Si los eventos A, B y C son mutuamente excluyentes, entonces P (A ∪ B ∪ C) =


P (A) + P (B) + P (C)

(c) P (A) = 1 − P (A), siendo A el complemento de A

(d) 0 ≤ P (A) ≤ 1

(e) P (A) = P (A ∩ B) + P (A ∩ B)

(f ) Teorema de adición para 2 eventos o fórmula de Silvester:

P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
Copyright © 2017. Universidad del Norte. All rights reserved.

(g) Teorema de adición para 3 eventos o fórmula de Silvester:

P (A∪B ∪C) = P (A)+P (B)+P (C)−P (A∩B)−P (A∩C)−P (B ∩C)+P (A∩B ∩C)

La demostración del teorema anterior no está dentro del propósito de este libro.

Ejemplo 2.3.3 Sean A, B y C eventos tales que P (A) = 0, 50, P (B) = 0, 26, P (C) = 0, 55,
P (A ∩ B) = 0, 15, P (A ∩ C) = 0, 25, P (B ∩ C) = 0, 15 y P (A ∩ B ∩ C) = 0, 05. Calcule las
siguientes probabilidades: (a) P (A ∪ B), (b) P (A ∩ C), (c) P (A ∪ C) y (d) P (A ∪ B ∪ C).

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 137

SOLUCIÓN:

(a) Teniendo en cuenta el teorema de adición para 2 eventos (véase la parte (f) del teorema 2.3.2),
se tiene que

P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 0, 50 + 0, 26 − 0, 15 = 0, 61

(b) Teniendo en cuenta el teorema 2.3.2(e), se obtiene que

P (A ∩ C) = P (A) − P (A ∩ C) = 0, 50 − 0, 25 = 0, 25

(c) Teniendo en cuenta la parte (c) del teorema 2.3.2, las leyes de de Morgan (compárese con el
teorema 2.1.14(i)) y la parte (b) de este ejercicio, se tiene

P (A ∪ C) = 1 − P (A ∪ C) = 1 − P (A ∩ C) = 1 − 0, 25 = 0, 75

(d) Teniendo en cuenta el teorema de adición para 3 eventos (véase la parte (g) del teorema 2.3.2),
se tiene que

P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C)


= 0, 50 + 0, 26 + 0, 55 − 0, 15 − 0, 25 − 0, 15 + 0, 05
= 0, 81

Alternativamente, las respuestas encontradas en los ejercicios (a)-(d) pueden ser obtenidas con
ayuda de las probabilidades que aparecen en el siguiente diagrama de Venn:
Copyright © 2017. Universidad del Norte. All rights reserved.

Figura 2.10: Diagrama de Venn para el ejemplo 2.3.3 

2.3.2 Probabilidad empı́rica

Este concepto esá basado en el llamado método de la frecuencia relativa, el cual


utiliza datos que se han observado empı́ricamente, registra la frecuencia con que ha ocurrido

2.3. Introducción a la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
138 Llinás / Rojas

algún evento en el pasado y estima la probabilidad de que el evento ocurra nuevamente con
base en estos datos históricos. En este método juega papel fundamental el concepto de
frecuencia relativa para estimar las probabilidades.

Definición 2.3.4 Supongamos que un experimento aleatorio se repite n veces y que un


evento A asociado con estas n repeticiones ocurre exactamente k veces. Entonces, la fre-
cuencia relativa del evento A es fn = nk .

Si continuamos calculando esta frecuencia relativa para cada cierto número de ensayos, a
medida que aumentamos n, las frecuencias relativas correspondientes serán más estables,
es decir, tienden a ser casi las mismas. En este caso, decimos que el experimento muestra
regularidad estadı́stica o estabilidad en las frecuencias relativas. Esto se ilustra en los
siguientes dos ejemplos:

Ejemplo 2.3.5 Considere la tabla 2.1, en donde se muestran datos tomados al lanzar una moneda
1.000 veces. En un total de 1.000 lanzamientos, 508 veces la moneda mostró cara, es decir, la
frecuencia relativa es aproximadamente 0,5, que es la probabilidad de obtener una cara. 

Tabla 2.1: Lanzamiento de una moneda 1.000 veces


Frecuencia
Número de Número Frecuencia Frecuencia acumulada
lanzamientos de caras relativa acumulada relativa
1 - 100 52 0,52 52 0,520
101 - 200 53 0,53 105 0,525
201 - 300 52 0,52 157 0,523
301 - 400 47 0,47 204 0,510
401 - 500 51 0,51 255 0,510
501 - 600 53 0,53 308 0,513
601 - 700 48 0,48 356 0,509
701 - 800 46 0,46 402 0,503
801 - 900 52 0,52 454 0,504
Copyright © 2017. Universidad del Norte. All rights reserved.

901 - 1.000 54 0,54 508 0,508


Total: 1.000 508 0,508

Ejemplo 2.3.6 La tabla 2.2 muestra experimentos hechos por tres investigadores. Obsérvese que
en cada una de las investigaciones, la frecuencia relativa del número de caras es aproximadamente
0,5, que es la probabilidad de obtener una cara. 

En la gran mayorı́a de los experimentos aleatorios de importancia práctica éstos tienen


estabilidad. Por esto podemos sospechar que prácticamente será cierto que la frecuencia

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 139

Tabla 2.2: Lanzamientos de una moneda realizados por 3 investigadores


Hecho Número de Número Frec. rel.
por lanzamientos de caras de caras
Buffon 4.040 2.048 0,5069
K. Pearson 12.000 6.019 0,5016
K. Pearson 24.000 12.012 0,5005

relativa de un evento A en un gran número de experimentos es aproximadamente igual a


un determinado número P (A), o sea, la probabilidad del evento es P (A) = lim nk , como
n→∞
podemos verificar con ayuda de los ejemplos 2.3.5 y 2.3.6, siendo A en estos dos ejemplos
el evento “obtener una cara”. Todo lo anterior se puede resumir en la siguiente definición:

Definición 2.3.7 (Definición empı́rica de probabilidad) Supongamos que se ha reali-


zado un experimento aleatorio. Sea A un evento asociado a él. Entonces, la probabilidad
P (A) es aproximadamente igual a la frecuencia relativa de A si efectuamos el experimento
muchas veces.

Cuando se usa la definición empı́rica, es importante tener en cuenta los siguientes aspectos:

• La probabilidad obtenida de esta manera es únicamente una estimación del valor real.

• Cuanto mayor sea el número de experimentos, tanto mejor será la estimación de la


probabilidad, es decir, a mayor número de experimentos mejor será la estimación.

• La validez de emplear esta definición depende de que los experimentos se hayan


repetido siempre bajo las mismas condiciones.

2.3.3 Definición clásica de “probabilidad”


Copyright © 2017. Universidad del Norte. All rights reserved.

Probabilidad clásica

Se pueden encontrar diversos ejemplos en los que se asocian la misma probabilidad a cada
evento elemental. En este caso se habla de un experimento laplaciano o clásico, es
decir, un experimento que tiene finitos resultados, que suceden con la misma probabilidad.
A este tipo de experimentos pertenecen algunos juegos de azar, como por ejemplo, dados,
juegos de cartas, ruletas; también modelos de la fı́sica, en los cuales se puede describir la
distribución de una partı́cula cualquiera, o modelos de la génetica.

2.3. Introducción a la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
140 Llinás / Rojas

Definición 2.3.8 (Probabilidad de un evento elemental) Sea Ω = ∅ un espacio


muestral finito. Si ω es un evento elemental de Ω, entonces la probabilidad de que suceda
ω, en sı́mbolos P (ω), es igual a 1 dividido por el número de elementos que tiene Ω. Es
decir,
1
P (ω) = (2.1)
Número de elementos de Ω

Ejemplo 2.3.9 (a) Consideremos el experimento de lanzar una moneda. Entonces, Ω =


{C, S}. Es decir, la probabilidad de obtener cara, simbolizado por P (C), y la de obtener
sello, simbolizado por P (S), está dado por P (C) = P (S) = 12 = 0, 5. Estas probabilidades
las interpretamos de la siguiente manera: En un gran número de lanzamientos aparecerá
una cara aproximadamente en la mitad de los lanzamientos y sello en la otra mitad. O
también podemos decir: si la moneda se lanza repetidamente, entonces el 50% (que resulta
de multiplicar 0,5 por 100) de las veces resultará cara y en el otro 50%, sello.

(b) Consideremos el experimento de lanzar un dado. Entonces, Ω = {1, 2, 3, 4, 5, 6}. Es decir,


1
P (1) = P (2) = P (3) = P (4) = P (5) = P (6) = ≈ 0, 166 . . . ,
6

Aquı́, el sı́mbolo “≈” significa “aproximadamente igual a” y, por ejemplo, P (1) = 0, 166 se
lee: “la probabilidad de obtener un 1 es 0,166”, la cual se interpreta de la siguiente manera:
De cada 1.000 lanzamientos de un dado, el número 1 aparecerá 166 veces aproximadamente.
O también ası́: si el número de lanzamientos de un dado es grande, entonces en el 16,6%
(que resulta de multiplicar 0,166 por 100) aparecerá el número 1 del dado. Las otras
probabilidades las interpretamos análogamente. 

A menudo es necesario asignar probabilidades a eventos de un espacio muestral. Por eso,


es importante el siguiente teorema:

Teorema 2.3.10 (Probabilidad de un evento) Sea Ω = ∅ un espacio muestral finito y


supongamos que todos los eventos elementales suceden con la misma probabilidad, es decir,
la expresión ( 2.1) se cumple para cada evento elemental ω de Ω. Entonces, para cada evento
Copyright © 2017. Universidad del Norte. All rights reserved.

A de Ω tenemos:
Número de elementos de A
P (A) = (2.2)
Número de elementos de Ω

Ejemplo 2.3.11 Dos dados no falsos se lanzan. Halle la probabilidad de (a) que la suma de los
números sea un 7, (b) que la suma sea por lo menos un 11, (c) que la suma sea a lo más un 2, (d)
obtener un doble, (e) no obtener doble.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 141

SOLUCIÓN:
Como ya vimos en el ejemplo 2.2.1, el espacio muestral correspondiente Ω contiene 36 resultados.
Además, cada uno de ellos ocurre con la misma probabilidad.

(a) Sea A el evento de obtener un 7 al lanzar los dos dados. Entonces, A es el conjunto

A = (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)

O sea que A tiene 6 elementos. Por consiguiente, aplicando (2.2) se obtiene que la proba-
bilidad de obtener un 7 es:
6 1
P (A) = = ≈ 0, 166
36 6

Aquı́, el sı́mbolo “≈” significa “aproximadamente igual a”.

(b) Sea B el evento de obtener por lo menos un 11, es decir, B es el evento de obtener una suma
mayor o igual que 11. Debido a que

B = (5, 6), (6, 5), (6, 6)

entonces
3 1
P (B) = = ≈ 0, 0833
36 12
(c) Sea C el evento de obtener a lo más un 2 o, lo que es equivalente, de obtener una suma

menor o igual que 2. En este caso, C = (1, 1) y, con ello,

1
P (C) = ≈ 0, 027
36

(d) Sea D el evento de obtener un doble. Es decir,



D = (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)

Por lo tanto,
6
P (D) = ≈ 0, 166
36
(e) Sea E el evento de obtener ningún doble. Observe: D es el complemento de E, es decir,
Copyright © 2017. Universidad del Norte. All rights reserved.

D = E. Por lo tanto, P (E) = P (D). Entonces,

P (E) = 1 − P (E) = 1 − P (D) ≈ 1 − 0, 166 = 0, 834 

Ejemplo 2.3.12 Una organización de caridad vende 1.000 billetes de loterı́a. Hay diez primeros
premios y cien premios de consolación, todos los cuales deben ser distribuidos. El proceso de
selección de los ganadores es tal que, al principio, cada boleto tiene las mismas posibilidades
de ganar un primer premio y cada uno tiene las mismas posibilidades de ganar un premio de
consolación. Ningún boleto puede ganar más de un premio.

(a) ¿Cuál es la probabilidad de ganar un premio con un único boleto?

2.3. Introducción a la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
142 Llinás / Rojas

(b) ¿Cuál es la probabilidad de ganar un premio de consolación?

(c) ¿Cuál es la probabilidad de ganar algún premio?

SOLUCIÓN:

(a) De entre los 1.000 billetes, 10 ganarán primeros premios, 100 ganarán premios de consolación y
890 no ganarán premio alguno. Nuestro único billete puede ser considerado como uno elegido
entre los 1.000. Sea A el suceso “el billete elegido gana un primer premio”. Dado que son
1.000 resultados igualmente probables, 10 de los cuales corresponden al suceso A, tenemos
que
10
P (A) = = 0, 01
1.000
(b) De modo similar, para el suceso B, “el billete elegido gana un premio de consolación”, se
deduce que
100
P (B) = = 0, 10
1.000
(c) Ahora bien, el suceso “el billete gana algún premio” es sencillamente la unión de los sucesos A
y B. Además, dado que sólo se permite un premio por billete, estos sucesos son mutuamente
excluyentes. Por tanto, la probabilidad requerida es:
P (A ∪ B) = P (A) + P (B) = 0, 01 + 0, 10 = 0, 11 

Ejemplo 2.3.13 En la primera época del desarrollo de un yacimiento de petróleo, una empresa
estimó en 0,1 la probabilidad de que las reservas económicamente recuperables excedieran los 2.000
millones de barriles. La probabilidad de que las reservas excediesen los 1.000 millones de barriles
se estimó en 0,5. Dada esta información, ¿cuál es la probabilidad estimada de que las reservas se
encuentren entre 1.000 y 2.000 millones de barriles?

SOLUCIÓN:
Sea A el evento “las reservas exceden los 2.000 millones de barriles” y B el evento “las reservas se
encuentran entre 1.000 y 2.000 millones de barriles”. Estos eventos son mutuamente excluyentes
y su unión, A ∪ B, es el evento “las reservas exceden los 1.000 millones de barriles”. Por tanto,
tenemos que
P (A) = 0, 1 y P (A ∪ B) = 0, 5
Copyright © 2017. Universidad del Norte. All rights reserved.

Figura 2.11: Diagrama para las probabilidades del ejemplo 2.3.13

Entonces, dado que A y B son mutuamente excluyentes, se obtiene que (compárese con la
figura 2.11)
P (B) = P (A ∪ B) − P (A) = 0, 5 − 0, 1 = 0, 4 

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 143

Cálculo de probabilidades utilizando técnicas de conteo

Una dificultad práctica que aparece a veces al calcular la probabilidad de un suceso es la


de contar el número de resultados básicos en el espacio muestral y en el evento de interés.
Los siguientes ejemplos ilustran cómo se pueden utilizar las técnicas de conteo, explicadas
en la sección anterior, para calcular probabilidades de eventos.

Ejemplo 2.3.14 Un estante tiene 6 libros de matemáticas y 4 de fı́sica. Halle la probabilidad de


que 3 libros determinados de matemáticas estén juntos, si

(a) todos los libros de matemáticas son diferentes y los libros de fı́sica también;

(b) todos los libros de matemáticas son diferentes y todos los libros de fı́sica son iguales;

(c) todos los libros de matemáticas son diferentes y 3 de los libros de fı́sica iguales.

Compare las tres respuestas y dé una conclusión general.

SOLUCIÓN:
Sean Ω el espacio muestral correspondiente y A el evento “3 libros determinados de matemáticas
están juntos”. Nos piden calcular P (A).

(a) En este caso, los elementos de Ω son las distintas permutaciones de los 6 + 4 = 10 libros. Por
el teorema 2.2.23, los 10 libros pueden ordenarse entre sı́ de 10! formas. Es decir, Ω tiene en
total 10! elementos.

Ahora, supongamos que los 3 libros determinados de matemáticas se reemplazan por 1. Ası́,
tenemos en total de 8 libros que pueden ordenarse entre sı́ de 8! formas. Como los tres libros
se pueden ordenar entre sı́ de 3! formas, entonces hay 8! 3! formas de ordenar los 10 libros,
con la condición de que 3 libros determinados estén juntos.

Por lo tanto, por la expresión (2.2), tenemos que

Número de elementos de A 8! 3!
P (A) = = ≈ 0, 0666
Copyright © 2017. Universidad del Norte. All rights reserved.

Número de elementos de Ω 10!

(b) En este caso, por el teorema 2.2.41, Ω tiene en total 10! 4! = 151.200 elementos. Supongamos
que los 3 libros determinados de matemáticas se reemplazan por 1. Ası́, tenemos en total de
8 libros que, por el teorema 2.2.41, pueden ordenarse entre sı́ de 8!
4! = 1.680 formas. Como los
tres libros se pueden ordenar entre sı́ de 3! = 6 formas, entonces hay 1.680 · 6 = 10.080 formas
de ordenar los 10 libros, con la condición de que 3 libros determinados de matemáticas estén
juntos y sabiendo que los de fı́sica son todos iguales. Con lo anterior,

Número de elementos de A 10.080


P (A) = = ≈ 0, 0666
Número de elementos de Ω 151.200

2.3. Introducción a la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
144 Llinás / Rojas

(c) En este caso, por el teorema 2.2.41, Ω tiene en total 10! 3! = 604.800 elementos. Supongamos
que los 3 libros determinados de matemáticas se reemplazan por 1. Ası́, tenemos en total de
8 libros que, por el teorema 2.2.41, pueden ordenarse entre sı́ de 8!
3! = 6.720 formas. Como los
tres libros se pueden ordenar entre sı́ de 3! = 6 formas, entonces hay 6.720 · 6 = 40.320 formas
de ordenar los 10 libros, con la condición de que 3 libros determinados de matemáticas estén
juntos y sabiendo que hay 3 fı́sica que son iguales. Por consiguiente,

Número de elementos de A 40.320


P (A) = = ≈ 0, 0666
Número de elementos de Ω 604.800

Con respecto a los resultados obtenidos podemos concluir que si todos los libros de matemáticas
son diferentes, entonces sin importar si los de fı́sica son iguales o no, la probabilidad de que 3
libros determinados de matemáticas estén juntos es aproximadamente 0,0666. 

Ejemplo 2.3.15 Un director de personal tiene ocho candidatos para cubrir cuatro puestos. De
éstos, cinco son hombres y tres mujeres. Si, de hecho, toda combinación de candidatos tiene las
mismas probabilidades de ser elegido, ¿cuál es la probabilidad de que ninguna mujer sea con-
tratada?

SOLUCIÓN:
Primero, el número total de combinaciones posibles de los ocho candidatos tomadas de cuatro en

cuatro es 84 = 70. Ahora bien, para que ninguna mujer sea contratada, los candidatos selecciona-

dos han de ser cuatro de los cincos hombres. El número de tales combinaciones es 54 = 5. Por
tanto, si al principio cada una de las 70 combinaciones posibles fuese igualmente probable, la pro-
babilidad de escoger una de las cinco combinaciones que incluyen sólo hombres es 5/70 = 0, 071.


Ejemplo 2.3.16 Una caja de doce lapiceros tiene dos defectuosos. Se extraen tres lapiceros sin
reemplazo. ¿Cuál es la probabilidad de que dos salgan defectuosos?

SOLUCIÓN:
Sean Ω el espacio muestral correspondiente y A el evento “de los tres lapiceros seleccionados,
 
dos están defectuosos”. Entonces, el número de elementos que tiene Ω será 12 = 220 y el
102 3
número de elementos que tiene A es 1 2 = 10. Por consiguiente, la probabilidad pedida es
10
P (A) = 220 = 0, 045. 
Copyright © 2017. Universidad del Norte. All rights reserved.

Ejemplo 2.3.17 Una caja contiene 8 fichas rojas, 3 blancas y 9 azules. Si se extraen 3 fichas sin
reemplazo y sin orden, determinar la probabilidad de que (a) las 3 fichas sean blancas, (b) 2 sean
rojas y 1 blanca, (c) al menos 1 sea blanca y (d) se extraiga una de cada color.

SOLUCIÓN:
Sea Ω el espacio muestral correspondiente a esta situación. En este caso, sus elementos son las
distintas combinaciones de 8 + 3 + 9 = 20 fichas tomadas de 3 en 3 (ya que se sacan cada vez 3
fichas sin reemplazo). Por el teorema 2.2.50, las 3 fichas se pueden escoger, de un total de 20, de
20
3 = 1.140 formas. Es decir, Ω tiene en total 1.140 elementos.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 145

3 
(a) Sea A el evento “sacar 3 fichas de 3 blancas”. O sea, A tiene 3 = 1 elemento. Entonces,

Número de elementos de A 1
P (A) = = = 0, 000877
Número de elementos de Ω 1.140

(b) Sea A el evento “las 3 fichas sacadas son 2 rojas y 1 blanca”. Ahora, 2 fichas, de un total

de 8 rojas, se pueden seleccionar de 82 = 28 maneras, y 1 ficha, de un total de 3 blancas,
   
se puede seleccionar de 31 = 3 maneras. Por lo tanto, A tiene 82 31 = 84 elementos.
Entonces,
Número de elementos de A 84
P (A) = = = 0, 074
Número de elementos de Ω 1.140
(c) Sea A el evento “por lo menos 1 de las 3 fichas sacadas es blanca”. Esto quiere decir que A,
el complemento de A, es el evento “de las tres bolas ninguna es blanca”. Ahora, si ninguna
es blanca, entonces 3 fichas, de un total de 8 + 9 = 17 (entre rojas y azules), se pueden
 
seleccionar de 17
3 = 680 maneras. Por lo tanto, A tiene 680 elementos. Entonces,

Número de elementos de A 680


P (A) = = = 0, 596
Número de elementos de Ω 1.140

Por consiguiente, con lo anterior, la probabilidad pedida está dada por

P (A) = 1 − P (A) = 1 − 0, 596 = 0, 404

(d) Sea A el evento “las 3 fichas sacadas son una de cada color”. Ahora, 1 ficha, de un total de

8 rojas, se puede seleccionar de 81 = 8 maneras, 1 ficha, de un total de 3 blancas, se puede
3
seleccionar de 1 = 3 maneras, y 1 ficha, de un total de 9 azules, se puede seleccionar de
9 839
1 = 9 maneras. Por lo tanto, A tiene 1 1 1 = 216 elementos. Entonces,

Número de elementos de A 216


P (A) = = = 0, 189 
Número de elementos de Ω 1.140

2.3.4 Probabilidad subjetiva o personal

Existen muchos eventos de interés cuyas probabilidades de ocurrencia no las podemos cal-
cular de acuerdo con los métodos axiomático, clásico y de frecuencia relativa (empı́rica),
sino que se basan en el “grado de creencia” acerca de que tenga o no lugar un determinado
Copyright © 2017. Universidad del Norte. All rights reserved.

hecho como, por ejemplo,

• exista vida en algún planeta distante,

• en los póximos diez años se descubra algún remedio contra el cáncer,

• determinada persona se vaya a destacar en la universidad,

• una persona se enferme,

• una determinada máquina se dañe.

2.3. Introducción a la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
146 Llinás / Rojas

Sin embargo, poca gente se muestra renuente a concederles probabilidades a los eventos
anteriores. Inclusive, con mucha frecuencia oı́mos decir que hay un 20% de posibilidades
de que llueva mañana, que el Junior gane, etc. Aquella probabilidad que nos permite asig-
narles probabilidades a eventos tales como éstos se denomina probabilidad subjetiva.

Definición 2.3.18 La probabilidad subjetiva o personal se puede definir como


la probabilidad que expresa un grado de creencia individual sobre la posibilidad de que
un evento ocurra. Al método de asignar estas probabilidades se le conoce como método
subjetivo.

La asignación de la probabilidad subjetiva a un evento dado no depende del tratamiento matemático ni de


la noción de experimentos repetibles.

La magnitud de la probabilidad que una persona asigna subjetivamente a un evento depende


del grado de crédito que le dé a la ocurrencia del evento. Esa es la razón por la que es
posible asignarles probabilidades a eventos que sólo se presentan una vez, como por ejemplo,
el evento de ganar una determinada competencia atlética. A diferencia del método de
probabilidad de frecuencia relativa, la probabilidad subjetiva no depende de la posibilidad
de repetición de un experimento.

Ejemplo 2.3.19 (a) Si afirmamos que la probabilidad de que salga cara al lanzar una moneda
es 1/2, lo que tenemos en mente es que la moneda no parece estar trucada y que resultará
igualmente probable que salga cara o cruz. Al enunciar esta probabilidad subjetiva, no esta-
mos pensando necesariamente en términos de la experimentación repetida, sino que estamos
interesado por un único lanzamiento de la moneda. Nuestra evaluación de la probabilidad
subjetiva implica que considerarı́amos justa una apuesta que consistiese en pagar 5.000 pesos
si saliera cruz y recibir 5.000 pesos si saliera cara. Si fueramos a recibir más de 5.000 pesos si
del lanzamiento resultase una cara, considerarı́amos favorable la apuesta.

(b) De modo similar, si creemos que la probabilidad de que un caballo gane una determinada
carrera es 0,4, estamos dando nuestra opinión personal de que existe una posibilidad de 40
entre 100 de que gane. Dada esta creencia, considerarı́amos justa una apuesta en la que
perdiésemos dos dólares si el caballo no ganase y tres dólares en caso contrario. 
Copyright © 2017. Universidad del Norte. All rights reserved.

Debemos insistir en que las probabilidades subjetivas son personales; no se requiere que
diferentes individuos consideren que el mismo evento debe tener lugar con las mismas
probabilidades, como se explica a través de las situaciones del siguiente ejemplo:

Ejemplo 2.3.20 (a) En el ejemplo del lanzamiento de una moneda, la mayorı́a de la gente lle-
garı́a a la conclusión de que la probabilidad apropiada para el resultado “cara” es 1/2. Sin
embargo, un individuo con más información sobre la moneda en cuestión podrı́a creer otra
cosa.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 147

(b) En el ejemplo de las carreras de caballos, es probable que dos apostadores cuenten con diferen-
tes probabilidades subjetivas. Por ejemplo, pueden no tener la misma información, e incluso
aunque la tuvieran, podrı́an interpretarla de distinta forma.

(c) Es obvio que los inversionistas individuales no cuentan con las mismas opiniones sobre el
probable futuro comportamiento de la bolsa. Sus probabilidades subjetivas deben ser vistas
como dependientes del conocimiento que tienen y su manera de interpretarlo. 

Ya hemos explicado que, en el caso de apuestas, como carreras de caballos y pronósticos


deportivos, a menudo se determina la probabilidad de ocurrencia de un evento usando pro-
babilidad subjetiva y se establece comúnmente en términos de oportunidades.

Definición 2.3.21 Sea A cualquier evento. Las oportunidades a favor de A se defi-


nen como la razón PP (A)
(A)
y las oportunidades en contra de A como

1 P (A)
Oportunidades en contra de A = =
Oportunidades a favor de A P (A)
n
Si las oportunidades en favor de A son iguales a m , entonces diremos que las oportunidades
son de n a m (lo cual escribiremos n : m) a favor de A.

Obsérvese que las oportunidades en contra de A son precisamente las oportunidades a favor de
A.

Ejemplo 2.3.22 Supongamos que la probabilidad de que un boxeador favorito gane una pelea
es 1/3. ¿Cuáles son las oportunidades a favor de ganar?

SOLUCIÓN:
Sea A el evento “el boxeador gana”. Entonces, las oportunidades a favor de ganar son:

P (A) 1/3 1
= =
P (A) 2/3 2
Copyright © 2017. Universidad del Norte. All rights reserved.

Es decir, las oportunidades son de 1 : 2 a favor de que el boxeador gane la pelea. Esto significa
que de cada 1 + 2 = 3 personas, 1 afirma que el boxeador ganará la pelea, y 2, que perderá. 

El siguiente teorema nos muestra una forma de calcular la probabilidad de un evento dado
con base en el conocimiento de las oportunidades en favor o en contra del evento:

Teorema 2.3.23 Si las oportunidades son de n : m en favor de A, entonces la probabilidad


n
de que ocurra el eventa A es P (A) = n+m .

2.3. Introducción a la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
148 Llinás / Rojas

Ejemplo 2.3.24 Si las oportunidades son de 5:3 en contra de que la Selección Colombia pierda
el partido de fútbol, ¿cuál es la probabilidad de que (a) pierda, (b) gane?

SOLUCIÓN:
Sea A el evento de que la Selección Colombia pierda el partido. Por tanto, por el teorema 2.3.23,
P (A) = 5+3 5
= 58 = 0, 625. Por consiguiente, P (A) = 1 − P (A) = 38 = 0, 375. Es decir, de 1.000
personas, 625 dirán que Colombia perderá el partido y el resto, que son 375, dirá que Colombia
lo ganará. 

Ejemplo 2.3.25 Para un partido entre Junior de Barranquilla y Unión de Santa Marta, le ofrecen
a Mario las siguientes apuestas:
Tarifa : $15.000.
Ganancia : $30.000 si Junior gana y Mario apuesta por Junior.
$20.000 si Unión gana y Mario apuesta por Unión.

El juego Junior vs Unión sigue hasta que haya un ganador. Mario acepta esta apuesta, pero no
puede decidirse si apuesta a Junior o a Unión. Determine su probabilidad subjetiva.

SOLUCIÓN:
La probabilidad subjetiva de Mario la determinamos como sigue: “Mario no puede decidirse”
significa que
30 P (“Junior gana”) = 20 P (“Unión gana”).

Además, obviamente, se tiene que

P (“Junior gana”) + P (“Unión gana”) = P (“Junior o Unión gana”) = 1.

Por lo tanto, resulta que P (“Junior gana”) = 2


5 y P (“Unión gana”) = 35 . 

✍ Ejercicios de la sección 2.3


39. La probabilidad de que Alfonso viaje a Alemania es 0,6, y la probabilidad de que viaje a
España es 0,3, y la probabilidad de que viaje a alguno de las dos paı́ses es 0,8. Calcule la
probabilidad de cada uno de los siguientes eventos:
Copyright © 2017. Universidad del Norte. All rights reserved.

(a) Alfonso viaja a ambos paı́ses.


(b) Alfonso viaja a Alemania pero no a España.
(c) Alfonso viaja a España pero no a Alemania.
(d) Alfonso no viaja a ninguno de los dos paı́ses.

40. Se estimó que un 28% de los estudiantes de último curso de un campus universitario estaban
seriamente preocupados por sus posibilidades de encontrar trabajo, el 35% por sus notas y
el 20% por ambas cosas. ¿Cuál es la probabilidad de que un estudiante de último curso,
elegido al azar en el campus, esté seriamente preocupado por al menos una de las dos cosas?

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 149

41. Un jefe de cierta compañı́a recibe un determinado artı́culo en paquetes de 100. Un estudio ha
indicado las probabilidades, que figuran en la tabla adjunta, correspondientes a los artı́culos
defectuosos de un paquete:

Número de defectuosas 0 1 2 3 más de 3


Probabilidad 0,03 0,29 0,10 0,22 0,36

(a) ¿Cuál es la probabilidad de que haya dos o más artı́culos defectuosos en un paquete?
(b) ¿Cuál es la probabilidad de que haya por lo menos un artı́culo defectuoso en un paquete?

42. Si los cumpleaños ocurren con la misma probabilidad en cualquiera de los 365 dı́as del año
(se ignoran años bisiestos y el hecho de que las tasas de natalidad no son uniformes durante
el año).

(a) Calcule la probabilidad de que no haya dos personas, en un grupo de 3 personas, con
el mismo dı́a de cumpleaños?
(b) Calcule la misma probabilidad de la parte (a) para el caso en que haya n personas en
vez de 3.

43. Si tres de veinte llantas están defectuosas y se seleccionan cuatro de éstas al azar para una
supervisión, ¿cuál es la probabilidad de que se incluya una de las llantas defectuosas?

44. Un dado se lanza dos veces. Encuentre la probabilidad de obtener (a) un 5 o un 7, (b) a lo
más un 9, (c) una suma impar y (d) un múltiplo de 4.

45. Una urna tiene seis bolas verdes, cinco rojas y cuatro blancas (cada bola es de un solo
color). Si se extrae una bola, calcule la probabilidad de que ésta sea (a) no verde, (b) no
roja, (c) roja y verde, (d) blanca o roja. Compare el resultado de (d) con el obtenido en
(a). Interprete siempre sus respuestas.

46. Se lanzan dos dados. Calcule la probabilidad de que la suma de los números obtenidos sea
(a) 13, (b) a lo sumo 3, (c) por lo menos 4, (d) 5 o 6, (e) 5 y 6. Interprete siempre sus
resultados.

47. Una caja contiene dos bolas negras, tres blancas y cuatro rojas. Se seleccionan dos bolas,
Copyright © 2017. Universidad del Norte. All rights reserved.

una después de la otra.

(a) ¿Cuál es la probabilidad de que la primera bola sea negra y la segunda blanca?
(b) ¿Cuál es la probabilidad de obtener una bola negra y una blanca?
(c) Repita los incisos anteriores si la selección es con reemplazo.

48. En una comunidad, el 30% de las personas son fumadoras, 55% son bebedoras y 20% tanto
fumadoras como bebedoras. Calcule la probabilidad de que una persona elegida al azar
(a) fume pero no beba, (b) ni fume ni beba, (c) fume o no beba. Interprete siempre sus
resultados.

2.3. Introducción a la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
150 Llinás / Rojas

49. Una entidad educativa ha propuesto tres proyectos para la mejora de la educación en cierta
región del paı́s. Para i = 1, 2, 3, sea Ai el evento que representa al evento “el proyecto i fue
aceptado”. Supongamos que

P (A1 ) = 0, 30, P (A2 ) = 0, 22, P (A3 ) = 0, 35, P (A1 ∩ A2 ) = 0, 08,


P (A1 ∩ A3 ) = 0, 09, P (A2 ∩ A3 ) = 0, 06, P (A1 ∩ A2 ∩ A3 ) = 0, 02

Exprese verbalmente cada uno de los siguientes eventos y determine la probabilidad de que
ocurra cada uno de ellos:

(a) A1 ∪ A2 , (b) A1 ∩ A2 , (c) A1 ∪ A2 ∪ A3 ,


(d) A1 ∩ A2 ∩ A3 , (e) A1 ∩ A2 ∩ A3 , (f) (A1 ∩ A2 ) ∪ A3

50. Una caja contiene diez bombillas, cuatro de las cuales están defectuosas. Si se seleccionan
aleatoriamente y sin reemplazo cuatro bombillas de la caja, ¿cuál es la probabilidad de que
el grupo contenga (a) dos (b) al menos dos bombillas defectuosas?

51. Una caja contiene cuatro focos rojos, cinco blancos y seis amarillos. Si se seleccionan uno
por uno, en orden aleatorio, ¿cuál es la probabilidad de que al menos se seleccionen dos
focos para obtener uno amarillo?

52. Una caja contiene diez tornillos, de los cuales tres están defectuosos. Se extraen tres tornillos
sin reemplazo. Calcule la probabilidad de que los tres tornillos no estén defectuosos.

53. Para un control de calidad se seleccionan aleatoriamente dos ventiladores, sin reemplazo,
de un lote. Si uno de los dos ventiladores está defectuoso, todo el lote será rechazado. Si
una muestra de 200 ventiladores tiene cinco defectuosos, calcule la probabilidad de que la
muestra sea rechazada.

54. Una biblioteca tiene cinco ejemplares (digamos, matemática, fı́sica, quı́mica, biologı́a y
estadı́stica), de los cuales hay dos ejemplares (digamos, matemática y fı́sica) que son de
primera edición, y el resto, de segunda edición. Serán seleccionados al azar dos ejemplares
para ser puestos en reserva durante 3 horas. ¿Cuál es la probabilidad de que

(a) ambos ejemplares seleccionados sean primeras ediciones?


(b) ambos ejemplares seleccionados sean segundas ediciones?
Copyright © 2017. Universidad del Norte. All rights reserved.

(c) al menos uno de los ejemplares seleccionados sea de primera edición?


(d) los ejemplares seleccionados sean de diferentes ediciones?

55. Se escoge un número comprendido entre 0 y 999. ¿Cuál es la probabilidad de que el dı́gito
central sea mayor que los otros dos?

56. En el menú del dı́a, un restaurante vegetariano ofrece una ensalada especial que contiene
tres tipos de verduras distintas que son las preferidas por ciertos habitantes de una ciudad:
Espárrago (A), brócoli (B) y coliflor (C). A continuación aparece el porcentaje de clientes
del restaurante que pide determinada(s) verdura(s):

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 151

70% A, 80% B, 75% C, 85% A o B,


90% A o C, 95% B o C, 98% A, B o C

en donde, por ejemplo, el evento A o C significa que por lo menos una de las opciones A o
C fue solicitada. Calcule las probabilidades de los siguientes eventos:

(a) El siguiente cliente pide, por lo menos, una de las tres opciones.
(b) El siguiente cliente no pide ninguna de las tres opciones.
(c) El siguiente comprador sólo pide la opción A y ninguna de las otras dos opciones.
(d) El siguiente cliente pide exactamente una de las tres opciones.

57. Supongamos que un determinado árbol puede tener tres tipos de enfermedades: Hojitis (H),
tallitis (T) y frutitis (F). Suponga que

P (H) = 0, 12, P (T ) = 0, 07, P (F ) = 0, 05, P (H ∪ T ) = 0, 15,


P (H ∪ F ) = 0, 14, P (T ∪ F ) = 0, 10, P (H ∩ T ∩ F ) = 0, 01

(a) ¿Cuál es la probabilidad de que el árbol no tenga hojitis?


(b) ¿Cuál es la probabilidad de que el árbol tenga hojitis y tallitis al mismo tiempo?
(c) ¿Cuál es la probabilidad de que el árbol tenga hojitis y tallitis al mismo tiempo pero
no frutitis?
(d) ¿Cuál es la probabilidad de que que el árbol tenga exactamente dos de esas enfer-
medades?

58. Una persona desea comprar un computador. De alguna manera, logra conseguir una lista
de las direcciones de 15 personas que quieren vender sus computadores. Pero la persona
tiene tiempo para ir sólo a cuatro direcciones de la lista.

(a) ¿En cuántas formas podrı́an escogerse las cuatro direcciones si se considera el orden de
visita?
(b) ¿En cuántas formas podrı́an escogerse las cuatro direcciones si el orden no importa?
(c) Si en siete direcciones los computadores son nuevos y en ocho ya han sido vendidos
Copyright © 2017. Universidad del Norte. All rights reserved.

previamente, y las cuatro direcciones por visitar se escogen al azar y sin orden, ¿cuál es
la probabilidad de que en las cuatro direcciones donde vaya la persona los computadores
sean nuevos?

59. Al poco tiempo de ponerse a funcionar, algunos computadores fabricados por ciertas compañı́as
presentan problemas con el funcionamiento de un determinado programa (digamos, Futbol-
net) que viene previamente instalado. Suponga que una pequeña empresa tiene 30 de estos
computadores y que ha habido problemas con el funcionamiento del Futbolnet en 7 de ellos.

(a) ¿Cuántas formas hay de seleccionar una muestra de 10 computadores de los 30 para
una revisión completa?

2.3. Introducción a la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
152 Llinás / Rojas

(b) ¿En cuántas formas puede una muestra de 10 computadores contener exactamente 3
con problemas en el funcionamiento del Futbolnet?
(c) Si se escoge al azar una muestra de 10 computadores, ¿cuál es la probabilidad de que
exactamente 3 de los 10 tengan problemas con el funcionamiento del Futbolnet?
(d) Si se escoge al azar una muestra de 10 computadores, ¿cuál es la probabilidad de que
al menos 6 de los seleccionados tengan problemas con el funcionamiento del Futbolnet?

60. En cierta bodega, una caja contiene ocho clavos de 1 pulgada, seis de 1 pulgada y media y
cinco de 2 pulgadas. Suponga que se seleccionan cuatro clavos al azar, sin reemplazo y sin
orden.

(a) ¿Cuál es la probabilidad de que exactamente tres de los clavos seleccionados sean de 2
pulgadas?
(b) ¿Cuál es la probabilidad de que los cuatro clavos seleccionados sean del mismo tamaño?
(c) ¿Cuál es la probabilidad de que entre los cuatro clavos seleccionados hallan dos de una
pulgada?

61. Un estante tiene 4 libros de quı́mica, 5 de estadı́stica y 3 de matemáticas. Si los libros de


estadı́stica son diferentes entre sı́, encuentre la probabilidad de que 2 libros determinados
de estadı́stica se encuentre juntos teniendo en cuenta cada una de las siguientes situaciones:

(a) Los libros de cada tipo son todos diferentes entre sı́.
(b) Los libros de quı́mica son iguales entre sı́, pero los de matemáticas son todos diferentes.
(c) Hay 2 libros de quı́mica que son iguales, pero todos los de matemáticas son iguales entre
sı́.
(d) A excepción de los de estadı́stica, los libros de cada tipo son todos iguales entre sı́.

2.4 Probabilidades condicionales


Supongamos que estamos interesados en dos sucesos A y B, y se nos da la información
adicional de que B ha ocurrido. Una pregunta de interés es, entonces ¿cuál es la probabilidad
de que A ocurra? La idea principal es que la posibilidad de que cualquier suceso ocurra es
Copyright © 2017. Universidad del Norte. All rights reserved.

probable que dependa de la ocurrencia o no ocurrencia de otros eventos.

Ejemplo 2.4.1 Analizemos las siguientes situaciones:

(a) Un fabricante que planea introducir una nueva marca puede poner a prueba el producto a
través de su venta en una serie reducida de almacenes particularmente escogidos. Es probable
que el fabricante confı́e mucho más en el éxito de la nueva marca en el mercado si el producto
resulta bien acogido en el test inicial que en caso contrario. El análisis de la empresa corres-
pondiente a la probabilidad de un elevado número de ventas estará, por tanto, condicionada
por el resultado de mercado.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 153

(b) En un barrio hay personas que saben nadar, otras que saben manejar bicicletas, y otras,
ambas cosas. Se selecciona una persona al azar y deseamos la probabilidad de que la persona
sepa nadar dado que sabe manejar bicicleta.

Por tanto, en ambas situaciones tenemos que estar interesados en la ocurrencia de un determinado
evento, dada la ocurrencia de otro.

Ahora, analicemos otro ejemplo.

Ejemplo 2.4.2 Supongamos que en una empresa hay 100 empleados, de los cuales 30 son mujeres
y 70 hombres. Supongamos, además, que hay 21 mujeres y 33 hombres que fuman (compárese
con la tabla 2.3).

Tabla 2.3: Clasificación de 100 empleados de una empresa


Hombre (H) Mujer (M )
Fuma (F ) 33 21
No fuma (F ) 37 9

(a) Si se saca un individuo al azar, determinar la probabilidad de que sea mujer.

(b) Si se saca un individuo, determinar la probabilidad de que sea mujer y fume.

(c) Si del grupo de las 30 mujeres se saca un individuo, determinar la probabilidad de que fume.

SOLUCIÓN:
30
(a) La probabilidad de que sea mujer es P (M ) = 100 .

(b) La probabilidad de que sea una mujer y que fuma es P (M ∩ F ) = 21


100 .

(c) La probabilidad de que una mujer fume de un total de 30 la simbolizaremos por P (F/M ) y
es igual a
21 21/100 P (F ∩ M )
P (F/M ) = = =
30 30/100 P (M )
∩M )
Es decir, P (F/M ) = P P(F(M ) , que es la forma como se calcula la llamada probabilidad condi-
cional de un evento F , sabiendo que ya ha ocurrido M . 
Copyright © 2017. Universidad del Norte. All rights reserved.

Estos tipos de problemas conllevan a considerar el concepto de probabilidad condicional.

Definición 2.4.3 Sean A y B dos eventos de un espacio muestral Ω = ∅. La probabi-


lidad condicional del evento A dado el evento B, simbolizada por P (A/B), se define
como
P (A ∩ B)
P (A/B) = , si P (B) > 0
P (B)

2.4. Probabilidades condicionales

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
154 Llinás / Rojas

Ejemplo 2.4.4 Una persona lanza una moneda tres veces, ¿cuál es la probabilidad de obtener 3
caras dado que salió por lo menos una cara?

SOLUCIÓN:
Los posibles resultados que se pueden obtener al lanzar la moneda tres veces son:

(C, C, C), (C, C, S), (C, S, C), (C, S, S), (S, C, C), (S, C, S), (S, S, C), (S, S, S)

Sean A y B los eventos “salió por lo menos una cara” y “obtener 3 caras” respectivamente.
Entonces, B = {(C, C, C)} y

A = {(C, C, C), (C, C, S), (C, S, C), (C, S, S), (S, C, C), (S, C, S), (S, S, C)}

Debido a que A ∩ B = {(C, C, C)}, entonces la probabilidad de obtener 3 caras sabiendo que salió
una cara es igual a
P (A ∩ B) 1/8 1
P (B/A) = = = 
P (A) 7/8 7

Despejando P (B ∩ A) en las expresiones dadas en la definición 2.4.3 obtenemos el llamado

Teorema 2.4.5 (Teorema de multiplicación para 2 eventos) Si A y B son dos even-


tos de un espacio muestral Ω = ∅ y si P (B ∩ A) > 0, entonces

P (B ∩ A) = P (B/A) P (A) o por P (B ∩ A) = P (A/B) P (B)

Ejemplo 2.4.6 Supongamos que una caja tiene diez bolas, de las cuales tres están defectuosas.
Se sacan dos bolas, una detrás de la otra y sin reemplazo. ¿Cuál es la probabilidad de sacar una
bola defectuosa seguida de otra defectuosa?

SOLUCIÓN:
Sean A el evento “la primera bola sacada está defectuosa” y B el evento “la segunda bola sacada
está defectuosa”. Nos piden calcular P (A ∩ B). Debido a que tres de las diez bolas están defectu-
3
osas, se tiene que P (A) = 10 . Ahora, como ya se ha sacado 1 bola defectuosa de la caja, quedan
en total 9 bolas disponibles, de entre las cuales hay ahora 2 defectuosas. Por tanto, P (B/A) = 29 .
Copyright © 2017. Universidad del Norte. All rights reserved.

Por consiguiente, por el teorema de multiplicación (teorema 2.4.5), obtenemos que


3 2
P (A ∩ B) = P (A) P (B/A) = · = 0, 066
10 9
Es decir, la probabilidad de sacar una bola defectuosa seguida de otra bola defectuosa es aproxi-
madamente de 0,066. 

La regla de multiplicación es más útil cuando el experimento consta de varias etapas suce-
sivas.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 155

Teorema 2.4.7 (Teorema de multiplicación para n eventos) Si A1 , . . . , An son


eventos de un espacio muestral Ω = ∅ y si P (A1 ∩ · · · ∩ An ) > 0, entonces

P (A1 ∩ · · · ∩ An ) = P (A1 ) · P (A2 /A1 ) · P (A3 /A1 ∩ A2 ) · · · P (An /A1 ∩ · · · ∩ An−1 )

Como podemos observar claramente, en este teorema hemos considerando que A1 es el evento que sucede
primero, luego A2 , posteriormente A3 , y ası́ sucesivamente hasta que sucede el último evento, que en nuestro
caso es An .

Del teorema 2.4.7 obtenemos en particular que

• Si n = 2, se tiene que

P (A1 ∩ A2 ) = P (A1 ) · P (A2 /A1 )

• Si n = 3, se tiene que

P (A1 ∩ A2 ∩ A3 ) = P (A1 ) · P (A2 /A1 ) · P (A3 /A1 ∩ A2 )

• Si n = 4, se tiene que

P (A1 ∩ A2 ∩ A3 ∩ A4 ) = P (A1 ) · P (A2 /A1 ) · P (A3 /A1 ∩ A2 ) · P (A4 /A1 ∩ A2 ∩ A3 )

Ejemplo 2.4.8 Una caja contiene 6 fichas rojas, 4 blancas y 5 azules. Halle la probabilidad de
que se extraigan en el orden roja, blanca y azul si las fichas (a) se reemplazan, (b) no se reemplazan.

SOLUCIÓN:
Hay tres eventos que debemos considerar para el problema:

R = “roja en la primera extracción”.

B = “blanca en la segunda extracción”.

A = “azul en la tercera extracción”.

Nos piden calcular P (R ∩ B ∩ A). Al aplicar el teorema general de multiplicación (teorema 2.4.7)
Copyright © 2017. Universidad del Norte. All rights reserved.

para el caso de n = 3 eventos, tenemos:

P (R ∩ B ∩ A) = P (R) · P (B/R) · P (A/R ∩ B) (1)

Obsérvese que en la caja hay disponible, inicialmente, 6 + 4 + 5 = 15 fichas.

(a) Si los eventos se reemplazan, entonces reemplazando las correspondientes probabilidades en


la expresión (1), tenemos
6 4 5 8
P (R ∩ B ∩ A) = · · = = 0, 0355
15 15 15 225

2.4. Probabilidades condicionales

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
156 Llinás / Rojas

(b) Si los eventos no se reemplazan, entonces reemplazando las correspondientes probabilidades


en la expresión (1), tenemos

6 4 5 4
P (R ∩ B ∩ A) = · · = = 0, 044 
15 14 13 91

Los teoremas de multiplicación son útiles al resolver muchos problemas en los que el resul-
tado final de un experimento depende de los resultados de varias etapas intermedias. Ahora
presentaremos otro resultado importante, llamado teorema de la probabilidad total, que nos
será útil para presentar el llamado teorema o regla de Bayes.

Teorema 2.4.9 (Teorema de la probabilidad total) Si los eventos A1 , A2 , . . ., An


forman una partición de un espacio muestral Ω (compárese con la definición 2.1.11) y
si P (Ai ) > 0 para todo i = 1, . . . , n, entonces para cada evento B de Ω se tiene que

P (B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + · · · + P (B/An ) P (An )

Del teorema 2.4.9 se tiene en particular:

• Si n = 2, se tiene que

P (B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 )

• Si n = 3, se tiene que

P (B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + P (B/A3 ) P (A3 )

• Si n = 4, se tiene que

P (B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + P (B/A3 ) P (A3 ) + P (B/A4 ) P (A4 )

Podemos hacer dos comentarios acerca del teorema de la probabilidad total (teorema 2.4.9):
Copyright © 2017. Universidad del Norte. All rights reserved.

• El teorema de la probabilidad total está estrechamente relacionado con el siguiente teorema de la


mecánica: El centro de gravedad de un cuerpo se puede determinar descomponiendo el cuerpo en
cualquier cantidad de partes, suponiendo que la masa de cada una de estas partes está concentrada
en su respectivo centro de gravedad y tomando el centro de gravedad del sistema de puntos originados
por este método.
• El teorema de la probabilidad total también está relacionada con el siguiente análogo quı́mico: En
k recipientes se encuentran diferentes soluciones de la misma sal, en total, 1 litro. Supongamos
que P (An ) simboliza el volumen del n-ésimo recipiente y P (B/An ), la concentración de la solución
en el n-ésimo recipiente. Si se reúne el contenido de todos los recipientes en uno sólo y P (A)
significa la concentración de la solución originada de esta manera, entonces se cumple el teorema de
la probabilidad total.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 157

Ejemplo 2.4.10 La caja I contiene 3 fichas rojas y 2 azules, en tanto que la caja II contiene
2 fichas rojas y 8 azules. Se lanza una moneda no falsa de tal forma que si cae cara, entonces
se saca una ficha de la caja I y, por el contrario, si cae sello, se saca una ficha de la caja II.
Supongamos que quien lanza la moneda no revela si resulta cara o sello (de tal forma que la caja
de la cual se sacó una ficha no se revela). Determine la probabilidad de haber sacado una ficha roja.

SOLUCIÓN:
Sea R el evento “sacar una ficha roja” y supongamos que I y II son los eventos “escoger la caja
I” y “escoger la caja II” respectivamente. Nos piden calcular P (R). En la figura 2.12 podemos
observar claramente estos eventos (obsérvese que el evento R corresponde a la región sombreada).

Figura 2.12: Diagrama para la situación del ejemplo 2.4.10

Ahora, en la caja I hay en total 3 + 2 = 5 fichas, y en la caja II, 2 + 8 = 10. Puesto que
una ficha roja se puede sacar de cualquiera de las cajas, entonces la probabildiad de sacar una
ficha roja de la caja I es P (R/I) = 35 y la de sacar una ficha roja de la caja II es P (R/II) = 10
2
= 15 .

Además, si C y S son los eventos “resultar cara” y “resultar sello”, respectivamente, entonces
la probabilidad de escoger la caja I es P (I) = P (C) = 12 y la de escoger la caja II es P (II) =
P (S) = 12 .

Por consiguiente, por el teorema de la probabilidad total (teorema 2.4.9) con n = 2, se obtiene
que
3 1 1 1 2
P (R) = P (R/I) P (I) + P (R/II) P (II) = · + · = = 0, 4 
5 2 5 2 5
Copyright © 2017. Universidad del Norte. All rights reserved.

Ejemplo 2.4.11 Un editor envı́a propaganda de un libro de estadı́stica al 70% de aquellos pro-
fesores que están a cargo de esa materia. El 40% de aquellos que recibieron la propaganda se
decidieron a utilizar el libro, inclusive, el 20% de los que no recibieron la propaganda también
utilizarán el libro. ¿Cuál es la probabilidad de utilizar el libro?

SOLUCIÓN:
Consideremos los eventos “recibe la propaganda” y “no recibe la propaganda”. Entonces, tenemos
que P (“recibe”)= 0, 70 y P (“no recibe”)= 1 − 0, 70 = 0, 30. Además,

P (“utiliza el libro” / “recibe”) = 0, 40, P (“utiliza el libro” / “no recibe”) = 0, 20.

2.4. Probabilidades condicionales

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
158 Llinás / Rojas

Nos piden calcular P (“utiliza el libro”). Esta la podemos calcular con ayuda del teorema de la
probabilidad total (teorema 2.4.9) de la siguiente manera:

P (“utiliza”) = P (“utiliza”/“recibe”) · P (“recibe”) + P (“utiliza”/“no recibe”) · P (“no recibe”)


= (0, 40)(0, 70) + (0, 20)(0, 30).

Figura 2.13: Diagrama para la situación del ejemplo 2.4.11

Los cálculos y las probabilidades anteriores se pueden observar claramente en el diagrama de árbol
de la figura 2.13. Junto a cada una de las cuatro ramas del diagrama aparecen probabilidades
(que llamaremos “totales”) que fueron calculadas con aplicación del teorema de multiplicación
(véase el teorema 2.4.5) y al final del diagrama aparece la probabilidad calculada que corresponde
a sumar sólo las probabilidades totales en donde aparece el evento “utiliza el libro”. 

Teorema 2.4.12 (Regla o teorema de Bayes) Sea A1 , A2 , . . . , An una partición de un


espacio muestral Ω. Entonces, para cada evento B con P (B) > 0 y para todo k = 1, . . . , n,
se tiene
P (B/Ak ) P (Ak )
P (Ak /B) =
P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + · · · + P (B/An ) P (An )
Copyright © 2017. Universidad del Norte. All rights reserved.

Del teorema de Bayes se tiene, en particular:

• Si n = 2, se tiene que
P (B/Ak ) P (Ak )
P (Ak /B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 )

• Si n = 3, se tiene que
P (B/Ak ) P (Ak )
P (Ak /B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + P (B/A3 ) P (A3 )

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 159

• Si n = 4, se tiene que
P (B/Ak ) P (Ak )
P (Ak /B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + P (B/A3 ) P (A3 ) + P (B/A4 ) P (A4 )

A continuación se presenta el siguiente análogo quı́mico del teorema de Bayes: En k recipientes están
contenidas soluciones de la misma sal con diferentes concentraciones. El volumen total de la solución es
1 litro. Si P (Ak ) es el volumen de la solución en el n-ésimo recipiente y P (B/Ak ) es la concentración de
sal en el n-ésimo recipiente, entonces la fórmula que aparece en el teorema 2.4.12 nos permite calcular qué
porcentaje de la cantidad total de sal está en el k-ésimo recipiente.

La interpretación más importante del teorema de Bayes se basa en la utilización de las


probabilidades subjetivas. Supongamos que una determinada persona está interesada en la
ocurrencia del evento Ak y se forma una opinión subjetiva de la probabilidad de que Ak
ocurra. En este contexto, la probabilidad P (Ak ) se denomina probabilidad a priori.
Si después este individuo consigue información adicional (por ejemplo, que el evento B ha
ocurrido), este hecho puede provocar una modificación de su juicio inicial sobre la probabi-
lidad de ocurrencia de Ak . Dado que se sabe que B ha ocurrido, la probabilidad relevante
correspondiente a Ak es ahora la probabilidad condicional de Ak dado B, que se denota
probabilidad a posteriori. Desde este punto de vista se puede interpretar el teorema
de Bayes como un método que nos permite actualizar una probabilidad a priori cuando se
conoce la información adicional de que el evento Ak ha tenido lugar.

Ejemplo 2.4.13 Considere la situación del ejemplo 2.4.10. Determine la probabilidad de haber
escogido la caja I (es decir, que el resultado de la moneda sea cara).

SOLUCIÓN:
Sean R, I y II eventos definidos como en el ejemplo 2.4.10. Aquı́ nos piden calcular P (I/R)
(compárese con la figura 2.14). Del ejemplo 2.4.10, tenemos que P (R/I) = 53 , P (R/II) = 15 ,
P (I) = P (II) = 12 .
Copyright © 2017. Universidad del Norte. All rights reserved.

Figura 2.14: Diagrama para la situación del ejemplo 2.4.13

Por consiguiente, por el teorema de Bayes (teorema 2.4.12) con n = 2, se obtiene que
P (R/I) P (I) 3
5 · 12 3
P (I/R) = = = = 0, 75
P (R/I) P (I) + P (R/II) P (II) 3
5 · 1
2 + 15 · 1
2
4

2.4. Probabilidades condicionales

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
160 Llinás / Rojas

De este modo, dada la información de que se ha sacado un ficha roja, la probabilidad de haber
escogido la caja I se ve modificada, pasando de P (I) = 0, 5 (a priori) a P (I/R) = 0, 75 (a
posteriori). 

Ejemplo 2.4.14 En cierta ciudad, aproximadamente el 10% de los habitantes está afectado por
una rara enfermedad, para la cual se ha desarrollado una prueba de diagnóstico. A través de esta
prueba se ha determinado que el 85% de los individuos que padecen la enfermedad presentan un
resultado positivo, mientras que el 20% de los individuos sin la enfermedad muestran un resultado
positivo. Supongamos que se hace una prueba en un individuo seleccionado al azar.

(a) ¿Cuál es la probabilidad de que el resultado sea positivo? ¿Y negativo?

(b) Si el resultado es positivo, ¿cuál es la probabilidad de que el individuo tenga la enfermedad?

(c) Si el resultado es negativo, ¿cuál es la probabilidad de que el individuo tenga la enfermedad?

(d) Si el resultado es positivo, ¿cuál es la probabilidad de que el individuo esté sano?

(e) Si el resultado es negativo, ¿cuál es la probabilidad de que el individuo esté sano?

SOLUCIÓN:
Analizando las situaciones del problema, podemos identificar los siguientes eventos:

A = el individuo está enfermo.

A = el individuo está sano.

B = el individuo ha sacado un resultado positivo.

B = el individuo ha sacado un resultado negativo.

Por consiguiente, P (A) = 0, 1, P (A) = 0, 90, P (B/A) = 0, 85 y P (B/A) = 0, 2. Observe que

P (B/A) = 1 − P (B/A) = 0, 15 y P (B/A) = 1 − P (B/A) = 0, 80

Junto a cada una de las cuatro ramas del diagrama aparecen probabilidades (que ya hemos llamado
“totales”) que fueron calculadas con aplicación del teorema de multiplicación (véase el teorema
2.4.5). Todas estas probabilidades se pueden identificar fácilmente en el diagrama de árbol de la
Copyright © 2017. Universidad del Norte. All rights reserved.

figura 2.15.
En (a) nos piden calcular P (B) y P (B). Para calcular la probabilidad de que ocurra B, aplicaremos
el teorema de la probabilidad total con n = 2 (véase el teorema 2.4.9). De igual manera, también
aplicaremos este mismo teorema para calcular la probabilidad de que ocurra B. Esto lo haremos
de la siguiente manera:

• Sumando las dos probabilidades totales ubicadas en las ramas correspondiente a un resultado
positivo, obtenemos:

P (B) = P (A) P (B/A) + P (A) P (B/A) = 0, 085 + 0, 18 = 0, 265

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 161

Figura 2.15: Diagrama de árbol para los datos del ejemplo 2.4.13

• Sumando las dos probabilidades totales ubicadas en las ramas correspondiente a un resultado
negativo, obtenemos:

P (B) = P (A) P (B/A) + P (A) P (B/A) = 0, 015 + 0, 72 = 0, 735

Para calcular las probabilidades pedidas en (b)-(d) aplicaremos el teorema de Bayes con n = 2
(teorema 2.4.12) de la siguiente manera:

(b) Nos piden calcular P (A/B):


P (A ∩ B) 0, 085
P (A/B) = = = 0, 3207
P (B) 0, 265

(c) Nos piden calcular P (A/B):

P (A ∩ B) 0, 015
P (A/B) = = = 0, 0204
P (B) 0, 735

(d) Nos piden calcular P (A/B):


Copyright © 2017. Universidad del Norte. All rights reserved.

P (A ∩ B) 0, 18
P (A/B) = = = 0, 6792
P (B) 0, 265

(e) Nos piden calcular P (A/B):

P (A ∩ B) 0, 72
P (A/B) = = = 0, 979
P (B) 0, 735

Obsérvese que para C = B o C = B se cumple que P (A/C) = 1−P (A/C), propiedad que siempre
se cumple para todo par de eventos A y C de un espacio muestral. 

2.4. Probabilidades condicionales

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
162 Llinás / Rojas

Ejemplo 2.4.15 Un analista de bolsa examina las perspectivas de las acciones de un gran número
de compañı́as. Cuando se investigó el comportamiento de estas acciones un año antes, se descubrió
que el 15% experimentó un crecimiento superior al de la media, el 40% inferior y el 45% restante
se mantuvo alrededor de la media. El 30% de los valores que crecieron por encima de la media
fueron clasificados como “buenas adquisiciones” por el analista, al igual que el 15% de las que
crecieron alrededor de la media y el 20% de las que tuvieron un crecimiento inferior. ¿Cuál es
la probabilidad de que un valor clasificado como “buena adquisición” por el analista crezca por
encima de la media del mercado?

SOLUCIÓN:
Definiendo los eventos

A1 : “crecimiento superior a la media”,

A2 : “crecimiento alrededor de la media”,

A3 : “crecimiento inferior a la media”,

B : el valor se considera como “buena adquisición”,

tenemos las probabilidades P (A1 ) = 0, 15, P (A2 ) = 0, 40, P (A3 ) = 0, 35 y las probabilidades
condicionales P (B/A1 ) = 0, 30, P (B/A2 ) = 0, 15, P (B/A3 ) = 0, 20. Necesita calcular la probabi-
lidad de que un valor crezca por encima de la media, dado que fue considerado “buena adquisición”
por el analista. Es decir, buscamos la probabilidad condicional P (A1 /B), la cual se deduce ha-
ciendo uso del teorema de Bayes (teorema 2.4.12) de la siguiente manera:

P (B/A1 )P (A1 )
P (A1 /B) =
P (B/A1 )P (A1 ) + P (B/A2 )P (A2 ) + P (B/A3 )P (A3 )
(0, 30)(0, 25)
= = 0, 3658 
(0, 30)(0, 25) + (0, 15)(0, 40) + (0, 20)(0, 35)

Ejemplo 2.4.16 Por un canal de comunicaciones afectado por ruido se transmite uno de dos
comandos de control en forma de palabras de código 11111 y 00000. Esto se transmite con pro-
babilidad a priori de 0,7 y 0,3 respectivamente. Por causa del ruido, la probabilidad de recepción
correcta de cada uno de los sı́mbolos disminuye a 0,6. Se supone que las palabras de código
Copyright © 2017. Universidad del Norte. All rights reserved.

se dañan o distorsionan independientemente. En la salida del receptor se registra la palabra de


código 10110. Determine qué comando fue transmitido.

SOLUCIÓN:
Consideremos los siguientes eventos:

A: “se registró la palabra de código 10110”;

H1 : “se transmitió 11111”;

H2 “se transmitió 00000”.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 163

Por consiguiente, P (H1 ) = 0, 7 y P (H2 ) = 0, 3. Para poder saber cuál fue la palabra de código
transmitida, calcularemos P (H1 /A) y P (H2 /A) y decidiremos nuestra respuesta teniendo la pro-
babilidad de mayor valor. Ahora,

P (A/H1 ) = (0, 6)(0, 4)(0, 6)(0, 6)(0, 4) = 0, 035,


P (A/H2 ) = (0, 4)(0, 6)(0, 4)(0, 4)(0, 6) = 0, 023

Aplicando el teorema de Bayes (teorema 2.4.12) tenemos:


P (A/H1 )P (H1 )
P (H1 /A) =
P (A/H1 )P (H1 ) + P (A/H2 )P (H2 )
(0, 035)(0, 7)
= = 0, 78
(0, 035)(0, 7) + (0, 023)(0, 3)

De manera análoga, encontramos que P (H2 /A) = 0, 22. Por consiguiente, como P (H1 /A) = 0, 78
es mayor que P (H2 /A) = 0, 22, podemos afirmar que la palabra de código transmitida fue 11111.


✍ Ejercicios de la sección 2.4


62. Cierta empresa construye mesas de madera (M) o de vidrio (V) y se pueden adquirir en
uno de cuatro colores: azul (A), roja (R), blanca (B) y natural (N). Las probabilidades
correspondientes de las diversas combinaciones de tipo de material y color son las siguientes:

Mesas Azul Roja Blanca Natural


Madera 0,13 0,13 0,14 0,10
Vidrio 0,15 0,12 0,12 0,11

(a) Calcule e interprete P (R), P (M ) y P (R ∩ M ).


(b) Calcule P (R/M ) y P (M/R) e interprete los valores de cada una de las probabilidades.
(c) Calcule e interprete P (N/V ) y P (N/V ).

63. La siguiente tabla recoge las proporciones de adultos en cierta ciudad, clasificadas en aquellos
que fuma o no fuman y aquellos que tienen problemas de salud:
Copyright © 2017. Universidad del Norte. All rights reserved.

Problemas Fuman No fuman


Sı́ 0,15 0,09
No 0,18 0,58

(a) ¿Cuál es la probabilidad de que un adulto de esta población elegido al azar tenga
problemas de salud?
(b) ¿Cuál es la probabilidad de que un adulto de esta población elegido fume?
(c) ¿Cuál es la probabilidad de que un adulto de esta población elegido al azar que no fume
tenga problemas de salud?

2.4. Probabilidades condicionales

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
164 Llinás / Rojas

64. La probabilidad de que Eduardo vea cierto programa de televisión es 0,4 y la probabilidad
de que su esposa Ana vea el programa es 0,5. La probabilidad de Eduardo vea el programa
sabiendo que Ana lo hace es 0,7. Encuentre la probabilidad de que

(a) Eduardo y Ana vean el programa;


(b) Ana vea el programa sabiendo que Eduardo lo hace;
(c) al menos uno de los dos vea el programa.

65. En cierta bodega, una caja contiene ocho clavos de 1 pulgada, seis de 1 pulgada y media
y cinco de 2 pulgadas. Suponga que se seleccionan tres clavos al azar, sin reemplazo y sin
orden.

(a) Si se ve que al menos uno de ellos es de 1 pulgada, ¿cuál es la probabilidad de que los
tres sean de 1 pulgada?
(b) Si al menos uno de los tres seleccionados no es de 2 pulgadas, ¿cuál es la probabilidad
de que los tres clavos tengan el mismo tamaño?

66. Una billetera tiene cinco billetes de $10.000 y siete de $20.000, y una segunda billetera
guarda ocho billetes de $10.000 y cuatro de $20.000. Se escoge al azar un billete de la
primera billetera y se coloca en la segunda. Después se selecciona un billete de la segunda
billetera y se coloca en la primera. ¿Cuál es la probabilidad de que se seleccione un billete
de $10.000 de la primera billetera y uno de $10.000 de la segunda?

67. Tres parejas de casados han comprado boletas para el cine y se sientan en una fila formada
por seis asientos. Supongamos que se sientan al azar.

(a) Utilice la regla de multiplicación para calcular la probabilidad de que una pareja (diga-
mos, José y Carmen) se siente junta en el extremo izquierdo y que otra pareja (digamos,
Jorge y Nubia) se siente junta en el medio.
(b) Sabiendo que Jorge y Nubia ya se han sentado juntos en el medio, ¿cuál es la proba-
bilidad de que los otros dos esposos (digamos, José, Ricardo) se sienten junto a sus
respectivas esposas (Carmen y Ana respectivamente).
(c) Sabiendo que Jorge y Nubia ya se han sentado juntos, ¿cuál es la probabilidad de que
todos los esposos se sienten junto a sus esposas?
Copyright © 2017. Universidad del Norte. All rights reserved.

68. Una entidad educativa ha propuesto tres proyectos para la mejora de la educación en cierta
región del paı́s. Para i = 1, 2, 3, sea Ai el evento que representa al evento “el proyecto i fue
aceptado”. Supongamos que

P (A1 ) = 0, 30, P (A2 ) = 0, 22, P (A3 ) = 0, 35, P (A1 ∩ A2 ) = 0, 08,


P (A1 ∩ A3 ) = 0, 09, P (A2 ∩ A3 ) = 0, 06, P (A1 ∩ A2 ∩ A3 ) = 0, 02

Determine las siguientes probabilidades y exprese verbalmente cada uno de los eventos cuya
probabilidad ha sido calculada:

(a) P (A2 /A1 )

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 165

(b) P (A2 ∩ A1 /A1 )


(c) P (A2 ∪ A3 /A1 )
(d) P (A1 ∩ A2 ∩ A3 /A1 ∪ A2 ∪ A3 )

69. Un lote contiene 15 piezas fundidas de un proveedor local y 25 piezas fundidas de un


proveedor del pueblo contiguo. Se seleccionan dos piezas fundidas al azar, sin reemplazo,
del lote de 40. Si A denota el evento de que la primera pieza fundida seleccionada es del
proveedor local y si B denota el evento de que la segunda pieza fundida seleccionada es del
proveedor local, determine:

(a) P (A), P (B), P (A ∩ B) utilizando las técnicas de conteo.


(b) P (B/A) y P (A/B) utilizando la definición de probabilidad condicional.
(c) P (A ∪ B) aplicando el teorema de adición para dos eventos.

70. En cierto batallón, 35% de los soldados reclutados son de estrato 1 y el resto, de estrato
2. De los soldados reclutados del estrato 1, el 85% no son hijos únicos, mientras que el
25% de los del estrato 2 lo son. Supongamos que se selecciona un soldado al azar para una
entrevista.

(a) Si es hijo único, ¿cuál es la probabilidad de que sea del estrato 1? ¿Del estrato 2?
(b) Si no es hijo único, ¿cuál es la probabilidad de que provenga del estrato 1? ¿Del estrato
2?

71. En cierta empresa, 31% de los empleados son europeos, 42% asiáticos y 27% latinoame-
ricanos. De los empleados europeos, 34% son mujeres; de los asiáticos, 42%, y de los
latinoamericanos, 72%.

(a) ¿Cuál es la probabilidad de que un empleado seleccionado al azar sea una (mujer)
europea? ¿(Hombre) asiático?
(b) ¿Cuál es la probabilidad de que un empleado seleccionado al azar sea una mujer? ¿Hom-
bre?
(c) Si un empleado seleccionado al azar es una mujer, ¿cuál es la probabilidad de que sea
Copyright © 2017. Universidad del Norte. All rights reserved.

europea? ¿Asiática? ¿Latinoamericana?


(d) Repita el inciso anterior teniendo en cuenta que el empleado seleccionado sea un hombre.

72. Una empresa fabrica computadores, cuyo disco duro tiene capacidad de 20 GB y otros de 30
GB. En el mes anterior, 35% de los computadores vendidos fueron los que tienen disco duro
de 20 GB. De los compradores de computadores con disco duro de 20 GB, 45% compran
los que tienen memoria RAM de 356 MB, mientras que el 30% de los compradores de
computadores con disco duro de 30 GB también lo hacen ası́. Si sabemos que un comprador
seleccionado al azar ha comprado un computador con memoria RAM de 356 MB, ¿cuál es
la probabilidad de que tenga un computador con disco duro de 30 GB?

2.4. Probabilidades condicionales

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
166 Llinás / Rojas

73. Se envı́an lapiceros de diversos colores a un proveedor de artı́culos escolares en lotes de


20. Suponga que el 50% de estos lotes no tienen lapiceros defectuosos; 30%, un lapicero
defectuoso y el resto de los lotes, dos lapiceros defectuosos. Sin tener en cuenta el orden,
supongamos que el proveedor selecciona al azar dos lapiceros de un lote y los prueba. ¿Cuáles
son las probabilidades correspondientes de que haya 0, 1 y 2 lapiceros defectuosos en el lote
bajo cada una de las dos siguientes situaciones? (Sugerencia: Dibuje primero un diagrama
de árbol en donde las tres primeras ramas principales corresponden a los tres tipos diferentes
de lotes).

(a) Ningún lapicero probado está defectuoso.


(b) Uno de los dos lapiceros probados está defectuoso.
(c) Ambos lapiceros probados están defectuosos.

74. Una prestigiosa universidad de Barranquilla utiliza tres hoteles locales para proporcionar
hospedaje nocturno a sus profesores invitados. Supongamos que a 25% de los profesores
se les asignan habitaciones en el Hotel Las Nieves, al 45% en el Hotel El Mar y al 30% en
el Hotel San Felipe. Si hay una decorado especial en 3% de la habitaciones del Hotel Las
Nieves, 5% del Hotel El Mar y en 8%de las habitaciones del Hotel San Felipe, ¿cuál es la
probabilidad de que

(a) a un cliente se le asigne una habitación con decorado especial?


(b) a una persona con una habitación que tiene un decorado especial se le haya acomodado
en el Hotel El Mar?

75. Para clientes que compran una estufa especial en un almacén electrodoméstico considere los
siguientes eventos:

A =“La estufa comprada es colombiana”;


B =“El comprador quiere una estufa de gas”;
C =“El comprador quiere una estufa con 6 fogones”.

Supongamos que sean dadas las siguientes probabilidades: P (A) = 0.30, P (B/A) = 0, 75,
P (B/A) = 0, 89, P (C/A ∩ B) = 0, 90, P (C/A ∩ B) = 0, 55, P (C/A ∩ B) = 0, 62 y P (C/A ∩
B) = 0, 40.
Copyright © 2017. Universidad del Norte. All rights reserved.

(a) Construya un diagrama de árbol colocando cada evento en niveles diferentes y encima
de cada una de él, las probabilidades correspondientes.
(b) ¿Cuál es la probabilidad de que la estufa comprada sea colombiana, de gas y con 6
fogones?
(c) ¿Cuál es la probabilidad de que la estufa comprada sea de gas y con 6 fogones?
(d) ¿Cuál es la probabilidad de que la estufa comprada no sea de 6 fogones?
(e) ¿Cuál es la probabilidad de que la estufa comprada sea colombiana sabiendo que es de
gas y con 6 fogones?

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 167

76. Una emisora de bonos municipales tiene tres categorı́as de clasificación (A, B y C). Suponga
que el año pasado, de los bonos municipales que se emitieron en cierto paı́s, 70% tuvieron
clasificación A, 20% clasificación B y 10% clasificación C. De los bonos municipales con
clasificación A, 50% fueron emitidos en ciudades, 40% en suburbios y 10% en áreas rurales.
De los bonos municipales con clasificación B, 60% fueron emitidos en ciudades, 20% en
suburbios y 20% en áreas rurales. De los bonos municipales con clasificación C, 90% fueron
emitidos en ciudades, 5% en suburbios y 5% en áreas rurales.

(a) ¿Qué proporción de bonos municipales emiten las ciudades? ¿Los suburbios? ¿Las áreas
rurales?
(b) Si una ciudad emitiera un nuevo bono municipal, ¿cuál serı́a la probabilidad de que
tuviera clasificación A?

77. Se les preguntó a los suscriptores de un periódico local si leı́an regularmente, ocasionalmen-
te o nunca la sección de deportes y, también, si habı́an practicado fútbol durante el año
anterior. La proporciones obtenidas en la encuesta figuran en la siguiente tabla:

Fútbol Lee regularmente Lee ocasionalmente Nunca lee


Sı́ 0,21 0,16 0,31
No 0,10 0,04 0,18

(a) ¿Cuál es la probabilidad de que un suscriptor elegido al azar nunca lea la sección de
deportes?
(b) ¿Cuál es la probabilidad de que un suscriptor elegido al azar haya jugado fútbol durante
el año pasado?
(c) ¿Cuál es la probabilidad de que un suscriptor que nunca lea la sección de deportes haya
jugado fútbol durante el año pasado?
(d) ¿Cuál es la probabilidad de que un suscriptor que ha jugado fútbol durante el año
pasado nunca lea la sección de deportes?
(e) ¿Cuál es la probabilidad de que un suscriptor que no lea regularmente la sección de
deportes haya jugado fútbol durante el año pasado?

2.5 Independencia
Copyright © 2017. Universidad del Norte. All rights reserved.

En general, el concepto de que dos eventos A y B sean independientes significa que el suceso
de uno de los dos eventos no tiene ninguna influencia sobre la probabilidad de que suceda
el otro evento. Por consiguiente, podemos formular la siguiente definición:

Definición 2.5.1 Dos eventos A, B de un espacio muestral Ω = ∅ se llaman (es-


tocásticamente) independientes si y sólo si P (A/B) = P (A) y son dependientes en
cualquier otro caso. Es decir, el evento A es independiente del evento B si la probabilidad
de A no se ve afectada por la ocurrencia o no de B.

2.5. Independencia

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
168 Llinás / Rojas

Ejemplo 2.5.2 Considere lanzar un dado no falso y defina los eventos A = {2, 4, 6}, B = {1, 2, 3}
y C = {1, 2, 3, 4}. Entonces, tenemos

1 1 1
P (A) = , P (A/B) = y P (A/C) =
2 3 2

Lo anterior nos muestra que los eventos A y B son dependientes, mientras que los eventos A y C
son independientes. 

Ejemplo 2.5.3 Las probabilidades de que llueva o nieve en una ciudad determinada el dı́a de
Navidad, el dı́a de año nuevo o en ambos dı́as son P (C) = 0, 60, P (N ) = 0, 60 y P (C ∩ N ) = 0, 42
respectivamente. Verifique si los eventos N y C son independientes.

SOLUCIÓN:
Por la definición de probabilidad condicional, tenemos que

P (C ∩ N ) 0, 42
P (N/C) = = = 0, 70
P (C) 0, 60

Ya que P (N/C) = 0, 70 no es igual que P (N ) = 0, 60, encontramos que los eventos N y C no son
independientes. Es decir, son dependientes. 

En el caso en que los eventos A y B sean independientes, encontramos con ayuda del
teorema de multiplicación (teorema 2.4.5) el siguiente resultado especial: P (A ∩ B) =
P (A/B) P (B) = P (A)P (B). Por tanto, podemos formular el siguiente teorema:

Teorema 2.5.4 (Teorema de multiplicación para eventos independientes) Dos


eventos A, B de un espacio muestral Ω = ∅ son independientes si y sólo si

P (A ∩ B) = P (A)P (B)

Algunos autores definen “independencia” de acuerdo a este teorema, puesto que ası́ no excluyen el caso en
que uno de los eventos sea vacı́o.
Copyright © 2017. Universidad del Norte. All rights reserved.

Ejemplo 2.5.5 Considere lanzar un dado no falso y defina los eventos A = {2, 4, 6}, B = {1, 3, 5}.
Entonces, A ∩ B = ∅ y
1
P (A) = P (B) = y P (A ∩ B) = P (∅) = 0
2

Es decir, los eventos A y B no son independientes porque P (A ∩ B) = P (A) P (B). La conclusión


es que si dos eventos son mutuamente excluyentes y si las probabilidades de ambos eventos son
positivas, entonces no pueden ser independientes. 

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 169

Ejemplo 2.5.6 La tabla de abajo contiene los resultados obtenidos al analizar 84 muestras de
aire con la finalidad de detectar dos moléculas raras. Sean A y B los eventos “todas las muestras
de aire contienen la molécula 1” y “todas las muestras contienen la molécula 2” respectivamente.

Molécula 1 (no) Molécula 1 (sı́) Total


Molécula 2 (no) 32 24 56
Molécula 2 (sı́) 16 12 28
Total 48 36 84

Entonces,
36 3 28 1 12 1
P (A) = = , P (B) = = y P (A ∩ B) = =
84 7 84 3 84 7

Es decir, los eventos A y B son independientes porque P (A ∩ B) = P (A) P (B). 

Teorema 2.5.7 Sean A, B eventos de un espacio muestral Ω = ∅. Entonces, las siguientes


cuatro proposiciones son equivalentes:

(a) A y B son independientes (b) A y B son independientes

(c) A y B son independientes (d) A y B son independientes

Ejemplo 2.5.8 Considere lanzar un dado no falso y defina los eventos A = {2, 4, 6} y B =
{1, 2, 3, 4}. Verifique las cuatros proposiciones equivalentes del teorema 2.5.7.

SOLUCIÓN:
Debido a que, adicionalmente, A = {1, 3, 5} y B = {5, 6} tenemos:

1 2 1 1
P (A) = , P (B) = , P (A) = , P (B) =
2 3 2 3

Ahora, como

A ∩ B = {2, 4}, A ∩ B = {1, 3}, A ∩ B = {6}, A ∩ B = {5}


Copyright © 2017. Universidad del Norte. All rights reserved.

se concluye que

• Los eventos A y B son independientes porque P (A ∩ B) = 1


3 = P (A) P (B)

• Los eventos A y B son independientes porque P (A ∩ B) = 1


3 = P (A) P (B)

• Los eventos A y B son independientes porque P (A ∩ B) = 1


6 = P (A) P (B)

• Los eventos A y B son independientes porque P (A ∩ B) = 1


6 = P (A) P (B) 

2.5. Independencia

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
170 Llinás / Rojas

Ejemplo 2.5.9 Se sabe que 30% de las lavadoras de cierta compañı́a requieren servicio cuando
están todavı́a en garantı́a, mientras que sólo 10% de las secadoras necesitan ese servicio. Si alguien
compra una lavadora y una secadora fabricadas por esta companı́a, ¿cuál es la probabilidad de
que ninguna de las dos máquinas necesite servicio dentro de la garantı́a? Suponga que las dos
máquinas funcionan de manera independiente.

SOLUCIÓN:
Señalemos como A el evento “la lavadora necesita servicio de garantı́a” y B, el evento “la secadora
necesita servicio de garantı́a”. Entonces, P (A) = 0, 30 y P (B) = 0, 10. Nos piden calcular
P (A ∩ B). Como las dos máquinas funcionan de manera independiente, entonces los eventos A y
B son independientes. Con esto y con el teorema 2.5.7 (en este teorema, si se cumple la proposición
(a), entonces también debe cumplirse (d)), los eventos A y B también son independientes. Por
consiguiente,

P (A ∩ B) = P (A) P (B) = (0, 70) · (0, 90) = 0, 63 

El concepto de independencia se puede generalizar al caso en que se tengan más de dos


eventos.

Definición 2.5.10 Se dice que n eventos A1 , . . . , An de Ω son ( completamente) in-


dependientes si y sólo si

P (Aj1 ∩ Aj2 ∩ · · · ∩ Ajk ) = P (Aj1 ) · P (Aj2 ) · · · P (Ajk ) (2.3)

para todo 1 ≤ j1 < j2 < · · · < jk ≤ n, con 2 ≤ k ≤ n

En particular, por ejemplo,6

(a) si n = 3, entonces A, B y C son completamente independientes si y sólo si se cumplen las 2


condiciones siguientes:

• Tomando la intersección de cada 2 eventos se tiene que


P (A ∩ B) = P (A) P (B), P (A ∩ C) = P (A) P (C), P (B ∩ C) = P (B) P (C)

• Tomando la intersección de cada 3 eventos se tiene que


Copyright © 2017. Universidad del Norte. All rights reserved.

P (A ∩ B ∩ C) = P (A) P (B) P (C)

(b) si n = 4, entonces A, B, C y D son completamente independientes si y sólo si se cumplen las 3


condiciones siguientes:

• Tomando la intersección de cada 2 eventos se tiene que

P (A ∩ B) = P (A) P (B), P (A ∩ C) = P (A) P (C), P (A ∩ D) = P (A) P (D),


P (B ∩ C) = P (B) P (C), P (B ∩ D) = P (B) P (D), P (C ∩ D) = P (C) P (D)

6
El caso n = 2 ya se ilustró en el teorema 2.5.4.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
Estadı́stica descriptiva y distribuciones de probabilidad 171

• Tomando la intersección de cada 3 eventos se tiene que

P (A ∩ B ∩ C) = P (A) P (B) P (C), P (A ∩ B ∩ D) = P (A) P (B) P (D),


P (A ∩ C ∩ D) = P (A) P (C) P (D), P (B ∩ C ∩ D) = P (B) P (C) P (D)

• Tomando la intersección de cada 4 eventos se tiene que

P (A ∩ B ∩ C ∩ D) = P (A) P (B) P (C) P (D)

El siguiente ejemplo ilustra que una independencia fı́sica en la realidad no necesariamente


necesita corresponder con una independencia estocástica en el modelo.

Ejemplo 2.5.11 Supongamos que un dado se lanza dos veces y consideremos los eventos A :=“primer
lanzamiento es un 2”, B :=“segundo lanzamiento es un 5” y C :=“la suma de ambos lanzamientos
es 7”. Demuestre que (a) A y B son independientes, (b) B y C son independientes, (c) A y C son
independientes y (d) A, B y C no son independientes.

Este ejemplo demuestra también que A, B y C son independientes dos a dos, pero no completamente
independientes.

SOLUCIÓN:

(a) Debido a que A y B tienen 6 elementos, tenemos que P (A) = P (B) = 16 y, por consiguiente,
que
  1 1 1
P (A ∩ B) = P escoger (2,5) = = · = P (A) P (B)
36 6 6

entonces podemos afirmar que A y B son independientes.

(b) El evento C es el conjunto



C = (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)

6
es decir, C tiene 6 elementos. Por consiguiente, P (C) = 36 = 16 . Ahora, debido a que
B ∩ C = {(2, 5)}, es claro ver que B ∩ C tiene un elemento. Por lo tanto,
Copyright © 2017. Universidad del Norte. All rights reserved.

Número de elementos de B ∩ C 1 1 1
P (B ∩ C) = = = = · = P (B) P (C)
Número de elementos de Ω 36 6 6

O sea que B y C son independientes.

(c) En forma semejante se puede demostrar que A y C son independientes.

(d) A, B y C no son completamente independientes porque

  1 1
P (A ∩ B ∩ C) = P (2, 5) =  = = P (A) P (B) P (C) 
36 63

2.5. Independencia

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.
172 Llinás / Rojas

✍ Ejercicios de la sección 2.5


78. Suponga que las proporciones de fenotipos sanguı́neos en determinada población son los
siguientes: A : 35%, B : 28%, AB : 13% y O : 24%. Supongamos que los fenotipos de dos
personas seleccionadas al azar son independientes entre sı́.

(a) ¿Cuál es la probabilidad de que ambos fenotipos sean O?


(b) ¿Cuál es la probabilidad de que sean iguales?

79. En su sistema de funcionamiento, una represa tiene cuatro puertas de seguridad idénticas.
La probabilidad de que una puerta en particular se abra cuando sea necesario es 0,97. Si
las puertas funcionan independientemente, calcule la probabilidad de que (a) al menos una
puerta se abra, (b) al menos una puerta no se abra.

80. La probabilidad de que Jeniffer cometa un error al marcar una pregunta de un examen de
opción múltiple es 0,2. Supongamos que hay 7 preguntas marcadas independientemente.

(a) ¿Cuál es la probabilidad de que Jeniffer no cometa error al marcar las 7 preguntas?
(b) ¿Cuál es la probabilidad de que Jeniffer cometa por lo menos un error al marcar las 7
preguntas?

81. Una costura en un chaleco antibalas necesita 10 puntos de seguridad. La costura tendrá
que volverse a realizar si cualquiera de los puntos de segudidad quedó débil. Suponga que
los puntos de seguridad están débiles independientemente unos de otros, cada uno con la
misma probabilidad.

(a) Si 20% de todas las costuras necesitan volver a efectuarse, ¿cuál es la probabilidad de
que un punto de seguridad esté defectuoso?
(b) ¿Qué tan pequeña debe ser la probabilidad de un punto de seguridad débil para asegurar
que sólo el 5% de todas las costuras necesiten volver a ejecutarse?

82. Una empresa de venta por correos considera tres posibles errores al enviarse un pedido:

A: el artı́culo enviado no es el solicitado.


B: el artı́culo se extravı́a.
Copyright © 2017. Universidad del Norte. All rights reserved.

C: el artı́culo sufre desperfectos en el transporte.

Supóngase que el suceso A es independiente de los sucesos B y C y que los sucesos B y C


son mutuamente excluyentes. Las probabilidades de los sucesos individuales son P (A) =
0, 03, P (B) = 0, 02 y P (C) = 0, 05. Calcule la probabilidad de que uno de estos errores
ocurra para al menos un pedido escogido al azar.

83. En cierta ciudad, el 70% de todas las personas examinadas en cierto consultorio odontológico
no tienen caries. Si se supone que personas sucesivas tienen o no tienen caries (por supuesto,
independientemente una de otra), calcule la probabilidad de los siguientes eventos:

(a) Las tres personas siguientes examinadas tienen caries.

Capı́tulo 2. Conceptos básicos de la probabilidad

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com


Created from unalbogsp on 2019-04-24 14:53:09.

Вам также может понравиться