Estadística Descriptiva y Distribuciones de Probab... - (PG 19 - 190)

CAPÍTULO 1
Estadı́stica descriptiva
Contenido
1.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1 Estadı́stica y sus aplicaciones . . . . . . . . . . . . . . . . . . . . 2
1.1.2 Términos comúnmente usados en estadı́stica . . . . . . . . . . . 6
1.1.3 Estadı́sticas descriptiva e inferencial . . . . . . . . . . . . . . . . 7
1.2 Organización de datos . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.1 Organización de datos de acuerdo al tipo . . . . . . . . . . . . . 10
1.2.2 Organización de datos de acuerdo a escalas de medidas . . . . . 11
1.2.3 Organización de datos mediante tablas . . . . . . . . . . . . . . . 13
1.2.4 Organización de datos mediante representaciones gráficas . . . . 22
1.3 Análisis de datos en tablas de frecuencias no agrupadas . . . . 33
1.3.1 Medidas de tendencia central o de centralización . . . . . . . . . 33
1.3.2 Medidas de colocación o de posición relativa . . . . . . . . . . . . 43
1.3.3 Medidas de dispersión o de variabilidad . . . . . . . . . . . . . . 45
1.3.4 Medidas de formas . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Copyright © 2017. Universidad del Norte. All rights reserved.
1.4 Análisis de datos en tablas de frecuencias agrupadas . . . . . . 66

1.5 Análisis exploratorio de datos . . . . . . . . . . . . . . . . . . . . 72
1.6 Uso de Statgraphics en la estadı́stica descriptiva . . . . . . . . 79
1.6.1 Análisis de un solo conjunto de datos . . . . . . . . . . . . . . . . 79
1.6.2 Análisis simultáneo de dos o más conjuntos de datos . . . . . . . 85
1.7 Uso de la calculadora en la estadı́stica . . . . . . . . . . . . . . . 90
✍ Ejercicios complementarios . . . . . . . . . . . . . . . . . . . . . . . 93
Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com

Created from unalbogsp on 2019-04-24 14:53:09.
2 Llinás / Rojas
☞ Objetivos del capı́tulo

1. Presentar una visión amplia sobre el campo de estudio de la estadı́stica y sus aplicaciones.
2. Distinguir entre estadı́stica descriptiva e inferencial.
3. Estudiar los tipos de datos.
4. Mostrar cómo organizar datos.
5. Construir tablas y gráficas para datos numéricos y categóricos.
6. Describir las medidas de tendencia central, de posición relativa, de variación y de forma de

los datos numéricos.
7. Describir las técnicas para realizar un análisis exploratorio de datos.
8. Presentar aplicaciones del uso de Statgraphics y de la calculadora en la estadı́stica.
☞ Empleo de la estadı́stica
La directora de producción de una empresa debe informar a su superior
sobre el número de dı́as promedio que los empleados de la empresa se ausen-
tan del trabajo. Sin embargo, la planta emplea más de dos mil trabajadores,
y la directora de producción no tiene tiempo de revisar los registros persona-
les de cada empleado. Como asistente, usted debe decidir cómo puede ella
obtener la información necesaria. ¿Qué consejo podrı́a darle?
1.1 Introducción
1.1.1 Estadı́stica y sus aplicaciones
¿Qué significa “estadı́stica”?

En la vida diaria, los diversos fenómenos de orden económico, social, polı́tico, educacional, e
incluso biológico, aparecen, se transforman y finalmente desaparecen. Para tan abundante
y complejo material es preciso tener un registro ordenado y continuo, a fin de conseguir
en un momento dado los datos necesarios para un estudio de lo que ha sucedido, sucede
o puede suceder. Para ello se requiere contar con un método, con un conjunto de reglas o
principios, que nos permita la observación, el ordenamiento, la cuantificación y el análisis
de dichos fenómenos.
En general, el término “estadı́stica” tiene tres acepciones gramaticales bien definidas:
Capı́tulo 1. Estadı́stica descriptiva

Estadı́stica descriptiva y distribuciones de probabilidad 3
1. Estadı́stica, según su acepción más común, es una colección de datos numéricos

ordenados y clasificados según un determinado criterio. Nos referimos a este sig-
nificado cuando hablamos de estadı́sticas de producción, estadı́sticas de cotizaciones
bursátiles, estadı́sticas demográficas, etc.
2. Según una segunda acepción, es la ciencia que, utilizando como instrumento las
matemáticas y el cálculo de probabilidades, estudia las leyes de comportamiento de
aquellos fenómenos que no están sometidos a las leyes fı́sicas y basándose en ellas
predice e infiere resultados. En este caso se la denomina estadı́stica matemática.
3. Finalmente, significa técnica o método cientı́fico usado para recolectar, organizar,

resumir, presentar, analizar, interpretar, generalizar y contrastar los resultados de las
observaciones de los fenómenos reales.
Se considera fundador de la estadı́stica a Godofredo Achenwall (1719-1772;53), profe-

sor y economista alemán, quien siendo profesor de la Universidad de Leipzig (Alemania) es-
cribió sobre el descubrimiento de una nueva ciencia que llamó estadı́stica (palabra derivada
del término alemán Staat, que significa “estado”) y que definió como “el conocimiento
profundo de la situación respectiva y comparativa de cada estado”. Achenwall y sus
seguidores estructuraron los métodos estadı́sticos que se orientaron a investigar, medir y
comparar las riquezas de las naciones. Lo anterior no significa que antes de los estudios de
Achenwall los estados no hubiesen efectuado inventarios de sus riquezas. Estos inventa-
rios se realizaron desde la Antigüedad. Se sabe que 2.000 a 2.500 años antes de Cristo, los
inventarios que hicieron los chinos y los egipcios eran muy elementales.
¿Por qué usted necesita conocer estadı́stica?
En general, el problema que enfrentan las compañı́as e industrias no es la escasez de in-

formación, sino cómo utilizar la información disponible para tomar las decisiones más ade-
cuadas. Por esta razón, desde la perspectiva de una toma de decisiones informada, cabe
preguntarse por qué un ingeniero, un administrador y un economista necesitan saber es-
tadı́stica. Para dar respuesta a esta inquietud podemos decir que éstos deben comprender
la estadı́stica, básicamente, por tres razones fundamentales:
1. Presentar y describir la información en forma adecuada.
2. Inferir conclusiones sobre poblaciones grandes basándose solamente en la información

obtenida de subconjuntos de ellas.
3. Utilizar modelos para obtener pronósticos confiables.
1.1. Introducción

4 Llinás / Rojas
Presentar y Obtener conclusiones acerca Obtener pronósticos

describir la de poblaciones, basándose so- confiables sobre
información lamente en la información variables de interés
obtenida a partir de subcon-
juntos de ellas
Introducción y Modelos de regresión
recopilación de lineal simple y
datos correlación
Probabilidad básica
Tablas y y distribuciones de Análisis de series
gráficas probabilidad de tiempo
Medidas
estadísticas
Distribuciones Pruebas de
muestrales y hipótesis
estimación
Figura 1.1: Esquema de rutas para aprender estadı́stica
En la figura 1.1 se presenta un esquema general de las rutas que sugerimos tomar desde la
perspectiva de estas tres razones para aprender estadı́stica. En este esquema se observa que
para tener en cuenta la primera razón se abordan los métodos referentes a la recopilación,
descripción y presentación de la información (que corresponde al capı́tulo 1 de este texto).
Para la segunda razón necesitaremos desarrollar los conceptos de distribuciones muestrales,
estimación y pruebas de hipótesis. Debido a que estos temas no hacen parte de los objetivos
de este texto, sólo se desarrollarán los conceptos básicos de probabilidad (capı́tulo 2) y
algunas distribuciones (capı́tulos 3, 4 y 5), temas que sirven como base para desarrollar
lo expresado en la segunda razón. Para la tercera razón sugerimos realizar el enfoque al
análisis de regresión, modelado y análisis de series de tiempo que proporcionan métodos
para hacer pronósticos (temas que tampoco tratamos en este texto).
Algunas aplicaciones de la estadı́stica

En esta sección presentaremos ejemplos que ilustran algunas de las aplicaciones de la es-
tadı́stica en la ingenierı́a, en la administración y en la economı́a.
Ingenierı́a
La importancia de la estadı́stica en la ingenierı́a ha sido subrayada por la participación

de la industria en el aumento de la calidad. Muchas empresas se han dado cuenta de que
la baja calidad de un producto (ya sea en la forma de defectos de fabricación, en una
baja confiabilidad en su rendimiento, o en ambos) tiene un efecto muy pronunciado en la

productividad global de la compañı́a, en el mercado y la posición competitiva y, finalmente,

en la rentabilidad de la empresa. Mejorar estos aspectos de la calidad puede eliminar el des-
perdicio; disminuir la cantidad de material de desecho, la necesidad de volver a maquilar las
piezas, los requerimientos para inspección y prueba y las pérdidas por garantı́a. Además
de mejorar la satisfacción del consumidor y permitir que la empresa se convierta en un
productor de alta calidad y bajo costo en el mercado. En este sentido, la estadı́stica es un
elemento decisivo en el incremento de la calidad, ya que las técnicas estadı́sticas pueden
emplearse para describir y comprender la variabilidad.1
Contabilidad
Las empresas de contadurı́a pública emplean procedimientos estadı́sticos de muestreo para

llevar a cabo auditorı́as a sus clientes. Por ejemplo, supongamos que una empresa de
contadores desea determinar si la cantidad que aparece en las cuentas por cobrar, en el
balance de un cliente, representa fielmente la cantidad real de ese rubro. Normalmente,
la cantidad de cuentas individuales por cobrar es tan grande que serı́a demasiado lento y
costoso revisar y validar cada cuenta. En casos como éste, regularmente se acostumbra que
el personal del auditor seleccione un subconjunto de las cuentas (llamado muestra). Después
de revisar la exactitud de las cuentas muestreadas, los auditores llegan a una conclusión
acerca de si la cantidad que aparece en cuentas por cobrar, en los estados financieros de sus
clientes, es aceptable.
Finanzas
Los asesores financieros recurren a una gama de información estadı́stica para guiarse en sus
recomendaciones de inversión. En el caso de las acciones, revisan una variedad de datos
financieros, que incluyen relaciones de precio a rendimiento y los dividendos. Al comparar
la información de determinadas acciones con la correspondiente acerca de promedios del
mercado accionario, un asesor financiero puede comenzar a sacar conclusiones sobre si esas
acciones están sobre o subevaluadas.
Economı́a
Con frecuencia se pide a los economistas su pronóstico acerca del futuro de la economı́a o
de alguno de sus aspectos. Estos recurren a diversas informaciones estadı́sticas para elabo-
rarlo. Ası́, para pronosticar las tasas de inflación usan indicadores como el ı́ndice de precios
al productor, la tasa de desempleo y la ocupación de la capacidad de producción. Muchas
veces, esos indicadores estadı́sticos se introducen en modelos computarizados de pronóstico,
cuyo resultado son predicciones sobre las tasas de inflación.
1
La variabilidad es el resultado de cambios en las condiciones bajo las que se hacen las observaciones.
1.1. Introducción

6 Llinás / Rojas
Mercadotecnia
Los escáners en las cajas de los almacenes al detalle se emplean para reunir datos que tienen
muchas aplicaciones de investigación de mercados.
Producción
Con el énfasis actual en la calidad, el control de calidad es una aplicación importante de

la estadı́stica en la producción. Para vigilar el resultado de un proceso de producción se
emplean diversas gráficas de control estadı́stico de calidad, en especial se usa una gráfica
para vigilar el promedio de un producto. Por ejemplo, supongamos que una máquina lle-
na envases con 12 onzas de una bebida muy conocida. Periódicamente se selecciona una
muestra de envases y se le determina su contenido promedio. Este promedio se anota en
una gráfica, a partir de la cual se observa si es necesario ajustar o corregir el proceso de
producción.
Los computadores, la calculadora y la estadı́stica
La mayor parte del análisis estadı́stico se realiza utilizando una biblioteca de programas
estadı́sticos. El usuario introduce los datos y luego selecciona los tipos de análisis y la
presentación de los resultados que le interesan. Los paquetes estadı́sticos están disponibles
para grandes sistemas de cómputo y para computadores personales. Entre los paquetes más
utilizados están SAS (Statistical Analysis System), SPSS (Statistical Package for Social
Sciencies), Statgraphics e, inclusive, Excel. En la sección 1.6 explicaremos cómo utilizar
Statgraphics en la estadı́stica y en la 1.7, cómo emplear la calculadora para hacer cálculos
estadı́sticos.
1.1.2 Términos comúnmente usados en estadı́stica
Definición 1.1.1 Una población es el conjunto total de objetos que son de interés para
un problema dado. Los objetos pueden ser personas, animales, producto fabricados, etc.
Cada uno de ellos recibe el nombre de elemento o individuo .
Ejemplo 1.1.2 Todos los niños nacidos en determinado año pueden constituir una población. Si
el director de una gran empresa manufacturera desea estudiar la producción de todas las plantas
de propiedad de la firma, entonces la producción de todas estas plantas es la población.
Definición 1.1.3 Una muestra es un subconjunto de la población.

Ejemplo 1.1.4 Si todos los niños nacidos en determinado año constituyen una población, en-
tonces los niños nacidos en febrero pueden constituir una muestra.
Definición 1.1.5 Los datos u observaciones son números o denominaciones que po-
demos asignar a un individuo o elemento de la población.
Ejemplo 1.1.6 Son ejemplos de datos: la edad de una persona, la respuesta a la pregunta “¿Usted
fuma?”, el tipo de sangre, el salario mensual de un trabajador, etc.
Definición 1.1.7 Un parámetro es cualquier caracterı́stica medible de una población.
Ejemplo 1.1.8 El ingreso promedio de todos los trabajadores de una determinada empresa es
un ejemplo de parámetro, si todos los trabajadores se consideran como una población.
Definición 1.1.9 Un estadı́stico es cualquier caracterı́stica medible de una muestra.
Ejemplo 1.1.10 El ingreso promedio de todos los asalariados de una determinada sección de la
empresa (viendo a los trabajadores de ésta como una muestra de todos los trabajadores de esta
empresa) es un ejemplo de estadı́stico.
Definición 1.1.11 Un censo (palabra derivada del latı́n censere, que significa “valuar o
tasar”) es la enumeración completa de la población.
Ejemplo 1.1.12 Según el censo llevado a cabo por el dane (Departamento Administrativo Na-
cional de Estadı́stica), en 1993 Colombia tenı́a 33.109.840 habitantes, de los cuales 16.296.539
eran hombres y 16.813.301 mujeres.
1.1.3 Estadı́sticas descriptiva e inferencial
Los procedimientos y análisis que aparecen en estadı́stica se clasifican en dos categorı́as

generales, estadı́stica descriptiva (o deductiva) y estadı́stica inferencial (o inductiva), de-
pendiendo del propósito del estudio.
Definición 1.1.13 La estadı́stica descriptiva se compone de aquellos métodos que

incluyen técnicas para recolectar, presentar, analizar e interpretar datos.
1.1. Introducción

8 Llinás / Rojas
En general, la estadı́stica descriptiva tiene como función el manejo de los datos recopilados
en cuanto se refiere a su ordenación y presentación, para poner en evidencia ciertas carac-
terı́sticas en la forma que sea más objetiva y útil. En este sentido, investiga los métodos
y procedimientos y establece reglas para que el manejo de los datos sea más eficiente y
para que la información entregada resulte confiable, y exprese correctamente ciertos con-
tenidos en un lenguaje que permita que cualquier persona los comprenda y pueda establecer
comparaciones.
Ejemplo 1.1.14 Las siguientes situaciones utilizan estadı́stica descriptiva:
(a) A un empresario le interesa determinar el promedio semanal total de sus gastos en algunos
productos durante un tiempo determinado.
(b) Una entidad quiere calcular la proporción de colombianos encuestados que están a favor de
determinado candidato polı́tico.
Definición 1.1.15 La estadı́stica inferencial abarca aquellos métodos y conjuntos de

técnicas que se utilizan para obtener conclusiones sobre las leyes de comportamiento de una
población basándose en los datos de muestras tomadas de esa población.
Ejemplo 1.1.16 Las situaciones siguientes, que son paralelas a las situaciones descriptivas dadas
anteriormente, requieren estadı́stica inferencial:
(a) Con base en una muestra de estudiantes, cierta universidad desea determinar el porcentaje
de estudiantes que fuman.
(b) Con base en una encuesta de opinión, a un polı́tico le gustarı́a calcular la opción que tiene
de ser reelegido en las próximas elecciones.
Definición 1.1.17 Las técnicas y métodos utilizados por la ciencia estadı́stica, tanto en su
parte descriptiva como en la parte inferencial, son los llamados métodos estadı́sticos.
✍ Ejercicios de la sección 1.1

1. Describa una posible muestra de tamaño 5 de cada una de las siguientes poblaciones:
(a) Todos los periódicos publicados en Colombia.

(b) Todas las empresas importantes de Colombia.
(c) Todos los estudiantes de su curso.
(d) Todos los promedios de calificaciones de los alumnos de su universidad.

2. Una revista publica datos sobre la clasificación de las 300 corporaciones industriales más
grandes de un paı́s, en términos de ventas y utilidades. En la tabla 1.1 se muestran datos
acerca de una muestra de estas 300 compañı́as.
(a) ¿Cuántos elementos hay en este conjunto de datos?

(b) ¿Cuál es la población?
(c) Calcule las ventas anuales en la muestra.
(d) Con el resultado del inciso (c), ¿cuál es la estimación de las ventas promedio para la
población?
Tabla 1.1: Muestra de 10 empresas que publica una revista

Ventas Utilidades Código del ramo
Compañı́a ($ millones) ($ millones) industrial
Todo Confort 38.420 2.586,0 12
Alles klar 20.847 5.157,0 15
Ramos del Caribe 8.071 234,0 2
Sofort 3.075 212,2 22
Express 8.092 168,7 48
El único 10.272 1.427,0 8
Integer 8.588 213,3 11
Good 6.371 49,7 10
Pueblo City 9.844 580,0 19
Report Info 6.454 87,0 19
3. Una empresa desea probar la eficacia de un nuevo comercial de televisión. Como parte
de la prueba, el comercial se pasa a las 8:30 p.m. en un programa de noticias locales en
cierta ciudad. Tres dı́as después, una empresa de investigación de mercado lleva a cabo una
encuesta telefónica para obtener información sobre la frecuencia de recuerdos (procentaje de
los telespectadores que recuerdan haber visto el comercial) y las impresiones del comercial.
(a) ¿Cuáles son la población y la muestra para este estudio?

(b) ¿Por qué se necesita usar una muestra en este caso? Explique su respuesta.
4. El candidato a alcalde de un pueblo pequeño quiere determinar si debe hacer una campaña
más fuerte contra su oponente. Para ello entrevistará a 300 de los 1.700 votantes registrados.
Si los resultados indican que tiene 35% más votos que su oponente, no intensificará sus
esfuerzos de campaña contra éste.
(a) Identifique la población, la muestra, un estadı́stico y un parámetro.

(b) ¿Qué harı́a el candidato si tuviera el 75% de los votos de la muestra?
1.1. Introducción

10 Llinás / Rojas
5. Se estableció que el costo promedio de los textos escolares en un colegio pequeño durante
el último año fue de $ 354.400, con base en una inscripción de 1.500 estudiantes. Como
un trabajo de clase en el colegio, un grupo de estadı́stica encuestó a 30 estudiantes para
determinar el promedio del costo de un libro de texto en el último año, y se concluyó que
fue de $ 399.700.
(a) Identifique la población, la muestra, los parámetros y dos estadı́sticos.

(b) ¿Qué podrı́a concluir el grupo de estadı́stica si el costo promedio de un libro para la
muestra de 30 estudiantes fuera de $ 1.050.000?
1.2 Organización de datos

Estudiaremos cuatro formas de organizar los datos: por el tipo de dato, de acuerdo a escalas
de medidas, mediante tablas y mediante representaciones gráficas.
1.2.1 Organización de datos de acuerdo al tipo
Como se ilustra en la figura 1.2, existen dos tipos de datos: categóricos (o cualitativos) y
numéricos (cuantitativos).
Tipos de datos Tipos de pregunta Respuestas
Categóricas ¿Es la Universidad del Norte Sí No

la universidad líder de la Costa?
Discretas ¿Cuántas universidades Número

hay en Barranquilla?
Numéricas
Continuas ¿Cuál es su peso? Kilogramos
Figura 1.2: Tipos de datos

1. Los datos categóricos o cualitativos representan categorı́as o atributos (como,

por ejemplo, “sı́” o “no”) que pueden clasificarse como un criterio o cualidad.
2. Los datos numéricos o cuantitativos producen respuestas numéricas, como el

peso en kilogramos o el número de universidades que hay en la Costa Atlántica. Estos
datos son de dos tipos: dicretos y continuos.
• Los datos discretos producen respuestas numéricas que surgen de un conteo.

Ejemplos de datos discretos son la cantidad de universidades que hay en la

Costa Atlántica, el número de estudiantes en la Universidad del Norte en 2003,

la cantidad de hermanos que tiene un determinado estudiante de administración,
el número de personas en una fila, etc.
• Los datos continuos producen respuestas numéricas que surgen de un proceso
de medición, donde la caracterı́stica de que se mide puede tomar cualquier valor
numérico en un intervalo. Ejemplos datos continuos son el peso (en kilogramos)
de una persona, su estatura (en metros), el tiempo que usted tarda en llegar a
la Universidad del Norte, etc.
1.2.2 Organización de datos de acuerdo a escalas de medidas
Los datos también se pueden clasificar según la escala de medición o el procedimiento que los
generó. Cuatro tipos de escalas de medición usados en estadı́stica son las escalas nominal,
ordinal, de intervalo y de razón.
Datos de nivel nominal
Un dato nominal se crea cuando se utilizan nombres para establecer categorı́as con la
condición de que cada dato pertenezca única y exclusivamente a una de estas categorı́as.
Existen escalas nominales tanto para los datos numéricos como categóricos. Una escala
nominal para datos numéricos asigna números a las categorı́as. Por ejemplo, entre los
datos numéricos que son nominales se incluyen los números en las camisetas deportivas, los
números telefónicos, etc.
Una escala nominal para datos categóricos es un agrupamiento no ordenado de los datos
en categorı́as discretas, donde cada dato puede incluirse solamente en uno de los grupos.
Por ejemplo, los datos nominales que son cualitativos incluyen el género, la raza, el tipo de
sangre y la religión.
Datos de nivel ordinal

Los datos medidos en una escala nominal ordenada de alguna manera se denominan datos
ordinales. Una escala ordinal coloca las medidas en categorı́as, cada una de las cuales
indica un nivel distinto respecto a un atributo que se está midiendo. La lista de datos
ordinales comprende:
1. Clasificaciones por letra: a, b, c y d; estos grados indican categorı́as de perfecciona-

miento, ası́ como los niveles alcanzados.
2. Rangos académicos: Doctor, magister, especialista y licenciado.
1.2. Organización de datos

12 Llinás / Rojas
3. La evaluación de un maestro: insuficiente, aceptable, bueno y excelente.
4. Los grados de la escuela: primero, segundo, tercero, etc.
No es posible determinar la diferencia o distancia entre los valores medidos en una escala
ordinal. Aun cuando codifiquemos las letras a como 4, b como 3, c como 2 y d como 1,
esto no quiere decir que con a el estudiante sabe el doble que un estudiante con c. Todo
lo que podemos decir es que la calificación A es mejor o de un grado superior a la de C, ya
que una escala ordinal no admite unidad de distancia.
Datos de nivel de intervalo
Los datos medidos en una escala ordinal para los cuales pueden clasificarse las distancias
entre valores se llaman datos de intervalos. La distancia entre dos valores es importante
y los datos de intervalo son numéricos por necesidad; una escala de intervalo no siempre
tiene un punto cero (es decir, un punto que indique la ausencia de lo que se quiere medir).
La lista de datos de intervalo comprenden:
1. Puntajes en las pruebas de inteligencia. Un puntaje de inteligencia de 110 es cinco

puntos superior a uno de 105 (datos ordinales). En este caso, no sólo podemos decir
que un puntaje de 110 es superior a uno de 105, sino que también podemos decir que
es cinco puntos más alto; pero no podemos decir que una persona con un puntaje de
inteligencia de 180 es doblemente inteligente que una persona que tiene uno de 90.
2. Temperaturas Celsius. Una temperatura Celsius de 80◦ es 40◦ más caliente que una de
40◦ , pero no es correcto decir que 80◦ es el doble de caliente que 40◦ . Nótese también
que una temperatura de 0 no implica que la energı́a interna del sistema sea igual a
cero. El punto cero en la escala de temperatura Celsius fue escogido arbitrariamente
como el punto de congelación e indica que está presente algo de calor.
3. Fechas. Supongamos que un determinado joven nació en el 2000, 31 años después de

su padre. Podemos especificar la distancia entre estos dos sucesos ordenados, 31 años,
pero si existiera el año cero no representarı́a la ausencia de tiempo.
Datos de nivel de razón
Los datos medidos en una escala de intervalo con un punto cero que significa “ninguno” se
llaman datos de razón. Con datos medidos en una escala de razón podemos determi-
nar cuántas veces es mayor una medida que otra. Las escalas de razón incluyen salarios,
unidades de producción, peso, altura, etc. El dinero nos da una buena ilustración. Si usted
tiene cero pesos, entonces no tiene dinero. El peso es otro ejemplo. Si la aguja marca cero
en la escala, entonces hay una completa ausencia de peso (sin importar si se utiliza distintas

escalas de razón, como kilogramos, gramos o libras). Las escalas de razón también incluyen
escalas, como, por ejemplo, pies, libras, centı́metros, etc., usadas comúnmente para medir
unidades. Los resultados de contar objetos también son datos de razón, como, por ejemplo,
diez peras es el doble de cinco.
1.2.3 Organización de datos mediante tablas
En esta forma de organización de datos es importante el concepto de frecuencia de un dato.
Definición 1.2.1 La frecuencia (absoluta) de un dato, simbolizado con la letra f , es

el número de veces que aparece ese dato en una colección de datos.
Ejemplo 1.2.2 En el conjunto de datos 4 5 5 3 2 6 7 7 7 2, el cuatro sólo aparece una vez (por
lo tanto, tiene frecuencia f = 1), el cinco aparece dos veces (o sea, frecuencia f = 2), el 7 tiene
frecuencia f = 3, etc.
Existen dos tipos generales de tablas para reportar datos usando frecuencias: tablas de
frecuencias no agrupadas y tablas de frecuencias agrupadas. Ambas tablas se mencionan
simplemente como tablas de frecuencia.2
Tabla de frecuencias no agrupadas
Son aquellas en donde aparecen básicamente dos informaciones: los datos y sus correspon-
dientes frecuencias. Los datos que organizados en tablas de frecuencias no agrupadas se
denominan usualmente datos no agrupados.
Ejemplo 1.2.3 La tabla de frecuencias (no agrupada) para el conjunto de datos 3 5 7 6 4 3 7 6

6 7 5 7 es:
Dato 3 4 5 6 7
Frecuencia 2 1 2 3 4
Tabla de frecuencias agrupadas
Otra posibilidad de organizar datos es agruparlos en intervalos (llamados intervalos de

clase o, simplemente, clases) y determinar la llamada frecuencia de clase de cada
clase, es decir, el total de datos que hay en cada clase. Posteriormente, las clases y las
2
En vez del término “tablas de frecuencia” se utiliza a menudo “distribución de frecuencias”.

14 Llinás / Rojas
frecuencias de clase se ubican en una tabla que llamaremos tabla de frecuencias

agrupadas. Los datos que organizados en tablas de frecuencias agrupadas se denomi-
nan generalmente datos agrupados.
Ejemplo 1.2.4 La tabla 1.2 es un ejemplo de una tabla de frecuencias agrupada y 10-14 y 15-19
son ejemplos de clases. En ella se presentan las distribuciones de frecuencia para los datos de
tiempo de auditorı́as de fin de año.
Tabla 1.2: Distribución de frecuencias para los datos de tiempo de auditorı́a

Tiempo de auditorı́a (dı́as) Frecuencia
10 - 14 4
15 - 19 8
20 - 24 5
25 - 29 2
30 - 34 1
Las clases de frecuencias agrupadas poseen lo que se llama lı́mites de clase. Conside-
remos la tabla 1.2. En la clase 10-14, a 10 se le llama lı́mite inferior de clase y a
14, lı́mite superior de clase. La distancia entre cualquiera de dos lı́mites superiores
consecutivos o entre cualquiera de dos lı́mites inferiores consecutivos es llamada amplitud
de clase. La amplitud de cada clase en la tabla 1.2 es 5.
Cada clase en una tabla de frecuencia tiene lı́mites de clases teóricos llamados lı́mites
reales de clase o frontera de clase (término que utilizaremos en el texto). Al
lı́mite superior teórico se le llama frontera superior de clase (o lı́mite real supe-
rior de clase) y al lı́mite inferior teórico de clase se le llama frontera inferior de
clase (o lı́mite real inferior de clase). En general, para una clase dada, cualquier
frontera se calcula de la siguiente manera:
lı́mite inf. de la clase dada + lı́mite sup. de la clase anterior
Frontera inferior =
2
Observemos que la frontera inferior de una clase siempre coincide con la frontera superior
de la clase superior. Por ejemplo, para los datos de la tabla 1.2, la frontera inferior para la
tercera clase es 19,5 (que es la misma frontera superior de la segunda clase) y la frontera
superior para esa misma clase es 24,5 (que es la misma frontera inferior de la quinta clase).
Todas estas fronteras aparecen ya calculadas en la segunda columna de la tabla 1.3.
El punto medio de cada clase se denomina marca de clase. Es decir, para una clase
dada, la marca de clase se encuentra usando la fórmula
frontera inferior de clase + frontera superior de clase
Marca de clase =
2

Tabla 1.3: Distribución de frecuencias para los datos de tiempo de auditorı́a

Tiempo de auditorı́a (dı́as) Fronteras inferior - superior Frecuencia
10 - 14 9,5 - 14,5 4
15 - 19 14,5 - 19,5 8
20 - 24 19,5 - 24,5 5
25 - 29 24,5 - 29,5 2
30 - 34 29,5 - 34,5 1
Sugerencias para construir una tabla de frecuencias agrupadas
Para construir cualquier tabla de frecuencias agrupadas debe tenerse en cuenta los siguientes
comentarios:
1. En la realidad, se acostumbra siempre agrupar los datos en clases, en donde los

extremos de la clase son las respectivas fronteras, en vez de los lı́mites de clase. De
ahora en adelante, nosotros lo haremos siempre ası́.
2. Para mayor comodidad en el proceso de construcción de las clases, acordaremos que

la primera clase debe contener por lo menos el dato menor (en la realidad, esto no
siempre es ası́).
3. Las clases deben ser mutuamente excluyentes, es decir, cada dato debe quedar exac-
tamente en una sola clase, no en dos al mismo tiempo.
4. Para mayor comodidad en el proceso de construcción de las clases, acordaremos que

todas las clases deben tener la misma amplitud (en la realidad, esto no siempre es ası́).
Determinación de la amplitud de clase. Para determinar la amplitud de clase

en cualquier tabla de frecuencias agrupadas, réstense dos lı́mites superiores de clases
consecutivos o dos lı́mites inferiores de clases consecutivos, o dos fronteras inferiores
consecutivas, o dos fronteras superiores consecutivas, o réstese la frontera inferior de

una clase de la frontera inferior superior de dicha clase.
5. Mientras menos clases escojamos será más fácil el trabajo, pero se perderá más in-
formación. Debido a que no hay un acuerdo general entre los estadı́sticos acerca del
número de clases que debe usarse y dado que la elección es arbitraria, para nuestros
fines, escogeremos entre 5 y 20. Una sugerencia útil para el número de clases es la
regla de Sturges.

16 Llinás / Rojas
Regla de Sturges. Esta establece como número de clases necesario, aproximada-

mente,
c = 3, 3(log n) + 1
donde n es el número de medidas y log n es el logaritmo de n en base 10. El valor de
c es común redondearlo al entero más cercano.
Otra regla razonable para el número de clases es:

√
c= n
6. Luego, determinar el rango R, que es la diferencia entre las medidas mayor y menor.
7. Posteriormente, la amplitud de clase w se encuentra como se muestra en el siguiente

recuadro:
Amplitud de clase. La amplitud de clase w se determina calculando el cociente

entre el rango R y el número de clases c. Es decir,
R
Amplitud de clase w =
c
El valor de w es común redondearlo al entero siguiente.
8. El dato menor debe caer en la primera clase. Por esta razón, el lı́mite inferior de
la primera clase debe estar en, o un poco antes de, el dato menor. Ası́ que pode-
mos establecer un acuerdo general sobre las clases de nuestras tablas de frecuencias
agrupadas, empezando siempre la primera clase con la frontera inferior, teniendo en
cuenta que el lı́mite inferior coincide con el dato menor. Cuando hacemos esto, el
valor mı́nimo que puede tomar la amplitud de clase se determina redondeando a w al
siguiente valor entero.
Ejemplo 1.2.5 (Primer modelo: Los datos son enteros) Construya una tabla de frecuen-
cias agrupadas considerando los siguientes datos:
14 21 23 21 16 19 22 25 16 16 24 24 25 19
16 19 18 19 21 12 16 17 18 23 25 20 23 16
20 19 24 28 15 22 24 20 22 24 22 20
SOLUCIÓN:
Paso 1. Primero determinamos el rango R. Como la medida mayor es 28 y la menor es 12, entonces
el rango es R = 28 − 12 = 16.
Paso 2. El ejemplo no nos dice con cuántas clases debemos construir la tabla de frecuencias agru-
padas. Podemos seleccionar esta cantidad arbitrariamente (entre 5 y 20) o aplicar la regla

de Sturges (que es la que utilizaremos). Como tenemos n = 40 datos, la regla de Sturges

sugiere usar c = 6 clases, porque el número de clase es
c = (3, 3) log 40 + 1 = (3, 3)(1, 60) + 1 = 6, 2867 ≈ 6
donde ≈ significa “aproximadamente igual que”. Observemos que con la otra regla se obtiene
√
el mismo resultado porque c = 40 = 6, 324 ≈ 6.
Paso 3. Ahora, determinamos w, la amplitud de cada clase. En este caso,

R 16
w = = = 2, 666
c 6
Como la unidad de precisión para los datos es 1, escogemos el mı́nimo entero mayor que
2,666 como el valor de la amplitud. En este caso, el mı́nimo entero mayor que 2,666 es 3.
Por lo tanto, w = 3.
Paso 4. A continuación se construye la primera clase con un ancho de w = 3. Para ello, primero,
tenemos que encontrar las fronteras inferior y superior de esta clase. Como la unidad de
medida es 1 (porque todos los datos son enteros) y como el “punto medio” de cada unidad
de medida es
Unidad de medida 1
Punto medio de cada unidad de medida = = = 0, 5
2 2
entonces, en este caso, la frontera inferior de la primera clase la hallaremos ası́:
Front. inf. de primera clase = dato menor − punto medio de unidad de medida
= 12 − 0, 5 = 11, 5
Es decir, la frontera superior de la primera clase es 11,5. Como la amplitud es w = 3,

entonces la frontera superior será:
Frontera superior = frontera inferior + amplitud = 11, 5 + 3 = 14, 5
En consecuencia, la primera clase resulta ser el intervalo 11,5 - 14,5.
Paso 5. Para obtener cada una de las clases siguientes a esta primera, tenemos en cuenta que la
frontera inferior de la clase siguiente coincide con la frontera superior de la clase anterior
y que la amplitud del intervalo es w = 3. De esta forma, las seis clases resultan ser las
siguientes:
Clase 1: 11,5 - 14,5

Clase 2: 14,5 - 17,5 (Observe: 17, 5 = 14, 5 + 3)
Clase 3: 17,5 - 20,5 (Observe: 20, 5 = 17, 5 + 3)
Clase 4: 20,5 - 23,5 (Observe: 23, 5 = 20, 5 + 3)
Clase 5: 23,5 - 26,5 (Observe: 26, 5 = 23, 5 + 3)
Clase 6: 26,5 - 29,5 (Observe: 29, 5 = 26, 5 + 3)

18 Llinás / Rojas
Tabla 1.4: Tabla de frecuencia agrupada con 6 clases para 40 datos

Clase Cuenta Frecuencia
11,5 - 14,5 || 2
14,5 - 17,5 ||||| ||| 8
17,5 - 20,5 ||||| ||||| | 11
20,5 - 23,5 ||||| ||||| 10
23,5 - 26,5 ||||| ||| 8
26,5 - 29,5 | 1
Paso 6. Para determinar la frecuencia de cada clase usamos una columna de marcas de cuenta. Si
uno de los datos cae en una clase, anotamos una marca (|) en la columna correspondiente a
esa clase. La tabla 1.4 contiene la tabla de frecuencias agrupadas para los 40 datos dados.
Ejemplo 1.2.6 (Segundo modelo: Datos con un solo lugar decimal) Forme una distribu-
ción de frecuencias considerando los siguientes datos:
8,9 10,2 11,5 7,8 10,0 12,2 13,5 14,1 10,0 12,2
6,8 9,5 11,5 11,2 14,9 7,5 10,0 6,0 15,8 11,5
SOLUCIÓN:
Paso 1. Como la medida mayor es 15,8 y la menor es 6,0, entonces el rango es:
R = 15, 8 − 6, 0 = 9, 8
Paso 2. Ya que tenemos n = 20 datos, entonces, por la regla de Sturges debemos usar c = 5 clases,
porque el número de clase es:
c = (3, 3) log 20 + 1 = (3, 3)(1, 30) + 1 = 5, 2933 ≈ 5
donde ≈ significa “aproximadamente igual que”.

Paso 3. Ahora, determinamos w, la amplitud de cada clase. En este caso,
R 9, 8
w = = = 1, 96
c 5
El mı́nimo entero mayor que 1,96 es 2. Por lo tanto, w = 2.
Paso 4. Como la unidad de medida es 0,1 (por tener los datos un sólo lugar decimal) y como el
“punto medio” de cada unidad de medida es:
Unidad de medida 0, 1
2 2

entonces la frontera inferior de la primera clase es:
Frontera inferior = dato menor − 0, 05 = 6, 0 − 0, 05 = 5, 95
y la frontera superior será:
Frontera superior = frontera inferior + amplitud = 5, 95 + 2 = 7, 95.
En consecuencia, la primera clase es 5,95 - 7,95.
frontera inferior de la clase precedente coincide con la frontera superior de la clase anterior
y que la amplitud del intervalo es w = 2. De esta forma, las seis clases resultan ser las
siguientes:
Clase 1: 5,95 - 7,95

Clase 2: 7,95 - 9,95 (Observe: 9, 95 = 7, 95 + 2)
Clase 3: 9,95 - 11,95 (Observe: 11, 95 = 9, 95 + 2)
Clase 4: 11,95 - 13,95
Clase 5: 13,95 - 15,95
Paso 6. Para determinar la frecuencia de cada clase usamos una columna de marcas de cuenta. Si
uno de los datos cae en una clase, anotamos una marca (|) en la columna correspondiente a
esa clase. La tabla 1.5 contiene la tabla de frecuencias agrupadas para los 20 datos dados.
Además, allı́ también aparecen las marcas de clase X correspondientes a cada clase. Por
ejemplo, la primera marca de clase se calcula ası́:
6, 0 + 7, 9
X= = 6, 95
2
Cada marca de clase sucesiva se encuentra sumando w = 2 a la marca anterior.

Clase Cuenta Frecuencia Marcas de clase X
5,95 - 7,95 |||| 4 6,95
7,95 - 9,95 || 2 8,95
9,95 - 11,95 ||||| ||| 8 10,95
11,95 - 13,95 ||| 3 12,95

13,95 - 15,95 ||| 3 14,95
Ejemplo 1.2.7 (Tercer modelo: Datos con dos lugares decimales) Forme una distribución
de frecuencias considerando los siguientes datos:
39,78 28,30 28,31 17,95 44,47 46,65 31,47 33,45 29,17

48,39 82,71 43,63 41,17 47,32 52,16 25,94 50,32 35,25
35,70 17,89 60,20 48,14 22,78 38,22 23,25

20 Llinás / Rojas
SOLUCIÓN:
Paso 1. El rango es R = 82, 71 − 17, 89 = 64, 82.
Paso 2. Aplicando la regla de Sturges obtenemos que el número de clase es:
c = (3, 3) log 25 + 1 = (3, 3)(1, 3979) + 1 = 5, 613 ≈ 6
√
Observemos que con la otra regla se obtiene c = 25 = 5. Es decir, podemos construir la
tabla con 5 o con 6 clases. Escogeremos c = 6.
Paso 3. Como c = 6 y R = 64, 82, entonces w = R

c = 10, 803. El mı́nimo entero mayor que 10,803
es 11. Por lo tanto, w = 11.
Paso 4. Como la unidad de medida es 0,01 (por tener los datos dos lugares decimales) y como como
el “punto medio” de cada unidad de medida es:
Unidad de medida 0, 01
2 2
entonces la frontera inferior de la primera clase es:
Frontera inferior = dato menor − 0, 005 = 17, 89 − 0, 005 = 17, 885
y la frontera superior:
Frontera superior = frontera inferior + amplitud = 17, 885 + 11 = 28, 885
En consecuencia, la primera clase es 17,885 - 28,885.
frontera inferior de la clase precedente coincide con la frontera superior de la clase anterior y
que la amplitud del intervalo es w = 11. De esta forma, las seis clases son como se muestran
en la tabla 1.6. Allı́ también aparecen las marcas de clase correspondientes a cada clase.

Clase Cuenta Frecuencia Marcas de clase X

17,885 - 28,885 ||||| || 7 23,385
28,885 - 39,885 ||||| || 7 34,385
39,885 - 50,885 ||||| ||| 8 45,385
50,885 - 61,885 || 2 56,385
61,885 - 72,885 0 67,385
72,885 - 83,885 | 1 78,385

Tabla de frecuencia relativas, de frecuencias acumuladas y de

frecuencias relativas acumuladas
Son tablas de frecuencias agrupadas o no agrupadas en donde adicionalmente aparecen las

frecuencias relativas, las frecuencias acumuladas y/o las frecuencias acumuladas relativas.
Definición 1.2.8 (a) La frecuencia relativa de un dato o de una clase se encuentra

dividiendo la frecuencia de dicho dato (o de la clase) entre el total de datos. Entonces,
a la tabla se le llama tabla de frecuencias relativas.
(b) La frecuencia acumulada de cualquier dato o clase es la suma de la frecuencia de

ese mismo dato o clase con las frecuencias de todos los demás datos o clases anteriores.
A la tabla se le llama tabla de frecuencias acumuladas.
(c) La frecuencia relativa acumulada de un dato o de una clase se obtiene dividiendo

la frecuencia acumulada del dato o de la clase por el número total de datos. A la tabla
que contiene a estas frecuencias se les denomina tabla de frecuencias relativas
acumuladas.
Ejemplo 1.2.9 En la tabla 1.7 se muestra la tabla de frecuencias relativas, de frecuencias acu-
muladas y de frecuencias acumuladas relativas para los 40 datos del ejemplo 1.2.5.
Tabla 1.7: Tabla de frecuencias para las datos del ejemplo 1.2.5.
Clase Frec. Frec. rel. Frec. acum. Frec. rel. acum.
11,5 - 14,5 2 2/40 = 0,05 ≈ 5% 2 2/40 = 0,05
14,5 - 17,5 8 8/40 = 0,20 ≈ 20% 10 (= 8+2) 10/40 = 0,25
17,5 - 20,5 11 11/40 = 0,275 ≈ 27,5% 21 (= 11+10) 21/40 = 0,525
20,5 - 23,5 10 10/40 = 0,25 ≈ 25% 31 (= 21+10) 31/40 = 0,775
23,5 - 26,5 8 8/40 = 0,20 ≈ 20% 39 (= 8+31) 39/40 = 0,975
26,5 - 29,5 1 1/40 = 0,025 ≈ 2,5% 40 (= 1+39) 40/ 40 = 1,0
Tablas de frecuencias bivariadas
Una tabla de frecuencias bivariadas es un arreglo de datos clasificados en dos cate-

gorı́as con sus respectivas frecuencias. Las categorı́as pueden ser números discretos, inter-
valos numéricos o valores cualitativos como género, color de cabello o religión.
Ejemplo 1.2.10 Una encuesta sobre el deporte preferido tuvo los resultados en hombres y mu-
jeres que se muestran en la tabla 1.8. La información que sigue, entre otras, puede leerse fácilmente
de la tabla:

22 Llinás / Rojas
(a) Se han encuestado en total a 108 personas.
(b) Hay 19 hombres que juegan béisbol.
(c) Hay 40 personas que juegan fútbol.
(d) Hubo 50 mujeres entrevistadas.
Tabla 1.8: Tabla de frecuencias bivariada para el ejemplo 1.2.10.

Deporte preferido
Béisbol Basquetbol Fútbol Total
Hombres 19 15 24 58
Mujeres 16 18 16 50
Total 35 33 40 108
1.2.4 Organización de datos mediante representaciones gráficas
Hay gráficas de varios tipos, entre los cuales se encuentran los siguientes: el diagrama
circular o de pastel, el pictograma, el diagrama de barras, el diagrama de caja y bigotes,
el histograma, el polı́gono (de frecuencia o de frecuencias relativas), la ojiva (o polı́gono
de frecuencias acumuladas o polı́gono de frecuencias relativas acumuladas) y el diagrama
de tallo y hojas. Explicaremos cada uno de ellos, con excepción del diagrama de caja y
bigotes, que será explicado en la sección 1.5.
Diagramas circulares (o de pastel)
Se utilizan para hacer representaciones porcentuales y se emplean generalmente para datos

categóricos.
Ejemplo 1.2.11 La siguiente tabla presenta los datos sobre la cantidad de refrescos de marca A,
B, C, D y E que se vendieron en una tienda:
Refresco Frecuencia Frecuencia relativa

A 19 0,38
B 8 0,16
C 5 0,10
D 13 0,26
E 5 0,10
Esta información se puede presentar a través de un diagrama circular como el que se muestra
en la figura 1.3. Para trazarlo se dibuja primero un cı́rculo. A continuación, con las frecuencias

relativas, se divide el cı́rculo en sectores o partes que corresponden a la frecuencia relativa de cada
clase. Por ejemplo, como hay 360 grados en un cı́rculo, y como el refresco A tiene 0,38 de frecuencia
relativa, el sector del diagrama circular que le corresponde debe tener (0,38)(360)=136,8 grados.
Se efectúan cálculos semejantes para las demás clases, y se obtiene el diagrama de la figura 1.3.
Los valores numéricos que se ven para cada sector pueden ser frecuencias, frecuencias relativas o
porcentajes.
Figura 1.3: Diagrama de pastel sobre compras de refresco
Pictogramas o pictógrafos
Un pictograma es la representación de datos estadı́sticos por medio de sı́mbolos que por

su forma sugieren la naturaleza del dato.
Ejemplo 1.2.12 El siguiente pictograma representa una información sobre las casas construidas
en algunos años por una firma constructora. En él se incluyen las siguientes convenciones: Δ
significa 1.000 casas construidas y Λ, 500 casas.
Años Casas construidas

2000 ΔΔΔΔΔ
2001 ΔΔΔΔΔΔΔΛ
2002 ΔΔΔΔΔΛ
2003 ΔΔΔΔΔΔΔ
Fácilmente se puede interpretar con base en el diagrama que en el 2000 la firma construyó 5.000
casas y en el 2002, 5.500 casas.
Diagrama de barras
Es una representación gráfica en la que cada una de las modalidades del aspecto de interés
se representa mediante una barra. En este gráfico se suelen disponer los datos en el primer

24 Llinás / Rojas
cuadrante de unos ejes coordenados, y se levanta sobre el eje de las abscisas una barra
para cada modalidad del dato observado. La altura de la barra ha de ser proporcional a
la frecuencia absoluta o relativa, que se representa en el eje de las ordenadas. Este tipo de
diagramas se utilizan tanto para datos categóricos como numéricos.
Ejemplo 1.2.13 La figura 1.4 muestra un diagrama de barras sobre los datos del ejemplo 1.2.11.
20
Frecuencia
16
Frecuencia
12
0
A B C D E
Refrescos
Refresco
Figura 1.4: Diagrama de barras para la compra de refrescos
Histogramas
Los histogramas son una forma de representación gráfica de una distribución de frecuen-
cia que consiste en representar las frecuencias (absolutas, relativas, acumuladas o relativas
acumuladas) por medio de áreas de rectángulos (barras). Cuando utilizamos frecuencias
absolutas, hablamos de histograma de frecuencias; cuando usamos frecuencias relativas,
histogramas de frecuencias relativas, etc. Los histogramas pueden construirse para dis-
tribuciones de frecuencias agrupadas y no agrupadas.
Histogramas para frecuencias no agrupadas
La idea de construir un histograma para frecuencia no agrupada de los datos es representar

cada frecuencia por una barra cuya área sea proporcional a ella. Tı́picamente, el ancho de
cada barra se escoge como 1, y ası́ el área de la barra es igual a la frecuencia (absoluta,
relativa, acumulada o relativa acumulada) del dato.
Es importante señalar que aquı́ los datos pueden ser categóricos o núméricos y que éstos
se colocan en el eje horizontal, y sus correspondientes frecuencias (absolutas, relativas,
acumuladas o relativas acumuladas), en el eje vertical del diagrama.
Ejemplo 1.2.14 El diagrama que se muestra en la figura 1.4 es un ejemplo de un histograma

para la frecuencia de los datos de compra de refrescos.

Histogramas para frecuencias agrupadas
Para construir un histograma para datos medidos en una escala de intervalo o en una escala
de razón, se acostumbra seguir dos pasos:
• Se organizan los datos en una tabla de frecuencias (absolutas, relativas, acumuladas

o relativas acumuladas) agrupadas.
• Se construye una gráfica de barras usando las fronteras de clase para colocar barras, y
las frecuencias (absolutas, relativas, acumuladas o relativas acumuladas) para indicar
las alturas de las barras.
Ejemplo 1.2.15 La tabla de frecuencias (absolutas, acumuladas y relativas) correspondiente a

los datos del ejemplo 1.2.6 se muestra en la tabla 1.9:
Tabla 1.9: Tabla de frecuencia agrupada para los datos del ejemplo 1.2.6
Clase Frecuencia Frecuencia acumulada Frecuencia relativa
5,95 - 7,95 4 4 0,2
7,95 - 9,95 2 6 0,1
9,95 - 11,95 8 14 0,4
11,95 - 13,95 3 17 0,15
13,95 - 15,95 3 20 0,15
Los histogramas de frecuencias relativas y de frecuencias acumuladas para estos datos son como
se ve en la figura 1.5:
%)
40 20
(en %)
acum.
Frec. acum.
rel. (en
16
30
12
Frec.rel.
20
Frec.
8
Frec.
10
4
0 0
5,95 7,95 9,95 11,95 13,95 15,95 5,95 7,95 9,95 11,95 13,95 15,95
Fronteras
Fronteras Fronteras
Fronteras
(a) Histograma de frecuencias (b) Histograma de frecuencias

relativas acumuladas
Figura 1.5: Histogramas para los datos del ejemplo 1.2.6

26 Llinás / Rojas
Polı́gonos
Estos gráficos se utilizan para representar series cronológicas y se construye usando una
tabla de frecuencias (absoluta o relativa) agrupadas con marcas de clase. Si se usan fre-
cuencias absolutas, se denomina polı́gono de frecuencias, y si se utilizan frecuencias relativas,
polı́gono de frecuencias relativas.
Ejemplo 1.2.16 Construya un polı́gono de frecuencia para los datos del ejemplo 1.2.6.
SOLUCIÓN:
Consideremos la tabla 1.5, la cual corresponde a la tabla de frecuencias agrupadas para los 20
datos del ejemplo 1.2.6, con sus correspondientes marcas de clase. Ahora construimos el polı́gono
con frecuencias absolutas mostrada en la figura 1.6.
8
Frecuencias
6
Frecuencias
0
4,95 6,95 8,95 10,95 12,95 14,95 16,95
Marcas de
Marcas declase
clase
Figura 1.6: Polı́gono de frecuencias para los datos del ejemplo 1.2.6
Las marcas de clase se colocan en el eje horizontal y las frecuencias en el eje vertical. Notemos
que el polı́gono se “baja” en ambos extremos, colocando el primero y el último punto en puntos
del eje horizontal que distan w = 2 de las marcas de clase más cercanas.
Ojivas
La ojiva, llamada también polı́gono de frecuencias acumuladas (o polı́gono de frecuencias

relativas acumuladas), se construye a partir de tablas de frecuencias (acumuladas o relativas
acumuladas). Las ojivas ofrecen un medio gráfico para interpolar o aproximar el número o
porcentaje de observaciones menores o iguales que un valor especı́fico.
Ejemplo 1.2.17 La figura 1.7 representa una ojiva con frecuencias acumuladas para los datos
del ejemplo 1.2.6. Para su construcción consideramos la tabla 1.9.

Para localizar los puntos de la ojiva usamos las fronteras superiores de cada clase (ubicadas
siempre sobre el eje horizontal) y sus correspondientes frecuencias acumuladas (ubicadas siempre
sobre el eje vertical). Después unimos los puntos consecutivos por segmentos de recta (observe
que la frecuencia acumulada para la frontera inferior de la primera clase es el número 0).
20
acum.
Frec. acum.16
12
Frec.
0
5,95 7,95 9,95 11,95 13,95 15,95
Fronteras superiores
Fronteras superiores
Figura 1.7: Ojiva para los datos del ejemplo 1.2.6
Diagrama de tallo y hojas
El uso de una tabla de frecuencia agrupada tiene una desventaja bastante obvia: los datos
originales se pierden en el proceso de agrupamiento. Para solucionar esta limitación puede
usarse el llamado diagrama de tallo y hojas. Estos diagramas fueron creados por el
estadı́stico John Tukey y ofrecen una forma novedosa y rápida de presentar información
numérica: si un numeral tiene dos o más dı́gitos, entonces se puede descomponer en un tallo
y una hoja. Un tallo es el primer dı́gito o parte del numeral, mientras que una hoja está
formada por el o los dı́gitos restantes. Por ejemplo, el numeral 534 se puede descomponer
en dos formas:
5 | 34 53 | 4
↑ ↑ ↑ ↑
tallo hoja tallo hoja
La presentación gráfica de datos es muy fácil de realizar usando tallos y hojas; cada dato
aporta una hoja de algún tallo.
Ejemplo 1.2.18 Los datos de abajo muestran el número de anuncios radiofónicos de 30 segundos
pagados el año pasado por cada uno de los 45 miembros de una empresa. Organice los datos en un
diagrama de tallo y hojas y determine la forma que toma este diagrama. ¿Alrededor de qué valores
tiende a acumularse el número de anuncios? ¿Cuál es el menor número de anuncios pagados por
un comerciante? ¿El mayor número pagado?

28 Llinás / Rojas
96 93 88 117 127 95 113 96 108 94 148 156 139 142 94

107 125 155 155 103 112 127 117 120 112 135 132 111 125 104
106 139 134 119 97 89 118 136 125 143 120 103 113 124 138
SOLUCIÓN:
En el conjunto de datos observamos que el menor número de anuncios pagados es 88. De manera
que el valor del primer tallo será 8. El número más grande es 156. Entonces, los valores de los
tallos empezarán en 8 e irán hasta 15. El primer número en los datos es 96, que tendrá como
tallo 9 y como hoja 6. Moviéndose por el renglón superior, el segundo valor es 93 y el tercero 88.
Después de tomar los tres primeros valores del conjunto de datos, su diagrama es:
8 8
9 6 3
10
11
12
13
14
15
Después de organizar todos los datos, el diagrama de tallo y hojas resultante será:
8 8 9
9 6 3 5 6 4 4 7
10 8 7 3 4 6 3
11 7 3 2 7 2 1 9 8 3
12 7 5 7 0 5 5 0 4
13 9 5 2 9 4 6 8
14 8 2 3
15 6 5 5
Lo que solemos hacer es ordenar los valores de las hojas de menor a mayor y, en este caso, el
diagrama final quedará ası́:
8 8 9
9 3 4 4 5 6 6 7
10 3 3 4 6 7 8
11 1 2 2 3 3 7 7 8 9
12 0 0 4 5 5 5 7 7
13 2 4 5 6 8 9 9
14 2 3 8
15 5 5 6
Del diagrama de tallos y hojas se pueden sacar varias conclusiones, como, entre otras, las siguientes:
• Primero, el menor número de anuncios comprados es 88 y el mayor es 156.

• Dos comerciantes compraron menos de 90 anuncios, y tres, más de 150.
• Puede observarse, por ejemplo, que hay tres comerciantes que compraron más de 150 co-
merciales.
• La mayor concentración del número de comerciales está entre 110 y 130.
• Hubo 9 comerciantes que compraron entre 110 y 119 anuncios y 8, entre 120 y 129.
• También podemos decir que dentro del grupo de 120 a 129, el número de anuncios comprados
se repartió uniformemente.
• Dos comerciantes compraron 120; uno, 124; tres, 125 y dos, 127.
Para concentrarnos en la forma que toma el diagrama de tallos y hojas, coloquemos un rectángulo
para representar la “cantidad de hojas” de cada tallo. Al hacerlo obtenemos la siguiente repre-
sentación:
8 8 9
9 3 4 4 5 6 6 7
10 3 3 4 6 7 8
11 1 2 2 3 3 7 7 8 9
12 0 0 4 5 5 5 7 7
13 2 4 5 6 8 9 9
14 2 3 8
15 5 5 6
Si giramos la página 90 grados en el sentido de las manecillas del reloj, obtenemos una imagen de
los datos que se parece mucho a la de un histograma con clases de 80 a 90, 90 a 100, 100 a 110,
etc. Aunque el diagrama de tallos y hojas parece ofrecer la misma información que un histograma,
tiene dos ventajas principales:
1. Es más fácil de construir.
2. Dentro de un intervalo de clase, el diagrama de tallo y hojas da más información que un

histograma porque muestra los valores reales.

6. Clasifique los datos siguientes en cuantitativos (numéricos) y cualitativos (categóricos). En
caso de ser numérico, como discretos o continuos:
(a) Estaturas en centı́metros de cuatro jugadores de fútbol.

(b) El número de goles anotados por un futbolista en toda su carrera deportiva.
(c) Los sueldos ganados por unos profesores universitarios.

30 Llinás / Rojas
(d) Las temperaturas promedios diarias en el último mes.

(e) Clasificación étnica de 30 empleados.
(f) Números telefónicos de ciertas personas.
(g) Calificaciones del primer parcial de Estadı́stica de unos estudiantes universitarios.
(h) Distancia (en metros) recorrido por un atleta en una temporada.
(i) Peso perdido (en kilogramos) por 10 personas debido a una dieta.
(j) Fecha de cumpleaños de determinadas personas.
(k) Calificaciones (E, S, A, D, I) de unos estudiantes de bachillerato.
(l) Rango militar.
7. Diga la clase de gráficas que son apropiadas para datos (a) cualitativos, (b) cuantitativos y
(c) nominales.
8. La tabla siguiente contiene la distribución de vehı́culos que hay en un parqueadero:
Clase Tipo de vehı́culo Cifra registrada

1 Taxi 30
2 Camioneta 20
3 Motocicleta 35
4 Bicicleta 40
(a) Identifique los datos de cada una de las tres columnas como cuantitativos o cualitativos.
(b) Identifique los datos de la tercera columna como discretos o continuos.
(c) Determine los datos de cada una de las tres columnas como nominales, ordinales, de
intervalo o de razón.
9. A continuación se presenta una escala numérica para medir la efectividad de la tecnologı́a

en la enseñanza de una determinada asignatura: 1, si necesita mejorarse; 3, si es efectiva y
competente; y 5, si es verdaderamente extraordinaria.
(a) Identifique el tipo de escala de medición.

(b) Suponga que 20 estudiantes usan esta escala para evaluar a su maestro de estadı́stica.
¿Será más fácil interpretar esos resultados que los que se obtendrı́an si los 20 estudiantes
evaluaran a su maestro mediante una opinión escrita de respuesta libre? Explique.
10. Los siguientes datos representan los totales, en miles de pesos, gastados en fotocopias por
una muestra de 25 estudiantes durante un semestre:
29 89 77 72 39 47 64 84 88 57 28 63 38
42 36 72 69 68 41 52 39 84 45 52 72
Construya una tabla de frecuencias agrupadas usando la regla de Sturges.

11. Los datos adjuntos representan una muestra del aumento de precios (en pesos) de la gasolina
extra en una cierta ciudad a lo largo de un año en particular:
123,9 127,9 130,9 121,9 132,9 120,8 115,9 117,9 131,9

121,9 126,9 122,8 126,9 137,9 115,9 115,9 121,9
126,9 119,9 118,9 119,8 116,9 129,9 122,8 119,9
Mediante cinco clases construya una tabla de frecuencias relativas acumuladas agrupadas.
12. Se clasificó a los estudiantes de un programa universitario de acuerdo con el semestre que
cursan y sus preferencias deportivas. Los resultados están registrados en la siguiente tabla:
Primero Segundo Tercero Cuarto

Fútbol 15 14 5 9
Béisbol 12 22 6 6
Voleibol 5 5 9 5
Basquetbol 26 7 6 7
Natación 7 8 4 2
(a) ¿Qué porcentaje de los estudiantes de primer semestre prefieren el fútbol?

(b) ¿Qué porcentaje de los aficionados a la natación son de segundo semestre?
(c) ¿Qué porcentaje del total de los estudiantes prefieren el basquetbol?
(d) ¿Qué porcentaje de los estudiantes son de cuarto semestre?
(e) ¿Qué porcentaje del total de estudiantes son de tercero o cuarto semestre?
(f) ¿Qué porcentaje prefiere la natación, el voleibol o el béisbol?
13. Los siguientes datos representan las cuentas telefónicas mensuales, en miles de pesos, de 25
residentes de un pequeño pueblo:
21,48 21,15 25,12 23,47 27,81 19,80 36,05 28,50 26,66

20,35 30,22 25,49 20,80 23,83 25,35 23,48 25,81 21,07
26,83 30,96 33,38 20,77 19,98 35,87 22,02
(a) ¿Qué porcentaje del grupo pagó más de 21.000 pesos?

(b) ¿Qué porcentaje pagó más de 22.000 pesos pero menos de 27.000 pesos?
14. Considere la siguiente distribución de frecuencias:
Clase 20-40 40-60 60-80 80-100 100-120

Trace un histograma de frecuencias relativas, un histograma de frecuencias relativas acu-

muladas, un polı́gono de frecuencias absolutas y una ojiva de frecuencias acumuladas para
estos datos.

32 Llinás / Rojas
15. Los datos que se indican a continuación representan el costo (en miles de pesos) de la
energı́a eléctrica durante un determinado mes del año para una muestra aleatoria de 50
apartamentos en cierta ciudad importante:
128 144 168 109 167 141 149 206 175 123
153 197 127 82 96 171 202 178 147 102
135 191 137 129 158 108 119 183 151 114
111 148 213 130 165 157 185 90 116 172
143 187 166 139 149 95 163 150 154 130
(a) Obtenga una tabla de frecuencias con 7 intervalos de clase.

(b) Grafique el correspondiente histograma de frecuencias, el polı́gono de frecuencias rela-
tivas y la ojiva con frecuencias acumuladas relativas.
(c) ¿Alrededor de qué cantidad parece concentrarse el costo mensual de energı́a eléctrica?
(d) Según su opinión, ¿cuál de las gráficas representa mejor la distribución de los costos de
energı́a eléctrica?
16. Se les pidió a 20 personas que identificaran su preferencia religiosa. Los resultados son:
C P P J J A J C P P C J J C P P A P C J
donde C denota católico; P, protestante; J, judı́o y A, ateo. Construya una tabla de fre-
cuencias (absolutas, relativas, acumuladas y acumuladas relativas), un diagrama de barras,
uno circular y un pictograma.
17. Los siguientes datos presentan los porcentajes de rentabilidad de las acciones de 25 empresas:
30,8 20,3 24,0 29,6 19,4 38,0 24,5 21,5 25,6

30,8 32,9 30,3 39,5 13,3 28,0 19,9 24,6 32,3
30,7 20,3 24,7 18,7 36,8 31,2 50,9
Construya un diagrama de tallo y hojas, una tabla de frecuencias agrupadas usando la

fórmula de Sturges y con ayuda de esta tabla responda las preguntas que se formulan en los
siguientes incisos:
(a) ¿Qué porcentaje de empresas tienen el porcentaje de rentabilidad de las acciones mayor
que 34,25%?
(b) ¿Cuántas empresas tienen el porcentaje de rentabilidad de las acciones menor que
27,25% o mayor que 41,25%?
18. Según un estudio reciente, en cierto paı́s mueren cada año 40.000 mujeres a causa del cáncer
de mama y 85.000 por diabetes. Dibuje un diagrama de barras y un pictograma que repre-
sente esta información.
19. En 1986 se produjeron 50,2 nacimientos por cada mil mujeres con edad entre 15 y 19 años.
En 1991, el número de nacimiento fue de 62,1 por cada mil mujeres de la misma edad.
Dibuje un diagrama de barras que represente esta información.

20. De las pelı́culas que están en cartelera en una gran ciudad, el 30% son dramas, el 35%
comedias, un 15% pelı́culas de acción, otro 6% de ciencia ficción, el 10% policiacas y el 4%
de terror. Construya un diagrama circular que represente esta información.
21. La siguiente tabla se refiere a los usos más comunes citados en una encuesta realizada
a usuarios de computadores de pequeñas y medianas empresas. Construya un diagrama
circular para representar esta información:
Área Respuestas (%)

Contabilidad 22
Procesadores de texto 12
Hojas de cálculo 16
Bases de datos 13
Puntos de venta 1
Telecomunicaciones 4
Otros 32
22. Un reporte sobre galletas reportó las siguientes calificaciones para varias marcas:
32 53 50 65 45 40 56 44 62 32
Integral
30 40 50 56 30 22 56 68 41
47 40 34 62 52 62 53 75 42
No integral
75 80 47 56 62 50 34 42 36
Construya una presentación comparativa de tallo y hoja, ponga en una lista los tallos (en el
centro de la página), las hojas integrales a la derecha y las hojas no integrales a la izquierda.
Describa las similitudes y diferencias para los dos tipos.
1.3 Análisis de datos en tablas de frecuencias

no agrupadas
A continuación estudiaremos las medidas que describen el comportamiento de un conjunto
de datos. Estas medidas son: las de tendencia central (o de centralización), las de colocación
(o de posición relativa), las de dispersión (o de variabilidad ) y las de forma. Estas se pueden

visualizar intuitivamente en las siguientes gráficas de la figura 1.8 (que corresponde a las
gráficas de los llamados histogramas suavizados).
1.3.1 Medidas de tendencia central o de centralización
Al estudiar la información estadı́stica mediante su representación gráfica, se puso en evi-

dencia un significativo comportamiento de los datos en cuanto a la frecuencia con que se
presentan los valores: algunos de estos valores son más frecuentes que otros. Además, se
1.3. Análisis de datos en tablas de frecuencias no agrupadas

34 Llinás / Rojas
Figura 1.8: Ilustración de las medidas estadı́sticas
observó una clara tendencia de agrupación en el vecindario de los valores más frecuentes,
lo cual hace que las gráficas representativas adquieran formas especiales. Por lo general,
la mayor densidad de frecuencia está en la parte central de las gráficas; de aquı́ deriva el
nombre de medidas de tendencia central que se da a la media, la mediana, la moda,
el rango medio, la media geométrica, la media armónica y la media cuadrática. En esta
sección estudiaremos estas medidas de tendencia central.
Media
Definición 1.3.1 La media aritmética de cierto conjunto de números se encuentra

sumando los números y dividiendo después entre la cantidad de datos. En otras palabras,
si x1 , . . . , xn son números, entonces la media aritmética de este conjunto de números está
dada por
x 1 + · · · + xn
Media aritmética =
n
En estadı́stica se habla de media aritmética poblacional, y se simboliza por μ, cuando el conjunto

de datos corresponden a los de la población; y de media aritmética muestral, y se simboliza por x,
cuando se tienen en cuentan los datos de una muestra.
Ejemplo 1.3.2 Supongamos que tenemos la muestra siguiente de edades en año de principiantes
de una universidad: 18, 18, 18, 18, 19, 19, 19, 20, 20, 21. Entonces, la media aritmética de estos
datos es:
18 + 18 + 18 + 18 + 19 + 19 + 19 + 20 + 20 + 21
x = = 19
10

Generalmente, para calcular la media de un conjunto de datos es más cómodo utilizar la

llamada media aritmética ponderada, la cual es un caso especial de la media aritmética.
Esta se puede utilizar cuando se tienen varias observaciones con un mismo valor, lo que
puede ocurrir si se han organizado los datos en una tabla de frecuencias.
Definición 1.3.3 Sea dada siguiente tabla de frecuencias no agrupadas:
Dato x1 x2 ... xn
Frecuencia f1 f2 ... fn
en donde fi es la frecuencia del dato xi . Entonces, la media aritmética ponderada o,

simplemente, media artimética, de los datos x1 , . . . , xn se define como
x1 f1 + · · · + xn fn
Media aritmética =
f1 + · · · + fn
Ejemplo 1.3.4 La media aritmética de los datos del ejemplo 1.3.2 la podemos calcular con ayuda
de la llamada media aritmética ponderada. Para ello, organizamos estos datos en una tabla de
frecuencias no agrupadas, tal como
Dato 18 19 20 21
Frecuencia 4 3 2 1
Luego, aplicamos la definición 1.3.3 y hallamos la media de los datos de la siguiente manera:
(18)(4) + (19)(3) + (20)(2) + (21)(1)

x = = 19
4+3+2+1
Desventaja de la media
La media tiene una seria desventaja: se ve afectada por los valores extremos del final de
una distribución. Como depende del valor de cada medida, los valores extremos pueden
llevarla a representar defectuosamente los datos.
Mediana y moda
La mediana y la moda son medidas de tendencia central que no tienen propiedades que
les permitan intervenir en desarrollos algebraicos como la media aritmética, por eso tienen
menor importancia teórica que aquélla. Sin embargo, poseen propiedades que ponen en
evidencia ciertas cualidades de un colectivo, cosa que no ocurre con la media aritmética,
que promedia todos los valores igualando en un justo reparto todas las observaciones, es
decir, suprimiendo sus individualidades. En cambio, la mediana y la moda destacan los

36 Llinás / Rojas
valores individuales, de lo que se desprende su utilidad e importancia en cierto tipo de

análisis.
Mediana
Definición 1.3.5 Para datos medidos en al menos una escala de intervalo, la mediana
es el puntaje medio ordenado.
Para determinar la mediana de n datos, hay que realizar los siguientes pasos:
• Ordene los datos de menor a mayor con ayuda de un diagrama de tallo y hojas ordenado.
• El valor de la mediana dependerá del hecho de que n sea par o impar:
– Si n es impar, entonces la mediana será el dato en el centro, es decir, la mediana es el dato

que se encuentra en el lugar n+1
2 ;
– si n es par, entonces la mediana es la media de los dos datos que ocupan posiciones centrales,
es decir, la mediana es el promedio de las datos que se encuentran en los lugares n2 y n2 + 1.
Nótese que, por ejemplo, n+1

2 no representa uno de los datos, sino el número de valores que deben
contarse para llegar a la mediana.
Ejemplo 1.3.6 El conjunto de números 3, 4, 4, 5, 6, 8, 8, 8 y 10 tiene mediana 6, puesto que ya

los datos están ordenados, el número de datos es 9 (impar) y, en este caso, el 6 está ubicado en el
centro (en el cuarto lugar).
Ejemplo 1.3.7 El conjunto de números 5, 5, 7, 9, 11, 12, 15 y 18 tiene mediana 12 (9 + 11) = 10,
puesto que ya los datos están ordenados, el número de datos es 8 (par), el 9 y el 11 son los dos
datos que ocupan posiciones centrales y 10 es el promedio de estos dos datos.
Ejemplo 1.3.8 Encuentre la mediana para los datos organizados en la siguiente tabla de frecuen-
cias:
Dato 0 1 2 3 4
SOLUCIÓN:
Como los datos se presentan en una tabla de frecuencias no agrupadas, para calcular la mediana
es conveniente determinar las frecuencias acumuladas de los datos. Estas se encuentran en la tabla
1.10:
Como el total de datos es n = 40 (par), entonces la mediana es el promedio de las medidas que
están en las posiciones n2 = 20 y n2 + 1 = 21. Para encontrar la mediana recomendamos contar los
datos en dirección de la medida menor a la mayor. En la tabla es fácil ver que el dato en lugar 20
es 1 y que el dato en la posición 21 es 2. Por tanto, la mediana es:
dato en la posición 20 + dato en la posición 21 1+2
Mediana = = = 1, 5
2 2

Tabla 1.10: Tabla de frecuencia acumulada para los datos del ejemplo 1.3.8
Dato Frecuencia Frecuencia acumulada
0 10 10
1 10 20
2 8 28
3 4 32
4 8 40
Ventajas y desventajas de la mediana
El uso de la mediana para datos de intervalo posee tanto ventajas como desventajas. Una
ventaja consiste en que la mediana no se ve afectada por valores extremos al final de la
distribución. Su desventaja reside en que no es fácilmente determinable si el conjunto
de datos es grande, puesto que las medidas deben ordenarse primero y ponerse en orden
numérico de menor a mayor o al contrario.
Moda
Definición 1.3.9 La moda, si se da, es el dato con mayor frecuencia.
Ejemplo 1.3.10 El conjunto 2, 2, 5, 7, 9, 9, 9, 11 tiene moda 9 porque este valor es el dato con
mayor frecuencia.
Ventajas y desventajas de la moda
• Tiene dos ventajas: Para ciertas muestras pequeñas, se le determina fácilmente y,

en general, no se ve afectada por los valores extremos al final de un conjunto de
datos ordenados. Cuando se analizan datos categóricos, la moda es el único dato
de tendencia central que puede utilizarse. Además, la moda puede usarse como una
medida de tendencia central para datos numéricos empleados en sentido categórico.

Una moda para datos en una tabla de frecuencia se encuentra localizando el valor de
frecuencia máxima, si no todas las frecuencias son iguales. El dato que corresponde
al valor de frecuencia máxima se toma como la moda.
Ejemplo 1.3.11 Para los datos del ejemplo 1.2.11, el refresco más popular es el A (es decir,
la moda es el refresco A), puesto que es el que más se compra.
• La moda tiene varias desventajas como medida de tendencia central: una de ellas
consiste en que para un cierto conjunto de datos no puede haber moda. Esta situación

38 Llinás / Rojas
surge cuando todos los datos tienen la misma frecuencia. Otra desventaja reside en
que la moda puede existir pero no ser única.
Ejemplo 1.3.12 (a) El conjunto 3, 3, 5, 5, 7 y 7 no tiene moda.
(b) El conjunto 3, 3, 5, 5, 5, 7, 7, 7, y 9 tiene dos modas: el 5 y el 7.
Rango medio
Definición 1.3.13 El rango medio de un conjunto de datos es el promedio de las medi-

das mayor y menor.
Ejemplo 1.3.14 El rango medio del conjunto de datos 32, 38, 45, 44, 27, 36, 40 y 38 está dado
por
27 + 45
Rango medio = = 36
2
ya que 45 y 27 son los datos mayor y menor respectivamente.
Ventajas y desventajas del rango medio
Con cierta frecuencia, el rango medio se utiliza como una medida de resumen tanto para
análisis financiero como para reportes metereológicos, porque puede proporcionar una me-
dida adecuada, rápida y sencilla que caracteriza a todo el conjunto de datos. A pesar de
estas ventajas y de su sencillez, el rango medio se debe utilizar con cuidado. Como sólo
incluye la observación más pequeña y la más grande en un conjunto de datos, el rango
medio es una medida modificada de tendencia central si está presente un valor extremo.
En estas situaciones, el rango medio no es apropiado.
Media geométrica
La media geométrica es útil para encontrar los cambios procentuales en una serie de
números positivos, inclusive, para encontrar el promedio de proporciones, ı́ndices, o tasas
de crecimiento. Tiene mucha aplicación en el comercio y en la economı́a porque nos interesa
encontrar el cambio porcentual en las ventas, salarios o datos económicos, tales como el
producto nacional bruto.

Definición 1.3.15 La media geométrica de un conjunto de n números enteros positivos

se define como la n-ésima raı́z del producto de los n valores. Es decir, la media geométrica
de los n números positivos x1 , . . . , xn se calcula a través de la fórmula
Media geométrica = (x1 · · · xn )1/n
Si estos números positivos x1 , . . . , xn tienen frecuencias (ponderaciones o pesos) f1 , . . . , fn ,

respectivamente, entonces la media geométrica (ponderada) de estos números viene
dada por la (f1 + · · · + fn )-ésima raı́z del producto de los valores, elevando cada uno a su
respectiva frecuencia, es decir,
1/(f1 +···+fn )
Media geométrica = xf11 · · · xfnn
La media geométrica siempre será menor que la media aritmética, salvo en el extraño caso en el que todos
los incrementos porcentuales sean iguales. Si esto último sucede, las dos medias serán iguales.
Ejemplo 1.3.16 Dos pueblos determinados tienen un 48 y un 34%, respectivamente, de población

masculina. Discutir la mayor conveniencia de la media geométrica para promediar porcentajes.
SOLUCIÓN:
La media aritmética para estos porcentajes es:
48% + 34%
x = = 41%
2
y la media geométrica: √
G = 48% · 34% = 40, 4%
Ahora, la media aritmética de los porcentajes recı́procos es:

1 1
+ 0, 0208 + 0, 0294
x = 48% 34%
= = 0, 0251
2 2
y la media geométrica es:

1 1

G = · = 0, 0208 · 0, 0294 = 0, 0247
48% 34%
Debido a que
1
= 0, 02439 = 0, 0251 = x
x
y, en cambio,
1 1
= = 0, 0247 = G
G 40, 4%
Debido a que x1 = x y a que G1 = G , podemos afirmar que la media geométrica es mejor que la
media artimética para promediar porcentajes y proporciones.

40 Llinás / Rojas
Ejemplo 1.3.17 El director ejecutivo de una empresa desea determinar la tasa de crecimiento
promedio en los ingresos con base en las cifras dadas en la tabla 1.11. Si la tasa de creciemiento
promedio es menor que el promedio industrial del 10%, se comenzará una nueva campaña publi-
citaria.
Tabla 1.11: Ingresos para una empresa

Año Ingreso (en dólares) Porcentaje del año anterior
1992 50.000 ––
1993 55.000 55/50 = 1, 10
1994 66.000 66/55 = 1, 20
1995 60.000 60/66 = 0, 91
1996 78.000 78/60 = 1, 30
SOLUCIÓN:
Primero es necesario determinar el porcentaje que los ingresos de cada año representan respecto
de los obtenidos el año anterior. En otras palabras, ¿qué porcentaje del ingreso de 1992 es el
ingreso en 1993? Esto se encuentra dividiendo los ingresos de 1992 entre los de 1993. El resultado
1,10 revela que los ingresos de 1993 son 110% de los ingresos de 1992. También se calculan los
porcentajes para los tres años restantes. Tomando la media geométrica de estos porcentajes da:
Media geométrica = [(1, 10)(1, 2)(0, 91)(1, 3)]1/4 = 1, 1179
Restando 1 para convertirlo a un incremento anual promedio da 0,1179, o un incremento promedio

de 11,79% para el promedio de cinco años. Por otro lado, la media aritmética es:
1, 1 + 1, 2 + 0, 91 + 1, 3
x = = 1, 1275
4
o un cambio promedio de 12,75%. Se divide por 4, ya que se presentaron cuatro cambios durante
el periodo de cinco años. Sin embargo, si un incremento promedio de 12,75%, basado en la media
aritmética, se aplica a la serie que comienza con 50.000 dólares, los resultados son:
50.000 dólares × 1, 1275 = 56.375 dólares
56.375 dólares × 1, 1275 = 63.563 dólares
63.563 dólares × 1, 1275 = 71.667 dólares
71.667 dólares × 1, 1275 = 80.805 dólares
Ya que 80.805 dólares excede los 78.000 que la empresa en realidad ganó, el incremento del 12,75%
es obviamente muy alto. Si se utiliza la tasa de crecimiento de la media geométrica del 11,79%,
se obtiene:
50.000 dólares × 1, 1179 = 55.895 dólares
55.895 dólares × 1, 1179 = 62.485 dólares
62.485 dólares × 1, 1179 = 69.852 dólares
69.852 dólares × 1, 1179 = 78.088 ≈ 78.000 dólares

Esto da un valor de 78.088 dólares, lo que está mucho más cerca al ingreso real de 78.000 dólares.
Como interpretación final podemos decir lo siguiente: La media geométrica representa el cambio
promedio con el tiempo. Debido a que la tasa de crecimiento supera el promedio de la industria
del 10%, la nueva campaña publicitaria no se llevará a cabo.
A continuación se presenta un ejemplo que ilustra el cálculo de la media geométrica de un

conjunto de datos que aparecen en una tabla frecuencias no agrupadas.
Ejemplo 1.3.18 La media geométrica de la distribución de frecuencias que aparece en la tabla
Dato 1 3 4 6
Frecuencia 3 2 3 5
viene dada por

3 2 3 5 1/13
Media geométrica = 1 ·3 ·4 ·6 ≈ 3, 248
Media armónica
Definición 1.3.19 La media armónica es el recı́proco de la media aritmética de los

recı́procos de los datos. Es decir, la media armónica de los datos x1 , x2 , . . . , xn está dada
por
n
Media armónica = 1
x1
+ x2 + · · · + x1n
1
Si estos datos x1 , . . . , xn tienen frecuencias (ponderaciones o pesos) f1 , . . . , fn , respectiva-

mente, entonces la media armónica (ponderada) de estos datos viene dada por
f1 + f2 + · · · + fn
Media armónica = f1
x1
+ xf22 + · · · + xfnn
Ejemplo 1.3.20 Una ama de casa ha ido comprando durante cuatro años arroz a distintos pre-
cios:
• El primer año a $ 1.200 el kilogramo.
• El segundo año a $ 1.400 el kilogramo.
• El tercer año a $ 1.600 el kilogramo.
• El cuarto año a $ 1.700 el kilogramo.
Halle el costo promedio del arroz durante estos cuatro años, suponiendo que

42 Llinás / Rojas
(a) El número promedio de kilos consumidos al año por el ama de casa es constante.
(b) La cantidad de dinero gastado al año es constante.
SOLUCIÓN:
Aquı́ nos piden calcular el cociente:
Costo total
T := Costo promedio =
Cantidad total comprada
(a) Si K representa al número de kilos consumidos cada año, entonces el costo promedio T será:
$ 1.200K + $ 1.400K + $ 1.600K + $ 1.700K

T =
4K
$ 1.200 + $ 1.400 + $ 1.600 + $ 1.700
= = $ 1.475 por kilogramo,
4
lo cual no es más que la media aritmética de los precios.
(b) Ahora, sea D la cantidad de dinero gastado por año. Entonces, en este caso, el costo promedio
T será:
4D
T = D D D D
$ 1.200 + $ 1.400 + $ 1.600 + $ 1.700
4 $4
= 1 1 1 1 = = $ 1.449, 27 por kilogramo,
$ 1.200 + $ 1.400 + $ 1.600 + $ 1.700
0, 00276
lo cual no es más que la media armónica de los precios.
La media armónica también es útil para promediar velocidades desarrolladas en distancias

iguales, como se ilustra en el siguiente
Ejemplo 1.3.21 Una persona viaja en auto de Barranquilla a Cartagena con una velocidad me-
dia de 60 kilómetros por hora y regresa (por la misma vı́a) a una velocidad media de 120 kilómetros
por hora. Halle su velocidad media en el viaje completo.
SOLUCIÓN:
Sea D la distancia recorrida por el auto de Barranquilla a Cartagena (que es la misma que recorre
el auto de Cartagena a Barranquilla). Entonces,
D
Tiempo para ir de Barranquilla a Cartagena =
60km/h
D
Tiempo para ir de Cartagena a Barranquilla =
120km/h
Por consiguiente,
distancia total 2D
Velocidad media del viaje total = = D D
tiempo total 60km/h + 120km/h
2D
= D D
= 80km/h
60km/h + 120km/h

que corresponde3 a la media armónica de 60 km/h y 120 km/h. Notemos que hubiéramos estado
tentado a calcular la media aritmética de 60 km/h y 120 km/h, obteniendo 45 km/h, lo cual es
incorrecto.
1.3.2 Medidas de colocación o de posición relativa
Definición 1.3.22 Una medida de colocación o de posición relativa para una dis-
tribución de frecuencias es aquel valor para el cual una porción especı́fica de la distribución
queda en o debajo de él.
La mediana, los percentiles, deciles y cuartiles son ejemplos de medidas de posición relativa.
Percentiles
Definición 1.3.23 El p-ésimo (punto) percentil es un valor tal que a lo más un p%

de los datos tienen dicho o menos de ese valor y, al menos, un (100 − p)% de los datos
tienen este valor o más.
Para calcular el p-ésimo (punto) percentil de un conjunto de n datos, es importante que tengamos
en cuenta los siguientes pasos:
• Ordenemos los datos de manera ascendente.
• Calculemos un ı́ndice i a través de la fórmula i = np/100, siendo p el percentil de interés y n, la
cantidad de datos.
• Decidamos de acuerdo a uno de los dos casos:
– Si el ı́ndice i no es entero, redondeamos al entero siguiente. Este valor aproximado de i indica

la posición del p-ésimo percentil.
– Si i es entero, el p-ésimo percentil es el promedio de los valores de los datos ubicados en las
posiciones i y i + 1.
Ejemplo 1.3.24 Calcule (a) el 85-ésimo punto percentil y (b) el 50-ésimo punto percentil de
los siguientes datos que representan los salarios (en millones de pesos) de 12 empleados en una
empresa:
2, 350 2, 450 2, 550 2, 380 2, 255 2, 210 2, 390 2, 630 2, 440 2, 825 2, 420 2, 380
SOLUCIÓN:
Como primer paso fundamental debemos ordenar los datos de manera ascendente (preferiblemente
3
Si las distancias recorridas no son iguales, se llega a una media armónica ponderada, en donde las
ponderaciones o pesos son las distancias.

44 Llinás / Rojas
con ayuda de un diagrama de tallo y hojas):
2, 210 2, 255 2, 350 2, 380 2, 380 2, 390 2, 420 2, 440 2, 450 2, 550 2, 630 2, 825
(a) Para determinar el 85-ésimo punto percentil, calculemos el ı́ndice i = np/100, con p = 85 y
n = 12. Al reemplazar obtenemos que i = 10, 2. En este caso, como i = 10, 2 no es entero,
entonces redondeamos a 11. Por lo tanto, el lugar del 85-ésimo percentil es el lugar 11. En
nuestros datos ordenados corresponde a 2,630. Esto quiere decir que el 85% de los empleados
de la empresa ganan $2.630.000 o menos de este valor y que el 15% de estos empleados ganan
$2.630.000 o más que este valor.
(b) En este caso, p = 50. Con ello y con n = 12 obtenemos que i = 6 (que es un número entero).
Es decir, el 50% percentil es el promedio de los valores sexto (2,390) y séptimo (2,420), o
sea, 2,405. Observemos que este valor coincide con la mediana del conjunto de datos. En
conclusión, podemos decir que el 50% de los empleados tienen un salario menor o igual (o
mayor o igual) que $2.405.000.
Cuartiles
Como veremos en la siguiente definición, los cuartiles son casos particulares de los per-
centiles.
Definición 1.3.25 Los cuartiles son las medidas de posición relativa correspondiente a
un conjunto ordenado de datos divididos en cuatro partes (iguales) y se definen ası́:
• Q1 = primer cuartil o 25-ésimo percentil.
• Q2 = segundo cuartil o 50-ésimo percentil o también mediana.
• Q3 = tercer cuartil o 75-ésimo percentil.
Ejemplo 1.3.26 Calcule todos los cuartiles del conjunto de datos del ejemplo 1.3.24.
SOLUCIÓN:
Como Q2 coincide con la mediana, entonces Q2 = 2, 405. Calculando los percentiles como en el
ejemplo 1.3.24 podemos verificar que
2, 350 + 2, 380 2, 450 + 2, 550
Q1 = = 2, 365 y Q3 = = 2, 500
2 2
Estos resultados se interpretan de la siguiente manera: el valor del primer cuartil significa que el
25% de los empleados gana al menos $2.365.000 o el 75% gana más de este salario, y el valor del
tercer cuartil significa que el 75% de los empleados gana al menos $2.500.000 o el 25% gana más
de este salario.

Deciles
Al igual que los cuartiles, los deciles también son casos particulares de los percentiles.
Definición 1.3.27 Los deciles son las medidas de posición relativa correspondiente a
un conjunto de datos (ordenado ascendentemente) que está dividido en diez partes, de tal
forma que cada parte contiene aproximadamente 10% de las medidas.
Hay nueve deciles, denotados por D1 , D2 , . . . y D9 . Si Dn es el n-ésimo decil, entonces cada

punto decil corresponde a un punto percentil. Por ejemplo, D4 es el 40-ésimo punto percentil, D7 es
70-ésimo punto percentil, etc.
1.3.3 Medidas de dispersión o de variabilidad
Los datos que se presentan en la tabla 1.12 muestran los salarios anuales de siete supervisores
de ventas de una empresa y los de siete de otra empresa. Observemos que ambos conjuntos
de datos tienen la misma media (33.500 dólares) y la misma mediana (33.800 dólares).
Tabla 1.12: Salarios anuales (en dólares) de la plantilla de supervisores de ventas de dos
empresa
Empresa 1 34.500 30.700 32.900 36.000 34.100 33.800 32.500
Empresa 2 34.000 27.500 31.600 39.700 35.300 33.800 31.700
Por tanto, si nos limitásemos a fijarnos en las medidas de centralización, no tendrı́amos

base alguna para distinguir entre la distribución de los salarios en las dos empresas.
(a) En la primera empresa
(b) En la segunda empresa
Figura 1.9: Dispersión de los salarios anuales de los empleados de dos empresas (compárese
con los datos de la tabla 1.12)

46 Llinás / Rojas
Sin embargo, estas dos distribuciones son muy diferentes, como podemos apreciar en la
figura 1.9. Evidentemente que los datos del segundo conjunto están mucho más dispersos
que los del primero. Una medida de centralización casi nunca es suficiente por sı́ sola
para analizar adecuadamente las caracterı́sticas de un conjunto de datos. Por lo general,
necesitaremos, además, una medida de la dispersión o variación de los datos. Entre las
que analizaremos se encuentran el rango o recorrido, el rango intercuartil, la desviación, la
varianza, la desviación estándar y el coeficiente de variación.
Rango o recorrido
Es la medida de dispersión más simple. Esta medida ya ha sido explicada en algunos ejem-
plos de las secciones anteriores.
Definición 1.3.28 Se define el rango o recorrido de un conjunto de datos (numéricos)

como la diferencia entre el dato más alto y el más bajo.
Su ventaja consiste en que es fácil de calcular y su desventaja reside en que considera sólo dos de
la gran cantidad de datos que hay en un conjunto (de datos) e ignora el resto.
Ejemplo 1.3.29 El rango R del conjunto de datos del ejemplo 1.3.24 es:
R = $2.825.000 − $2.210.000 = $615.000
Rango intercuartil
Una medida de dispersión que elimina la influencia de los valores extremos de los datos es
el rango intercuartil.
Definición 1.3.30 El rango intercuartil, simbolizado por R.I, es la diferencia entre

el tercero y el primer cuartil. Es decir,
R.I = Q3 − Q1
El rango intercuartil contiene el 50% de los datos, dejando a la izquierda el 25% inferior de los datos y a
la derecha el 25% superior.
Ejemplo 1.3.31 Halle el rango intercuartil del conjunto de datos de la empresa 1 de la tabla 1.12.

SOLUCIÓN:
Para estos datos, el primer cuartil es 32.500 dólares y el tercero 34.500 dólares. Por lo tanto,
Rango intercuartil = 34.500 − 32.500 = 2.000 dólares.
Desviación
Definición 1.3.32 La desviación de un dato se define como la diferencia entre el dato

y la media del conjunto de datos de donde proviene dicho dato. Es decir, sean dados los
datos x1 , . . . , xn . Entonces, la desviación del dato xi se define como
Desviación del dato xi = xi − x

Una desviación positiva para una medida indica que la medida está por encima de la media, mientras que
una desviación negativa nos señala que está por debajo de la media. Una desviación 0 para un dato indica
que el dato es igual a la media.
Ejemplo 1.3.33 Calcule la desviación de los puntajes para los datos siguientes, que representen
el número de defectos encontrados por un inspector de automóviles en una lı́nea de ensamblaje
en los últimos cinco automóviles producidos: 1, 4, 6, 6 y 8.
SOLUCIÓN:
Podemos determinar que la media muestral es x = 5. Las desviaciones de los valores las presen-
tamos en la tabla siguiente:
x x−x
1 1-5 = -4
4 4-5 = -1
6 6-5 = 1
6 6-5 = 1
8 8-5 = 3
Podemos observar que
1. Las medidas 6 y 8 están arriba de la media y sus desviaciones son positivas.
2. Las medidas 1 y 4 están debajo de la media y sus desviaciones son negativas.
3. La suma de las desviaciones es 0.
Una propiedad importante que podemos resaltar con respecto la desviación de un dato es
la siguiente:

48 Llinás / Rojas
Teorema 1.3.34 La suma de las desviaciones de los valores para cualquier conjunto de
números x1 , . . . , xn es igual a cero. Esto es, (x1 − x) + · · · + (xn − x) = 0.
La desviación de los valores puede usarse para describir la dispersión de una distribución
dada de datos cuantitativos. Recordemos que la desviación de un valor representa la dife-
rencia entre un dato y la media del conjunto de datos del cual proviene. En consecuencia,
podrı́amos pensar que el promedio de todas las desviaciones de los valores proporciona una
medida de la dispersión de todos los valores, pero eso no ocurre, pues ya se ha dicho en el
teorema 1.3.34 que la suma de todas las desviaciones de los valores es 0.
Varianza y desviación estándar (o tı́pica)
Aunque el rango es una medida de dispersión total y el rango intercuartil es una medida
de la dispersión de la media, ninguna de estas medidas de variación toma en cuenta cómo
se distribuyen o se agrupan las observaciones. Dos medidas de uso común que sı́ toman
en cuenta la distribución de los valores de los datos son la varianza y su raı́z cuadrada, la
desviación estándar o tı́pica. Estas medidas evalúan la manera en que fluctúan los valores
respecto a la media.
Definición 1.3.35 La varianza de una población de valores se define como el prome-

dio de los cuadrados de las desviaciones de los valores, y se denota por σ 2 (léase “sigma
cuadrada”). La varianza de la población de valores x1 , . . . , xn está dada por la fórmula
(x1 − μ)2 + (x2 − μ)2 + · · · + (xn − μ)2

σ2 =
n
La desviación estándar (o tı́pica) poblacional de un conjunto de datos, simbolizada
por σ, se define como la raı́z cuadrada de la varianza poblacional de los datos. Es decir,
√
σ = Varianza poblacional.
Por razones de comodidad en los cálculos, para determinar la varianza de la población se

usa normalmente la fórmula que aparece en el siguiente
Teorema 1.3.36 La varianza de la población de valores x1 , . . . , xn está dada por
x21 + x22 + · · · + x2n

σ2 = − μ2
n
Esta fórmula es equivalente a la que se introdujo en la definición 1.3.35 y puede recordarse fácilmente
mediante la espresión: “ la media de los cuadrados menos el cuadrado de la media”.

Ejemplo 1.3.37 Encuentre la varianza y desviación de los datos 62, 80, 83, 72 y 73 si éstos
constituyen una población.
SOLUCIÓN:
La media de estos datos es μ = 74. Por lo tanto, la varianza poblacional está dada por
(62 − 74)2 + (80 − 74)2 + (83 − 74)2 + (72 − 74)2 + (73 − 74)2 266
σ2 = = = 53, 2
5 5
√
La desviación estándar de estos datos es σ = 53, 2 = 7, 29.
Definición 1.3.38 La varianza de una muestra con valores x1 , . . . , xn se denota por

s2 y se define por
(x1 − x)2 + (x2 − x)2 + · · · + (xn − x)2
s2 =
n−1
La desviación estándar (o tı́pica) muestral de un conjunto de datos, denotada
por √
s, se define como la raı́z cuadrada de la varianza muestral de los datos. Es decir,
s = Varianza muestral.
Al igual que la varianza poblacional, la varianza muestral la podemos calcular de otra ma-
nera como se ilustra en el siguiente
Teorema 1.3.39 La varianza muestral de un conjunto de datos x1 , . . . , xn la podemos cal-

cular por
(x21 + x22 + · · · + x2n ) − nx2
s2 =
n−1
Ejemplo 1.3.40 Encuentre la varianza y desviación estándar de los datos del ejemplo 1.3.37 si
éstos constituyen una muestra de una población.
SOLUCIÓN:
Nuevamente, x = 74. Por lo tanto, la varianza muestral está dada por
(62 − 74)2 + (80 − 74)2 + (83 − 74)2 + (72 − 74)2 + (73 − 74)2 266
s2 = = = 66, 5
5−1 4
√
y la desviación muestral por s = 66, 5 = 8, 15. Observemos cómo cambia el valor de la varianza
(y, por consiguiente, también la desviación muestral) al considerar los datos como una muestra o
como una población.

50 Llinás / Rojas
Desviación media
Otro tipo de medida de dispersión es la que se define a continuación.
Definición 1.3.41 La desviación media de un conjunto de datos es la media de las

desviaciones de cada dato. Es decir, la desviación media de los datos x1 , . . . , xn se define
como
|x1 − x| + |x2 − x| + · · · + |xn − x|
DM =
n
La definición es análoga para datos poblacionales. Observemos que la desviación media está medida en las
mismas unidades que la de los datos.
Ejemplo 1.3.42 Para la población 2, 2, 4, 5 y 2 de las edades (en años) de cinco casas, la media
es x = 3, con lo que la desviación media es DM = 6/5 = 1, 2 años. Ası́, la edad de cada casa
difiere de la media de la población en un promedio de 1,2 años.
Ventajas y desventajas de la varianza, la desviación estándar

y la desviación media
Si la varianza se usa por sı́ misma como medida descriptiva de la dispersión, es difı́cil
interpretarla, porque las unidades de la varianza son el cuadrado de las unidades de me-
dida. En otras palabras, la desviación estándar se mide con las mismas unidades que las de
los datos originales. Por esta razón, la desviación estándar se compara con más facilidad
con el promedio y otros estadı́sticos que tienen las mismas unidades que los datos originales.
A la hora de elegir una medida que describa la cantidad de dispersión de un conjunto

de datos, la desviación media tiene dos ventajas frente a la desviación tı́pica. En primer
lugar, es más fácil de interpretar conceptualmente. Es más sencillo conceptuar “el promedio
de las desviaciones respecto de la media” que “la raı́z cuadrada del promedio del cuadrado
de las desviaciones respecto de la media”. En segundo lugar, dado que en el cálculo de
la varianza y de la desviación tı́pica se elevan al cuadrado las desviaciones individuales,

estas dos medidas se verán más influenciadas por observaciones extremadamente grandes o
extremadamente pequeñas que la desviación media. A pesar de sus ventajas, la desviación
media se emplea con poca frecuencia en la práctica, debido a las complicaciones que pueden
surgir si se usa para hacer inferencias sobre una población a partir de las observaciones de
una muestra.
La varianza y la desviación estándar tienen una limitación seria: pueden verse afectadas
en presencia de valores extremos, pues ambas dependen de la media, que se modifica por
las medidas extremas. Cuando en un conjunto de datos están presentes valores extremos y

requerimos una medida resistente a ellas, debemos utilizar el rango intercuartil.
Varianza y desviación tı́pica para datos en tablas de frecuencia
A menudo tendremos ocasión de encontrar la varianza y la desviación estándar para datos

desplegados en una tabla de frecuencia.
Definición 1.3.43 Las varianzas poblacional y muestral (ponderadas) de un

conjunto de datos x1 , . . . , xn con frecuencias f1 , . . . , fn se calculan mediante las siguientes
fórmulas:
f1 (x1 − μ)2 + · · · + fn (xn − μ)2 f1 (x1 − x)2 + · · · + fn (xn − x)2

σ2 = s2 =
f1 + · · · + fn (f1 + · · · + fn ) − 1
Estas medidas las podemos calcular, equivalentemente, de la siguiente manera:

f1 x21 + · · · + fn x2n f1 x21 + · · · + fn x2n − (f1 + · · · + fn )x2
σ2 = − μ2 s2 =
f1 + · · · + fn (f1 + · · · + fn ) − 1
respectivamente.
Ejemplo 1.3.44 Dados los siguientes datos de una población, hallar la media, varianza y desviación
estándar.
Dato 28 31 34 37 40 43 46
Frecuencia 1 10 14 33 14 7 3
SOLUCIÓN:
Primero construimos la tabla 1.13, que nos ayudará en los cálculos:
Tabla 1.13: Tabla de frecuencias para el ejemplo 1.3.44

Dato x Frecuencia f fx x−μ (x − μ)2 f (x − μ)2
28 1 28 -9 81 81
31 10 310 -6 36 360
34 14 476 -3 9 126
37 33 1.221 0 0 0
40 14 560 3 9 126
43 7 301 6 36 252
46 3 138 9 81 243
Sumas 82 3.034 1.188

52 Llinás / Rojas
Se encuentra que la media poblacional es:

fx 3.034
μ = = = 37
f 82
Además,
f (x − μ)2 1.188
σ 2
= = = 14, 4878
f 82
√
y de esta forma σ = 14, 4878 = 3, 806.
Aplicaciones de la desviación estándar poblacional
Hasta ahora hemos visto que la varianza y la desviación estándar son muy útiles para com-
parar la dispersión de dos poblaciones. Pero también podemos interpretar la desviación
de una única población. Concretamente, puede usarse esta cantidad para estimar el por-
centaje de valores de la población que se encontrarán a menos de una distancia especı́fica de
la media. Para construir tales estimaciones utilizaremos dos reglas: la regla de Tchebychev
(válida para cualquier población) y la empı́rica.
Teorema 1.3.45 (Regla de Tchebychev) Para cualquier población con media μ y

desviación estándar σ, por lo menos el 100(1 − 1/k 2 )% de los valores de la población se
encuentran a una distancia de la media menor que k veces la desviación estándar, para
cualquier número k > 1. En otras palabras, dentro del intervalo que va desde μ − kσ hasta
μ + kσ se encuentra por lo menos el 100(1 − 1/k 2 )% de los valores de la población.
Para ver cómo funciona la regla de Tchebychev en la práctica, hemos construido la siguiente
tabla:
k 1,5 2 2,5 3 3,5 4

100(1 − 1/k )% 55,6%
2
75% 84% 88,9% 91,18% 93,7%
Es decir, de acuerdo con la regla de Tchebychev, al menos el 55,6% de los valores de la

población se encuentran a una distancia de la media menor que 1,5 veces de la desviación
tı́pica. O, dicho de otra forma, dentro del intervalo [μ − 1, 5σ; μ + 1, 5σ] encontramos por
lo menos el 55, 6% de los valores de la población. Esta situación se ilustra en la figura 1.10.
Ejemplo 1.3.46 Consideremos los datos de la empresa 1 de la tabla 1.12(a), que tenı́a una media
de 33.000 dólares y una desviación estándar de 1.554 dólares. La regla de Tchebychev nos dice
que, para esta población, al menos el 55% de los salarios deben estar a una distancia de la media
menor que (1,5)(1.554)=2.331 dólares. En otras palabras, dentro del intervalo que va desde 31.169
a 35.831 dólares están por lo menos el 55,6% de los salarios. Analogamente, dentro del intervalo
que va desde 30.392 a 36.608 dólares se encuentran por lo menos el 75% de los salarios.

0,7
0,6
0,5 Por lo menos 55,6%
de los datos están
0,4 en el rango de la
1s sombreada
región
0,3
0,2
0,1
0
0 1
μ - 1,5s μ 2 μ + 1,5s
3 4 5
Figura 1.10: Ilustración de la regla de Tchebychev
Ejemplo 1.3.47 Un inspector de control de calidad selecciona aleatoriamente 14 clavos de una

caja de 100 clavos de 1 pulgada (una pulg.=2,54 cm). Las longitudes, en cm, son:
2, 54 2, 55 2, 50 2, 60 2, 51 2, 52 2, 70 2, 40 2, 36 2, 53 2, 54 2, 52 2, 51 2, 55
Si el inspector decide excluir los clavos que están fuera del intervalo x ± 2s, ¿cuál es el porcentaje
de clavos excluidos? ¿Se verifica la regla de Tchebychev?
SOLUCIÓN:
Vemos que x = 2, 52 y s = 0, 07. Como deseamos desechar los clavos que están fuera del intervalo
x ± 2s, es decir, [2, 38; 2, 66], observamos que dos clavos no pertenecen a ese intervalo (los de
longitud 2,70 y 2,36) que corresponde al 14, 28% de la muestra. La regla de Tchebychev afirma
que por lo menos el 75% de los clavos deberán estar en el intervalo x ± 2s, es decir, a lo más el
25% estarán fuera de dicho intervalo, lo cual verifica la regla de Tchebychev.
La ventaja de la regla de Tchebychev consiste en que se puede aplicar a cualquier población.

Pero tiene un serio inconveniente. Para muchas poblaciones, el porcentaje de valores que
se encuentran de un intervalo determinado es mucho mayor que el mı́nimo asegurado por la
regla de Tchebychev. Para poblaciones que tengan forma acampanada, es posible establecer
una regla empı́rica que proporcione estimaciones fiables.
Teorema 1.3.48 (Regla empı́rica) Para las poblaciones que tengan forma acampanada,
aproximadamente el 68% de los valores de la población se encuentran a una distancia de la
media menor que una desviación estándar, y aproximadamente el 95% están a una distancia
de la media menor que dos veces la desviación tı́pica (compárese con la figura 1.11).
Ejemplo 1.3.49 Supongamos que tenemos una población de salarios que tienen forma acam-
panada con una media de 33.500 dólares y una desviación estándar de 1.554 dólares. La regla

54 Llinás / Rojas
empı́rica estimarı́a que aproximadamente el 68% de los salarios estarán dentro del intervalo que
va desde 31.946 a 35.054 dólares y que aproximadamente el 95% estará dentro del intervalo que
va desde 30.392 a 36.608 dólares.
(a) Porcentaje de datos en (μ − 1σ, μ + 1σ)
(b) Porcentaje de datos en (μ − 2σ, μ + 2σ)
Figura 1.11: Ilustración de la regla empı́rica

El coeficiente de variación de Pearson
Para comparar las dispersiones de dos o más conjuntos de valores no podemos confrontar
simplemente las varianzas o las desviaciones estándar respectivas, puesto que estos coe-
ficientes de dispersión vienen afectados por la escala de medida del respectivo valor. Es
necesario, por tanto, eliminar esa influencia convirtiendo dichos valores en números sin
unidades de medidas. Una medida que cumple perfectamente con este cometido es el lla-
mado coeficiente de variación de Pearson.

Definición 1.3.50 El coeficiente de variación de Pearson de un conjunto de datos,

simbolizado por CV , es igual a la desviación estándar dividida entre la media, multiplicada
por 100 por ciento. Es decir,

desviación estándar de los datos

CV = · 100%
media aritmética de los datos
Observemos que al dividir la desviación estándar por la media aritmética se elimina la in-
fluencia de la escala de medida, convirtiéndose ası́ el coeficiente de variación en una medida
útil para comparar conjuntos de datos con diferentes unidades de medida. El inconveniente
de este coeficiente radica en que deja de ser utilizable cuando la media es igual a cero.
El siguiente ejemplo ilustra el cálculo del coeficiente de variación.
Ejemplo 1.3.51 Los siguientes datos representan el promedio de millas por galón diario por
cinco dı́as para un determinado auto: 20, 25, 30, 15, 35. Encuentre el coeficiente de variación e
interprete su respuesta.
SOLUCIÓN:
La media y desviación estándar de millas por galón están dadas por x = 25 y s = 7, 9 respectiva-
mente. Por tanto, el coeficiente de variación de estos datos es:
s
7, 9
CV = · 100% = · 100% = 31, 6%
x 25
Por consiguiente, el tamaño relativo de la “dispersión media alrededor de la media” con relación
a la media es 31,6%.
Como medida relativa, el coeficiente de variación resulta especialmente útil cuando se com-
para la variabilidad de dos o más conjuntos de datos, que se expresan en diferentes unidades
de medidas. Esto se muestra en el siguiente ejemplo.
Ejemplo 1.3.52 El gerente de operaciones de un servicio de paqueterı́a desea adquirir una nueva
flota de autos. Cuando los paquetes se guardan con eficiencia en el interior de los autos (durante la
preparación de las entregas), se deben considerar dos restricciones principales: el peso (en libras)
y el volumen (en pies cúbicos) de cada paquete. Ahora, en una muestra de 200 paquetes, el peso
promedio es 26 libras, con una desviación estándar de 3,9 libras. Además, el volumen promedio
de cada paquete es 8,8 pies cúbicos, con una desviación estándar de 2,2 pies cúbicos. ¿Cómo se
puede comparar la variación del peso y del volumen?
SOLUCIÓN:
Como las unidades de medida difieren para las restricciones de peso y volumen, si el gerente
de operaciones desea comparar las fluctuaciones en estas medidas, debe considerar la variabi-
lidad relativa en ambos tipos de medidas. Para el peso, el coeficiente de variación es CV =

56 Llinás / Rojas
(3, 9/26)100% = 15%; para el volumen, el coeficiente de variación es CV = (2, 2/8, 8)100% = 25%.
Entonces, con relación a la media, el volumen de un paquete es mucho más variable que su peso
porque el coeficiente de variación del peso es menor que el del volumen.
El coeficiente de variación es muy útil cuando se comparan dos o más conjuntos de datos
que se miden con las mismas unidades, pero son tan diferentes que una comparación directa
de las desviaciones estándar respectivas no ayuda mucho. Esto se ilustra en el siguiente
Ejemplo 1.3.53 Un inversionista potencial piensa adquirir acciones en una de dos compañı́as A
o B, listadas en la Bolsa de Valores de Nueva York. Si ninguna de las compañı́as ofrece dividendos
a sus clientes y ambas tienen igual clasificación (según varios servicios de inversión) en términos
de crecimiento potencial, el posible inversionista quizás considere la volatilidad (variabilidad) de
ambas acciones para ayudar en la decisión de inversión. En los últimos meses, el precio promedio
de las acciones en la compañı́a A fue de 50 dólares, con una desviación estándar de 10 dólares.
Además, durante el mismo periodo, el precio promedio de las acciones en la compañı́a B fue de
12 dólares, con una desviación estándar de 4 dólares. ¿Cómo puede determinar el inversionista
cuáles acciones son más variables?
SOLUCIÓN:
En términos de la desviación estándar, el precio de las acciones de A parece más volátil que el de
las acciones de B. Sin embargo, como los precios promedio por acción de las dos compañı́as son
tan diferentes, serı́a conveniente que el inversionista potencial considere la variabilidad en precio
respecto al promedio a fin de examinar la volatilidad/estabilidad de ambas acciones.
Para la compañı́a A, el coeficiente de variación es CV = (10/50)100% = 20%; para la compañı́a

B, el coeficiente de variación es CV = (4/12)100% = 33, 3%. Entonces, en relación con la media,
el precio de las acciones B es mucho más variable que el de las acciones A.
1.3.4 Medidas de formas

Una vez iniciado el análisis estadı́stico de sintetización de la información, para lo cual hemos
estudiado las medidas de tendencia central, de posición relativa y de dispersión de un con-
junto de datos, necesitamos conocer más sobre el comportamiento de tales datos. Para ello
estudiaremos las medidas de forma, las cuales nos proporcionan información sobre cómo se
distribuyen los datos.
Las medidas de forma se clasifican en medidas de asimetrı́a (o coeficiente de sesgo) y

medidas de curtosis (o de apuntamiento). A continuación explicaremos cada una de ellas.
Antes estudiaremos los conceptos de simétrı́a y asimétrı́a.

Simetrı́a y asimetrı́a
Una distribución de frecuencias será simétrica o asimétrica según lo sea su representación

gráfica.
Definición 1.3.54 Decimos que una distribución de frecuencias es simétrica cuando lo

es su representación gráfica, es decir, los datos equidistantes a una medida central de la
misma tienen frecuencias iguales. Esta medida central coincide con la mediana y la media.
Una distribución de frecuencias que no es simétrica se denomina asimétrica. La asimetrı́a
se puede presentar a la derecha ( asimetrı́a positiva) o a la izquierda ( asimetrı́a nega-
tiva) si la representación gráfica está más “estirada” hacia la derecha o hacia la izquierda
respectivamente.
Los conceptos explicados en la definición se ilustran en la figura 1.12:
(a) Distribución simétrica (b) Distribución simétrica

unimodal bimodal
(c) Distribución asimétrica a (d) Distribución asimétrica

la derecha a la izquierda
Figura 1.12: Comparación de cuatro distribuciones cuya forma difiere
Ahora consideremos los siguientes comentarios para el caso en que la distribución de fre-
cuencias tiene una sola moda::
• En una distribución simétrica, la media, la mediana y la moda siempre coinciden

(compárese con la figura 1.13a). Es decir, se cumple la relación

58 Llinás / Rojas
Media = mediana = moda
En este tipo de distribuciones, los datos se encuentran repartidos a lo largo del re-
corrido, de forma que todas las medidas de tendencia central están justo en el centro
del conjunto de datos.
• Si la distribución es asimétrica a la derecha, el orden en que aparecen las medidas de

tendencia central es moda-mediana-media (compárese con la figura 1.13b). Es decir,
se cumple la relación
Moda < mediana < media
Esto es ası́ porque es en el lado derecho donde se concentra la mayor frecuencia de

los datos, por lo tanto, observamos una cola larga a la derecha de la distribución.
• Si la distribución es asimétrica a la izquierda, el orden en que aparecen es media-

mediana-moda (compárese con la figura 1.13c). Es decir, se cumple la relación
Media < mediana < moda
En este caso, la mayor frecuencia de los datos se concentra en el lado izquierdo. Por
lo tanto, observamos una cola larga hacia la izquierda de la distribución.
Consideremos el caso en que la distribución no es unimodal :
• Para distribuciones que no tengan moda, si la media es igual a la mediana, entonces

la representación gráfica de la distribución es simétrica.
• Para distribuciones que tengan más de una moda, la media es igual a la mediana si y
sólo si la representación gráfica de la distribución es simétrica.
Medidas de asimetrı́a
Las medidas de asimetrı́a o coeficientes de sesgo tienen como finalidad elaborar un

indicador que permita establecer el grado de simetrı́a (o asimetrı́a) que presenta una dis-
tribución, sin necesidad de llevar a cabo su representación gráfica. La medida de asimetrı́a
más utilizada en la práctica es el llamado coeficiente de asimetrı́a de Pearson.

(a) Simétrica (b) Asimétrica a la derecha
(c) Asimétrica a la izquierda
Figura 1.13: Comparación de tres distribuciones unimodales cuya forma difiere
Definición 1.3.55 El coeficiente de asimetrı́a de Pearson, simbolizado por Ap , se

define como la diferencia entre la media aritmética y la mediana dividida por la desviación
estándar. Es decir,
Media aritmética − Moda
Ap =
Desviación estándar
Cuando Ap = 0, se dice que la distibución es simétrica; cuando Ap < 0, se dice que la distribución es
sesgada negativamente o a la izquierda, y cuando Ap > 0, se dice que la distribución es sesgada
positivamente o a la derecha.
Consideremos la figura 1.13, en donde mostramos la forma de tres conjuntos de datos:

• Los datos en la figura 1.13(a) son simétricos. Por esta razón, el coeficiente de sesgo
es cero.
• Los datos de la figura 1.13(b) están sesgados a la derecha. Por lo tanto, el coeficiente
de sesgo es positivo.
• Los datos de la figura 1.13(c) están sesgados a la izquierda. Por consiguiente, el el

coeficiente de sesgo es negativo.
Ahora bien, por diversas razones, el coeficiente de asimetrı́a de Pearson tan sólo es aplicable

60 Llinás / Rojas
en las distribuciones de forma acampanada y unimodales. En distribuciones de otro tipo

se puede utilizar, entre otros, los llamados coeficiente de asimetrı́a de Fisher y coeficiente
de asimetrı́a de Fisher estandarizado.
Definición 1.3.56 Los coeficientes de asimetrı́a de Fisher (simbolizado por g1 ) y

de Fisher estandarizado (simbolizado por gs ) de un conjunto de datos x1 , . . . , xn con
frecuencias f1 , . . . , fn se definen, respectivamente, como
(x1 − x)3 f1 + · · · + (xn − x)3 fn g1

g1 = , gs =
s3 n 6/n
Si g1 = 0 la distribución es simétrica; si g1 > 0, la distribución es sesgada positivamente, y si g1 < 0, la
distribución es sesgada negativamente. Interpretaciones análogas se tienen con el valor de gs .
Relación empı́rica entre media, mediana y moda
El siguiente teorema fue encontrado empı́ricamente por Pearson. Allı́ se puede observar
claramente una relación empı́rica entre la media, la mediana y la moda.4
Teorema 1.3.57 Para distribuciones campanoides (es decir, con forma de campana), uni-
modales y moderadamente asimétricas se cumple aproximadamente la relación empı́rica
Media − Moda ≈ 3(Media aritmética − Mediana)
Con lo anterior, el coeficiente de asimetrı́a de Pearson lo podemos calcular también a través

de la fórmula
3(Media aritmética − Mediana)
Ap =
Desviación estándar
Medidas de curtosis o de apuntamiento
Las medidas de curtosis estudian la distribución de frecuencias en la zona central de la

misma. Como ya sabemos, la mayor o menor concentración de frecuencias alrededor de la
media y en la zona central de la distribución dará lugar a una distribución más o menos
apuntada. Por esta razón, a las medidas de curtosis se aplican a distribuciones campani-
formes, es decir, unimodales simétricas o con ligera asimetrı́a. Para estudiar la curtosis de
4
Téngase en cuenta que en las distribuciones moderadamente asimétricas, la mediana siempre se sitúa
entre la media y la moda.

una distribución es necesario definir previamente una distribución tipo, que vamos a tomar
como modelo de referencia. Esta distribución es la normal, que sólo estudiaremos en la
sección 4.4. Por esta razón, aplazaremos nuestro estudio de la curtosis de una distribución
para más adelante, una vez que hayamos introducido la distribución normal.

23. Responda las siguientes preguntas. Justifique sus respuestas.
(a) ¿Qué escala de medida se requiere para la mediana? ¿Y para la moda?

(b) ¿En qué condiciones coinciden la media, la mediana y la moda de una muestra?
(c) ¿En qué caso será demasiado grande la diferencia entre la media y la mediana?
(d) ¿Cuándo aumenta el tamaño de la muestra, también aumenta la varianza?
24. Supongamos que en un conjunto de 10 observaciones la media es 20 y la mediana es 15. Si

hay en ese conjunto dos seis, y todos los otros valores son diferentes, ¿cuál es la moda?
25. Veintiún personas en un salón de clase tienen altura promedio de 168 centı́metros. Si al
salón entra una persona adicional, entonces ¿cuál es la altura que debe tener esta persona
para que la altura promedio se incremente en un centı́metro?
26. Una empresa de servicio eléctrico de una ciudad le realiza la lectura del contador de luz a
un usuario, y se obtienen los siguientes datos:
Fecha Lectura
27 de agosto 00553 Kwh
30 de agosto 00571 Kwh
4 de septiembre 00605 Kwh
El recibo de pago le llegó al usuario con lectura de 00638 Kwh, realizada el 9 de septiembre,
pero la empresa no dejó constancia de lectura, hecho que motivó el reclamo del usuario,
quien alegó que le estaban cobrando de más. ¿Tiene la razón el usuario? Explique.
27. Un piloto A de la Fórmula 1 ganó 60 carreras de las 152 en las cuales participó, mientras
que otro piloto B ganó 52 carreras de las 115 en las que participó. ¿Cuál de los dos es mejor
piloto? Explique su respuesta.
28. El peso medio de los 45 productos de una determinada empresa es de 215 libras. Si ninguno
de los productos pesa menos de 170 libras, ¿cuántos de ellos, como máximo, pueden pesar
250 libras?
29. Un elevador de un edificio de oficinas está diseñado para soportar una carga máxima de
1.000 kilogramos. ¿Está sobrecargado si lleva a nueve mujeres con un peso medio de 61,5
kilogramos y cinco hombres de 87 kilogramos? ¿Por qué?

62 Llinás / Rojas
30. Una cadena de grandes almacenes tiene diez establecimientos. Se analiza el volumen de
ventas durante el perı́odo de Navidad y se comparan con las obtenidas en el mismo perı́odo
del año anterior. Los porcentajes de incrementos de ventas en dólares de los diez estableci-
mientos fueron:
10,2 3,1 5,9 7,0 3,7 2,9 6,8 7,3 8,2 4,3
Halle la media, la mediana, la varianza muestral, la desviación tı́pica, el rango y el rango

intercuartil del porcentaje de incremento de ventas en dólares. Interprete sus respuestas.
31. Los neumáticos de cierta marca tiene una duración de vida con media de 29.000 kilómetros
y desviación tı́pica de 3.000 kilómetros.
(a) Encontrar un intervalo en el que se pueda garantizar que se encuentra por lo menos el
75% de los tiempos de vida de los neumáticos de esta marca.
(b) Usando la regla impı́rica y suponiendo que la población tiene forma acampanada, en-
contrar un intervalo en el cual se estime que se encuentra aproximadamente el 95% de
los tiempos de vida de los neumáticos de esta marca.
32. Se ha estimado que la media de la cantidad de dinero que gastan en ropa las mujeres
colombianas es de 500.000 pesos, mientras que para los hombres la media es de 350.000
pesos. Dibuje un diagrama de barras que represente esta información.
33. Considere las siguientes observaciones de resistencia al corte (en megapascales) de una unión
pegada de cierta manera:
73,7 36,6 109,9 4,4 33,1 66,7 30,0 81,5 22,2 40,4 16,4
Determine el valor de la media y mediana muestrales. ¿Por qué la mediana es tan diferente
de la media?
34. Los valores de presión sanguı́nea se reportan a veces a los 5 mm Hg más cercanos (100,
105, 110, etc.). Suponga que los valores reales de presión sanguı́nea para nueve individuos
seleccionados al azar son:
130,0 113,7 122,0 108,3 131,5 133,2 118,6 127,4 138,4

(a) ¿Cuál es la mediana de los valores reportados de presión sanguı́nea?

(b) Suponga que la presión del octavo individuo es 127,6 en lugar de 127,4 (un pequeño
cambio en su valor). ¿Cómo afectarı́a esto a la mediana de los valores reportados? ¿Qué
dice esto sobre la sensibilidad de la mediana para redondear o agrupar los datos?
35. La propagación de grietas por fatiga en diversas partes de aeronaves ha sido objeto de
profundo estudio en años recientes. Los datos que aparecen a continuación constan de
tiempo de propagación (horas de vuelo/104 ) para llegar a un tamaño de grieta dado en
agujeros sujetadores que se usan en aeronaves militares:

0,915 0,937 0,983 1,007 0,736 0,863 0,865 0,913

1,132 1,140 1,153 1,253 1,394 1,011 1,064 1,109
(a) Calcule los valores de la media y mediana muestrales.

(b) ¿En cuánto se puede reducir la observación muestral más grande, sin afectar el valor de
la mediana?
36. Una manifestación interesante de la variación surge cuando se efectúan los análisis de emisión
de gases en los vehı́culos automotores. Los requisitos de costo y tiempo del procedimiento
federal de prueba (PFT) en cierto pais evitan la difusión de su uso en los programas de
inspección vehicular. Como resultado, muchas agencias han desarrollado análisis menos
costosos y más rápidos con la esperanza de reproducir los resultados. Según un artı́culo
de una prestigiosa revista, se dice que la aceptación del PFT como patrón de excelencia
ha conducido a la creencia de que las mediciones repetidas en el mismo vehı́culo darán
resultados idénticos (o casi). Los autores del artı́culo aplicaron el PFT a siete vehı́culos
caracterizados como “grandes emisores”. Los resultados de uno de esos vehı́culos son los
siguientes:
HC (g/mi) 32,2 32,5 13,8 18,3

CO (g/mi) 232 236 118 149
(a) Calcule las desviaciones estándar muestrales de las observaciones de HC y CO. ¿Parece
justificada la creencia general?
(b) Compare los coeficientes de variación de cada conjunto de datos para determinar cuáles
presentan mayor o menor variación.
37. Los puntajes finales de 20 alumnos en un curso de Estadı́stica son:
50 55 61 60 71 73 53 54 67 67
54 77 72 76 81 83 87 44 48 67
¿Qué proporción de estos puntajes cae
(a) dentro de ±1 desviación estándar de la media?

(b) dentro de ±2 desviaciones estándar de la media?
(c) dentro de ±3 desviaciones estándar de la media?
38. Un taller de mecánica acepta una orden por 10.000 ruedas de 2 pulgadas de diámetro. Las
especificaciones de tamaño del producto podrán ser mantenidas sólo si el diámetro medio
es de 2 pulgadas y la desviación estándar es muy pequeña. En este caso, ¿cuál es el margen
de tolerancia permitido para la desviación estándar?
39. Un profesor cuenta el examen final de un curso como el triple de cada uno de los tres
exámenes de una hora. ¿Cuál es la calificación promedio de un estudiante que obtuvo las
calificaciones 72, 86 y 80 en los tres exámenes de una hora y 90 en el examen final?

64 Llinás / Rojas
40. Millones de habitantes de un cierto paı́s se levantan cada mañana y trabajan en sus propias
casas. Se sugiere que el uso creciente de computadoras es una de las razones por las que
las personas pueden trabajar en empresas caseras. A continuación vemos una muestra de
datos sobre las edades de esas personas:
57 31 30 41 22 58 24 50 29 52
37 32 44 49 29 44 40 46 29 31
(a) Calcule la media y la moda.

(b) Suponga que se sabe que la mediana de edad de la población de todos los adultos es
de 35,1 años. Use la mediana de la edad de los datos anteriores para comentar si los
trabajadores en casa tiende a ser más jóvenes o más viejos que la población de todos
los adultos.
(c) Calcule el primero y el tercer cuartil y el 42% percentil. Interprete sus resultados.
41. En una prueba de rendimiento y consumo de gasolina se probaron 13 autos, durante 400
millas, en condiciones de tránsito en ciudad y en el campo; de lo anterior se obtuvieron los
siguientes datos en millas por galón:
14,4 13,2 15,3 16,8 16,2 16,7 15,9

Ciudad
16,0 15,3 16,2 16,1 15,3 15,2
18,3 18,6 19,2 17,4 19,4 20,6 17,2
Campo
18,6 18,5 18,7 19,0 21,1 19,4
Para llegar a una conclusión sobre la diferencia de rendimiento en la ciudad y en el campo,

use la media, la mediana y la moda.
42. Si s es la desviación estándar de una muestra, podemos demostrar que

R R n
≤ s ≤
2(n − 1) 2 n−1
donde n es el tamaño de la muestra y R es el rango. Los siguientes datos representan los

niveles de colesterol en la sangre para una muestra de ocho personas: 239, 218, 227, 357,
161, 286, 310 y 245.
(a) Encuentre cotas superiores e inferiores para s.

(b) Estime s usando el punto medio del intervalo determinado por el resultado anterior.
(c) Calcule el valor de s y compare el resultado con el valor estimado en el inciso (b).
43. Una profesora borra accidentalmente la calificación de uno de sus seis estudiantes; las cinco
calificaciones restantes son 3,8; 4,3; 2,2; 4,5 y 3,3; y la media de las seis calificaciones es 3,5.
Encuentre la calificación que borró la profesora.
44. En un esfuerzo por reducir su consumo de cigarillo, un trabajador de oficina registra los
números siguientes de cigarillos fumados durante un periodo de 21 dı́as:

5 6 5 8 4 0 2 3 7 5 6 4 5 3 6 7 1 2 3 0 3
¿Qué la medida de tendencia central le servirá mejor para su propósito? ¿Cuál es su valor
numérico?
45. La tabla siguiente contiene los salarios (en miles de pesos) de 30 trabajadores:
Salario anual 550 600 700 800 3.000

(a) Determine la moda, la media, la mediana, el rango medio y el sesgo.

(b) ¿Cuál medida de tendencia usarı́a para determinar el valor central? Explique.
(c) ¿Cuál es el primer cuartil, el tercer cuartil y el sexto decil?
(d) Encuentre el rango, la desviación estándar y el rango intercuartil.
46. Una maestra hizo un examen con el mismo grado de dificultad en cada uno de sus tres
grupos. Con los resultados determinó las tres medianas y las promedió para estimar el
punto central de su habilidad profesional. ¿Puede engañarse al hacer esto? Diga por qué.
47. Suponga que una muestra tiene media 26 y desviación estándar 3,1.
(a) Determine un intervalo que contenga al menos 95% de las medidas de las muestras.
(b) ¿Cuál es el mı́nimo porcentaje de la muestra que está contenido en el intervalo 18 - 34?
48. Suponga que una muestra tiene media 542 y desviación estándar 10,4.
(a) Determine un intervalo que contenga al menos 93% de las medidas de las muestras.
(b) ¿Cuál es el mı́nimo porcentaje de la muestra que está contenido en el intervalo 523,22
- 567,22?
49. La tabla siguiente da una muestra de los tiempos de recorrido (en minutos) de un camino
de 2,5 millas para el carro de José y el de Mariela:
José 0,8 0,9 1,0 0,9 1,0 1,0 0,9 1,0

Mariela 1,1 0,9 1,4 1,3 1,3 1,3 1,0 0,9
(a) Encuentre el promedio de los tiempos de recorrido para cada uno de los carros.
(b) Calcule la varianza de los tiempos de recorrido para cada uno de los carros respectiva-
mente.
(c) ¿Qué auto tuvo un desempeño más consistente, si la consistencia se mide con la va-
rianza?
(d) Encuentre el coeficiente de variación para cada carro y comente al respecto.
50. Una gran lecherı́a vigila continuamente el nivel de contenido de grasa en su producto. El
porcentaje de grasa no debe desviarse mucho del 1% de la leche, siendo aceptable una
desviación estándar del 8%. Se obtuvo una muestra de 20 cartones de leche y se registró el
porcentaje grasa en cada uno. Los resultados se anotan a continuación:

66 Llinás / Rojas
1,97 1,80 2,05 2,23 1,65 1,86 1,85 2,25 2,01 1,90
2,14 1,93 2,08 2,17 1,91 1,93 2,02 2,09 2,04 2,07
Calcule la media y la desviación estándar para la muestra de contenidos de grasa. ¿Hay

evidencia de que el contenido de grasa es demasiado alto? Explique.
1.4 Análisis de datos en tablas de frecuencias

agrupadas
Es posible calcular las medidas de tendencia central y dispersión para datos exhibidos en una
tabla de frecuencia agrupada, pero sus valores no son exactos sino únicamente aproximados.
Eso se debe al desconocimiento de las medidas en grupo, las cuales se han colocado en
intervalos de clase. En esta sección describiremos procedimientos para calcular medidas
numéricas que resuman la información cuando sólo disponemos de datos agrupados.
Media para datos agrupados
Si debemos encontrar la media para datos proporcionados en tablas de frecuencia agrupada,

usamos marcas de clase para representar las medidas para cada clase. De esta forma, usamos
la fórmula conocida de la media aritmética para determinar la llamada media muestral
aproximada xa , puesto que los datos originales se desconocen y cada observación está
representada por su marca de clase.
Ejemplo 1.4.1 Los datos siguientes representan el número de personas que han entrado a un
establecimiento diariamente durante un periodo de 25 dı́as:
60 36 61 56 19 35 51 42 21 28 33 67 30
49 57 54 59 28 63 38 15 24 35 46 53
√
Los datos han sido agrupados en la tabla de frecuencias agrupadas 1.14 usando la fórmula c = n
para el número de clases.
Tabla 1.14: Tabla de frecuencias agrupadas para el ejemplo 1.4.1

Número de personas Número de dı́as
14,5 - 25,5 4
25,5 - 36,5 7
36,5 - 47,5 3
47,5 - 58,5 6
58,5 - 69,5 5

(a) Calcule la media x del número de personas que entran por dı́a.
(b) Calcule la media aproximada xa del número de personas que entran por dı́a.
SOLUCIÓN:
(a) Se puede comprobar que la media de los datos es x = 42, 4.
(b) Primero debemos calcular la marca de cada clase (recordemos que una marca de clase es el
punto medio de cada intervalo de clase). Cada marca de clase se multiplica por su frecuencia
correspondiente, como se muestra en la tabla 1.15.

Número de personas Número de dı́as f Marca de clase X fX
14,5 - 25,5 4 20 80
25,5 - 36,5 7 31 217
36,5 - 47,5 3 42 126
47,5 - 58,5 6 53 318
58,5 - 69,5 5 64 320
Sumas 25 1.061
Por consiguiente, la media aproximada es:

fx 1.061
xa = = = 42, 44
f 25
el cual es sólo un valor aproximado para la media de las 25 medidas muestrales originales. La
aproximación se considera buena comparada con el valor exacto x = 42, 40, obtenido en la
parte (a).
Mediana para datos agrupados
Si se han registrado datos en una tabla de frecuencias, no pueden colocarse en un arreglo

ordenado para calcular la mediana. A manera de ilustración presentamos la tabla de fre-

cuencias 1.16.
Primero hallamos la clase de la mediana de la distribución de frecuencia. La clase me-
diana es la mı́nima clase cuya frecuencia acumulada es mayor o igual a n/2, siendo n el
número total de datos. Debido a que n es igual a 50, se necesita localizar la primera clase
que tenga una frecuencia acumulada de 25 o más. En este caso, la tercera clase es la clase
mediana porque tiene una frecuencia acumulada de 28. La mediana la podemos determinar
entonces como
n/2 − F
Mediana = Lmed + ·w
fmed
1.4. Análisis de datos en tablas de frecuencias agrupadas

68 Llinás / Rojas
Tabla 1.16: Distribución de frecuencia

Clase Frecuencia Frecuencia acumulada
49,5 - 59,5 3 3
59,5 - 69,5 7 10
69,5 - 79,5 18 28
79,5 - 89,5 12 40
89,5 - 99,5 8 48
99,5 - 109,5 2 50
en donde
• Lmed es la frontera inferior de la clase de la mediana (de la tabla, es 69,5)
• F es la frecuencia acumulada de la clase que antecede a la clase de la mediana (en este

caso, es la frecuencia acumulada correspondiente a la segunda clase, o sea F = 10)
• fmed es la frecuencia de la clase de la mediana (en este caso, f = 18)
• w es la amplitud del intervalo de clase de la clase de la mediana (w = 10).
Es decir,
25 − 10
Mediana = 69, 5 + · 10 = 77, 83
18
Moda para datos agrupados
Una desventaja de usar la moda con una distribución de frecuencia agrupada radica en que
el valor de la moda a menudo depende del agrupamiento arbitrario de los datos. La clase
que contiene al mayor número de datos suele denominarse clase modal o moda cruda.
Para estimar la moda en el caso de datos agrupados, se utiliza la siguiente fórmula:

Da
Moda = Lmod + ·w
Db + Da
en donde
• Lmod es la frontera inferior de la clase modal (por ejemplo, de la tabla 1.16, tenemos
que Lmod = 69, 5)
• Da es la diferencia entre la frecuencia de la clase modal y de la clase que la antecede

(por ejemplo, de la tabla 1.16, Da = 18 − 7 = 11)

• Db es la diferencia entre la frecuencia de la clase modal y de la clase que le sigue (por

ejemplo, de la tabla 1.16, Db = 18 − 12 = 6)
• w es el ancho del intervalo de clase de la clase modal (por ejemplo, de la tabla 1.16,
w = 10).
Respecto a la tabla 1.16, la moda es:

11
Moda = 69, 5 + · 10 = 75, 97
6 + 11
Rango medio para datos agrupados

Para datos organizados en una tabla de frecuencias agrupadas, el rango medio es aproxi-
madamente el promedio de la frontera inferior de clase de la primera clase y la frontera
superior de clase de la última clase.
Ejemplo 1.4.2 El rango promedio aproximado para los datos del ejemplo 1.4.1 es:
14, 5 + 69, 5
Rango promedio = = 42
2
Puntos de posición para datos de una tabla de frecuencia agrupada
Supongamos que queremos encontrar el sexagésimo punto percentil de los datos que pre-
sentamos en la tabla 1.16. Para ello, primero debemos hallar la clase del sexagésimo punto
percentil de la distribución de frecuencias. En general, la clase del p-ésimo punto
percentil es la mı́nima clase cuya frecuencia acumulada es mayor o igual a p%n, siendo
n el número total de datos. Como n = 50 y p = 60, entonces necesitamos localizar la
primera clase que tenga una frecuencia acumulada de (60%)(50)=30 o más. En este caso,
la cuarta clase es la clase donde se encuentra el sexagésimo punto percentil de los datos
porque tiene una frecuencia acumulada de 40. Entonces, el sexagésimo punto percentil
puede determinarse como

p%n − F
p-ésimo punto percentil = Lp + ·w
fp
en donde
• Lp es la frontera inferior de la clase del p-ésimo punto percentil (de la tabla, es 79,5)
• F es la frecuencia acumulada de la clase que antecede a la clase del p-ésimo punto

percentil (en este caso, es la frecuencia acumulada correspondiente a la tercera clase,
o sea F = 28)

70 Llinás / Rojas
• fp es la frecuencia de la clase del p-ésimo punto percentil (en este caso, fp = 12)
• w es la amplitud del intervalo de clase de la clase del p-ésimo punto percentil (w = 10).
Es decir,

30 − 28
Sexagésimo punto percentil = 79, 5 + · 10 ≈ 81, 16
12
Varianza y desviación tı́pica
Las marcas de clase se usan tı́picamente para representar medidas que caen en las clases
de una tabla de frecuencia agrupada cuando se necesita obtener la varianza o la desviación
estándar aproximadas de los datos. Al hacer esto usamos las fórmulas análogas para cal-
cular la varianza y la desviación estándar, para el caso de distribuciones de frecuencias no
agrupadas.
Ejemplo 1.4.3 Calcularemos la varianza y desviación estándar de los datos agrupados que se
muestran en la tabla 1.17. Como antes, primero debemos encontrar las marcas de clase m, y con
ello completamos la tabla 1.17, siendo μa la media poblacional aproximada de los datos.

Clase m f f m m − μa (m − μa )2 f (m − μa )2
26,5 - 29,5 28 1 28 -9 81 81
29,5 - 32,5 31 10 310 -6 36 360
32,5 - 35,5 34 14 476 -3 9 126
35,5 - 38,5 37 33 1.221 0 0 0
38,5 - 41,5 40 14 560 3 9 126
41,5 - 44,5 43 7 301 6 36 252
44,5 - 47,5 46 3 138 9 81 243
Sumas 82 3.034 1.188
Se encuentra que la media poblacional aproximada es:

fm 3.034
μa = = = 37
f 82
Además, la varianza poblacional aproximada es:

f (m − μa )2 1.188
σa2 = = = 14, 4878
f 82
√
y de esta forma la desviación poblacional aproximada será σa = 14, 4878 = 3, 806.


51. Situémonos en el contexto del ejercicio 17, en el que se recogı́an los porcentajes de rentabi-
lidad de las acciones de 25 empresas:
(a) A partir de la agrupación de datos usada para construir el histograma, estime la media,
la mediana, la desviación tı́pica y el rango intercuartil de los porcentajes de rentabilidad.
(b) Calcule directamente la media y la desviación tı́pica a partir de las 25 observaciones y
compárelas con las obtenidas en el apartado (a).
52. Se toma una muestra de 20 estudiantes. La tabla siguiente muestra la cantidad de tiempo
(en horas) empleado por cada uno de estos estudiantes de dicha muestra en preparar un
examen:
Tiempo de estudio (horas) 0-3 3-6 6-9 9-12 12-15

Número de estudiantes 2 6 7 4 1
(a) Halle las frecuencias relativas y las frecuencias relativas acumuladas.

(b) Estime la media, la mediana, la moda y la desviación tı́pica del tiempo de estudio.
53. Durante una epidemia de gripe, los tiempos de espera en cierto centro de salud fueron más
largos de lo habitual. La siguiente tabla resume la distribución de los tiempos de espera
para una muestra de 24 pacientes que visitaron el centro de salud durante este perı́odo:
Tiempo de espera (horas) 0-1 1-2 2-3 3-4

Número de pacientes 7 10 5 2
(a) Halle las frecuencias acumuladas, relativas y relativas acumuladas.

(b) Dibuje un histograma, un polı́gono y una ojiva.
(c) Estime la media, la mediana, la moda, la varianza y la desviación tı́pica del tiempo de
espera.
(d) Estime el rango intercuartil.
54. Se dispone de la siguiente información acerca de las rentas familiares (en millones de pesos)
en los hogares de cierta ciudad:
Renta familiar 1,5-2,0 2,0-2,5 2,5-3,0 3,0-3,5 3,5-4,0 4,0-4,5 4,5-5,0

Frec. relativa 0,10 0,20 0,22 0,12 0,13 0,08 0,15
Estime la media y la desviación tı́pica poblacional de la renta familiar.
55. Las ayudas concedidas, en miles de euros, por cierto gobierno a 60 proyectos empresariales
innovadores, se presentan en la siguiente tabla:
Importe de la ayuda 0-600 600-1.200 1.200-1.800 1.800-2.400

No de proyectos 10 15 20 15

72 Llinás / Rojas
(a) Calcule la ayuda media y ver si este valor es representativo.

(b) Calcule la ayuda máxima concedida al 70% de los proyectos menos favorecidos en el
reparto.
(c) Calcule la ayuda mı́nima concedida al 65% de los proyectos más favorecidos.
(d) Si se aumenta posteriormente las ayudas en once mil euros a cada proyecto, ¿cómo
afecta a los incisos anteriores?
(e) Si para el año siguiente las ayudas aumentan un 5% sobre el valor inicial, manteniéndose
el criterio del reparto, ¿cuál será ahora la ayuda media? ¿Sigue siendo representativa?
56. A continuación se presentan algunas medidas estadı́sticas (mediana, primero y tercer cuartil)
y una tabla de frecuencia agrupada, para las edades de un grupo de personas que hay en
una sala de concierto. Con base en estos datos responda las preguntas que aparecen abajo.
Mediana = 20, primer cuartil = 17,5 y tercer cuartil = 23.
Frecuencia Frecuencia Frec. acum.

Edades Frecuencia relativa acumulada relativa
11,5 - 14,5 2 0,0500 2 0,0500
14,5 - 17,5 8 0,2000 10 0,2500
17,5 - 20,5 11 0,2750 21 0,5250
20,5 - 23,5 10 0,2500 31 0,7750
23,5 - 26,5 8 0,2000 39 0,9750
26,5 - 29,5 1 0,0250 40 1,0000
(a) ¿Cuál era el número exacto de personas que habı́a en la sala del concierto?
(b) ¿Cuál es la media aproximada de las personas que asistieron al concierto?
(c) ¿Qué edad tienen el 77,5% de las personas?
(d) ¿Qué porcentaje de personas tienen una edad entre 11,5 y 20,5? ¿Mayor que 23,5?
(e) ¿Cuántas personas tienen una edad entre 17,5 y 20,5? ¿Mayor que 14,5?
(f) ¿Qué interpretación tiene el valor de la mediana y el de los cuartiles?
1.5 Análisis exploratorio de datos

Una vez que hemos estudiado las cuatro propiedades más importantes de los datos numéricos
(tendencia central, posición relativa, dispersión y forma), es importante identificar y des-
cribir las caracterı́sticas principales de los datos en forma resumida. Un enfoque a este
análisis exploratorio de datos5 consiste en desarrollar un resumen de cinco números
y construir un diagrama de caja y bigotes.
5
En general, las técnicas del análisis exploratorio de datos consisten en operaciones aritméticas
sencillas y representaciones fáciles de trazar, que pueden emplearse para resumir con rapidez los datos.
Muchos autores consideran el diagrama de tallo y hoja como técnica del análisis exploratorio de datos.

Resumen de cinco números
Definición 1.5.1 Un resumen de cinco números consiste en cinco cantidades que se

emplean para resumir los datos: valor mı́nimo, primer cuartil (Q1 ), mediana (Q2 ), tercer
cuartil (Q3 ) y valor máximo.
Con base en el resumen de cinco números se pueden obtener, entre otras, dos medidas
de tendencia central (la mediana y el rango medio) y dos medidas de variación (el rango
intercuartil y el rango) para tener una mejor idea de la forma de la distribución. Si la dis-
tribución es simétrica, la relación entre las diversas medidas nos la da el siguiente teorema:
Teorema 1.5.2 (Situaciones para reconocer la simetrı́a de los datos) Si la distri-

bución es simétrica:
• La distancia de Q1 a la mediana es igual a la distancia de la mediana a Q3 . Además,

la distancia del valor mı́nimo a Q1 es igual a la distancia de Q3 al valor máximo.
• La mediana y el rango medio son iguales. (Estas medidas son iguales a la media de
los datos.)
Por otra parte, si se trata de distribuciones no simétricas, la relación de las diversas medidas
se expresan en el siguiente teorema:
Teorema 1.5.3 (Situaciones para reconocer a los datos no simétricos) Si la dis-

tribución no es simétrica:
• En las distribuciones sesgadas a la derecha, la distancia de Q3 al valor máximo excede

la distancia del valor mı́nimo a Q1 . Además, la mediana es menor que el rango medio.
• En las distribuciones sesgadas a la izquierda, la distancia del valor mı́nimo a Q1

excede la distancia de Q3 al valor máximo. Además, el rango medio es menor que la

mediana.
Ejemplo 1.5.4 Utilice el resumen de cinco números para estudiar la forma de la distribución de
los datos del ejemplo 1.3.24.
SOLUCIÓN:
En el ejemplo 1.3.26 calculamos que el primer cuartil es 2,365; la mediana 2,405 y el tercer cuartil
1.5. Análisis exploratorio de datos

74 Llinás / Rojas
2,500. Por tanto, el resumen de cinco números es:
2, 210 2, 365 2, 405 2, 500 2, 825
De los teoremas 1.5.2 y 1.5.3 se puede afirmar que los salarios están sesgados a la derecha, porque
la distancia del valor mı́nimo a Q1 (es decir, 0,155) es bastante menor que la distancia de Q3
al valor máximo (es decir, 0,325). Además, si se compara la mediana (2,405) y el rango medio
(2,5175), se observa que el rango medio se mueve debido al valor extremo 2,825, y es, por tanto,
la más grande de estas medidas de resumen (compárese con la figura 1.14).
2
Frecuencias
Frecuencias
0
2,210
2,350
2,390
2,440
2,550
2,825
Salarios
2,255
2,380
2,420
2,450
2,630
Salarios
Dato Primer Mediana Tercer Dato

menor cuartil cuartil mayor
Figura 1.14: Diagrama de barras para los datos del ejemplo 1.5.4
Diagrama de caja y bigotes
El diagrama de caja y bigotes, como el que se muestra en la figura 1.15, proporciona

una representación gráfica de los datos mediante el resumen de cinco números.

Mediana
Valor atípico
(moderado)
1,5 R.I 1,5 R.I
+ + +
Media Valores atípicos

3 R.I (extremos)
Primer
2200
2,200 2,400 Tercer 2600
2400 2,600 2800
2,800 3000
3,000
cuartil cuartil
Salarios mensuales
Figura 1.15: Diagrama de caja y bigotes

Esta herramienta de análisis exploratorio de datos permite estudiar la simetrı́a de los datos,
detectar los valores atı́picos y vislumbrar un ajuste de los datos a una distribución de
frecuencias determinada. El diagrama de caja y bigotes divide los datos en cuatro áreas de
igual frecuencia, una caja central dividida en dos áreas por una lı́nea vertical y otras dos
áreas representadas por dos segmentos horizontales (bigotes) que parten del centro de cada
lado de la caja. La caja central encierra el 50% de los datos. En el interior de caja central
se acostumbra a representar la media con un signo más y se dibuja la mediana como una
lı́nea vertical en el interior de la caja (compárese con la figura 1.15). Si esta lı́nea está en el
centro de la caja, no hay asimetrı́a en los datos. Los lados verticales están situados en los
cuartiles inferior y superior de los datos. Partiendo del centro de cada lado vertical de la
caja se dibujan los dos bigotes, uno hacia la izquierda y el otro hacia la derecha, teniendo
en cuenta lo siguiente:
• El bigote de la izquierda tiene un extremo en el primer cuartil Q1 y el otro en el

valor dado por el primer cuartil menos 1,5 veces el rango intercuartil R.I, esto es,
Q1 − 1, 5R.I.
• El bigote de la derecha tiene un extremo en el tercer cuartil Q3 y el otro en el valor

dado por el tercer cuartil más 1,5 veces el rango intercuartil R.I, esto es, Q3 + 1, 5R.I.
Si hay datos que se encuentran a la izquierda del bigote izquierdo y a la derecha del bigote
derecho, se les denomina valores atı́picos.
Definición 1.5.5 Todo valor que está más alejado del 1,5R.I del cuarto más cercano se
dice que es atı́pico. Un valor atı́pico es extremo si está a más de 3R.I del cuarto más
cercano, y es moderado en otro caso.
En el diagrama de caja, los valores atı́picos moderados se representan mediante un pequeño cuadrado, y
los extremos, con un pequeño cuadrado con un signo más en su interior.
Un valor atı́pico puede ser un elemento para el cual se haya anotado su valor en forma
errónea. Si es ası́, puede corregirse antes de proseguir con el análisis. También, un valor
atı́pico puede ser uno que por error se incluyó en el conjunto de datos y, en estos casos, debe
eliminarse. Por último, puede ser tan sólo un elemento poco común que se haya anotado en
forma correcta y que sı́ pertenece al conjunto de datos. En estos casos ese elemento debe
mantenerse.
Ejemplo 1.5.6 Construya un diagrama de caja y bigotes para los datos del ejemplo 1.5.4.
SOLUCIÓN:
Tenemos que el rango intercuartil es R.I = 2, 500 − 2, 365 = 0, 135, de donde se obtiene que la
longitud de los bigotes es 1, 5R.I = 0, 2025. Ahora

76 Llinás / Rojas
• El bigote de la izquierda tiene un extremo en el primer cuartil Q1 = 2, 365 y el otro en el

valor Q1 − 1, 5R.I = 2, 1625.
• El bigote de la derecha tiene un extremo en el tercer cuartil Q3 = 2, 500 y el otro en el valor

Q3 + 1, 5R.I = 2, 7025.

Mediana = 2,405
Valor atípico
(moderado)
1,5 R.I 1,5 R.I
+
0,2025 0,2025
Media
2,1625
2200 2,365
2400 2,5002600
2,7025 2800
2,825 3000
Salarios mensuales
Salarios mensuales
Figura 1.16: Diagrama de caja y bigotes para los datos del ejemplo 1.5.4
La figura 1.16 es el diagrama de caja y bigotes pedido. En el diagrama podemos observar que hay
un valor atı́pico (el valor 2,825) porque éste se encuentra por fuera de los bigotes. Debido a que
Q3 + 3R.I = 2, 905, este valor atı́pico es moderado, porque 2,825 es menor que 2,905. Además,
podemos afirmar que la distribución de frecuencias está sesgada a la derecha, porque el área del
rectángulo a la izquierda de la mediana es menor que el del rectángulo a la derecha de la mediana.
Esto también se puede concluir al tener en cuenta que media es mayor que la mediana.
Diagramas de cajas múltiples (o comparativos)
Un diagrama de caja múltiple (o comparativo) es una forma muy eficaz de mostrar

semejanzas y diferencias entre dos o más conjuntos de datos.
Ejemplo 1.5.7 La figura 1.17 contiene los diagramas de caja de las calificaciones en un examen
de matemáticas para quince estudiantes de primer curso de primaria, quince de segundo y quince
de tercero. En el diagrama puede apreciarse que no hay valores atı́picos en ninguno de los tres
grupos. Los estudiantes del tercer curso consiguieron la mejor mediana, pero sus calificaciones
tienen una variabilidad considerablemente mayor que la de los otros grupos. Otro hecho que llama
la atención es la gran cantidad de calificaciones bajas obtenidas por los estudiantes de primer curso.
Finalmente, podemos afirmar que las distribuciones de frecuencias de los tres conjuntos de datos
están sesgadas a la izquierda.

Primero
Segundo
Tercero
40 50 60 70 80 90 100
Calificaciones
Calificaciones
Figura 1.17: Diagrama de caja y bigotes de las calificaciones en un examen

57. Un fabricante de baterı́as para linternas tomó una muestra de 13 baterı́as de un dı́a de
producción y las usó hasta que se agotaron. Las horas que funcionaron hasta fallar son:
166 342 426 492 562 298 264 631 451 1.049 317 545 512
Proporcione el resumen de cinco números, construya el diagrama de caja y bigotes, deter-

mine en cada caso si hay valores atı́picos y haga un análisis exploratorio de cada conjunto
de datos.
58. Los siguientes datos muestran las yardas acumuladas durante la temporada de fútbol ame-
ricano colegial para una muestra de 20 receptores:
451 1.023 852 809 596 744 652 576 1.112 971
1.278 820 511 907 1.251 941 975 400 711 1.174
Haga el resumen de cinco números, trace un diagrama de caja e indentifique en él el o los
valores atı́picos.
59. Los siguientes datos representan los rendimientos porcentuales anuales en cuentas de mer-
cado de dinero de una muestra de 15 bancos comerciales en el área metropolitana de una
ciudad a una determinada fecha:
Nombre del banco Rendimiento Nombre del banco Rendimiento

Banco su cuenta 3,10 Banco el Paı́s 2,28
The Bank 2,63 Banco la Clave 3,01
Mein Bank 2,79 Banco del Norte 2,53
Your Bank 3,25 Banco del Sur 2,00
El Banco del pueblo 1,90 Banco Nacional 3,05
Aero Bank 2,79 Nuestro Banco 2,02
Union Bank 2,90 Banco el dinero 3,05
Bank del cliente 2,73

78 Llinás / Rojas
(a) Proporcione el resumen de cinco números.

(b) Construya el diagrama de caja y bigotes y describa la forma.
(c) Si alguien le dijera:“los rendimientos del mercado de dinero no varı́an mucho de un
banco a otro”, con base en estos datos, ¿qué dirı́a?
60. Una de las metas de toda administración es ganar lo más posible en relación con el capital
invertido en la empresa. Una medida del éxito en alcanzarla es el retorno sobre la aportación,
que es la relación de la ganancia neta entre el valor de las acciones. A continuación se
muestran los porcentajes de ganancia sobre las acciones para 25 empresas:
11,4 15,8 52,7 17,3 12,3 9,0 19,6 22,9 41,6

5,1 17,3 31,1 6,2 19,2 14,7 9,6 8,6 11,2
16,6 5,0 30,3 12,8 12,2 14,5 9,2
Haga el resumen de cinco números, trace un diagrama de caja y bigotes y determine si hay
valores atı́picos. ¿Cómo podrı́a un analista financiero usar esta información?
61. Una revista publica regularmente las clasificaciones de funcionamiento y de calidad para
muchos productos de consumo. Se publicaron calificaciones generales de una muestra de 16
televisores de precio intermedio en esta revista. Las marcas y las calificaciones aparecen en
la tabla siguiente:
Fabricante Calificación Fabricante Calificación Fabricante Calificación

PCG 73 Rernat 72 Katze 81
Monch 89 Kuril 77 Sheck 76
RMA 79 Tosh 79 Fish 77
Cuark 75 Pate 78 Karl 79
Magnifon 80 Wand 78 Wind 90
Sodium 86
(a) Determine la calificación promedio y haga el resumen de cinco números.

(b) Una evaluación similar de radios proporcionó calificaciones que tuvieron una media de
82,56, una desviación estándar 6,39 y un resumen de cinco números 75, 77, 82, 86 y
93. Compare los datos de calificaciones de la revista de televisores con los del radio.
Trace los diagramas de caja de ambos.
(c) ¿Hay valores atı́picos en los datos de televisores? Explique su respuesta.
62. Dos modos que usan las empleados para ir a trabajar diariamente son el transporte público
y el automóvil. A continuación vemos unas muestras de tiempos de cada modo. Las cifras
son minutos:
Transporte público 25 29 32 41 34 28 29 32 37 33
Automóvil 30 31 32 35 33 29 31 33 32 34
(a) Calcule la media y la desviación estándar de la muestra del tiempo que se lleva en
cada modo de transporte.

(b) Con base en los resultados del inciso (a), ¿qué modo de transporte debe preferirse?
Explique sus razones.
(c) Trace un diagrama de caja para cada modo. Al comparar los diagramas de caja, ¿se
respalda la conclusión del inciso (b)?
1.6 Uso de Statgraphics en la estadı́stica descriptiva

A continuación presentaremos una breve descripción de la forma cómo se utiliza Statgra-
phics en el análisis descriptivo de uno o más conjuntos de datos.
1.6.1 Análisis de un solo conjunto de datos
En esta sección trabajaremos con los datos que aparecen en el archivo calles.sf3. Este
contiene las variables longitud, anchura y nombre, que son la longitud, anchura y el
nombre de 112 calles del antiguo casco de Madrid (España). Utilizando este archivo y con
ayuda de Statgraphics realizaremos un análisis de la variable longitud. Al abrir el archivo
calles.sf3 sale la ventana de hojas de cálculos que mostramos en la figura 1.18. El acceso a
todas las opciones analı́ticas y gráficas que necesitamos en cualquier práctica la realizamos
de la misma manera:
Figura 1.18: Aspecto de la ventana de hojas de cálculos
• Seleccionamos Describe . . . Numeric Data . . . One-Variable Analysis y aparecen todas

las variables que contiene el archivo.
1.6. Uso de Statgraphics en la estadı́stica descriptiva

80 Llinás / Rojas
• Con el ratón se elige la variable deseada (que en nuestro caso será la variable lon-
gitud), aparecerá resaltada, y a continuación pulsamos el botón Data, aparece el
nombre de dicha variable como variable activa. Dicha ventana tiene la opción or-
denar (sort) las variables alfabéticamente. Los botones que aparecen en la parte
inferior permiten realizar el análisis, cancelar el análisis, transformar los datos y con-
sultar la ayuda. Pulsamos la opción OK para realizar el análisis y aparece la llamada
ventana del análisis, que da informaciones estadı́sticas acerca del conjunto de datos
con el que estamos trabajando (véase la figura 1.19).
Figura 1.19: Aspecto de la ventana del análisis
Los ı́conos principales que hay en la barra de herramientas de esta ventana son los cuatro
de la izquierda (los restantes los activamos en algunas opciones gráficas):
• El primer ı́cono (Input dialog, ı́cono de diálogos) permite la selección (o cambio) de

variables dentro del archivo y análisis seleccionado. Por ejemplo, dentro del archivo
calles.sf3 podemos cambiar la variable longitud por la variable anchura utilizando
este ı́cono.
• El segundo ı́cono (Tabular options, ı́cono de opciones tabulares) permite seleccionar

opciones analı́ticas.
• El tercer ı́cono (Graphical options, ı́cono de opciones gráficas) permite seleccionar

diferentes opciones de gráficos.
• El cuarto ı́cono (Save results, ı́cono de salvar resultados) permite salvar los resultados
del análisis para tratarlos posteriormente o para imprimirlos.

Opciones numéricas
Al marcar el segundo ı́cono (Tabular options) de la barra de herramientas de la ventana del

análisis podemos seleccionar las siguientes opciones:
• Analysis Summary (Resumen de procedimiento)

Presenta una información muy general del análisis (nombre de la variable, número de
datos que ella tiene, datos mayor y menor, etc.).
• Summary Statistics (Resumen estadı́stico)

Esta opción nos permite obtener algunas medidas estadı́sticas. Por defecto, ofrece el
número de datos, la media, varianza, desviación tı́pica, valores máximo y mı́nimo, los
coeficientes de asimetrı́a y apuntamiento estandarizados y la suma de los valores de
las observaciones. Para obtener un número mayor o menor de medidas, es suficiente
con pulsar el botón derecho del ratón y seleccionar Pane options, con lo que aparece
una ventana con un amplio conjunto de medidas.
• Percentiles
Permite el cálculo simultáneo de hasta 10 percentiles a voluntad del usuario. Si,
estando situado sobre esta salida, pulsamos el botón derecho del ratón y elegimos
Pane options, introducimos los percentiles que deseemos calcular.
• Frequency Tabulation (Tabla de frecuencia)

Permite resumir la distribución de los datos en una tabla de frecuencias absolutas,
relativas, absolutas acumuladas y relativas acumuladas. Si, estando situados sobre
esta salida, pulsamos el botón derecho del ratón y elegimos Pane options, obtenemos
la ventana de diálogo Frequency Tabulation Options, en donde tenemos los siguientes
campos:
– Number of Classes (Número de clases)

Aquı́, introducimos el número de intervalos de clase para agrupar los datos de
la distribución.
– Lower Limit (Lı́mite inferior )
En él introducimos el lı́mite inferior para la primera clase.
– Upper Limit (Lı́mite superior )

En este campo introducimos el lı́mite superior para la última clase.
– Hold (Mantener )
Lo señalamos cuando queremos mantener la definición actual de clase para la
siguiente tabla de frecuencias que realicemos.
• Stem-and-Leaf Display (Diagrama de tallo y hojas)

Esta opción permite mostrar el diagrama de tallo y hojas. En este caso, el diagrama
de tallo y hojas para la variable longitud está formado por cuatro tallos. Los valores

82 Llinás / Rojas
que están a la izquierda de cada tallo son la frecuencia absoluta acumulada de los
tallos, donde dicha frecuencia se comienza a contar tanto por arriba como por abajo,
a excepción de valor que aparece entre paréntesis, que corresponde al tallo donde
se encuentra la mediana. Si, estando situados sobre esta opción, pulsamos el botón
derecho del ratón y elegimos Pane options, obtenemos la ventana de diálogo Stem-
and-Leaf Display Options, cuyo campo Flag Outliers (Valores Anómalos) permite
marcar valores atı́picos en el diagrama. Como podemos observar, el diagrama de tallo
y hojas de la variable longitud presenta cuatro valores atı́picos.
• Las otras dos opciones, Confidence Intervals (Intervalos de confianza) y Hypothesis

Tests (Pruebas de hipótesis), corresponden a conceptos de la estadı́stica inferencial.
Opciones gráficas
Al marcar el tercer ı́cono (Graphical options) de la barra de herramientas de la ventana del

análisis podemos seleccionar las siguientes opciones:
• Scatterplot (Gráfico de dispersión)

Presenta un diagrama de dispersión para la variable en el que se muestran sus va-
lores mediante puntos no conectados a lo largo de un eje horizontal agrupados por
intervalos.
• Box-and-Whisker Plot (Gráfico de cajas y bigotes)

Permite realizar diagramas de cajas y bigotes. Si, estando situados sobre esta salida,
pulsamos el botón derecho del ratón y elegimos Pane options, obtenemos la ventana
de diálogo Frequency Tabulation Options, que ofrece los siguientes campos:
– Direction (Dirección)
Podemos elegir Vertical u Horizontal para orientar el diagrama en el sentido que
deseemos.
– Features (Aspectos)
Esta opción permite señalar o no en el gráfico la media (Mean Marker ), los
valores atı́picos (Outlier Symbols) y muescas sobre la mediana (Median Nocht).
• Frequency Histogram (Histograma de frecuencia)

Esta opción permite realizar histogramas y polı́gonos de frecuencias absolutas y rela-
tivas, que también pueden ser acumulados.6 Si, estando situados sobre el gráfico del
histograma, pulsamos el botón derecho del ratón y elegimos Pane options, obtenemos
la ventana de diálogo Frequency Plot Options con las siguientes opciones:
6
Recordemos que los polı́gonos acumulados o acumulados relativos son las llamadas ojivas.

– En los campos Number of Classes, Lower Limit y Upper Limit podemos definir
el número de clases deseado, el lı́mite inferior de la primera clase y el lı́mite
superior de la última clase respectivamente.
– El campo counts permite seleccionar frecuencias relativas (Relative) y acumu-
ladas (Cumulative).
– El campo Hold (Mantener ) permite mantener la escala actual para los gráficos
siguientes.
– El histograma de frecuencias absolutas lo obtenemos señalando el botón His-
togram del campo Plot Type y dejando en blanco los dos botones del campo
Counts; el de frecuencias relativas, señalando el botón Histogram del campo
Plot Type y el botón Relative del campo Counts; el de frecuencias acumuladas,
señalando el botón Histogram del campo Plot Type y el botón Cumulative del
campo Counts; el de frecuencias acumuladas, señalando el botón Histogram del
campo Plot Type y los botones Cumulative y Relative del campo Counts.
– El polı́gono de frecuencias absolutas lo obtenemos señalando el botón Polygon
del campo Plot Type y dejando en blanco los dos botones del campo Counts; el
de frecuencias relativas, señalando el botón Polygon del campo Plot Type y el
botón Relative del campo Counts.
– La ojiva de frecuencias acumuladas la obtenemos señalando el botón Polygon
del campo Plot Type y el botón Cumulative Relative del campo Counts; la de
frecuencias acumuladas relativas, señalando el botón Polygon del campo Plot
Type y los botones Relative y Cumulative del campo Counts.
• Density Trace (Gráfico de densidad )

Esta opción permite visualizar en cierta forma el histograma suavizado.
• Symmetry Plot (Gráfico de simetrı́a)

Este gráfico permite analizar el grado de simetrı́a de un conjunto de datos. En el eje
de las abscisas se representan las distancias de los datos a la mediana que quedan por
debajo de ella. Si la simetrı́a fuese perfecta, el conjunto de puntos resultante serı́a la
diagonal principal. Mientras más se aproxime la gráfica a la diagonal, más simetrı́a
existirá en la distribución de los datos.
Conclusiones sobre la variable longitud
Tiene especial interés la comparación de la media (Average) y la mediana (Median), donde

observamos que la media es mayor que la mediana en 40 unidades. Esto indica cierta
asimetrı́a en los datos, que debe concordar con un coeficiente de asimetrı́a grande y positivo.
En el histograma observamos asimetrı́a, con mayor concentración de datos en la parte

84 Llinás / Rojas
izquierda. Es recomendable modificar el número de clases del histograma, para ası́ observar
las variaciones que se producen en éste.
El diagrama de caja de la variable longitud pone claramente de manifiesto la asimetrı́a de

los datos, con mayor concentración en la parte izquierda que en la derecha, y la presencia
de valores atı́picos. La caja está delimitada por el primero y tercer cuartil, con valores
respectivos de 89 y 210. La lı́nea que separa la caja en dos partes es la mediana, con
magnitud igual a 135. El valor mı́nimo es 25, y no se observan valores atı́picos en la parte
izquierda de los datos. En la parte derecha aparecen varios valores atı́picos.
Si deseamos obtener una distribución simétrica y con probable desaparición de ciertos va-
lores atı́picos, recomendamos realizar una transformación.
Transformación de la variable longitud
Las cuatro transformaciones más habituales para resolver este tipo de problemas son: lo-
garitmo, raı́z cuadrada, inversa y cuadrado.
Los comandos que representan estas tres transformaciones son:
• LOG(nombre variable) para el logaritmo neperiano
• SQRT(nombre variable) para la raı́z cuadrada
• y 1/(nombre variable) para la inversa.
Para trabajar con la variable transformada es suficiente con escribir en lugar del nombre
de la variable la transformación adecuada. Por ejemplo, si quisiéramos trabajar con el
logaritmo de la variable, escribimos LOG(longitud) en vez de longitud. Otro método
para escribir la transformación adecuada es desde la opción de One Variable Analysis;
en la parte inferior de la ventana activar el botón Transform, lo que nos permite acceder
a los diferentes operadores (Operators), entre los que se encuentran las transformaciones
antes mencionadas. De las estas transformaciones, la que ofrece una distribución más
simétrica es el logaritmo. A continuación presentamos las conclusiones obtenidas del estudio
descriptivo (medidas caracterı́sticas, diagrama de tallo y hojas, caja e histograma) de la
variable LOG(longitud).
Conclusiones sobre el logaritmo de la variable longitud
Repetimos todo el análisis realizado para la variable longitud, pero ahora con la variable
transformada (LOG(longitud)). Como consecuencia de la transformación realizada obte-

nemos un comportamiento simétrico, aunque detectamos la presencia de un valor atı́pico

correspondiente a la calle Atocha de 1260 metros.7
1.6.2 Análisis simultáneo de dos o más conjuntos de datos
Mediante la opción Compare . . . Two Samples . . . Two Sample Comparison . . . podemos

analizar dos conjuntos de datos simultáneamente (véase el ejercicio 68).
Para obtener diagramas de cajas múltiples para dos o más conjuntos de datos, una alter-
nativa es mediante las opciones Compare . . . Multiple Samples . . . Multiple-Sample Com-
parison . . . Multiple Data Columns . . . Ok . . . Samples= (en esta última opción mencionar
los datos que queremos comparar).
Statgraphics también habilita la subopción Plot . . . Exploratory Plots . . . Multiple Box-

and-Whishker Plot . . . Data=distancia . . . Level codes=year . . . para obtener diagramas de
cajas múltiples de varios conjuntos de datos con respecto diferentes grupos en que podemos
dividir los conjuntos de datos (véase el ejercicio 64c).

63. Considere la variable anchura que contiene el conjunto de datos que encontramos en el
archivo calles.sf3 y que corresponde al ancho de 112 calles de Madrid (España).
(a) Obtenga la media y la mediana, la moda, el primero y tercer cuartil, el segundo y octavo
decil, los percentiles 35, 66, 81 y 93, el sesgo y el coeficiente de variación. Interprete
cada uno de sus resultados.
(b) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera frontera
inferior sea 0 y la última frontera superior sea 40. Con base en ella, responda las
siguientes preguntas:
i. ¿Cuántas calles tienen un ancho entre 5 y 25 kilómetros?
ii. ¿Qué porcentaje de calles tienen un ancho entre 10 y 30 kilómetros?
iii. ¿Cuántas calles tienen un ancho mayor que 20 kilómetros?

iv. ¿Qué porcentaje de calles tienen un ancho mayor que 25 kilómetros?
v. ¿Cuántas calles tienen un ancho menor que 15 kilómetros?
vi. ¿Qué porcentaje de calles tienen un ancho menor que 35 kilómetros?
7
La presencia de este valor atı́pico la podemos explicar acudiendo a razones históricas. Por ejemplo, la
calle Atocha está ubicada entre la Plaza de Santa Cruz y el Paseo del Prado,que data de 1589, al igual que
las calles de su entorno. Una explicación de su carácter peculiar (atı́pico) es su función como unión entre
Madrid capital y el Hospital General (inicialmente en la periferia).

86 Llinás / Rojas
(c) Con 8 clases (en donde la primera frontera inferior sea 0 y la última frontera superior
sea 40) construir los histogramas de frecuencias absolutas y de frecuencias absolutas
acumuladas, los polı́gonos de frecuencia y de frecuencias relativas y las ojivas de fre-
cuencias acumuladas y de frecuencias relativas acumulada. A partir de estos gráficos
responda las siguientes preguntas:
i. ¿Aproximadamente cuántas calles tienen un ancho mayor que 16,9 kilómetros?
ii. ¿Aproximadamente cuántas calles tienen un ancho menor que 12,5 kilómetros?
iii. ¿Qué porcentaje aproximado de calles tienen un ancho mayor que 7,7 kilómetros?
iv. ¿Qué porcentaje aproximado de calles tienen un ancho menor que 13,8 kilómetros?
(d) Estudie la simetrı́a de la distribución de los datos.
(e) ¿Existen valores atı́picos? ¿Cuántos? ¿Cuáles?
(f) ¿Existe alguna transformación que mejora la simetrı́a? ¿Y la presencia de valores
atı́picos? Indique en caso positivo la transformación seleccionada.
64. En el archivo de datos autos.sf3 mostramos las distancias recorridas (dadas en millas por
galón) de 154 modelos de automóviles sacados al mercado entre los años 1978 y 1982 por
diferentes fabricantes: americanos (origen=1), europeos (origen=2) y japoneses (origen=3).
También aparecen los respectivos cilindrajes de los autos, las potencias, etc.
(a) Construya un diagrama de caja y bigotes para los datos de la distancia recorrida, y con
base en él responda las siguientes preguntas: ¿Entre cuáles valores varı́a la distancia
recorrida? ¿Cuánto recorre el 50% central de los autos? ¿Hay valores atı́picos? ¿Es
simétrica o asimétrica la distribución de los datos? En caso de ser asimétrica, ¿es
asimétrica a la izquierda o a la derecha? ¿Cuáles son los valores de la media y de la
mediana?
(b) Estudie el grado de simetrı́a de los datos de la distancia recorrida de cuatro maneras
diferentes (compare sus respuestas):
i. Utilizando las medidas estadı́sticas (media, mediana, moda, sesgo, etc.).
ii. Construyendo un histograma de frecuencias con 5 clases.
iii. Construyendo un histograma con 13 clases. ¿Porqué este histograma resulta más
adecuado que el que construyó con 5 clases?
iv. Construyendo un gráfico de simetrı́a con la opción graphical options . . . symmetry
plot de Statgraphics.
(c) Considere ahora por separado los conjuntos de distancias recorridas de los modelos de
cada uno de los cinco años.
i. Analice gráfica y numéricamente cada uno de estos conjuntos.
ii. Utilizando la opción Plot . . . Exploratory Plots . . . Multiple Box-and-Whishker
Plot . . . Data=distancia . . . Level codes=year . . . obtenga los diagramas de ca-
jas (múltiples) de los cinco conjuntos de distancias recorridas con respecto a cada
uno de los años. ¿Qué se observa? ¿Conoce alguna razón que pueda explicar lo que
resulta de los análisis numéricos y de la observación de los diagramas de cajas?

(d) Ahora construya el diagrama de caja múltiple de la distancia recorrida de los automó-
viles según su cilindrada.
i. Teniendo en cuenta cada uno de los diagramas responda las preguntas formuladas
en la parte (a).
ii. Compare entre sı́ los distintos diagramas y responda las siguientes preguntas:
¿Dónde es más fuerte la asimetrı́a? ¿Dónde es menor? ¿Dónde no existe? ¿Varı́a
bastante los valores de la media y de la mediana para los diferentes grupos?
(e) Construya el diagrama de caja múltiple de la potencia de los automóviles según su
origen y responda las preguntas formuladas en el inciso anterior.
65. Se han medido los diámetros (en milı́metros) de 50 tornillos y se han obtenido los resultados
que mostramos en el archivo tornillos.sf3.
(a) Obtenga la mediana, la moda, el primero y tercer cuartil, el sexto y séptimo decil y los
percentiles 54, 47, 82. Interprete cada uno de sus resultados.
(b) Forme la tabla de frecuencias con 6 clases para los datos, y con base en ella responda
las siguientes preguntas:
i. ¿Cuántos tornillos tienen un diámetro entre 29 y 32 milı́metros?
ii. ¿Qué porcentaje de tornillos tienen un diámetro entre 30 y 34 milı́metros?
iii. ¿Cuántos tornillos tienen un diámetro mayor que 32 milı́metros?
iv. ¿Qué porcentaje de tornillos tienen un diámetro mayor que 34 milı́metros?
v. ¿Cuántos tornillos tienen un diámetro menor que 31 milı́metros?
vi. ¿Qué porcentaje de tornillos tienen un diámetro menor que 33 milı́metros?
(c) Con 6 clases construir los histogramas de frecuencias absolutas y de frecuencias abso-
lutas acumuladas, los polı́gonos de frecuencia y de frecuencias relativas y las ojivas de
frecuencias acumuladas y de frecuencias relativas acumulada. Con base en estos gráficos
responda las siguientes preguntas:
i. ¿Aproximadamente cuántos tornillos tienen un diámetro mayor que 34,4 milı́metros?
ii. ¿Aproximadamente cuántos tornillos tienen un diámetro menor que 32,2 milı́metros?
iii. ¿Qué porcentaje aproximado de tornillos tienen un diámetro mayor que 31,6 milı́-
metros?
iv. ¿Cuántos tornillos tienen un diámetro menor que 32,8 milı́metros?
66. Los datos del archivo fotocopia.sf3 muestran el gasto en fotocopias (en miles de pesos) de
70 estudiantes universitarios durante un determinado año.
inferior sea 0 y la última frontera superior sea $ 1.400.000. Con base en ella responda
las siguientes preguntas:

88 Llinás / Rojas
i. ¿Cuántos estudiantes han gastando entre $ 175.000 y $ 525.00 en el año?

ii. ¿Qué porcentaje de estudiantes han gastando entre $ 700.000 y $ 1.225.000 en el
año?
iii. ¿Cuántos estudiantes han gastando más de $ 1.050.000 en el año?
iv. ¿Qué porcentaje de estudiantes han gastando más de $ 350.000 en el año?
v. ¿Cuántos estudiantes han gastando menos de $ 875.000 en el año?
vi. ¿Qué porcentaje de estudiantes han gastando menos de $ 525.000 en el año?
(c) Con 8 clases (en donde la primera frontera inferior sea 0 y la última frontera superior
sea $ 1.400.000) construya los histogramas de frecuencias absolutas y de frecuencias
absolutas acumuladas, los polı́gonos de frecuencia y de frecuencias relativas y las ojivas
de frecuencias acumuladas y las de frecuencias relativas acumuladas. Teniendo en cuenta
estos gráficos responda las siguientes preguntas:
i. ¿Aproximadamente cuántos estudiantes han gastando más de $ 767.810 en el año?
ii. ¿Aproximadamente cuántos estudiantes han gastando menos de $ 391.821 en el
año?
iii. ¿Qué porcentaje aproximado de estudiantes han gastando más de $ 601.583 en el
año?
iv. ¿Cuántos estudiantes han gastando menos de $ 1.104.220 en el año?
(e) ¿Existen valores atı́picos? ¿Cuántos? ¿Cuáles?
(f) Realice una transformación logarı́tmica de los datos e interprete los resultados. Comente
las diferencias con los datos sin transformar.
67. En el archivo de datos doscientos.sf3 proporcionamos las sesenta y nueve mejores marcas
de todos los tiempos en la prueba de 200 metros lisos masculinos (las marcas se dan en
segundos), ası́ como el nombre del atleta y la fecha en que se consiguió la marca.
inferior sea 19,2 segundos y la última frontera superior sea 20,2 segundos. Con base en
ella responda las siguientes preguntas:
i. ¿Cuántos atletas han recorrido entre 19,325 y 19,7 segundos?
ii. ¿Qué porcentaje de atletas han recorrido entre 19,45 y 19,95 segundos?
iii. ¿Cuántos atletas han recorrido más de 19,7 segundos?
iv. ¿Qué porcentaje de atletas han recorrido más de 19,45 segundos?
v. ¿Cuántos atletas han recorrido menos de 19,95 segundos?
vi. ¿Qué porcentaje de atletas han recorrido menos de 19,825 segundos?

(c) Con 8 clases (en donde la primera frontera inferior sea 19,2 segundos y la última frontera
superior sea 20,2 segundos) construya los histogramas de frecuencias absolutas y de
frecuencias absolutas acumuladas, los polı́gonos de frecuencia y de frecuencias relativas
y las ojivas de frecuencias acumuladas y de frecuencias relativas acumuladas. A partir
de estos gráficos responda las siguientes preguntas:
i. ¿Aproximadamente cuántos atletas han recorrido más de 19,818 segundos?
ii. ¿Qué porcentaje aproximado de atletas han recorrido más de 19,845 segundos?
iii. ¿Qué porcentaje aproximado de atletas han recorrido más de 19,782 segundos?
iv. ¿Aproximadamente cuántos atletas han recorrido menos de 20,03 segundos?
(e) ¿Se detecta algo peculiar en la distribución de estos datos?
(f) ¿Se detecta algún valor potencialmente atı́pico? ¿Cuál es?
68. En el archivo de datos gemelos.sf3 mostramos los resultados de tests de inteligencia rea-
lizados a parejas de gemelos monozigóticos. Los gemelos monozigóticos se forman por la
división en dos de un mismo óvulo ya fecundado y, por tanto, tienen la misma carga genética.
Al mismo tiempo, por razones obvias, es muy frecuente que compartan el entorno vital y es
difı́cil separar ambos factores. En el conjunto de datos, los de la columna A corresponden
al gemelo criado por sus padres naturales, los de la columna B al criado por un familiar u
otra persona. Mediante la opción Compare . . . Two Samples . . . Two Sample Comparison
. . . Sample 1=A . . . Sample 2=B . . . Ok, resuelva lo siguiente:
(a) Compare la simetrı́a de los datos de la columna A y B.

(b) Construya un diagrama de caja múltiple para los datos de la columna A y B y describa
sus interesantes propiedades.
(c) ¿Cómo interpreta el coeficiente de variación de ambos conjuntos de datos?
69. En el archivo de datos Cavendish.sf3 presentamos 29 medidas de la densidad de la Tierra

obtenidas por Henry Cavendish en 1798 empleando una balanza de torsión. La densidad de
la Tierra se proporciona como un múltiplo de la densidad del agua.
(a) Utilice los diagramas de tallo y hojas y de cajas para determinar si existe algún valor
atı́pico.
(b) Proponga, razonando la respuesta, un valor para la densidad de la Tierra.
70. En 1893 Lord Rayleigh investigó la densidad del nitrógeno empleando en su obtención dis-
tintas fuentes. Previamente habı́a comprobado la gran diferencia existente entre la densidad
del nitrógeno producido tras la eliminación del oxı́geno del aire y el nitrógeno producido
por la descomposición de ciertos compuestos quı́micos. Los datos del archivo Rayleigh.sf3
muestran esta diferencia de forma clara. Esto llevó a Lord Rayleigh a investigar detenida-
mente la composición del aire libre de oxı́geno y al descubrimiento de un nuevo elemento
gaseoso, el argón.

90 Llinás / Rojas
(a) Analice numérica y gráficamente estos datos. Preste especial atención a los diagramas
de tallo y hojas y al diagrama de cajas. ¿Hay alguna peculiaridad de la población de
pesos que se manifieste en un diagrama y no en el otro?
(b) Realice diagramas de cajas dividiendo los datos en los pesos obtenidos con base aire y
los obtenidos con base en compuestos quı́micos del nitrógeno. ¿Qué se observa?
71. Una de las medidas de seguridad de los reactores nucleares frente a desajustes en el proceso
de generación de energı́a o de extracción de ésta es el disparo del reactor. Esta medida
consiste en la detención del proceso de fusión mediante la inserción en el núcleo del reactor
de venenos neutrónicos. El número de disparos no previstos de un reactor en un periodo es
un indicador de problemas de comportamiento y de fiabilidad en la planta. En el archivo
de datos disparos.sf3 proporcionamos, para dos años diferentes (1984 y 1993), el número
de disparos no previstos en sesenta y seis reactores nucleares de los Estados Unidos de
Norteamérica.
(a) Analice numérica y gráficamente, por separado, el número de disparos de reactor en

cada uno de los dos años considerados.
(b) Compare gráficamente las distribuciones de ambas variables ¿Se aprecian diferencias
importantes entre ellas? ¿Qué conclusiones le sugiere esta comparación?
1.7 Uso de la calculadora en la estadı́stica

El objetivo de esta sección es ilustrar en forma breve el manejo de la calculadora como
herramienta de ayuda en los cálculos estadı́sticos, pero utilizando directamente las funciones
estadı́sticas que están incorporadas en ella. En particular, las explicaciones las basaremos
en la utilización de las calculadoras Casio fx-82MS, fx-83MS, fx-85MS, fx-270MS, fx-300MS
y fx-350MS.
Cálculos estadı́sticos
Para realizar cálculos estadı́sticos en la calculadora, tenga en cuenta los siguientes comen-
tarios:
• Utilice las teclas mode 2 para ingresar el modo SD cuando desea realizar cálculos
estadı́sticos con ayuda de las funciones estadı́sticas que hay incorporadas en la calcu-
ladora.
• El ingreso de datos comienza siempre con shift clr 1 = para borrar la memoria
de estadı́sticas.
• Ingrese los datos usando la secuencia de tecla siguiente: <Dato> dt .

• Los datos ingresados los usamos para calcular los valores para n (el total de datos),
2
x (la suma de todos los datos), x (la suma de los cuadrados de los datos), x (la
media), σn (la desviación estándar poblacional) y σn−1 (la desviación estándar mues-
tral), que pueden llamarse usando las operaciones de tecla indicados a continuación:
Para llamar este tipo de valor: Realice esta operación:

2
x shift s-sum 1

x shift s-sum 2
n shift s-sum 3
x shift s-var 1
σn shift s-var 2
σn−1 shift s-var 3

Ejemplo 1.7.1 Calcule n, x, x2 , x, σn y σn−1 para los datos siguientes: 55, 54, 51, 55, 53,
53, 54 y 52.
SOLUCIÓN:
• Primero, ingresamos al modo SD con las teclas mode 2 .
• Luego, borramos la memoria con la secuencia de teclas shift clr 1 = .
• Posteriormente, ingresamos los datos: 55 dt 54 dt 51 dt 55 dt 53 dt 53 dt 54 dt

52 dt
• Por último, calculamos las medidas estadı́sticas pedidas:
2
Suma de los cuadrados de los valores x = 22.805 shift s-sum 1 =

Suma de valores x = 427 shift s-sum 2 =
Número de datos n = 8 shift s-sum 3 =
Media aritmética x = 53, 375 shift s-var 1 =
Desviación estándar poblacional σn = 1, 316956719 shift s-var 2 =
Desviación estándar muestral σn−1 = 1, 407885953 shift s-var 3 =
Precauciones con el ingreso de datos
• dt dt ingresa el mismo dato dos veces.
• También puede ingresar múltiples entradas del mismo dato usando shift ; . Por
ejemplo, para ingresar el dato 110 diez veces presiones 110 shift ; 10 dt .
1.7. Uso de la calculadora en la estadı́stica

92 Llinás / Rojas
• Mientras ingresa datos o después de completar el ingreso de datos, puede usar las
teclas
y ∇ para ir visualizando a través de los datos que ha ingresado. Si ingresa
múltiples ingresos del mismo dato usando shift ; para especificar la frecuencia de
datos (número de ı́temes de datos) como se describe anteriormente, pasando a través
de los datos muetra el ı́tem de dato y una pantalla separada para la frecuencia de
datos (freq).
• Los datos visualizados pueden editarse, si ası́ lo desea. Ingrese el valor nuevo y presione
la tecla = para reemplazar el valor antiguo por el valor nuevo. Esto también significa
que si desea realizar alguna otra operación (cálculo, llamada de resultados de cálculos
estadı́sticos, etc.), siempre deberá presionar primero la tecla ac para salir de la
presentación de datos.
• Presionando la tecla dt , en lugar de = , después de cambiar un valor sobre la

presentación, registra el valor que ha ingresado como un elemento de dato nuevo, y
deja el valor antiguo tal como está.
• Puede borrar el valor del dato visualizado usando

y ∇ , y luego presionando
shift cl . Borrando un valor de dato ocasiona que todos los valores siguientes se
desplacen hacia arriba.
• Después de ingresar los datos estadı́sticos en el modo SD no podrá visualizar o editar

más los datos ı́temes de datos individuales, después de cambiar a otro modo.

72. Una determinada persona es propietario de 12 terrenos cuyos tamaños (en kilómetros
cuadrados) son:
21 22 27 36 22 29 22 23 22 28 36 33
Halle la media y la desviación tı́pica directamente de la calculadora.
73. Los porcentajes de rentabilidad de los fondos de inversión de diez grandes empresas fueron:
17,6 26,6 15,6 12,4 22,9 25,0 22,4 18,5 27,9 11,6
Halle la media y la desviación tı́pica directamente de la calculadora.
74. Directamente de la calculadora, halle la media y la desviación tı́pica de los datos del ejercicio
45.
75. Sea dada la siguiente tabla de frecuencias. Halle la media y la desviación tı́pica directamente
de la calculadora.
Dato 5,0 2,5 3,2 2,0
Frecuencia 8 2 6 3

✍ Ejercicios complementarios
76. Diga si la afirmación dada es verdadera o falsa. Justifique siempre su respuesta. En caso
que sea falsa, dé un contraejemplo.
(a) La suma de las desviaciones de los valores respecto a la media para cualquier conjunto
de datos es uno.
(b) Si la desviación estándar de un conjunto de datos es 0, entonces los datos son iguales.
(c) El valor de la desviación estándar es menor que el de la varianza.
(d) No existen datos de tal forma que sean iguales el rango y la desviación estándar.
(e) No existen datos de tal forma que sean iguales el rango y la varianza.
(f) Si el ingreso medio de 25 trabajadores es de $ 2.500.000, entonces el ingreso total es de
$ 10.000.000.
(g) Si 10 calificaciones tienen una media de 2,0 y 27 calificaciones una media de 3,0, entonces
la media del grupo total de 37 calificaciones es 2,5.
(h) Existen datos con desviación estándar negativa.
(i) En una distribución simétrica, la media, la mediana y la moda son iguales.
(j) En una distribución positivamente sesgada, la mediana es mayor que la media.
(k) La desviación estándar está dada por las mismas unidades que la media.
(l) Toda información numérica proporciona datos cuantitativos.
(m) Toda información no numérica ofrece datos cuantitativos.
(n) Cuando todos los datos son categóricos, la moda es la única medida de tendencia central
que se puede utilizar.
(o) Si el primer cuartil en el primer examen de estadı́stica fue de 3,0, entonces este valor
indica que el 25% de los estudiantes ganaron el examen.
(p) Si x es un dato de una muestra y s2 es la varianza de esa muestra, entonces la expresión
x − s2 carece de sentido.
(q) Si un conjunto de datos no es asimétrico, entonces su coeficiente de sesgo es 1.
77. Un determinado reporte presenta las siguientes observaciones de resistencia de vigas (los
datos están en megapascales):
6,8 7,0 7,6 6,8 5,9 7,2 7,3 6,3 8,1 11,6 9,0 11,8 10,7 11,3
6,5 7,0 6,3 7,9 8,2 8,7 7,8 9,7 7,7 9,7 7,8 7,7 7,4
(a) Construya un diagrama comparativo de tallo y hojas de los datos. ¿Cuál parece ser
un valor representativo de la resistencia? ¿Parecen estar las observaciones muy concen-
tradas cerca del valor representativo o sólo están dispersas?
(b) ¿Parece ser razonablemente simétrico el diagrama respecto a un valor representativo o
describirı́a su forma de otra manera?
Cap. 1. Ejercicios complementarios

94 Llinás / Rojas
(c) ¿Parece haber algún valor extraño o atı́pico?

(d) ¿Qué proporción de observaciones de resistencia fueron mayores que 10 megapascales?
78. El reporte del ejercicio 77 también presenta las siguientes observaciones de resistencia de
cilindros:
9,2 6,6 8,3 7,0 8,3 6,1 5,8 7,8 7,1 7,2
9,8 9,7 14,1 12,6 11,2 7,8 8,1 7,4 8,5 8,9
(a) Construya un diagrama comparativo de tallo y hojas de los datos para vigas y para
cilindros y a continuación conteste las preguntas de la parte (b) a (d) de aquel ejercicio,
sobre las observaciones con cilindros.
(b) ¿En qué aspectos se parecen los dos lados del diagrama? ¿Hay diferencias obvias entre
las observaciones para vigas y para cilindros?
79. Según un diario, en Colombia la donación y disponibilidad de sangre es muy baja, tomando
en cuenta que la captación anual es tan sólo de 485 mil unidades, lo que equivale al 1 por
ciento de la población. ¿Cuál es el promedio de unidades de sangre para 1.000 personas?
80. Un multicentro ha vendido el 70 por ciento de sus metros cuadrados por un valor de 399
millones de dólares. Si el multicentro tiene 190 mil metros cuadrados, ¿cuál es el precio
promedio por metro cuadrado? ¿Cuánto recibirá aproximadamente la cadena por la venta
de todos los locales del multicentro?
81. Si cada colombiano consume cien botellas de 8 onzas de una marca de gaseosa al año,
¿cuánto consume de dicha gaseosa diariamente en botellas y en onzas?
82. Una revista efectuó una encuesta para estudiar sus suscriptores en ciertos paı́ses. Una de
las preguntas pedı́a el valor del portafolio del suscriptor (acciones, bonos, fondos hipoteca-
rios y certificados de depósitos). La siguiente distribución de frecuencias porcentuales fue
preparada con las respuestas:
Inversión (dólar ) Frecuencia porcentual

Menos de 15.000 27
15.000 - 40.000 7
40.000 - 90.000 10
90.000 - 240.000 18
240.000 - 490.000 5
490.000 - 990.000 13
990.000 y más 20
(a) ¿Qué porcentaje de suscriptores tienen inversiones menores que 90.000 dólares?
(b) ¿Qué porcentajes de suscriptores tienen inversiones en el intervalo de 40.000 a 490.000
dólares?
(c) ¿Qué porcentajes de suscriptores tienen inversiones de 490.000 dólares o más?

(d) La distribución porcentual de frecuencias se basa en 816 respuestas. ¿Aproximadamente

cuántos encuestados dijeron tener inversiones entre 40.000 y 990.000 dólares?
(e) Estime la cantidad de encuestados que aseguran tener inversiones menores que 90.000
dólares.
83. De todos los anuncios de bebidas alcohólicas en vallas publicitarias, el 60% son de cerveza,
el 30% de licores con alto contenido de alcohol, el 6% sobre vino, y el 4% restante de
bebidas con bajo contenido de alcohol. Construya un diagrama de barras y uno de pastel
que represente esta información.
84. Una sucursal bancaria localizada en la zona comercial de una ciudad desarrolló un proceso
para atender a sus clientes durante la hora pico de almuerzo, de 12:00 p.m. a 1:00 p.m.
Se registró el tiempo de espera en minutos (definido como el tiempo desde que el cliente
se forma en la cola hasta que lo atienden) para todos los clientes que asisten a esta hora
durante una semana. Se seleccionó una muestra aleatoria de 15 clientes y los resultados
fueron:
2,34 3,02 3,54 3,20 5,13 4,21 5,55 4,77

4,50 6,10 6,19 3,79 5,12 6,46 0,38
(a) Calcule la media, la mediana, la moda, el rango medio, los tres cuartiles, el rango, el
rango intercuartil, la varianza, la desviación estándar y el coeficiente de variación.
(b) ¿Están los datos sesgados? Si es ası́, ¿cómo?
(c) Un cliente entra en la sucursal a la hora del almuerzo y pregunta cuánto tiempo tendrá
que esperar. Y él mismo se responde: “es casi seguro que no tendré que esperar más de
cinco minutos”. Evalúe esta afirmación según los resultados obtenidos en el inciso (a).
85. Un auditor ha comprobado que el valor de la facturas pagadas por cierta empresa norte-
americana tiene una media de 300 dólares y una desviación tı́pica de 65 dólares. Halle un
intervalo en el cual se pueda garantizar que se encuentra por lo menos (a) 60%, (b) 80% de
estos valores.
86. Los siguientes tiempos fueron registrados por corredores de cuarto de milla de un equipo
universitario de pista (tiempos en minutos):
Tiempos en el cuarto de milla 1,04 0,90 0,99 0,92 0,98

Tiempos en la milla 4,60 4,70 4,50 4,52 4,35
Después de ver esta muestra de tiempos, uno de los entrenadores comentó que los corredores
de cuarto de milla corrı́an con más consistencia. Emplee la desviación estándar y el coe-
ficiente de variación para resumir la variabilidad de los datos. ¿El coeficiente de variación
indica que es cierta la afirmación del entrenador?
87. La máxima temperatura registrada durante el verano en una ciudad europea durante los
últimos 8 años son: 25; 24; 23,2; 25,5; 24,8; 23,6; 26 y 35 ◦ C. ¿Se puede considerar la última
temperatura como fuera de lo normal? Justifique.

96 Llinás / Rojas
88. Dos poblaciones constan de n datos cada una. La media de estas dos poblaciones es la
misma, y también lo son sus desviaciones tı́picas. Si (a) n = 2, (b) n = 3, ¿son necesaria-
mente iguales los valores numéricos de los datos de las dos poblaciones?
89. Sean dados los datos x1 , . . ., xn .

n
(a) ¿Para qué valor de c la cantidad i=1 (xi − c)2 es minimizada?
n
(b) Mediante el resultado del inciso (a), ¿cuál de las dos cantidades i=1 (xi − x)2 y
n
i=1 (xi − μ) será menor que la otra (suponiendo que x = μ)?
2
90. Supongamos que a cada dato de un conjunto de datos se le suma una constante c, es decir,
supongamos que se agrega una constante c a cada xi en una muestra, y se obtiene yi = xi +c.
(a) Demuestre que la media del nuevo conjunto de datos es igual a la media de los datos
originales más la constante. Es decir, y = x + c.
(b) Demuestre que la mediana del nuevo conjunto de datos es igual a la mediana de los
datos originales más la constante. Es decir,
(Mediana de los yi ) = (Mediana de los xi ) + c
(c) Demuestre que la varianza del nuevo conjunto de datos es igual a la varianza de los
datos originales. Es decir,
(Varianza de los yi ) = (Varianza de los xi )
(d) Demuestre que la desviación estándar del nuevo conjunto de datos es igual a la desviación
estándar de los datos originales. Es decir,
(Desviación estándar de los yi ) = (Desviación estándar de los xi )
91. Supongamos que a cada dato de un conjunto de datos se le multiplica una constante, es
decir, supongamos que se multiplica una constante k a cada xi en una muestra, y se obtiene
yi = kxi .
(a) Demuestre que la media del nuevo conjunto de datos es igual a la media de los datos
originales multiplicada por la constante. Es decir, y = kx.

(b) Demuestre que la mediana del nuevo conjunto de datos es igual a la mediana de los
datos originales multiplicada por la constante. Es decir,
(Mediana de los yi ) = k (Mediana de los xi )
(c) Demuestre que la varianza del nuevo conjunto de datos es igual a la varianza de los
datos originales por la constante al cuadrado. Es decir,
(Varianza de los yi ) = k 2 (Varianza de los xi )

(d) Demuestre que la desviación estándar del nuevo conjunto de datos es igual a la desviación
estándar de los datos originales multiplicada por el valor absoluto de la constante . Es
decir,
(Desviación estándar de los yi ) = |k| (Desviación estándarde los xi )
Aplique los resultados de los ejercicios 90 y 91 para resolver los problemas 92 y 93.
92. (a) Una muestra de temperatura para iniciar cierta reacción quı́mica dio una media mues-
tral de 87, 3◦ C y una desviacón estándar muestral de 1, 04◦ C. ¿Cuál son la media y
desviación estándar muestrales medidas en ◦ F ? (Sugerencia: F = 95 C + 32.)
(b) Si se suma 5 a cada dato en un conjunto de diez que tiene una desviación estándar de
7, ¿cuál es la desviación estándar del nuevo conjunto de datos?
(c) Suponga que 3,0 es la media de una muestra de cuatro calificaciones.
i. Si se suma 5 décimas a cada calificación, ¿cuál es la media del nuevo conjunto?
ii. Si cada calificación se multiplica por 1,5 puntos, ¿cuál será la media?
93. El propietario de una pequeña empresa gana un sueldo de 3.910 euros mensuales. Los
salarios de los empleados aparecen a continuación:
480 510 739 883 859 499 505 1.106 980

1.172 853 487 553 944 920 1.713 1.893 595
(a) ¿Cuál es el salario medio de todos los que trabajan en la empresa, incluyendo al propie-
tario? ¿Cuál es la desviación estándar?
(b) Si se decide aumentar el salario a cada uno en 20 euros, ¿cómo varı́a la media? ¿Y la
desviación estándar?
(c) Si se aumenta sólo el sueldo del dueño en 600 euros, ¿qué ocurre con la media?
(d) Halle la mediana. ¿Cómo varı́a la mediana si se aumentan todos los sueldos en 300
euros? ¿Y si sólo se aumenta el salario del director en 1.200 euros?
94. Se pidió a los alumnos de la facultad de Administración de Empresas de una prestigiosa

universidad llenar un cuestionario de evaluación del curso final del mismo. Consiste en una
diversidad de preguntas cuyas respuestas se clasifican en cinco categorı́as: mala, regular,
buena, muy buena, excelente. Una de las preguntas es: En comparación con otros cursos
que has estudiado, ¿cuál es la calidad general de éste? En una muestra de 60 alumnos
que terminaron un curso de estadı́stica durante un determinado semestre de cierto año se
obtuvieron las respuestas que se presentan a continuación (para facilitar el procesamiento
de los resultados del cuestionario en el computador, se usó una escala numérica en la que
1 = mala, 2 = regular, 3 = buena, 4 = muy buena, 5 = excelente):
5 2 4 5 4 4 3 3 4 4 5 1 5 4 3 5 4 5 4 3
2 5 4 2 4 4 4 4 5 5 4 4 4 5 1 5 3 3 4 3
3 4 5 4 3 5 4 5 5 3 4 5 5 2 4 5 3 4 4 3

98 Llinás / Rojas
(a) Comente por qué estos datos son cualitativos.

(b) Elabore un diagrama de frecuencias y una distribución de frecuencias relativas de los
datos.
(c) Trace un resumen de los datos en forma de gráfica de barras y de diagrama circular.
(d) Con base en sus resúmenes haga comentarios sobre la evaluación general del curso por
parte de los alumnos.
95. En el archivo de datos bombeo.sf3 se proporcionan los nombres y potencias instaladas

(en megawatios) de las veinticuatro centrales españolas de bombeo en funcionamiento en el
2000. Se desea analizar numérica y gráficamente este conjunto de datos.
96. Una de las principales atracciones turı́sticas del Parque Nacional de Yellowstone (Estado de
Wyoming, Estados Unidos de Norteamérica) es el géiser Old Faithful, cuyo nombre procede
del hecho de que sus erupciones siguen una pauta bastante estable a lo largo del tiempo.
En el archivo de datos parque.sf3 se proporcionan los lapsos de tiempo transcurridos
entre sucesivas erupciones (variable Lapso) y las duraciones de esas erupciones (variable
Duración). Ambas variables se dan en minutos. Estudie numérica y gráficamentre ambas
variables. ¿Se observa alguna peculiaridad en ellas?
97. En el archivo de datos pi.sf3 se proporcionan los 200 primeros dı́gitos del número π. Analice
numérica y gráficamente este conjunto de datos.
98. En el archivo de datos sismo.sf3 se muestran el tiempo transcurrido (dado en dı́as) entre
sismos sucesivos acaecidos en el mundo. Todos los sismos considerados o tuvieron una
intensidad de al menos 7,5 en la escala de Richter o produjeron más de 1.000 vı́ctimas
mortales. Los sismos registrados ocurrieron entre el 16 de diciembre de 1902 y el 4 de marzo
de 1977. Estudie numérica y gráficamente estos datos.

CAPÍTULO 2
Conceptos básicos de la probabilidad
Contenido
2.1 Experimentos, espacios muestrales y eventos . . . . . . . . . . . 100

2.2 Modelo de urnas y técnicas de conteo . . . . . . . . . . . . . . . 113
2.2.1 Modelos de urnas . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
2.2.2 El conteo por enumeración de elementos . . . . . . . . . . . . . . 115
2.2.3 El conteo a través de diagramas de árbol . . . . . . . . . . . . . 117
2.2.4 Teorema fundamental del conteo . . . . . . . . . . . . . . . . . . 118
2.2.5 El principio de adición . . . . . . . . . . . . . . . . . . . . . . . . 120
2.2.6 Permutación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
2.2.7 Combinación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
2.3 Introducción a la probabilidad . . . . . . . . . . . . . . . . . . . 135
2.3.1 Definición matemática de “probabilidad” . . . . . . . . . . . . . 135
2.3.2 Probabilidad empı́rica . . . . . . . . . . . . . . . . . . . . . . . . 137
2.3.3 Definición clásica de “probabilidad” . . . . . . . . . . . . . . . . 139

2.3.4 Probabilidad subjetiva o personal . . . . . . . . . . . . . . . . . . 145
2.4 Probabilidades condicionales . . . . . . . . . . . . . . . . . . . . . 152
2.5 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
✍ Ejercicios complementarios . . . . . . . . . . . . . . . . . . . . . . . 175
99

100 Llinás / Rojas
☞ Objetivos del capı́tulo

1. Describir y aplicar algunas técnicas de conteo en la solución de problemas.
2. Desarrollar la comprensión de los conceptos básicos de probabilidad.
3. Definir y aplicar el concepto de probabilidad condicional.
4. Aplicar el teorema de Bayes en el cálculo de probabilidades.
5. Definir y aplicar el concepto de independencia entre eventos.
☞ Empleo de la estadı́stica
En una encuesta hecha a estudiantes de nuevo ingreso a la universidad
se encontró que, entre todos los estudiantes admitidos, el 55% no tienen
problemas de ningún tipo, el 25% sienten que fueron mal orientados en
cuanto a la carrera elegida y el 20% tienen problemas de tipo económico. La
misma encuesta muestra que de los que no tienen ningún tipo de problema
solamente el 1% no regresa al segundo semestre; que la probabilidad de que
los que fueron mal orientados no continúen en el segundo semestre es de
0,7 y la probabilidad de que los que tienen problemas económicos continúen
es de 0,05. Si se elige al azar un alumno del segundo semestre, ¿cuál es la
probabilidad de que él sea uno de los que a pesar de no estar en la carrera
de su vocación haya continuado?
2.1 Experimentos, espacios muestrales y eventos
Experimentos determinı́sticos y aleatorios
En este texto utilizaremos el término experimento para describir virtualmente cualquier

acción o proceso que genera observaciones.
Definición 2.1.1 Un experimento es cualquier acción o proceso que genera observa-

ciones.
La validez de la mayorı́a de las teorı́as cientı́ficas está basada, en gran parte, en que los
experimentos, sobre los cuales se fundamentan las teorı́as, suministran esencialmente el
mismo resultado cuando estos experimentos se repiten. Este tipo de experimentos se lla-
man determinı́sticos.
Capı́tulo 2. Conceptos básicos de la probabilidad

Definición 2.1.2 Un experimento determinı́stico es cualquier experimento que, al

repetirse bajo las mismas condiciones, genera siempre los mismos resultados.
Un ejemplo, en fı́sica, que es un experimento determinı́stico es la ley de la caı́da libre.
Sin embargo, hay experimentos cuyos resultados no son predecibles con certeza si las condi-
ciones de los experimentos se mantienen constante. Estos se llaman experimentos aleatorios
o estocásticos.
Definición 2.1.3 Un experimento aleatorio (o estocástico) es cualquier experi-

mento que, al repertirse bajo las mismas condiciones, no genera siempre los mismos resul-
tados.
Ejemplos familiares de estos experimentos son los juegos de suerte, como dados, lanzamiento
de monedas o juegos de cartas. Sin embargo, hay otros tipos de ejemplos de experimentos
aleatorios, como los siguientes:
(1) Semillas de igual estado que producen plantas de diferentes tamaños.
(2) Una máquina de coser alarga a veces una puntada sin un motivo claro.
(3) La duración de vida de las personas que viven bajo condiciones semejantes varı́a y no
se puede predecir.
(4) El sexo de un recién nacido.
Espacio muestral, evento y evento elemental
El primer paso para analizar un determinado experimento consiste en definir con cuidado los
resultados experimentales. Cuando hayamos definido todos los resultados posibles, habre-
mos identificado el llamado espacio muestral del experimento.
Definición 2.1.4 Supongamos que se realiza un experimento aleatorio. El conjunto de

todos los posibles resultados de ese experimento se denomina espacio muestral ( o de
resultados). Cualquier subconjunto del espacio muestral se llama evento. Si un evento
tiene un solo elemento se llama evento elemental.
El espacio muestral se simbolizará con la letra griega Ω (leı́da “omega”) y los eventos con las letras
mayúsculas A, B, C, etc. “El evento A ha sucedido” significa que el resultado observado del experimento
está en A.
2.1. Experimentos, espacios muestrales y eventos

Ejemplo 2.1.5 Consideremos los siguientes experimentos aleatorios:
1. El lanzamiento de una moneda
• Los posibles resultados son cara (C) o sello (S). Por tanto, Ω = {C, S}.
• {C} =“la moneda señala cara” es un evento elemental.
• “La primera moneda muestra sello” = {(S, S), (S, C)} es un evento.
2. Lanzamiento de dos monedas
a) Dos monedas diferentes se lanzan al mismo tiempo.

• El espacio muestral correspondiente está dado por
Ω = {(C, C), (C, S), (S, C), (S, S)} = {C, S} × {C, S}
y en este caso (C, S) = (S, C).

• {(C, C)} =“las monedas muestran cara” es un evento elemental.
• “ambas monedas muestran el mismo lado” = {(S, S), (C, C)} es un ejemplo de
un evento.
b) Dos monedas que no se pueden distinguir entre sı́ se lanzan al mismo tiempo.
• En esta situación, Ω = {(C, C), {C, S}, (S, S)}. Aquı́, (C, S) = (S, C).

• {C, S} =“las monedas muestran diferentes lados” es un evento elemental.
• Un evento es “ambas monedas muestran el mismo lado” = {(S, S), (C, C)}.
3. Una moneda se lanza hasta que aparezca una cara (C)
• Se observa el número de lanzamientos que muestran sello (S) antes de que aparezca
una cara. Por tanto, Ω = {0, 1, 2, . . . , ∞}.
• En este caso, “{3} = C aparece por primera vez en el cuarto lanzamiento” es un evento
elemental y “{∞}” es el evento elemental de que la moneda nunca muestre a C.
• “C aparece no antes del séptimo lanzamiento” = {6, 7, 8, . . . , ∞} es un evento.
4. Duración de la vida humana
• Se observa la edad en la que diferentes personas mueren. De esta forma, Ω es el

conjunto de todos los números reales menores o iguales que k, donde k es la edad de
la persona que más años ha vivido en la tierra.
• “{59,7}” es el evento elemental de que una determinada persona murió a la edad de
59,7 anõs.
• “Alguien muere con edad entre 60 y 70 años” = [60, 70] es un ejemplo de un evento
de Ω.

Eventos seguro e imposible
En especial, el conjunto vacı́o ∅ y Ω son eventos. El conjunto Ω es el llamado evento

seguro, que siempre sucede, y ∅ es el llamado evento imposible, que nunca puede
suceder (por ejemplo, que se obtenga un 7 en el lanzamiento de un dado, siempre y cuando
se use un dado corriente en el sentido de que sus caras están marcadas del 1 al 6).
Operaciones entre eventos
En muchas aplicaciones, estamos interesados simultáneamente en uno o más eventos. Por

ejemplo, si se lanza un dado, dos eventos que podrı́an considerarse son “el número resul-
tante es un múltiplo de 2” y “el número resultante es por lo menos 5”. Una posibilidad es
que todos los eventos de interés podrı́an ocurrir; éste serı́a el caso si el resultado básico del
experimento aleatorio pertenece a todos estos eventos. El conjunto de resultados básicos
que pertenece a todos los eventos de un grupo se denomina intersección.
Definición 2.1.6 Sean A y B dos eventos de un espacio muestral Ω. Su intersección,

simbolizada por A ∩ B, es el conjunto de todos los resultados posibles en Ω que pertenecen
a A y a B. Por tanto, la intersección A ∩ B ocurre si y sólo si tanto A como B ocurren.
De manera más general, dado n eventos A1 , A2 , . . . , An de un espacio muestral Ω, su intersección

A1 ∩ A2 ∩ · · · ∩ An es el conjunto de todos los resultados posibles de Ω que pertenecen a todos los Ai
(i = 1, 2, . . . , n).
(a) A ∩ B es el área som- (b) A y B son mutuamente

breada excluyentes
Figura 2.1: Diagramas de Venn para la intersección de los eventos A y B
Un instrumento útil para pensar en intersecciones y otras relaciones de conjuntos es el dia-

grama de Venn. En la figura 2.1 se muestran diagramas para pares de conjuntos A y B.
En la parte (a) de la figura, el rectángulo Ω representa el espacio muestral, mientras que

las dos circunferencias representan los dos eventos, A y B.
Ası́, por ejemplo, un resultado básico perteneciente a A estará dentro del cı́rculo corres-
pondiente. El área sombreada donde se cruzan las dos figuras es A ∩ B. Claramente, un
resultado básico estará en A ∩ B si y sólo si está tanto en A como en B. De esta manera, al
lanzar un dado, los resultados 3 y 5 pertenecen a los dos eventos A =“se obtiene un número
impar” y B =“se obtiene por lo menos 3”.
Es posible que los eventos A y B no tengan resultados en común, en cuyo caso las figuras no
se cruzarán como en la parte (b) de la figura 2.1. Tales eventos se dice que son mutuamente
excluyentes (o disyuntos). Por ejemplo, si al lanzar un dado, los eventos A =“se obtiene
un número par” y B =“se obtiene un número impar” son mutuamente excluyentes.
Definición 2.1.7 Sean A y B dos eventos de un espacio muestral Ω. Si los sucesos A y

B no tienen en común resultados de Ω, se denominan mutuamente excluyentes (o
disyuntos) y su intersección A ∩ B es el conjunto vacı́o. De esto se deduce que el evento
A ∩ B no puede ocurrir.
De manera más general, decimos que n eventos A1 , A2 , . . . , An de un espacio muestral Ω son mu-
tuamente excluyentes si todo par de estos eventos es mutuamente excluyente.
Cuando se consideran varios eventos conjuntamente, otra posibilidad de interés es que por
lo menos uno de ellos ocurra. Esto sucederá si el resultado del experimento pertenece al
menos a uno de los eventos. El conjunto de resultados pertenecientes por lo menos a uno
de los eventos se denomina unión. Por ejemplo, en el experimento del lanzamiento de un
dado, los resultados 2, 4, 5 y 6 pertenecen por lo menos a uno de los eventos A =“se obtiene
un número par” o B =“se obtiene por lo menos 4”.
Definición 2.1.8 Sean A y B dos eventos de un espacio muestral Ω. Su unión, simboli-

zada por A ∪ B, es el conjunto de todos los resultados posibles en Ω que pertenecen por lo
menos a uno de estos eventos. Por tanto, la unión A ∪ B ocurre si y sólo si por lo menos
alguno de estos dos eventos, A o B, ocurre.
De manera más general, dado n eventos A1 , A2 , . . . , An de un espacio muestral Ω, su unión A1 ∪A2 ∪· · ·∪An
es el conjunto de todos los resultados posibles de Ω que pertenecen por lo menos a uno de estos n eventos.
La unión de un par de eventos se ilustra en el diagrama de Venn de la figura 2.2a, donde

claramente se observa que un resultado estará en A ∪ B si y sólo si está en por lo menos
alguno de estos dos eventos, A o B.

(a) A ∪ B es el área som- (b) A − B es el área som-

breada breada
Figura 2.2: Diagramas de Venn para la unión y diferencia de los eventos A y B
Ahora, cuando se consideran dos eventos conjuntamente, otra situación que interesa es
que uno de ellos ocurra pero el otro no. Esto ocurre cuando el resultado del experimento
pertenece a uno de ellos pero no al otro. El conjunto de resultados que pertenecen a un
evento pero no a otro otro se denomina diferencia entre ambos eventos. Por ejemplo, los
resultados 2 y 4 pertenecen al evento A =“se obtiene un número par estrictamente menor
que 6” pero no al evento B =“se obtiene por lo menos 5”.
Definición 2.1.9 Sean A y B dos eventos de un espacio muestral Ω. La diferencia

entre A y B, simbolizada por A − B, es el conjunto de todos los resultados posibles en Ω
que pertenecen a A pero no a B. Por tanto, la diferencia A − B ocurre si y sólo si A ocurre
pero B no.
La diferencia entre un par de eventos se muestra en el diagrama de Venn de la figura 2.2b,

donde se observa que un resultado estará en A − B si y sólo si está en A pero no en B.
A continuación, sea A un evento, y supongamos que nuestro interés es que A no ocurra.

Esto sucederá si el resultado del experimento aleatorio se encuentra en Ω (como debe ser)
pero no en A. El conjunto de resultados pertenecientes al espacio muestral, y que no
pertenecen a determinado evento, se denomina complemento de ese conjunto.
Definición 2.1.10 Sea A evento de un espacio muestral Ω. Su complemento, sim-

bolizado por A, es el conjunto de todos los resultados posibles en Ω que no pertenecen a A.
Por tanto, el complemento A de A ocurre si y sólo si A no ocurre.
Claramente, los eventos A y A son mutuamente excluyentes. El complemento del evento A

se ilustra en la figura 2.3a.

(a) A es el área sombreada (b) Partición de Ω
Figura 2.3: Diagrama de Venn para el complemento de A y partición de Ω a través de

A1 , A2 , A3 , . . . , An
Un caso de especial interés lo constituye una colección de varios eventos cuya unión es la
totalidad del espacio muestral Ω. Dado que todo resultado pertenece a Ω, se deduce que
todo resultado de un experimento aleatorio estará al menos en una clase de estas colec-
ciones de eventos. Estos eventos se denominan colectivamente exhaustivos. Por ejemplo, si
se lanza un dado, los sucesos “el resultado es por lo menos 3” y el resultado es a lo más
6” son colectivamente exhaustivos (al menos uno de estos eventos debe ocurrir). Pero, si
adicionalmente estas colecciones de eventos son mutuamente excluyentes, entonces se dice
que estos eventos forman una partición de Ω.
Definición 2.1.11 Sean A1 , A2 , . . . , An eventos de un espacio muestral Ω.
(a) Si se cumple que A1 ∪ A2 ∪ · · · ∪ An = Ω, entonces estos n eventos se denominan

colectivamente exhaustivos.
(b) Decimos que estos n eventos forman una partición de Ω si ellos son colectivamente
exhaustivos y mutuamente excluyentes.
Una representación gráfica de esta situación se observa en la figura 2.3b. Observemos que
todos los eventos elementales forman una partición del espacio muestral correspondiente.
Ejemplo 2.1.12 Sea Ω = {1, 2, 3, 4, 5} el espacio muestral correspondiente a un experimento

aleatorio dado. Además, sean A = {2}, B = {1, 4}, C = {3, 5} y D = {2, 3, 4, 5}. Entonces (ver
figura 2.4),
• A, B y C es una partición de Ω porque A ∪ B ∪ C = Ω y A ∩ B = ∅, A ∩ C = ∅, B ∩ C = ∅.
• B y D son colectivamente exhaustivos pero no forman una partición de Ω porque B ∩ D =

{4} = Ω.

• A, C y D no son colectivamente exhaustivos (y, por tanto, tampoco forman una partición
de Ω) porque 1 ∈ A ∪ C ∪ D.
Figura 2.4: Diagrama de Venn para el ejemplo 2.1.12
Hemos presentado cuatro conceptos de mucha importancia (intersección, unión, diferen-

cia y complemento). Todos ellos serán relevantes en nuestro estudio subsiguiente de la
probabilidad. Los siguientes ejemplos ilustran estas operaciones entre eventos.
Ejemplo 2.1.13 Se lanza un dado. Sea A el evento “se obtiene un número impar” y B el evento
“se obtiene por lo menos 3”. Entonces,
• Los complementos de estos eventos son, respectivamente,
A = “se obtiene un número par” = {2, 4, 6}

B = “se obtiene máximo un 2” = {1, 2}.
• La intersección de A y B es el evento
A ∩ B = “se obtiene un número impar distinto de 1” = {3, 5}.
• La unión de A y B es el evento
A ∪ B = “se obtiene un número distinto de 2” = {1, 3, 4, 5, 6}.

• La diferencia de A y B es el evento
A − B = “se obtiene el número 1” = {1}.
• La diferencia de B y A es el evento
B − A = “se obtiene un número par distinto de 2” = {4, 6}.
Observemos también que los eventos A y A son mutuamente excluyentes, dado que su intersección
es el conjunto vacı́o, y colectivamente exhaustivos, dado que su unión es el espacio muestral Ω.
En otras palabras, A y A forman una partición de Ω.

Algunas propiedades relacionadas con eventos
A continuación presentamos algunas de las propiedades básicas que debemos tener en cuenta
cuando trabajamos con eventos.
Teorema 2.1.14 Sean A y B eventos de un espacio muestral Ω. Entonces, son válidas

las siguientes afirmaciones:
(a) Ω = ∅ (b) ∅ = Ω (c) A = A
(d) A ∩ ∅ = ∅ (e) A ∪ ∅ = A (f ) A ∩ A = ∅
(g) A ∪ A = Ω (h) A ∩ B = A ∪ B (i) A ∪ B = A ∩ B
Los resultados (h) e (i) son las llamadas leyes de De Morgan.
Presentamos ahora dos resultados más que incluyen uniones e intersecciones. Serán em-
pleados más adelante para desarrollar algunas reglas de probabilidad.
Teorema 2.1.15 Sean A, A1 , . . ., An y B eventos de un espacio muestral Ω. Entonces,

son válidas las siguientes afirmaciones.
(a) Los eventos A ∩ B y A ∩ B son mutuamente excluyentes y su unión es igual al evento

B, es decir, forman una partición de B (ver figura 2.5a).
(b) Si A1 , . . ., An forman una partición de Ω, entonces los eventos A1 ∩ B, . . ., An ∩ B

son mutuamente excluyentes y su unión es B, es decir, forman una partición de B.
(a) Diagrama de Venn para (b) Diagrama de Venn para

los eventos A ∩ B y A ∩ B A1 ∩ B, A2 ∩ B, . . . y An ∩ B
Figura 2.5: Diagramas de Venn para diferentes intersecciones

Para comprender lo expuesto en el teorema 2.1.15b, consideraremos el diagrama de Venn

de la figura 2.5b. El rectángulo grande es el espacio muestral Ω y está subdividido en partes
más pequeñas que representan los n eventos A1 , A2 , . . ., An , que forman la partición de
Ω. El evento B viene representado por la región sombreada. Se observa que los eventos
comprendidos en la interseción de B y cada uno de los eventos Ai forman una partición de
B, es decir, son mutuamente excluyentes y su unión es B.
Ejemplo 2.1.16 Consideremos el lanzamiento de un dado. Verificaremos los dos resultados que
se presentan en el teorema 2.1.15.
(a) Sean A = {1, 3, 5} y B = {3, 4, 5, 6}. Entonces, los eventos A ∩ B = {3, 5} y A ∩ B = {4, 6}
son mutuamente excluyentes y su unión es B (ver figura 2.6a). De esta forma queda verificada
la parte (a) del teorema.
(b) Sean B = {3, 4, 5, 6}, A1 = {1, 3}, A2 = {2, 4, 6} y A3 = {5}. Observemos que los eventos A1 ,
A2 y A3 forman una partición de Ω. ¿Por qué? Ahora, claramente podemos observar que los
eventos A1 ∩ B = {3}, A2 ∩ B = {4, 6} y A3 ∩ B = {5} son mutuamente excluyentes y su
unión es B (ver figura 2.6b), verificándose, de esta manera, la parte (b) del teorema.
(a) Los eventos A ∩ B y (b) A1 ∩ B, A2 ∩ B y

A ∩ B son mutuamente ex- A3 ∩ B son mutuamente ex-
cluyentes y su unión es B cluyentes y su unión es B
Figura 2.6: Diagramas de Venn para diferentes intersecciones
Ejemplo 2.1.17 Un problema al que se enfrenta frecuentemente la investigación de mercados

lo constituye el hecho de que algunas preguntas que nos gustarı́a hacer son tan delicadas que
muchas personas se negarán a contestarlas o darán una respuesta falsa. Una manera de atacar
este problema es utilizar el método de la respuesta aleatorizada1 . Esta técnica consiste
en acompañar la pregunta delicada con otra pregunta normal. Por ejemplo, podrı́amos tener el
siguiente par de preguntas:
(a) ¿Ha hurtado en almacenes intencionalmente en los últimos doce meses?
1
Ver, por ejemplo, M. D. Geurts, “Using a randomized response research design to eliminate nonresponse
biases in business research”, Journal of Academy of Marketing Science, 8 (1980), 83-90.

(b) ¿Ha realizado una compra por catálogo en los últimos doce meses?
A los encuestados se les pide que lancen una moneda y que contesten a la pregunta (a) si se
obtiene “cara” y a la (b) en otro caso. Dado que el encuestador no puede saber a qué pregunta se
contesta, se espera que se obtengan de esta manera respuestas verdaderas. Para las preguntas que
acompañan a la de interés, el investigador cuenta ya con información sobre la población sujeta a
estudio. De este modo, en nuestro ejemplo, el investigador sabe qué proporción de la población
realizó una compra por catálogo en los últimos doce meses.
Definamos ahora los siguientes eventos:
B : El encuestado responde “sı́”.
A1 : El encuestado responde a la pregunta delicada.
A2 : El encuestado responde a la pregunta normal.
Claramente, los eventos A1 y A2 son mutuamente excluyentes y colectivamente exhaustivos. De

este modo, se cumplen las condiciones de la parte (b) del teorema 2.1.15 y se tiene que los eventos
A1 ∩ B = El encuestado responde “sı́” y lo hace a la pregunta delicada

A2 ∩ B = El encuestado responde “sı́” y lo hace a la pregunta normal
son mutuamente excluyentes. Además, su unión es el evento B, como se puede verificar.

1. En un concurso de televisión, el ganador puede elegir tres de cinco personas diferentes: A,
B, C, D y E.
(a) Enumere los elementos del espacio muestral correspondientes.

(b) ¿Cuántos elementos hay en el espacio muestral correspondientes a una selección que
incluye a A?
(c) ¿Cuántos elementos hay en el espacio muestral correspondientes a una selección que
incluye a A y a B?
(d) ¿Cuántos elementos hay en el espacio muestral correspondientes a una selección que
incluye a A o a B?
2. La gerencia de producción de una corporación realizó un estudio para determinar el tiempo,

en minutos, necesario para que un técnico ejecute cierta tarea relacionada con el montaje
de sus televisores.
(a) Describa el espacio muestral correspondiente a este estudio.

(b) Describa el evento E de que un técnico tarde tres minutos o menos para realizar la
tarea.
(c) Describa el evento F de que un técnico tarde más de tres minutos para realizar la tarea.
3. Como parte de un procedimiento de control de calidad, un inspector de una granja seleccionó

10 adornos al azar de cada lote que recibe y registra el número de adornos defectuosos.
(a) ¿Cuál es el espacio muestral adecuado para cada lote?

(b) Describa el evento F de que a lo más cuatro adornos estén rotos.
(c) Describa el evento G de que al menos siete adornos estén rotos.
(d) Describa los eventos F ∩ G y F ∪ G.
(e) Describa el evento H de que diez adornos estén rotos.
(f) Determine si la proposición dada es verdadera o falsa. Si es verdadera, explique por
qué, y si es falsa, construya un contraejemplo (es decir, un ejemplo para mostrar que es
falsa): “Si E y F son eventos mutuamente excluyentes y E y G son eventos mutuamente
excluyentes, entonces F y G son mutuamente excluyes”.
4. En un campeonato de fútbol participan cuatro universidades: Uninorte, Uniatlántico, Uni-

autónoma y la Cuc. En la primera vuelta, Uninorte jugará contra Uniatlántico y Uni-
autónoma contra la Cuc. Los dos ganadores jugarán por el campeonato y subcampeonato
y los perdedores, por el tercero y cuarto puesto. Un posible resultado definitivo puede re-
presentarse por la tupla (Uninorte, Uniautónoma, Uniatlántico, Cuc), en donde se indica
que Uninorte fue el campeón, Uniautónoma el subcampeón, Uniatlántico quedó de tercero
y la Cuc, de cuarto.
(a) Enumere todos los posibles resultados de Ω.

(b) Sea A el evento en que Uninorte gana el torneo. Haga una lista de los elementos de A.
(c) Sea B el evento en que Uniatlántico llega a la final. Haga una lista de los elementos de
B.
(d) ¿Cuáles son los resultados en A ∪ B y en A ∩ B? ¿Cuáles son los resultados en A?
5. En el departamento de recaudos se acaba de terminar una votación secreta para elegir el

nuevo jefe de ese departamento. La urna de votos contiene tres papeletas con votos para
Marta, uno de los dos candidatos, y dos papeletas con votos para Julio, el otro candidato.
Supongamos que las papeletas se sacan de la caja una por una.
(a) ¿Cuántos resultados disponibles hay? ¿Cuáles son?

(b) Suponga que se realiza un conteo a medida que se sacan las papeletas. Si la última
papeleta sacada es la de Julio, ¿cuáles son los diferentes resultados?
6. Una familia formada por Juana, Pedro y Jorge asisten a una clı́nica que siempre tiene un
médico en cada una de las oficinas 1, 2 y 3. Durante cierta semana, cada miembro de la
familia visita una vez la clı́nica y se le asigna al azar un médico: el experimento consiste en
registrar el número de la oficina asignada a cada miembro de la familia. Un resultado de
(3, 2, 2) es: para Juana la oficina 3; Pedro, oficina 2, y Jorge, oficina 2.

(a) Elabore una lista de los 27 resultados del espacio muestral.

(b) Haga una lista de todos los resultados del evento en el cual las tres personas de la familia
vayan a la misma oficina.
(c) Efectúe una lista de todos los resultados del evento en el cual todos los miembros de la
familia vayan a diferentes oficinas.
(d) Realice una lista de todos los resultados del evento en el cual ningún miembro de la
familia vaya a la oficina 2.
7. Sea Ω = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} el espacio muestral correspondiente a un experimento

aleatorio dado. Sean A, B, C y D eventos de Ω definidos por
A = {0, 1, 2, 3}, B = {4, 5, 6, 7}, C = {2, 4, 6}, D = {1, 8, 9}
Liste los elementos de los conjuntos que corresponden a los siguientes eventos: (a) A ∪ D;
(b) B ∩ C; (c) D; (d) (D ∩ A) ∪ C; (e) Ω ∩ B; (f) B ∩ C ∩ D.
8. Señale la región de la figura de abajo que representa a cada evento: (a) A ∪ B ∪ C, (b)
A ∩ B ∩ C, (c) A ∩ B ∩ C, (d) A ∩ B ∩ C, (e) A ∩ B ∩ C, (f) (A ∪ B) ∩ C, (g) A ∪ (B ∩ C),
(h) A ∪ B ∪ C.
9. Sean Ω el evento de todos los turistas que visitaron a Barranquilla durante un fin de semana,
y A, B y C los eventos formados por los turistas que visitaron el Museo Romántico, el
Zoológico y Bocas de Cenizas respectivamente. Exprese con palabras las regiones indicadas
a continuación teniendo en cuenta la figura de abajo: (a) Región 1, (b) Regiones 1 y 4
juntas, (c) Regiones 4, 5, 7 y 8 juntas, (d) Regiones 5, 6 y 7.
A B
7 3 6
1
4 2
5 8
C
10. En una encuesta realizada en un colegio de la ciudad a un total de 150 alumnos se encontró:
54 estudian álgebra; 89, inglés; 80, ciencias naturales; 60, ciencias naturales e inglés; 10, sólo
álgebra; 20, álgebra y ciencias naturales; 15, las tres materias simultáneamente. Determine
el número de alumnos que conforman los siguientes eventos:

(a) Estudian álgebra e inglés pero no ciencias naturales.

(b) Estudian sólo una materia.
(c) Estudian a lo sumo dos materias.
11. Una universidad realiza tres tipos de pruebas a 100 aspirantes y obtiene los siguientes
resultados: 2 fracasaron en las tres pruebas; 7, en la primera y en la segunda; 8, en la
segunda y en la tercera; 10, en la primera y en la tercera; 25, en la primera; 30, en la
segunda; 25, en la tercera. Determine el número de aspirantes que conforman los siguientes
eventos:
(a) Fracasaron exactamente en una prueba.

(b) Aprobaron las tres pruebas.
(c) Fracasaron en la primera y en la tercera pero no en la segunda.
(d) Fracasaron en la segunda y en la tercera pero no en la primera.
(e) Fracasaron en al menos una prueba.
(f) Aprobaron al menos una prueba
(g) Aprobaron la segunda o la tercera pero no la primera.
12. Un equipo de fútbol ha determinado contratar un futbolista de talla internacional para el

próximo campeonato. Sean A, B y C eventos que representan el hecho de que el futbolista
contratado ha jugado en el Real Madrid, en el Milan y en el Bayern de Munich respecti-
vamente. Utilice las operaciones de unión, intersección y complemento para describir, en
términos de A, B y C, dibuje un diagrama de Venn y sombree la región correspondiente a
cada uno.
(a) Por lo menos el futbolista ha jugado en uno de los tres equipos mencionados.
(b) El futbolista ha jugado en los tres equipos mencionados anteriormente.
(c) El futbolista ha jugado en el Real Madrid y no en el Milan.
(d) El futbolista sólo ha jugado en el Bayern de Munich.
(e) El futbolista ha jugado exactamente en uno de los tres equipos mencionados.
2.2 Modelo de urnas y técnicas de conteo

A pesar de la complejidad de muchos procedimientos avanzados, proporcionados por la
tecnologı́a moderna, el simple proceso de contar resultados de un experimento aleatorio
continúa jugando un papel importante en problemas prácticos de la vida cotidiana. Tenemos
que contar, por ejemplo, el número de alumnos por grupo, el número de llamadas recibidas
en una oficina por dı́a, el número de accidentes ocurridos en los fines de semana, etc. Pero,
en muchos problemas, como, por ejemplo,
2.2. Modelo de urnas y técnicas de conteo

• calcular de cuántas formas podemos sentar 10 personas, una al lado de la otra para
una foto;
• o determinar cuántos números de tres cifras se pueden formar con los dı́gitos del 1 al
9 si no se pueden repetir los dı́gitos,
la tarea no resulta ser fácil si no se desarrollan técnicas especiales de conteo. Debido

a que frecuentemente es necesario determinar cantidades como éstas para poder calcular
probabilidades2 , entonces se hace obligatorio para nosotros estudiar algunas técnicas. Las
técnicas especiales de conteo que estudiaremos, y que son fundamentales para el cálculo de
algunas probabilidades, son: el conteo por enumeración de elementos, el conteo a través de
diagramas de árbol, el teorema fundamental del conteo, el principio de adición, el conteo de
permutaciones y el conteo de combinaciones.
2.2.1 Modelos de urnas
Antes de comenzar a introducir los conceptos y propiedades básicas que caracterizan a cada
una de las técnicas mencionadas anteriormente, consideraremos importante enfatizar que
muchos experimentos aleatorios pueden describirse por medio de los llamados modelos de
urnas, los cuales se caracterizan por los siguientes dos hechos:
1. En una urna hay bolas distinguibles (por ejemplo, numeradas), no distinguibles (por
ejemplo, rojas) o mixtas. Estas bolas se consideran como una población.
2. De esta urna se quiere sacar una o más bolas, al mismo tiempo o no, reemplazando o no
las bolas seleccionadas antes de seleccionar nuevamente otra(s) bola(s) y observando
el orden o no de las bolas extraı́das. Las bolas extraı́das se consideran como una
muestra. Para obtener estas muestras, podemos distinguir los siguientes casos:
(a) Seleccionar sin reemplazo

Cada bola seleccionada se deposita fuera de la urna, y por eso puede seleccionarse
una sola vez.
(b) Seleccionar con reemplazo
Cada bola seleccionada se reemplaza en la urna, y por eso puede seleccionarse

varias veces.
(c) Seleccionar considerando el orden
Se selecciona cierta cantidad de bolas, una tras otra, y se considera el orden
obtenido. En este caso, las bolas seleccionadas se pueden considerar como tuplas
ordenadas.3
2
Concepto que veremos más adelante.
3
Por una tupla ordenada se entiende una expresión, por ejemplo, de la forma (a, b, c, d, e, . . . , z), en
donde el orden de estas letras es importante. Por ejemplo, para el caso de tener sólo dos letras, a y b, no

(d) Seleccionar sin considerar el orden

Se selecciona cierta cantidad de bolas a la vez (o también una tras otra), pero sin
que interese el orden de las bolas extraı́das.
Los cuatro casos se pueden combinar: las bolas se seleccionan con o sin reemplazo
y con o sin orden. Inclusive, podemos identificar otros tipos de modelo de urna con
base en las situaciones anteriores, como, por ejemplo,
(e) Seleccionar formando una partición

Seleccionar grupos de bolas sin importar el orden y cada grupo se guarda, por
ejemplo, en gavetas numeradas. Esto se hace hasta que no queden bolas en la
urna.
Ahora procederemos a explicar las mencionadas técnicas de conteo.
2.2.2 El conteo por enumeración de elementos
Nuestra primera regla es tratar de enumerar todos los elementos de un espacio muestral
y luego contarlos. Esta técnica es adecuada cuando el número de resultados posibles no
es muy grande. Para ilustrar esto consideremos los siguientes ejemplos. Observe que a la
mayorı́a de ellos los hemos identificados con un modelo de urna.4
Ejemplo 2.2.1 (Selección con reemplazo y con orden) Una urna contiene 4 fichas: una
azul, una verde, una roja y una negra. ¿Cuáles son las distintas maneras de seleccionar dos
fichas con reemplazo?
SOLUCIÓN:
Abreviaremos el color de las fichas con su correspondiente letra inicial: A, V, R y N. Como la
selección es con reemplazo, entonces se selecciona un ficha y se vuelve a introducir en la urna antes
de seleccionar la segunda. Por lo tanto, los elementos del espacio muestral son:
AA, VA, AR, RA, AN, NA, VR, RN,
VN, NV, RN, NR, AA, VV, RR, NN
En este ejemplo, el orden es importante, por eso aparecen AV y VA como dos elementos distintos
del espacio muestral.
Ejemplo 2.2.2 (Selección sin reemplazo y sin orden) ¿De cuántas maneras se puede armar
un grupo de 2 de entre 4 personas (digamos Marta, Juliana, Manuel y Luis)?
es lo mismo (a, b) que (b, a). A la tupla con dos elementos se le llama par ordenado; a la de tres elementos,
tripleta ordenada, etc.
4
A los que no hemos identificado con un modelo de urna, significa que el ejemplo no se puede clasificar
directamente como uno de los modelos de urna descritos anteriormente. En realidad, hay otros tipos de
modelos de urna.

SOLUCIÓN:
En esta situación, el orden no interesa (por eso no se utilizan paréntesis al identificar cada se-
lección del grupo). Es como si colocáramos los nombres de estas cuatro personas en una bolsa y
sacáramos dos de ellas al mismo tiempo. Observe que, en este caso, da lo mismo la posibilidad
“Marta, Juliana” que “Juliana, Marta” (por eso, sin orden). Además, la posibilidad de obtener
un grupo conformado por “Marta, Juliana” no existe (por eso, sin reemplazo).
Al tener en cuenta lo anterior encontramos que los posibles grupos de dos personas que se pueden
escoger son:
Marta, Juliana, Marta, Manuel, Marta, Luis,

Juliana, Manuel, Juliana, Luis, Manuel, Luis
Es decir, en total hay 6 maneras posibles de seleccionar un grupo de 2 personas, sabiendo que hay
4 disponibles.
Ejemplo 2.2.3 (Selección sin reemplazo y con orden) ¿De cuántas maneras se pueden sen-
tar Gabriela, Jeniffer, Alberto y Hernán en un sofá que sólo tiene disponible dos puestos?
SOLUCIÓN:
En este ejemplo, el orden es importante, porque no es lo mismo, por ejemplo, que Gabriela se
siente en el primer puesto y Jeniffer en el segundo que lo contrario. Por eso utilizaremos parejas
ordenadas para enumerar los posibles resultados. Ahora, es obvio que Gabriela no puede aparecer
sentada en el primer puesto y en el segundo puesto al mismo tiempo (por eso, sin reemplazo). Es
decir, no existe la posibilidad que aparezca el resultado (Gabriela, Gabriela).
Con lo anterior, fácilmente podemos determinar que las posibles maneras en que se sienten dos
personas en el sofá son:
(Gabriela, Jeniffer), (Gabriela, Alberto), (Gabriela, Hernán), (Jeniffer, Gabriela)

(Jeniffer, Alberto), (Jeniffer, Hernán), (Alberto, Gabriela), (Alberto, Jeniffer)
(Alberto, Hernán), (Hernán, Gabriela), (Hernán, Jeniffer), (Hernán, Alberto)
Es decir, en total hay 12 maneras posibles de que dos de las cuatro personas se sienten en el sofá

de dos puestos.
Ejemplo 2.2.4 (Selección con reemplazo y con orden) ¿De cuántas formas pueden acomodarse
3 libros iguales de matemáticas (M) y 2 libros iguales de fı́sica (F) en un estante que tiene sólo 5
puestos disponibles?
SOLUCIÓN:
Como los libros, digamos, de matemáticas son iguales, entonces no importa el orden en que se
coloquen en el estante (por eso, sin orden). Además, los libros de matemáticas están repetidos
(por eso, con reemplazo). Igual sucede con los de fı́sica. Las posibles organizaciones de los 5 libros
en el estante son:

MMMFF, FFMMM, MMFFM, MMFMF, MFMFM,

MFMMF, MFFMM, FMFMM, FMMFM, FMMMF
Es decir, en total hay 10 maneras posibles de organizar los 5 libros en el estante.
Ejemplo 2.2.5 (Partición de un espacio muestral) Supongamos que se dispone de una habitación
triple y de una habitación sencilla. ¿De cuántas maneras diferentes pueden acomodarse cuatro
personas (digamos, Margarita, Diana, Rodrigo y Felipe) en dichas habitaciones?
SOLUCIÓN:
En este ejemplo, se debe dividir a las cuatros personas en grupos de dos (por eso, una partición),
donde un grupo tendrá 3 personas (que son las que dormirán en la habitación triple) y el otro
grupo, 1 persona (que dormirá en la habitación sencilla). Por otra parte, la pareja (Margarita-
Rodrigo-Diana, Felipe) significa que las 3 primeras personas dormirán en la habitación triple y la
última, en la sencilla.
Teniendo en cuenta lo anterior, las posibles reparticiones de las cuatro personas son:
(Margarita-Rodrigo-Diana, Felipe), (Margarita-Rodrigo-Felipe, Diana),

(Margarita-Felipe-Diana, Rodrigo), (Felipe-Diana-Rodrigo, Margarita)
Es decir, en total hay 4 maneras posibles de repartir a 3 personas en una habitación triple y 1 en
la sencilla.
Ejemplo 2.2.6 Una joven tiene tres blusas (de marcas A, B y C), dos faldas (de colores azul
y roja) y dos pares de zapatos (de cuero y plástico). Utilizando estas siete prendas de vestir,
¿cuántos juegos de ropa diferentes podrı́a ponerse?
SOLUCIÓN:
Como podemos ver, los posibles juegos de ropa que la joven podı́a ponerse son los siguientes:
(A, azul, cuero), (A, azul, plástico), (A, rojo, cuero), (A, rojo, plástico)
(B, azul, cuero), (B, azul, plástico), (B, rojo, cuero), (B, rojo, plástico)
(C, azul, cuero), (C, azul, plástico), (C, rojo, cuero), (C, rojo, plástico)
O sea que en total ella podrı́a ponerse 12 juegos.
2.2.3 El conteo a través de diagramas de árbol
Cuando el número de posibilidades no es demasiado grande, se puede utilizar una repre-

sentación gráfica que se conoce con el nombre de diagrama de árbol, para mostrar todas
las secuencias posibles de tales operaciones. Un diagrama de árbol consta de una serie de
“ramas” que corresponden a cada una de las formas en que se pueden realizar la operación.
Ilustraremos este diagrama a través de un solo ejemplo.

Ejemplo 2.2.7 (Selección sin reemplazo y con orden) ¿De cuántas formas distintas se pueden
organizar las letras A, B, C?
SOLUCIÓN:
El diagrama de árbol correspondiente a esta situación se presenta en la figura 2.7. Como puede
verse, las diferentes posibilidades se pueden enumerar teniendo en cuenta las últimas ramas del
diagrama. Allı́ vemos que hay en total seis ramas. Es decir, hay 6 maneras diferentes de organizar
las letras dadas.
Figura 2.7: Diagrama de árbol para el ejemplo 2.2.11
2.2.4 Teorema fundamental del conteo
El siguiente teorema será básico para todo nuestro trabajo:
Teorema 2.2.8 (Teorema fundamental del conteo) Si r experimentos se ejecutan de

tal manera que el primero puede resultar en n1 posibles resultados y si para cada uno de
estos n1 posibles resultados hay n2 posibles resultados del segundo experimento y si para cada
uno de los posibles resultados de los dos primeros experimentos hay n3 posibles resultados
del tercer experimento y si . . ., entonces hay un total de n1 · n2 · · · nr posibles resultados de
los r experimentos.
Para resolver cualquier problema de conteo, sugerimos realizar siempre los siguientes pasos:
• Primer paso:
Determine cuántos eventos hay en el problema, y si es necesario identifique cada uno de ellos.
• Segundo paso:
Calcule de cuántas formas puede ocurrir cada uno de estos eventos.

• Tercer paso:
Por último aplique el teorema fundamental del conteo (teorema 2.2.8).
Ejemplo 2.2.9 Un dado se lanza dos veces. Determine el número de formas en que podemos
obtener los números del dado en los dos lanzamientos.
SOLUCIÓN:
Como los dos dados no están relacionados en forma alguna cuando los lanzamos y como cada uno
puede caer de seis formas distintas, el número total de formas en que pueden caer, uno después
del otro, es 6 · 6 = 36, por el teorema fundamental del conteo (teorema 2.2.8), que son:

Ω = (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),
(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),
(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),
(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6),
(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6),

(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)
Ejemplo 2.2.10 Para el ejemplo 2.2.6 pueden ocurrir tres eventos, uno después del otro: Escoger
una de las 3 blusas, escoger una de las 2 faldas y escoger uno de los dos pares de zapatos. El
primer evento puede ocurrir de 3 formas; el segundo, de 2 formas, y el tercero, de 2 formas. Por
tanto, por el teorema fundamental del conteo (teorema 2.2.8), los cuatros eventos, uno seguido
del otro, pueden ocurrir en 3 · 2 · 2 = 12 maneras distintas.
Ejemplo 2.2.11 (Selección sin reemplazo y con orden) En la situación del ejemplo 2.2.7
hay tres eventos que debemos considerar: el de escoger la letra A, el de escoger la B y el de
escoger la C. Por otra parte, para la primera posición hay 3 posibilidades de escoger la primera
letra. Si se selecciona una, en la segunda posición habrá dos posibilidades, y si selecciona otra,
en la última habrá una posibilidad. Por tanto, por el teorema fundamental del conteo (teorema
2.2.8), el total de formas para organizar las tres letras es 3 · 2 · 1 = 6, como se obtuvo en el ejemplo
2.2.7.
Ejemplo 2.2.12 (Selección sin reemplazo y con orden) Hay cuatro facturas diferentes que
un gerente quiere ordenar, de izquierda a derecha, en cuatro lugares distintos de su escritorio. ¿De
cuántas maneras puede él hacerlo?
SOLUCIÓN:
Hay dos formas de analizar este ejemplo: como un problema de colocación y como un problema
de selección.
• Un problema de colocación
Los cuatro eventos son:
A = Colocar la primera factura en uno de los cuatro espacios.

B = En seguida, colocar la segunda factura en uno de los tres espacios restantes.

C = De los dos espacios aún vacı́os, uno será para la tercera factura.
D = La última factura va en el único lugar disponible.
• Un problema de selección
Los cuatro eventos son:
A = Seleccionar una factura para el primer lugar.

B = Después de llenar el primer espacio, se elige la segunda factura de entre las tres
restantes
C = Luego de ocupar tres espacios, se selecciona la tercera factura de entre las que quedan.
D = Colocar la cuarta factura en el último espacio.
En cualquiera de las dos situaciones, A puede hacerse de 4 maneras; B, de tres; C, de dos, y D,

de una sola manera. Por consiguiente, por el teorema fundamental del conteo (teorema 2.2.8), el
número total de formas posibles en que el gerente puede ordenar sus facturas es 4 · 3 · 2 · 1 = 24.
Ejemplo 2.2.13 (Selección sin reemplazo y con orden) Considere la situación del ejemplo
2.2.3. El primer puesto hay 4 maneras de que se siente una persona. Sentada una allı́, quedarán
disponibles 3 personas para el segundo puesto. Por tanto, por el teorema fundamental del conteo
(teorema 2.2.8) hay 12 = 4 · 3 maneras posibles de que dos de las cuatro personas se sienten en el
sofá de dos puestos.
Sin embargo, hay situaciones en las que no se puede aplicar (o no se puede aplicar fácilmente)
el teorema fundamental del conteo (teorema 2.2.8), en especial cuando el orden no importa.
Algunos ejemplos son los siguientes:
Ejemplo 2.2.14 Cuando la selección es
(a) sin reemplazo y sin orden, como en el ejemplo 2.2.2;
(b) con reemplazo y sin orden, como en el ejemplo 2.2.4;
(c) a través de la partición de un espacio muestral, como en el ejemplo 2.2.5
el teorema fundamental del conteo (teorema 2.2.8) no es aplicable (directamente). En los dos
primeros casos porque no importa el orden, y en el tercero, por la estructura del modelo de urna.

2.2.5 El principio de adición
Consideremos el siguiente ejemplo:
Ejemplo 2.2.15 Cinco empresas de transporte terrestre tienen servicio diario entre Barranqui-
lla y Bogotá. Tres empresas de aviación tienen vuelo diario entre Barranquilla y Bogotá. En
consecuencia, hay 5 + 3 maneras de ir de Barranquilla a Bogotá en avión o en bus.

En el ejemplo anterior vemos que no es posible aplicar el teorema fundamental del conteo
(teorema 2.2.8). Para resolver este tipo de problemas es importante considerar el siguiente
teorema:
Teorema 2.2.16 (Principio de adición) Si los eventos A1 , A2 , . . ., Ak tienen n1 , n2 ,

. . ., nk elementos, respectivamente, y si son mutuamente excluyentes (véase la definición
2.1.7), entonces el evento A1 ∪ A2 ∪ · · · ∪ Ak tiene n1 + n2 + · · · + nk elementos.
Ejemplo 2.2.17 En el lanzamiento de dos dados, ¿de cuántas formas se puede obtener que la
suma de los números sea un siete o un ocho?
SOLUCIÓN:
Sean A y B los eventos “obtener un siete” y “obtener un ocho” respectivamente. Entonces, A ∪ B
será el evento “obtener un siete o un ocho”. Debido a que
A = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)} y B = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)}
entonces A y B pueden ocurrir de 6 y 5 formas distintas respectivamente, y, además, son mutua-

mente excluyentes. Por consiguiente, por el principio de adición (teorema 2.2.16), el evento A ∪ B
ocurrirá de 6 + 5 = 11 maneras distintas.
Ejemplo 2.2.18 Consideremos el experimento de lanzar una moneda al aire tres veces. ¿De
cuántas formas se puede obtener una, dos o tres caras?
SOLUCIÓN:
Sean A, B y D los eventos “obtener una cara ” y “obtener dos caras”, “obtener tres caras”
respectivamente. Entonces, A ∪ B ∪ D será el evento “obtener una, dos o tres caras”. Como
A = {(C, S, S), (S, C, S), (S, S, C)}, B = {(S, C, C), (C, S, C), (C, C, S)} y D = {(C, C, C)}
entonces A, B y D pueden ocurrir de 3, 3 y 1 formas distintas. Obsérvese, además, que son

mutuamente excluyentes. Por lo tanto, por el principio de adición (teorema 2.2.16), el evento
A ∪ B ∪ D ocurrirá de 3 + 3 + 1 = 7 maneras diferentes.
2.2.6 Permutación
Definición 2.2.19 Una permutación es un arreglo ordenado de una cantidad finita de

objetos distintos.
Es importante tener en cuenta que toda permutación se puede identificar como una muestra selec-
cionada sin o con reemplazo, pero siempre con orden.

Ejemplo 2.2.20 (Permutaciones de 3 letras, sin reemplazo) ACB es un ejemplo de una

permutación de las letras A, B y C. Hay en total 6 permutaciones de estas letras (compárese con
el ejemplo 2.2.7): ABC, ACB, BCA, BAC, CBA y CAB.
Ejemplo 2.2.21 (Permutaciones de 4 letras tomándolas de 2 en 2, sin reemplazo) AC

es un ejemplo de una permutación de las letras A, B, C y D, pero tomado solamente dos de ellas.
Hay en total 12 permutaciones de estas cuatro letras, tomándolas de 2 en 2:
AB AC AD BA BC BD CA CB CD DA DB DC
Ejemplo 2.2.22 (Permutaciones de 4 letras si hay letras iguales, con reemplazo) CAC
es un ejemplo de una permutación de las letras A, C y C. En total hay 3 permutaciones de estas
letras: ACC, CAC y CCA.
En la mayor parte de los casos, el total de permutaciones de un conjunto de objetos lo

podemos calcular siempre a través del teorema fundamental del conteo (teorema 2.2.8). De
todas formas, para situaciones especiales hay fórmulas (obtenidas del teorema fundamental
del conteo) que también nos permiten calcular la cantidad de permutaciones. Las situa-
ciones especiales (relacionadas con permutaciones) que explicaremos a continuación son las
siguientes:
• Permutaciones sin repetición de n objetos tomados todos a la vez y tomados de k en

k (k ≤ n).
• Permutaciones circulares.
• Permutaciones con repetición de n objetos tomados de k en k (k es cualquier número

natural).
• Permutaciones de n objetos de los cuales hay n1 de un primer tipo, n2 de un segundo

tipo, . . ., nk de un k-ésimo tipo, donde n1 + n2 + · · · + nk = n.
• Maneras de hacer una partición de un conjunto.
Permutaciones sin repetición de n objetos tomados todos a la vez

Estas permutaciones se pueden considerar como muestras seleccionadas sin reemplazo.
Teorema 2.2.23 El número de permutaciones de un conjunto de n elementos distintos es

igual a n! := 1 · 2 · · · (n − 1) · n, siendo 0! := 1.
El sı́mbolo “!” se conoce con el nombre de factorial. Cuando escribamos, por ejemplo, 5! leere-
mos “5 factorial”. Algunos valores factoriales son los siguientes:
1! = 1, 2! = 2 · 1 = 2, 3! = 3 · 2 · 1 = 6, 4! = 4 · 3 · 2 · 1 = 24, etc.

Ejemplo 2.2.24 (Permutaciones de 4 objetos, sin reemplazo) El ejemplo 2.2.12 se puede

resolver también aplicando el teorema 2.2.23 porque el gerente quiere ordenar sus cuatro facturas
disponiendo sólo de cuatro espacios posibles. Aplicando este teorema tenemos que el gerente puede
ordenar sus facturas de 4! = 4 · 3 · 2 · 1 = 24 maneras, que fue el resultado obtenido aplicando el
teorema fundamental del conteo (teorema 2.2.8).
Ejemplo 2.2.25 (Permutaciones de 8 objetos, sin reemplazo) Suponga que una empresa
dispone de ocho máquinas atornilladoras y de ocho espacios en el área de producción. ¿De cuántas
maneras diferentes se pueden acomodar estas ocho máquinas en los ocho espacios disponibles?
SOLUCIÓN:
Podemos aplicar directamente el teorema 2.2.23, puesto que tenemos un total de n = 8 objetos
que queremos ordenar entre sı́. Es decir, hay 8! = 40.320 maneras de ordenar las ocho máquinas
en los ocho espacios disponibles.
Ejemplo 2.2.26 (Permutaciones de 5 objetos, sin reemplazo) Si se le pide a un consumi-

dor que ordene, por orden de preferencia, el sabor de cinco marcas de cerveza, entonces el número
de permutaciones que resultan será 5! = 120.
Ejemplo 2.2.27 (Permutaciones de 12 objetos, sin reemplazo) Cuatro libros distintos de

matemáticas, seis diferentes de fı́sica y dos diferentes de quı́mica se colocan en un estante. ¿De
cuántas formas distintas es posible ordenarlos si (a) los libros de cada asignatura deben estar todos
juntos, (b) solamente los libros de matemáticas deben estar juntos?
SOLUCIÓN:
(a) Los libros de matemáticas pueden ordenarse de 4! formas, los de fı́sica de 6! formas, los de
quı́mica de 2! formas y los tres grupos de 3! formas. Por consiguiente,
número de ordenaciones pedido = 4! 6! 2! 3! = 207.360.
(b) Considerar los cuatro libros de matemáticas como un solo libro. Entonces, se tienen 9 libros
que pueden ordenarse de 9! formas. En todos estos casos, los libros de matemáticas están
juntos, pero pueden ordenarse de 4! formas. Por consiguiente,
número de ordenaciones pedido = 9! 4! = 8.709.120.
Permutaciones sin repetición de n objetos tomados de k en k (k ≤ n)
Hay situaciones en las que podemos hallar las permutaciones de n objetos distintos tomándolos
de k en k, como se ilustró en el ejemplo 2.2.21. Para calcular el número de permutaciones
de este tipo, podemos tener en cuenta el siguiente teorema:

Teorema 2.2.28 El número de permutaciones de un conjunto de n elementos distintos

n!
tomados de k en k es igual a (n−k)! .
Las permutaciones de este tipo también se pueden considerar como muestras seleccionadas sin reemplazo.
Además, obsérvese que cuando k = n, este resultado coincide siempre con el del teorema 2.2.23.
Ejemplo 2.2.29 (Permutaciones de 2 en 2, sin reemplazo) Por el teorema 2.2.28, el número

4!
de permutaciones de las letras A, B, C y D, tomadas de dos en dos es igual a (4−2)! = 12
(compaárese con el ejemplo 2.2.21).
Ejemplo 2.2.30 (Permutaciones de 5 en 5, sin reemplazo) ¿De cuántas formas diferentes

se pueden sentar 8 alumnos en una oficina con sólo 5 sillas?
SOLUCIÓN:
Por el teorema 2.2.28, el número de formas en que se pueden sentar 8 alumnos en una oficina con
8!
5 sillas es igual a (8−5)! = 6.720.
Ejemplo 2.2.31 (Permutaciones de 3 en 3, sin reemplazo) ¿Cuántos números de 3 cifras

sin repetición se pueden formar con los dı́gitos 8, 2, 5, 4 y 7?
SOLUCIÓN:
Nuevamente, por el teorema 2.2.28, esto se puede hacer de 5!
(5−3)! = 60 formas.
Ejemplo 2.2.32 (Permutaciones de 4 en 4, sin reemplazo) Una sección de maquinaria de-

terminada consta de cuatro piezas y puede ser ensamblada poniendo las piezas en cualquier orden.
Supóngase que se decide estudiar el tiempo de ensamblaje para esta sección de maquinaria mi-
diendo el tiempo que requiere para cada uno de los ensamblajes resultantes de tomar las piezas
en distinto orden. ¿Cuántas de estas mediciones habrá que hacer?
SOLUCIÓN:
Por el teorema 2.2.28, el número total de mediciones es 4!
(4−4)! = 24.
Permutaciones circulares
Ahora estudiaremos algunas situaciones de arreglos circulares. Para ello consideremos el

siguiente ejemplo:
Ejemplo 2.2.33 (Permutación circular) Sabemos que si queremos sentar a Greyci, Jeniffer,
Brian y Humberto, una al lado de la otra en fila, el número de arreglos que podemos hacer es
4! = 24. Ahora bien, si los queremos sentar alrededor de una mesa circular, ¿de cuántas maneras
lo podemos hacer?

SOLUCIÓN:
Al considerar a una persona en un lugar fijo (digamos Greyci) y acomodar a las otras tres personas
en 3! formas diferentes, se encuentra que hay 6 arreglos distintos alrededor de la mesa circular
(compárese con la figura 2.8).
Figura 2.8: Permutación de 4 personas en una mesa circular
Este ejemplo también se puede resolver directamente aplicando directamente el siguiente

teorema:
Teorema 2.2.34 El número de permutaciones de n objetos distintos acomodados en un

cı́rculo es (n − 1)!.
Ejemplo 2.2.35 (Permutación circular) ¿De cuántas formas pueden sentarse Greyci, Jenif-
fer, Brian y Humberto alrededor de una mesa circular si Greyci y Humberto no deben estar una
al lado de la otra?
SOLUCIÓN:
Considérense las dos personas que no deben ir juntas como una sola.
Por lo tanto, hay 3 personas para sentarse en la mesa circular, que lo pueden hacer de 2! formas.
Pero las dos personas consideradas como una sola se pueden ordenar de 2! maneras. Por consi-
guiente, el número de permutaciones de 3 personas alrededor de una mesa circular, si dos de ellas
pueden estar juntas, es 2! 2! = 4, que son las “mesas no sombreadas” de la figura 2.9. Entonces,
el número total de formas en que Greyci, Jeniffer, Brian y Humberto pueden sentarse alrededor
de una mesa circular, si Greyci y Humberto no deben estar una al lado de la otra, es 4 − 2 = 2
formas, que corresponden a las “mesas sombreadas” de la figura 2.9.

Figura 2.9: Las mesas sombreadas son las permutaciones en que Greyci, Jeniffer, Brian y
Humberto se pueden organizar si Greyci y Humberto no deben estar juntas
Permutaciones con repetición de n objetos tomados de k en k

(k es cualquier número natural)
Veamos otra aplicación del teorema fundamental del conteo (teorema 2.2.8).
Ejemplo 2.2.36 (Permutaciones de 2 en 2, k > n, con reemplazo) Supongamos que tene-

mos 3 niños de un colegio de primaria y 2 sabores de helados disponibles (digamos, fresa y mango).
¿De cuántas maneras diferentes podemos servir un helado a los 3 niños?
SOLUCIÓN:
Al primer niño le podemos servir uno de los 2 sabores, al segundo también le podemos servir de los
2 sabores, y al tercero también uno de los 2 sabores. Por consiguiente, por el teorema fundamental
del conteo (teorema 2.2.8), hay 2 · 2 · 2 = 23 = 8 maneras diferentes de servir un helado a los 3
niños. Estas posibilidades son las siguientes:
(fresa, fresa, fresa), (fresa, fresa, mango), (fresa, mango, fresa),

(fresa, mango, mango), (mango, fresa, fresa), (mango, fresa, mango),
(mango, mango, fresa), (mango, mango, mango),
en donde, por ejemplo, la tripleta (fresa, mango, mango) significa que el primer niño pidió un
helado de fresa, el segundo, de mango, y el tercero, de mango.
Este ejemplo se puede categorizar como un modelo de urna en el que las muestras son
seleccionadas con orden y con reemplazo. En este tipo de situaciones se están considerando
aquellas permutaciones con repetición de n objetos distintos tomándolos de k en k, y en
donde k es cualquier número natural. Aplicando el teorema fundamental del conteo (teo-
rema 2.2.8) obtenemos el siguiente teorema:

Teorema 2.2.37 Sea k cualquier número natural. Entonces, el número de permutaciones

con repetición de n objetos distintos tomándolos de k en k es igual a nk .
Las permutaciones de este tipo se pueden considerar como muestras seleccionadas con reemplazo.
Ejemplo 2.2.38 (Permutaciones de 3 en 3, k < n, con reemplazo) ¿Cuántos números de

2 cifras con repetición se pueden fomar usando todos los siguientes dı́gitos: 5, 2 y 3?
SOLUCIÓN:
Por el teorema 2.2.37, hay 32 = 9 números de dos cifras con repetición y son 55, 52, 53, 25, 22,
23, 35, 32 y 33.
Ejemplo 2.2.39 (Permutaciones de 4 en 4, k>n, con reemplazo) ¿De cuántas formas pode-
mos contestar un examen con 10 preguntas de selección múltiple si cada pregunta tiene 4 posibi-
lidades de respuesta?
SOLUCIÓN:
Por el teorema 2.2.37, hay 410 = 1.048.576 formas de responder las 10 preguntas si cada una de
ellas tiene cuatro posibilidades de respuesta.
Ejemplo 2.2.40 (Permutaciones de 5 en 5, k = n, con reemplazo) Un ladrón quiere abrir

una caja fuerte. Observa que para abrirla debe manipular un dispositivo de seguridad formado
por cinco anillos y cada uno marcado con los dı́gitos 1, 2, 3, 4 y 5, pero no sabe la combinación
correcta. ¿Cuál es el número máximo de intentos incorrectos que puede realizar antes de encontrar
la combinación correcta?
SOLUCIÓN:
En cada uno de los 5 anillos pueden ponerse los 5 dı́gitos. Ası́ que, por el teorema 2.2.37 con
n = k = 5, hay 55 = 3.125 posibilidades de escoger una clave. Pero como una de estas 3.125 es la
correcta, el número máximo de intentos incorrectos es 3.124.
Permutaciones de n objetos en donde hay n1 de un primer tipo, n2 de un segundo

tipo, . . ., nk de un k-ésimo tipo, con n1 + n2 + · · · + nk = n
Ahora consideraremos algunas permutaciones de n objetos en donde algunos grupos de

objetos son iguales entre sı́, como podemos observar en los ejemplos 2.2.4 y 2.2.22. Para
calcular permutaciones de este tipo se puede aplicar el siguiente teorema:

Teorema 2.2.41 El número de permutaciones de n objetos en donde hay n1 de un primer

tipo, n2 de un segundo tipo, . . ., nk de un k-ésimo tipo, con n1 + n2 + · · · + nk = n, es
n!
n1 ! n2 ! · · · nk !
donde n1 , . . . , nk son números naturales.
Ejemplo 2.2.42 (Permutación con 7 grupos de objetos iguales) ¿Cuántas palabras distin-
tas se pueden formar con las letras de la palabra “estadı́stica”? (También cuentan palabras sin
sentido como, por ejemplo, “setadı́stica”).
SOLUCIÓN:
Obsérvese que en la palabra “estadı́stica” hay n = 11 letras, distribuidas ası́: 1 “e”, 2 “s”, 2 “t”, 2
“a”, 1 “d”, 2 “i” y 1 “c”. Por tanto, aplicando el teorema 2.2.41, se concluye que podemos formar
11!
= 2.494.800
1! 2! 2! 2! 1! 2! 1!
palabras distintas con las letras de la palabra mencionada anteriormente.
Ejemplo 2.2.43 (Permutación con 2 grupos de objetos iguales) ¿Cuántas señales diferen-
tes se pueden hacer con 5 banderas de las cuales 2 son azules y 3, rojas?
SOLUCIÓN:
De acuerdo al teorema 2.2.41, hay 5!
2! 3! = 10 señales que se pueden hacer.
Maneras de hacer una partición de un conjunto
A menudo interesa determinar el número de formas en que se pueden repartir n objetos

en k subconjuntos (llamados celdas5 ), como sucede en la situación del ejemplo 2.2.5. En
general, este número de formas lo podemos calcular directamente con ayuda del siguiente
teorema:
Teorema 2.2.44 El número de formas de partir n objetos distintos en donde en k celdas

con n1 objetos en la primera celda, n2 en la segunda tipo, . . ., nk en la k-ésima celda, con
n1 + n2 + · · · + nk = n, es

n n!
=
n1 , n2 , . . . , nk n1 ! n2 ! · · · nk !
No importa el orden de los objetos dentro de cada celda.
5
En el ejemplo 2.2.5 se han considerado 2 celdas: las habitaciones triple y sencilla.

Ejemplo 2.2.45 (Partición en 3 celdas) Doce estudiantes van a viajar en carros distintos a
cierta ciudad. Si 3 de ellos van en un carro, 4 en otro carro y 5 en el otro, ¿de cuántas maneras
se pueden acomodar si cualquiera puede conducir?
SOLUCIÓN:
Por el teorema 2.2.44, hay
12 12!
= = 27.720
3, 4, 5 3! 4! 5!
formas en que los 12 estudiantes se pueden acomodar en los tres carros, viajando 3, 4 y 5 estu-
diantes en carros distintos.
2.2.7 Combinación
Cuando tratamos con permutaciones de objetos, el orden de escogencia o de colocación es

importante. Hay ocasiones en que no nos interesa considerar conjuntos de objetos donde el
orden no es importante. Cuando esto ocurre, la escogencia se llama combinación.
Definición 2.2.46 Una escogencia de k objetos de un conjunto de n objetos distintos, sin

importar el orden en que los k objetos son escogidos, se llama combinación.
Una combinación puede ser con repetición o sin repetición.
Ejemplo 2.2.47 (Combinaciones tomadas de 2 en 2, sin repetición) Todas las posibles com-
binaciones de las n = 5 letras A, B, C, D y E, tomadas de dos en dos (o sea, k = 2) sin repetición
son:
AB, AC, AD, AE, BC, BD, BE, CD, CE, DE
Es decir, en total hay 10 posibles formas de escoger dos letras de un total de 5, cuando el orden
no importa y la selección es sin repetición. Obsérvese que, en este caso, da lo mismo escoger AB
y BA (es decir, no importa el orden).
Ejemplo 2.2.48 (Combinaciones tomadas de 2 en 2, con repetición) Todas las posibles

combinaciones de las n = 5 letras A, B, C, D y E, tomadas de dos en dos (o sea, k = 2) con
repetición son:
AB, AC, AD, AE, BC, BD, BE, CD

CE, DE, AA, BB, CC, DD, EE
Es decir, en total hay 15 posibles formas de escoger dos letras, de un total de 5, cuando el orden
no importa y la selección es con repetición.

Ejemplo 2.2.49 (Diferentes problemas con combinaciones) Otros casos en los que se pre-
sentan problemas con combinaciones son los siguientes:
(a) En una caja hay n = 5 fichas numeradas y se sacan k = 3 fichas, una detrás de otra, sin
reponer y sin importar el orden.
(b) Se reparten n = 10 fichas diferentes y numeradas sobre k = 6 puestos no numerados, de tal

forma que en cada puesto haya exactamente una ficha.
(c) Repartir k = 7 fichas iguales no numeradas sobre n = 9 puestos numerados, de tal forma que
en cada puesto haya a lo más una ficha.
Pero, ¿cómo calculamos el número de combinaciones de un conjunto de objetos sin enu-

merar tales combinaciones? El siguiente teorema nos da la respuesta:
Teorema 2.2.50 El número de combinaciones de k objetos seleccionados, sin repetición,

de un conjunto de n elementos, es

n n! n
:= , siendo := 1
k k!(n − k)! 0
Y el número de combinaciones de k objetos seleccionados con repetición, de un conjunto de

n elementos, es

n n+k−1 (n + k − 1)! n
:= = , siendo := 1
k r k k!(n − 1)! 0

Los números nk se conocen con el nombre de coeficiente binomial porque aparecen como coeficientes
de ak bn−k , con 0 ≤ k ≤ n, en el desarrollo binomial de (a + b)n como se muestra a continuación:
n
n k n−k
(a + b)n = a b , para todo a, b ∈ R.
k
k=0
Ejemplo 2.2.51 (Combinaciones tomadas de 4 en 4, sin repetición) Una pieza de un ra-

dio puede ser comprado de cualquiera de cinco proveedores. ¿De cuántas maneras se pueden
escoger cuatro de los cinco proveedores?
SOLUCIÓN:

Por el teorema 2.2.50, esto se puede hacer de 54 = 5 maneras.
Ejemplo 2.2.52 (Combinaciones tomadas de 2 en 2, con repetición) Por el teorema 2.2.50,

el número de las posibles combinaciones de las n = 5 letras A, B, C, D y E, tomadas de dos en

dos (o sea, k = 2), con repetición, es igual a 52 r = 15 (compárese con el ejemplo 2.2.48).
Debido a que las combinaciones con repetición son poco usuales en la práctica, de ahora en
adelante todas las combinaciones que se seleccionen serán sin repetición.

Ejemplo 2.2.53 (Combinaciones tomadas de 8 en 8) Por el teorema 2.2.50, un comité de

k = 3 mujeres de un grupo de n = 8, se puede escoger de 83 = 56 maneras.
Ejemplo 2.2.54 (Combinaciones tomadas de 5 en 5) De un total de 5 matemáticos y 7

fı́sicos se forma un comité de 2 matemáticos y 3 fı́sicos. ¿De cuántas maneras puede formarse si
(a) puede pertenecer a él cualquier matemático y fı́sico, (b) un fı́sico determinado debe pertenecer
al comité, (c) dos matemáticos determinados no pueden pertenecer al comité?
SOLUCIÓN:

(a) 2 matemáticos, de un total de 5, pueden elegirse de 52 = 10 maneras. Ahora, 3 fı́sicos de

un total de 7 pueden elegirse de 73 = 35 maneras. Por consiguiente,
número total de selecciones posibles = 10 · 35 = 350.

(b) 2 matemáticos, de un total de 5, pueden elegirse de 52 = 10 maneras. Ahora, 2 fı́sicos
6
restantes, de un total de 6, pueden elegirse de 2 = 15 maneras. Por consiguiente,

(c) 2 matemáticos, de un total de 3, pueden elegirse de 32 = 3 maneras. Ahora, 3 fı́sicos, de
7
un total de 7, pueden elegirse de 3 = 35 maneras. Por consiguiente,
El número de combinaciones de n objetos tomados de k en k está relacionado con el número

de permutaciones de n objetos tomados de k en k. Observemos que cada combinación puede
arreglarse de k! maneras distintas. Si aplicamos el teorema fundamental del conteo (teo-
rema 2.2.8), el número total de permutaciones de n objetos distintos tomados de k en k es
igual al producto de k! y al número de combinaciones de n objetos distintos tomados de k

en k, o sea, igual a k! nk . Esto se puede resumir en el siguiente teorema:
Teorema 2.2.55 El número total de permutaciones de n objetos distintos tomados de k en

k es igual al producto de k! y al número de combinaciones de n objetos distintos tomados

de k en k, o sea, igual a k! nk .
Ejemplo 2.2.56 (Permutaciones de 5 en 5) Por el teorema 2.2.28, el número de formas en

que se pueden sentar 8 alumnos en una oficina con 5 sillas es igual a 5! 85 = 6.720, que coincide
con el resultado obtenido en el ejemplo 2.2.30.


13. En un reinado mundial de la belleza, el jurado debe elegir, de un total de cinco finalistas,
a la nueva reina. ¿De cuántas formas se puede seleccionar (a) reina y virreina? (b) reina,
virreina y primera princesa? (c) dos candidatas para ser reina?
14. En un estudio médico, los pacientes se clasifican de acuerdo a su peso (liviano, normal, pe-
sado) y estatura (medio bajo, bajo, alto y medio alto). Enumere las diferentes posibilidades
en las que un paciente se puede clasificar. ¿Cuántas posibilidades hay?
15. Si un experimento consiste en lanzar un dado, luego, lanzar una moneda y después es-
coger al azar una letra de nuestro alfabeto, ¿cuántos elementos tiene el espacio muestral
correspondiente? (Suponga que nuestro alfabeto tiene 27 letras).
16. Los estudiantes de un curso de estadı́stica se clasifican como estudiantes de administración,

economı́a o ingenierı́a; como repitente o no repitente y también como hombre o mujer.
Encuentre el número total de clasificaciones posibles para los estudiantes de dicho curso.
17. Dados los dı́gitos 0, 2, 4, 5, 6, 8 y 9. Si no se aceptan repeticiones,
(a) ¿cuántos números de tres dı́gitos se pueden formar?

(b) ¿cuántos de esos números son múltiplos de 5?
18. En un determinado almacén, ciertas lámparas se venden en cuatro estilos diferentes, con
cada estilo disponible en cinco colores diferentes. Si el almacén desea mostrar lámparas que
muestren la totalidad de los diversos estilos y colores, ¿cuántas lámparas diferentes tendrı́a
que mostrar?
19. ¿De cuántas maneras diferentes se puede responder un cuestionario de falso-verdadero que
tiene 10 preguntas?
20. Un medicamento para problemas renales es fabricado por seis laboratorios diferentes en
forma de jarabe, tabletas, cápsulas o inyección, todas de concentración alta o baja. ¿De
cuántas maneras diferentes puede un doctor recetar el medicamento a un paciente que tenga
problemas renales?
21. Supongamos que 7 personas se quieren organizar en una fila.
(a) ¿De cuántas maneras diferentes pueden hacerlo?

(b) ¿De cuántas maneras diferentes pueden hacerlo si una de ellas no debe estar al comienzo
de la fila?
22. En un concurso nacional de canto, los seis finalistas son 3 hombres y 3 mujeres. Encuentre
el número de ordenamientos posibles al final del concurso para (a) los seis finalistas, (b) las
tres primeras posiciones.

23. Una persona ha visto un accidente de tránsito cuyo culpable huyó. A pesar de esto le dice
a la Policı́a que la placa del carro en el que viajaba el culpable tenı́a tres letras (de las
cuales las dos primeras eran C y A) y tres dı́gitos (de los cuales el último era 0). Encuentre
el número máximo de placas de carro que la Policı́a debe verificar bajo cada una de las
siguientes condiciones (nuestro alfabeto tiene 27 letras):
(a) Las tres letras son diferentes y los tres dı́gitos también.
(b) Las tres letras son diferentes y los dos dı́gitos que faltan son diferentes entre sı́.
(c) La letra que hace falta es diferente de la A y los dı́gitos que hacen falta son diferentes
e impares.
24. La mayor accionista de una determinada empresa decide que en el futuro se divida el pre-
supuesto de publicidad entre tres agencias. Seis son las agencias que están siendo conside-
radas para este trabajo. ¿Cuántas son las posibles elecciones de tres agencias?
25. Supongamos que se quieren formar números de tres dı́gitos con los dı́gitos 0, 2, 4, 5, 7, 8 y
9.
(a) ¿Cuántos números resultan si los dı́gitos pueden estar repetidos?

(b) ¿Cuántos números resultan si cada dı́gito puede usarse sólo una vez?
(c) ¿Cuántos números resultan si los números resultantes son impares y si los dı́gitos pueden
estar repetidos?
(d) ¿Cuántos números resultan si los números resultantes son pares y si cada dı́gito puede
usarse sólo una vez?
(e) ¿Cuántos números son menores que 440 y si los dı́gitos pueden estar repetidos?
(f) ¿Cuántos números resultan si el primer dı́gito es 5 y si cada dı́gito puede usarse sólo
una vez?
26. ¿De cuántas maneras se pueden parquear siete carros, de modelos distintos, en una calle si
hay tres zonas disponibles en un lado de la calle y cuatro en el lado opuesto?
27. ¿De cuántas maneras pueden sentarse tres hombres y tres mujeres en una fila con seis puestos
si se deben alternar?
28. ¿Cuáles y cuántas son las muestras ordenadas, con reemplazo, de tamaño dos de la población
consistente en (a) tres valores, 2, 4 y 6; (b) cuatro valores, 0, 2, 4 y 6.
29. Tres parejas de casados han comprado boletas para el cine y se sientan en una fila formada
por seis asientos. Supongamos que se sientan al azar. Determine el número de formas
diferentes en que se pueden sentar teniendo en cuenta cada una de las siguientes situaciones:
(a) No hay restricción alguna.

(b) Todos los hombres se sientan juntos a la izquierda de todas las mujeres.
(c) Exactamente una pareja (digamos, Luis y Matilde) está sentada en los dos asientos del
extremo derecho.

(d) Luis y Matilde están sentados uno junto a la otra.

(e) Luis y Matilde están sentados juntos en el extremo izquierdo y otra pareja (digamos,
Jorge y Nubia) está sentada junta en el medio.
(f) Jorge y Nubia están sentados juntos en el medio y los otros dos esposos (digamos,
Luis, Ricardo) están sentados junto a sus respectivas esposas (Matilde y Ana respecti-
vamente).
(g) Todos los esposos están sentados junto a sus respectivas esposas.
30. ¿De cuántas maneras se pueden llenar las 11 posiciones inciales de un equipo de fútbol con
17 jugadores que pueden jugar en cualesquiera de las posiciones?
31. ¿De cuántas maneras se pueden sembrar seis árboles diferentes en un cı́rculo si (a) no hay
restricción alguna, (b) hay dos en especial que deben estar juntos, (c) hay dos en especial
que no deben estar juntos?
32. ¿Cuántas palabras diferentes se pueden formar con la palabra “Barranquilla” (las palabras
no necesariamente deben tener sentido) si (a) no hay restricción alguna, (b) la primera letra
debe ser una “q” y la última una “a”.
33. ¿De cuántas maneras se pueden permutar tres focos rojos, cuatro bolas blancas y dos fichas
amarillas si los objetos del mismo tipo (a) se pueden distinguir, (b) no se pueden distinguir.
34. Catorce personas deciden ir a ver un partido de fútbol en cuatro carros que llevan dos, tres,
cuatro y cinco personas respectivamente. ¿De cuántas maneras es posible transportar a las
catorce personas hasta el estadio si cualquiera puede conducir?
35. Dados los dı́gitos 0, 1, 3, 6, 8 y 9. Si no se aceptan repeticiones,
(a) ¿cuántos números de cuatro dı́gitos se pueden formar?

(b) ¿cuántos de esos números son pares?
(c) ¿cuántos son impares?
(d) ¿cuántos de los números obtenidos en (a) son mayores de 3.000?
36. ¿De cuántas maneras se pueden repartir dos contratos a tres empresas, A, B y C, si cada
empresa puede tener 0, 1 o 2 contratos? Descrı́balas.
37. Si una prueba de opción múltiple consiste en cuatro preguntas cada una con tres respuestas
posibles, de las que sólo una es correcta.
(a) ¿De cuántas maneras diferentes puede elegir un estudiante una respuesta a cada pre-
gunta?
(b) ¿De cuántas maneras puede escoger un estudiante una respuesta a cada pregunta y
tener todas las respuestas incorrectas?
(c) ¿De cuántas maneras puede escoger un estudiante una respuesta a cada pregunta y
tener por lo menos una respuesta correcta?

38. Las placas para autos en Barranquilla antes tenı́an dos letras y cuatro números. El sistema
de nomenclatura cambió y ahora son de tres letras y tres números. Con el sistema actual,
¿aumentó o disminuyó el número de placas que se pueden emitir? ¿En qué porcentaje?
2.3 Introducción a la probabilidad

Antes de señalar cómo se utilizan las probabilidades, es necesario conocer de cierta manera
de dónde provienen. Básicamente, explicaremos 4 formas de calcular o estimar la probabi-
lidad: mediante los siguientes métodos (que se relacionan todos entre sı́): axiomático, de
la frecuencia relativa, clásico y subjetivo.
2.3.1 Definición matemática de “probabilidad”
Al igual que la geometrı́a, el álgebra y otras disciplinas matemáticas, también la teorı́a de

la probabilidad se construye a través de axiomas, los cuales se enumeran a continuación:
Axioma 2.3.1 Sean Ω = ∅ un espacio muestral y F un conjunto de eventos de Ω. Una

función P : F −→ R se llama una probabilidad si se cumplen los siguientes 3 axiomas:
(a) La probabilidad de cualquier evento debe ser siempre mayor o igual que cero, es decir,
P (A) ≥ 0, para todo A ∈ F.
(b) La probabilidad del espacio muestral siempre es uno, es decir, P (Ω) = 1.
(c) Para cada sucesión de eventos A1 , A2 , . . . ∈ F son mutuamente excluyentes (véase la

definición 2.1.7), entonces se cumple que

∞ ∞
P An = P (An )
n=1 n=1
A la tripleta (Ω, F, P ) se le llama espacio de probabilidad.

La serie que aparece en (c) existe (converge) porque el primer axioma asegura que P (An ) ≥ 0 y el segundo,
que
∞

P( An ) ≤ P (Ω) = 1
n=1
Es decir,
∞

∞
P (An ) = P An ≤ 1 < ∞
n=1 n=1
2.3. Introducción a la probabilidad

Es importante enfatizar que el conjunto F, mencionado en la definición anterior, debe estar construido de
tal manera que cumpla las siguientes propiedades:
(a) Ω siempre debe estar en F.

(b) Si A está en F, entonces el complemento A de A también debe estar en F.

∞
(c) Si A1 , A2 , . . . están en F, entonces An también debe estár en F.
n=1
El axioma (a) refleja la noción intuitiva de que la probabilidad de que ocurra cualquier
evento A debe ser por lo menos 0, ası́ que las probabilidades negativas no se permiten. El
axioma (b) señala que la probabilidad máxima posible de 1 se asigna al espacio muestral
Ω. El axioma (c) formaliza la idea de que si deseamos la probabilidad de que ocurra por
lo menos uno de varios eventos y no pueden ocurrir dos de estos eventos simultáneamente,
entonces la probabilidad de que ocurra al menos uno es la suma de las probabilidades de
los eventos individuales.
Teniendo en cuenta el axioma 2.3.1, se demuestran las siguientes propiedades:
Teorema 2.3.2 Para eventos A, B, C de un espacio muestral Ω = ∅ se tiene:
(a) P (∅) = 0
(b) Si los eventos A, B y C son mutuamente excluyentes, entonces P (A ∪ B ∪ C) =

P (A) + P (B) + P (C)
(c) P (A) = 1 − P (A), siendo A el complemento de A
(d) 0 ≤ P (A) ≤ 1
(e) P (A) = P (A ∩ B) + P (A ∩ B)
(f ) Teorema de adición para 2 eventos o fórmula de Silvester:
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
(g) Teorema de adición para 3 eventos o fórmula de Silvester:
P (A∪B ∪C) = P (A)+P (B)+P (C)−P (A∩B)−P (A∩C)−P (B ∩C)+P (A∩B ∩C)
La demostración del teorema anterior no está dentro del propósito de este libro.
Ejemplo 2.3.3 Sean A, B y C eventos tales que P (A) = 0, 50, P (B) = 0, 26, P (C) = 0, 55,
P (A ∩ B) = 0, 15, P (A ∩ C) = 0, 25, P (B ∩ C) = 0, 15 y P (A ∩ B ∩ C) = 0, 05. Calcule las
siguientes probabilidades: (a) P (A ∪ B), (b) P (A ∩ C), (c) P (A ∪ C) y (d) P (A ∪ B ∪ C).

SOLUCIÓN:
(a) Teniendo en cuenta el teorema de adición para 2 eventos (véase la parte (f) del teorema 2.3.2),
se tiene que
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 0, 50 + 0, 26 − 0, 15 = 0, 61
(b) Teniendo en cuenta el teorema 2.3.2(e), se obtiene que
P (A ∩ C) = P (A) − P (A ∩ C) = 0, 50 − 0, 25 = 0, 25
(c) Teniendo en cuenta la parte (c) del teorema 2.3.2, las leyes de de Morgan (compárese con el
teorema 2.1.14(i)) y la parte (b) de este ejercicio, se tiene
P (A ∪ C) = 1 − P (A ∪ C) = 1 − P (A ∩ C) = 1 − 0, 25 = 0, 75
(d) Teniendo en cuenta el teorema de adición para 3 eventos (véase la parte (g) del teorema 2.3.2),
se tiene que
P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C)

= 0, 50 + 0, 26 + 0, 55 − 0, 15 − 0, 25 − 0, 15 + 0, 05
= 0, 81
Alternativamente, las respuestas encontradas en los ejercicios (a)-(d) pueden ser obtenidas con
ayuda de las probabilidades que aparecen en el siguiente diagrama de Venn:
Figura 2.10: Diagrama de Venn para el ejemplo 2.3.3
2.3.2 Probabilidad empı́rica
Este concepto esá basado en el llamado método de la frecuencia relativa, el cual

utiliza datos que se han observado empı́ricamente, registra la frecuencia con que ha ocurrido

algún evento en el pasado y estima la probabilidad de que el evento ocurra nuevamente con
base en estos datos históricos. En este método juega papel fundamental el concepto de
frecuencia relativa para estimar las probabilidades.
Definición 2.3.4 Supongamos que un experimento aleatorio se repite n veces y que un

evento A asociado con estas n repeticiones ocurre exactamente k veces. Entonces, la fre-
cuencia relativa del evento A es fn = nk .
Si continuamos calculando esta frecuencia relativa para cada cierto número de ensayos, a
medida que aumentamos n, las frecuencias relativas correspondientes serán más estables,
es decir, tienden a ser casi las mismas. En este caso, decimos que el experimento muestra
regularidad estadı́stica o estabilidad en las frecuencias relativas. Esto se ilustra en los
siguientes dos ejemplos:
Ejemplo 2.3.5 Considere la tabla 2.1, en donde se muestran datos tomados al lanzar una moneda
1.000 veces. En un total de 1.000 lanzamientos, 508 veces la moneda mostró cara, es decir, la
frecuencia relativa es aproximadamente 0,5, que es la probabilidad de obtener una cara.
Tabla 2.1: Lanzamiento de una moneda 1.000 veces

Frecuencia
Número de Número Frecuencia Frecuencia acumulada
lanzamientos de caras relativa acumulada relativa
1 - 100 52 0,52 52 0,520
101 - 200 53 0,53 105 0,525
201 - 300 52 0,52 157 0,523
301 - 400 47 0,47 204 0,510
401 - 500 51 0,51 255 0,510
501 - 600 53 0,53 308 0,513
601 - 700 48 0,48 356 0,509
701 - 800 46 0,46 402 0,503
801 - 900 52 0,52 454 0,504
901 - 1.000 54 0,54 508 0,508

Total: 1.000 508 0,508
Ejemplo 2.3.6 La tabla 2.2 muestra experimentos hechos por tres investigadores. Obsérvese que
en cada una de las investigaciones, la frecuencia relativa del número de caras es aproximadamente
0,5, que es la probabilidad de obtener una cara.
En la gran mayorı́a de los experimentos aleatorios de importancia práctica éstos tienen

estabilidad. Por esto podemos sospechar que prácticamente será cierto que la frecuencia

Tabla 2.2: Lanzamientos de una moneda realizados por 3 investigadores

Hecho Número de Número Frec. rel.
por lanzamientos de caras de caras
Buffon 4.040 2.048 0,5069
K. Pearson 12.000 6.019 0,5016
K. Pearson 24.000 12.012 0,5005
relativa de un evento A en un gran número de experimentos es aproximadamente igual a

un determinado número P (A), o sea, la probabilidad del evento es P (A) = lim nk , como
n→∞
podemos verificar con ayuda de los ejemplos 2.3.5 y 2.3.6, siendo A en estos dos ejemplos
el evento “obtener una cara”. Todo lo anterior se puede resumir en la siguiente definición:
Definición 2.3.7 (Definición empı́rica de probabilidad) Supongamos que se ha reali-

zado un experimento aleatorio. Sea A un evento asociado a él. Entonces, la probabilidad
P (A) es aproximadamente igual a la frecuencia relativa de A si efectuamos el experimento
muchas veces.
Cuando se usa la definición empı́rica, es importante tener en cuenta los siguientes aspectos:
• La probabilidad obtenida de esta manera es únicamente una estimación del valor real.
• Cuanto mayor sea el número de experimentos, tanto mejor será la estimación de la

probabilidad, es decir, a mayor número de experimentos mejor será la estimación.
• La validez de emplear esta definición depende de que los experimentos se hayan

repetido siempre bajo las mismas condiciones.
2.3.3 Definición clásica de “probabilidad”

Probabilidad clásica
Se pueden encontrar diversos ejemplos en los que se asocian la misma probabilidad a cada
evento elemental. En este caso se habla de un experimento laplaciano o clásico, es
decir, un experimento que tiene finitos resultados, que suceden con la misma probabilidad.
A este tipo de experimentos pertenecen algunos juegos de azar, como por ejemplo, dados,
juegos de cartas, ruletas; también modelos de la fı́sica, en los cuales se puede describir la
distribución de una partı́cula cualquiera, o modelos de la génetica.

Definición 2.3.8 (Probabilidad de un evento elemental) Sea Ω = ∅ un espacio

muestral finito. Si ω es un evento elemental de Ω, entonces la probabilidad de que suceda
ω, en sı́mbolos P (ω), es igual a 1 dividido por el número de elementos que tiene Ω. Es
decir,
1
P (ω) = (2.1)
Número de elementos de Ω
Ejemplo 2.3.9 (a) Consideremos el experimento de lanzar una moneda. Entonces, Ω =

{C, S}. Es decir, la probabilidad de obtener cara, simbolizado por P (C), y la de obtener
sello, simbolizado por P (S), está dado por P (C) = P (S) = 12 = 0, 5. Estas probabilidades
las interpretamos de la siguiente manera: En un gran número de lanzamientos aparecerá
una cara aproximadamente en la mitad de los lanzamientos y sello en la otra mitad. O
también podemos decir: si la moneda se lanza repetidamente, entonces el 50% (que resulta
de multiplicar 0,5 por 100) de las veces resultará cara y en el otro 50%, sello.
(b) Consideremos el experimento de lanzar un dado. Entonces, Ω = {1, 2, 3, 4, 5, 6}. Es decir,

1
P (1) = P (2) = P (3) = P (4) = P (5) = P (6) = ≈ 0, 166 . . . ,
6
Aquı́, el sı́mbolo “≈” significa “aproximadamente igual a” y, por ejemplo, P (1) = 0, 166 se
lee: “la probabilidad de obtener un 1 es 0,166”, la cual se interpreta de la siguiente manera:
De cada 1.000 lanzamientos de un dado, el número 1 aparecerá 166 veces aproximadamente.
O también ası́: si el número de lanzamientos de un dado es grande, entonces en el 16,6%
(que resulta de multiplicar 0,166 por 100) aparecerá el número 1 del dado. Las otras
probabilidades las interpretamos análogamente.
A menudo es necesario asignar probabilidades a eventos de un espacio muestral. Por eso,

es importante el siguiente teorema:
Teorema 2.3.10 (Probabilidad de un evento) Sea Ω = ∅ un espacio muestral finito y

supongamos que todos los eventos elementales suceden con la misma probabilidad, es decir,
la expresión ( 2.1) se cumple para cada evento elemental ω de Ω. Entonces, para cada evento
A de Ω tenemos:
Número de elementos de A
P (A) = (2.2)
Número de elementos de Ω
Ejemplo 2.3.11 Dos dados no falsos se lanzan. Halle la probabilidad de (a) que la suma de los
números sea un 7, (b) que la suma sea por lo menos un 11, (c) que la suma sea a lo más un 2, (d)
obtener un doble, (e) no obtener doble.

SOLUCIÓN:
Como ya vimos en el ejemplo 2.2.1, el espacio muestral correspondiente Ω contiene 36 resultados.
Además, cada uno de ellos ocurre con la misma probabilidad.
(a) Sea A el evento de obtener un 7 al lanzar los dos dados. Entonces, A es el conjunto

A = (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)
O sea que A tiene 6 elementos. Por consiguiente, aplicando (2.2) se obtiene que la proba-
bilidad de obtener un 7 es:
6 1
P (A) = = ≈ 0, 166
36 6
Aquı́, el sı́mbolo “≈” significa “aproximadamente igual a”.
(b) Sea B el evento de obtener por lo menos un 11, es decir, B es el evento de obtener una suma
mayor o igual que 11. Debido a que

B = (5, 6), (6, 5), (6, 6)
entonces
3 1
P (B) = = ≈ 0, 0833
36 12
(c) Sea C el evento de obtener a lo más un 2 o, lo que es equivalente, de obtener una suma

menor o igual que 2. En este caso, C = (1, 1) y, con ello,
1
P (C) = ≈ 0, 027
36
(d) Sea D el evento de obtener un doble. Es decir,

D = (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)
Por lo tanto,
6
P (D) = ≈ 0, 166
36
(e) Sea E el evento de obtener ningún doble. Observe: D es el complemento de E, es decir,
D = E. Por lo tanto, P (E) = P (D). Entonces,
P (E) = 1 − P (E) = 1 − P (D) ≈ 1 − 0, 166 = 0, 834
Ejemplo 2.3.12 Una organización de caridad vende 1.000 billetes de loterı́a. Hay diez primeros
premios y cien premios de consolación, todos los cuales deben ser distribuidos. El proceso de
selección de los ganadores es tal que, al principio, cada boleto tiene las mismas posibilidades
de ganar un primer premio y cada uno tiene las mismas posibilidades de ganar un premio de
consolación. Ningún boleto puede ganar más de un premio.
(a) ¿Cuál es la probabilidad de ganar un premio con un único boleto?

(b) ¿Cuál es la probabilidad de ganar un premio de consolación?
(c) ¿Cuál es la probabilidad de ganar algún premio?
SOLUCIÓN:
(a) De entre los 1.000 billetes, 10 ganarán primeros premios, 100 ganarán premios de consolación y
890 no ganarán premio alguno. Nuestro único billete puede ser considerado como uno elegido
entre los 1.000. Sea A el suceso “el billete elegido gana un primer premio”. Dado que son
1.000 resultados igualmente probables, 10 de los cuales corresponden al suceso A, tenemos
que
10
P (A) = = 0, 01
1.000
(b) De modo similar, para el suceso B, “el billete elegido gana un premio de consolación”, se
deduce que
100
P (B) = = 0, 10
1.000
(c) Ahora bien, el suceso “el billete gana algún premio” es sencillamente la unión de los sucesos A
y B. Además, dado que sólo se permite un premio por billete, estos sucesos son mutuamente
excluyentes. Por tanto, la probabilidad requerida es:
P (A ∪ B) = P (A) + P (B) = 0, 01 + 0, 10 = 0, 11
Ejemplo 2.3.13 En la primera época del desarrollo de un yacimiento de petróleo, una empresa
estimó en 0,1 la probabilidad de que las reservas económicamente recuperables excedieran los 2.000
millones de barriles. La probabilidad de que las reservas excediesen los 1.000 millones de barriles
se estimó en 0,5. Dada esta información, ¿cuál es la probabilidad estimada de que las reservas se
encuentren entre 1.000 y 2.000 millones de barriles?
SOLUCIÓN:
Sea A el evento “las reservas exceden los 2.000 millones de barriles” y B el evento “las reservas se
encuentran entre 1.000 y 2.000 millones de barriles”. Estos eventos son mutuamente excluyentes
y su unión, A ∪ B, es el evento “las reservas exceden los 1.000 millones de barriles”. Por tanto,
tenemos que
P (A) = 0, 1 y P (A ∪ B) = 0, 5
Figura 2.11: Diagrama para las probabilidades del ejemplo 2.3.13
Entonces, dado que A y B son mutuamente excluyentes, se obtiene que (compárese con la
figura 2.11)
P (B) = P (A ∪ B) − P (A) = 0, 5 − 0, 1 = 0, 4

Cálculo de probabilidades utilizando técnicas de conteo
Una dificultad práctica que aparece a veces al calcular la probabilidad de un suceso es la

de contar el número de resultados básicos en el espacio muestral y en el evento de interés.
Los siguientes ejemplos ilustran cómo se pueden utilizar las técnicas de conteo, explicadas
en la sección anterior, para calcular probabilidades de eventos.
Ejemplo 2.3.14 Un estante tiene 6 libros de matemáticas y 4 de fı́sica. Halle la probabilidad de

que 3 libros determinados de matemáticas estén juntos, si
(a) todos los libros de matemáticas son diferentes y los libros de fı́sica también;
(b) todos los libros de matemáticas son diferentes y todos los libros de fı́sica son iguales;
(c) todos los libros de matemáticas son diferentes y 3 de los libros de fı́sica iguales.
Compare las tres respuestas y dé una conclusión general.
SOLUCIÓN:
Sean Ω el espacio muestral correspondiente y A el evento “3 libros determinados de matemáticas
están juntos”. Nos piden calcular P (A).
(a) En este caso, los elementos de Ω son las distintas permutaciones de los 6 + 4 = 10 libros. Por
el teorema 2.2.23, los 10 libros pueden ordenarse entre sı́ de 10! formas. Es decir, Ω tiene en
total 10! elementos.
Ahora, supongamos que los 3 libros determinados de matemáticas se reemplazan por 1. Ası́,
tenemos en total de 8 libros que pueden ordenarse entre sı́ de 8! formas. Como los tres libros
se pueden ordenar entre sı́ de 3! formas, entonces hay 8! 3! formas de ordenar los 10 libros,
con la condición de que 3 libros determinados estén juntos.
Por lo tanto, por la expresión (2.2), tenemos que
Número de elementos de A 8! 3!
P (A) = = ≈ 0, 0666
Número de elementos de Ω 10!
(b) En este caso, por el teorema 2.2.41, Ω tiene en total 10! 4! = 151.200 elementos. Supongamos
que los 3 libros determinados de matemáticas se reemplazan por 1. Ası́, tenemos en total de
8 libros que, por el teorema 2.2.41, pueden ordenarse entre sı́ de 8!
4! = 1.680 formas. Como los
tres libros se pueden ordenar entre sı́ de 3! = 6 formas, entonces hay 1.680 · 6 = 10.080 formas
de ordenar los 10 libros, con la condición de que 3 libros determinados de matemáticas estén
juntos y sabiendo que los de fı́sica son todos iguales. Con lo anterior,
Número de elementos de A 10.080

P (A) = = ≈ 0, 0666
Número de elementos de Ω 151.200

(c) En este caso, por el teorema 2.2.41, Ω tiene en total 10! 3! = 604.800 elementos. Supongamos
que los 3 libros determinados de matemáticas se reemplazan por 1. Ası́, tenemos en total de
8 libros que, por el teorema 2.2.41, pueden ordenarse entre sı́ de 8!
3! = 6.720 formas. Como los
tres libros se pueden ordenar entre sı́ de 3! = 6 formas, entonces hay 6.720 · 6 = 40.320 formas
de ordenar los 10 libros, con la condición de que 3 libros determinados de matemáticas estén
juntos y sabiendo que hay 3 fı́sica que son iguales. Por consiguiente,
Número de elementos de A 40.320

P (A) = = ≈ 0, 0666
Con respecto a los resultados obtenidos podemos concluir que si todos los libros de matemáticas
son diferentes, entonces sin importar si los de fı́sica son iguales o no, la probabilidad de que 3
libros determinados de matemáticas estén juntos es aproximadamente 0,0666.
Ejemplo 2.3.15 Un director de personal tiene ocho candidatos para cubrir cuatro puestos. De
éstos, cinco son hombres y tres mujeres. Si, de hecho, toda combinación de candidatos tiene las
mismas probabilidades de ser elegido, ¿cuál es la probabilidad de que ninguna mujer sea con-
tratada?
SOLUCIÓN:
Primero, el número total de combinaciones posibles de los ocho candidatos tomadas de cuatro en

cuatro es 84 = 70. Ahora bien, para que ninguna mujer sea contratada, los candidatos selecciona-

dos han de ser cuatro de los cincos hombres. El número de tales combinaciones es 54 = 5. Por
tanto, si al principio cada una de las 70 combinaciones posibles fuese igualmente probable, la pro-
babilidad de escoger una de las cinco combinaciones que incluyen sólo hombres es 5/70 = 0, 071.

Ejemplo 2.3.16 Una caja de doce lapiceros tiene dos defectuosos. Se extraen tres lapiceros sin
reemplazo. ¿Cuál es la probabilidad de que dos salgan defectuosos?
SOLUCIÓN:
Sean Ω el espacio muestral correspondiente y A el evento “de los tres lapiceros seleccionados,

dos están defectuosos”. Entonces, el número de elementos que tiene Ω será 12 = 220 y el
102 3
número de elementos que tiene A es 1 2 = 10. Por consiguiente, la probabilidad pedida es
10
P (A) = 220 = 0, 045.
Ejemplo 2.3.17 Una caja contiene 8 fichas rojas, 3 blancas y 9 azules. Si se extraen 3 fichas sin
reemplazo y sin orden, determinar la probabilidad de que (a) las 3 fichas sean blancas, (b) 2 sean
rojas y 1 blanca, (c) al menos 1 sea blanca y (d) se extraiga una de cada color.
SOLUCIÓN:
Sea Ω el espacio muestral correspondiente a esta situación. En este caso, sus elementos son las
distintas combinaciones de 8 + 3 + 9 = 20 fichas tomadas de 3 en 3 (ya que se sacan cada vez 3
fichas sin reemplazo). Por el teorema 2.2.50, las 3 fichas se pueden escoger, de un total de 20, de
20
3 = 1.140 formas. Es decir, Ω tiene en total 1.140 elementos.

3
(a) Sea A el evento “sacar 3 fichas de 3 blancas”. O sea, A tiene 3 = 1 elemento. Entonces,
Número de elementos de A 1
P (A) = = = 0, 000877
(b) Sea A el evento “las 3 fichas sacadas son 2 rojas y 1 blanca”. Ahora, 2 fichas, de un total

de 8 rojas, se pueden seleccionar de 82 = 28 maneras, y 1 ficha, de un total de 3 blancas,

se puede seleccionar de 31 = 3 maneras. Por lo tanto, A tiene 82 31 = 84 elementos.
Entonces,
P (A) = = = 0, 074
(c) Sea A el evento “por lo menos 1 de las 3 fichas sacadas es blanca”. Esto quiere decir que A,
el complemento de A, es el evento “de las tres bolas ninguna es blanca”. Ahora, si ninguna
es blanca, entonces 3 fichas, de un total de 8 + 9 = 17 (entre rojas y azules), se pueden

seleccionar de 17
3 = 680 maneras. Por lo tanto, A tiene 680 elementos. Entonces,

P (A) = = = 0, 596
Por consiguiente, con lo anterior, la probabilidad pedida está dada por
P (A) = 1 − P (A) = 1 − 0, 596 = 0, 404
(d) Sea A el evento “las 3 fichas sacadas son una de cada color”. Ahora, 1 ficha, de un total de

8 rojas, se puede seleccionar de 81 = 8 maneras, 1 ficha, de un total de 3 blancas, se puede
3
seleccionar de 1 = 3 maneras, y 1 ficha, de un total de 9 azules, se puede seleccionar de
9 839
1 = 9 maneras. Por lo tanto, A tiene 1 1 1 = 216 elementos. Entonces,

P (A) = = = 0, 189
2.3.4 Probabilidad subjetiva o personal
Existen muchos eventos de interés cuyas probabilidades de ocurrencia no las podemos cal-
cular de acuerdo con los métodos axiomático, clásico y de frecuencia relativa (empı́rica),
sino que se basan en el “grado de creencia” acerca de que tenga o no lugar un determinado
hecho como, por ejemplo,
• exista vida en algún planeta distante,
• en los póximos diez años se descubra algún remedio contra el cáncer,
• determinada persona se vaya a destacar en la universidad,
• una persona se enferme,
• una determinada máquina se dañe.

Sin embargo, poca gente se muestra renuente a concederles probabilidades a los eventos
anteriores. Inclusive, con mucha frecuencia oı́mos decir que hay un 20% de posibilidades
de que llueva mañana, que el Junior gane, etc. Aquella probabilidad que nos permite asig-
narles probabilidades a eventos tales como éstos se denomina probabilidad subjetiva.
Definición 2.3.18 La probabilidad subjetiva o personal se puede definir como

la probabilidad que expresa un grado de creencia individual sobre la posibilidad de que
un evento ocurra. Al método de asignar estas probabilidades se le conoce como método
subjetivo.
La asignación de la probabilidad subjetiva a un evento dado no depende del tratamiento matemático ni de

la noción de experimentos repetibles.
La magnitud de la probabilidad que una persona asigna subjetivamente a un evento depende

del grado de crédito que le dé a la ocurrencia del evento. Esa es la razón por la que es
posible asignarles probabilidades a eventos que sólo se presentan una vez, como por ejemplo,
el evento de ganar una determinada competencia atlética. A diferencia del método de
probabilidad de frecuencia relativa, la probabilidad subjetiva no depende de la posibilidad
de repetición de un experimento.
Ejemplo 2.3.19 (a) Si afirmamos que la probabilidad de que salga cara al lanzar una moneda
es 1/2, lo que tenemos en mente es que la moneda no parece estar trucada y que resultará
igualmente probable que salga cara o cruz. Al enunciar esta probabilidad subjetiva, no esta-
mos pensando necesariamente en términos de la experimentación repetida, sino que estamos
interesado por un único lanzamiento de la moneda. Nuestra evaluación de la probabilidad
subjetiva implica que considerarı́amos justa una apuesta que consistiese en pagar 5.000 pesos
si saliera cruz y recibir 5.000 pesos si saliera cara. Si fueramos a recibir más de 5.000 pesos si
del lanzamiento resultase una cara, considerarı́amos favorable la apuesta.
(b) De modo similar, si creemos que la probabilidad de que un caballo gane una determinada
carrera es 0,4, estamos dando nuestra opinión personal de que existe una posibilidad de 40
entre 100 de que gane. Dada esta creencia, considerarı́amos justa una apuesta en la que
perdiésemos dos dólares si el caballo no ganase y tres dólares en caso contrario.
Debemos insistir en que las probabilidades subjetivas son personales; no se requiere que
diferentes individuos consideren que el mismo evento debe tener lugar con las mismas
probabilidades, como se explica a través de las situaciones del siguiente ejemplo:
Ejemplo 2.3.20 (a) En el ejemplo del lanzamiento de una moneda, la mayorı́a de la gente lle-
garı́a a la conclusión de que la probabilidad apropiada para el resultado “cara” es 1/2. Sin
embargo, un individuo con más información sobre la moneda en cuestión podrı́a creer otra
cosa.

(b) En el ejemplo de las carreras de caballos, es probable que dos apostadores cuenten con diferen-
tes probabilidades subjetivas. Por ejemplo, pueden no tener la misma información, e incluso
aunque la tuvieran, podrı́an interpretarla de distinta forma.
(c) Es obvio que los inversionistas individuales no cuentan con las mismas opiniones sobre el
probable futuro comportamiento de la bolsa. Sus probabilidades subjetivas deben ser vistas
como dependientes del conocimiento que tienen y su manera de interpretarlo.
Ya hemos explicado que, en el caso de apuestas, como carreras de caballos y pronósticos

deportivos, a menudo se determina la probabilidad de ocurrencia de un evento usando pro-
babilidad subjetiva y se establece comúnmente en términos de oportunidades.
Definición 2.3.21 Sea A cualquier evento. Las oportunidades a favor de A se defi-

nen como la razón PP (A)
(A)
y las oportunidades en contra de A como
1 P (A)
Oportunidades en contra de A = =
Oportunidades a favor de A P (A)
n
Si las oportunidades en favor de A son iguales a m , entonces diremos que las oportunidades
son de n a m (lo cual escribiremos n : m) a favor de A.
Obsérvese que las oportunidades en contra de A son precisamente las oportunidades a favor de
A.
Ejemplo 2.3.22 Supongamos que la probabilidad de que un boxeador favorito gane una pelea
es 1/3. ¿Cuáles son las oportunidades a favor de ganar?
SOLUCIÓN:
Sea A el evento “el boxeador gana”. Entonces, las oportunidades a favor de ganar son:
P (A) 1/3 1
= =
P (A) 2/3 2
Es decir, las oportunidades son de 1 : 2 a favor de que el boxeador gane la pelea. Esto significa
que de cada 1 + 2 = 3 personas, 1 afirma que el boxeador ganará la pelea, y 2, que perderá.
El siguiente teorema nos muestra una forma de calcular la probabilidad de un evento dado
con base en el conocimiento de las oportunidades en favor o en contra del evento:
Teorema 2.3.23 Si las oportunidades son de n : m en favor de A, entonces la probabilidad

n
de que ocurra el eventa A es P (A) = n+m .

Ejemplo 2.3.24 Si las oportunidades son de 5:3 en contra de que la Selección Colombia pierda
el partido de fútbol, ¿cuál es la probabilidad de que (a) pierda, (b) gane?
SOLUCIÓN:
Sea A el evento de que la Selección Colombia pierda el partido. Por tanto, por el teorema 2.3.23,
P (A) = 5+3 5
= 58 = 0, 625. Por consiguiente, P (A) = 1 − P (A) = 38 = 0, 375. Es decir, de 1.000
personas, 625 dirán que Colombia perderá el partido y el resto, que son 375, dirá que Colombia
lo ganará.
Ejemplo 2.3.25 Para un partido entre Junior de Barranquilla y Unión de Santa Marta, le ofrecen
a Mario las siguientes apuestas:
Tarifa : $15.000.
Ganancia : $30.000 si Junior gana y Mario apuesta por Junior.
$20.000 si Unión gana y Mario apuesta por Unión.
El juego Junior vs Unión sigue hasta que haya un ganador. Mario acepta esta apuesta, pero no
puede decidirse si apuesta a Junior o a Unión. Determine su probabilidad subjetiva.
SOLUCIÓN:
La probabilidad subjetiva de Mario la determinamos como sigue: “Mario no puede decidirse”
significa que
30 P (“Junior gana”) = 20 P (“Unión gana”).
Además, obviamente, se tiene que
P (“Junior gana”) + P (“Unión gana”) = P (“Junior o Unión gana”) = 1.
Por lo tanto, resulta que P (“Junior gana”) = 2

5 y P (“Unión gana”) = 35 .

39. La probabilidad de que Alfonso viaje a Alemania es 0,6, y la probabilidad de que viaje a
España es 0,3, y la probabilidad de que viaje a alguno de las dos paı́ses es 0,8. Calcule la
probabilidad de cada uno de los siguientes eventos:
(a) Alfonso viaja a ambos paı́ses.

(b) Alfonso viaja a Alemania pero no a España.
(c) Alfonso viaja a España pero no a Alemania.
(d) Alfonso no viaja a ninguno de los dos paı́ses.
40. Se estimó que un 28% de los estudiantes de último curso de un campus universitario estaban
seriamente preocupados por sus posibilidades de encontrar trabajo, el 35% por sus notas y
el 20% por ambas cosas. ¿Cuál es la probabilidad de que un estudiante de último curso,
elegido al azar en el campus, esté seriamente preocupado por al menos una de las dos cosas?

41. Un jefe de cierta compañı́a recibe un determinado artı́culo en paquetes de 100. Un estudio ha
indicado las probabilidades, que figuran en la tabla adjunta, correspondientes a los artı́culos
defectuosos de un paquete:
Número de defectuosas 0 1 2 3 más de 3

Probabilidad 0,03 0,29 0,10 0,22 0,36
(a) ¿Cuál es la probabilidad de que haya dos o más artı́culos defectuosos en un paquete?
(b) ¿Cuál es la probabilidad de que haya por lo menos un artı́culo defectuoso en un paquete?
42. Si los cumpleaños ocurren con la misma probabilidad en cualquiera de los 365 dı́as del año
(se ignoran años bisiestos y el hecho de que las tasas de natalidad no son uniformes durante
el año).
(a) Calcule la probabilidad de que no haya dos personas, en un grupo de 3 personas, con
el mismo dı́a de cumpleaños?
(b) Calcule la misma probabilidad de la parte (a) para el caso en que haya n personas en
vez de 3.
43. Si tres de veinte llantas están defectuosas y se seleccionan cuatro de éstas al azar para una
supervisión, ¿cuál es la probabilidad de que se incluya una de las llantas defectuosas?
44. Un dado se lanza dos veces. Encuentre la probabilidad de obtener (a) un 5 o un 7, (b) a lo
más un 9, (c) una suma impar y (d) un múltiplo de 4.
45. Una urna tiene seis bolas verdes, cinco rojas y cuatro blancas (cada bola es de un solo
color). Si se extrae una bola, calcule la probabilidad de que ésta sea (a) no verde, (b) no
roja, (c) roja y verde, (d) blanca o roja. Compare el resultado de (d) con el obtenido en
(a). Interprete siempre sus respuestas.
46. Se lanzan dos dados. Calcule la probabilidad de que la suma de los números obtenidos sea
(a) 13, (b) a lo sumo 3, (c) por lo menos 4, (d) 5 o 6, (e) 5 y 6. Interprete siempre sus
resultados.
47. Una caja contiene dos bolas negras, tres blancas y cuatro rojas. Se seleccionan dos bolas,
una después de la otra.
(a) ¿Cuál es la probabilidad de que la primera bola sea negra y la segunda blanca?
(b) ¿Cuál es la probabilidad de obtener una bola negra y una blanca?
(c) Repita los incisos anteriores si la selección es con reemplazo.
48. En una comunidad, el 30% de las personas son fumadoras, 55% son bebedoras y 20% tanto
fumadoras como bebedoras. Calcule la probabilidad de que una persona elegida al azar
(a) fume pero no beba, (b) ni fume ni beba, (c) fume o no beba. Interprete siempre sus
resultados.

49. Una entidad educativa ha propuesto tres proyectos para la mejora de la educación en cierta
región del paı́s. Para i = 1, 2, 3, sea Ai el evento que representa al evento “el proyecto i fue
aceptado”. Supongamos que
P (A1 ) = 0, 30, P (A2 ) = 0, 22, P (A3 ) = 0, 35, P (A1 ∩ A2 ) = 0, 08,

P (A1 ∩ A3 ) = 0, 09, P (A2 ∩ A3 ) = 0, 06, P (A1 ∩ A2 ∩ A3 ) = 0, 02
Exprese verbalmente cada uno de los siguientes eventos y determine la probabilidad de que
ocurra cada uno de ellos:
(a) A1 ∪ A2 , (b) A1 ∩ A2 , (c) A1 ∪ A2 ∪ A3 ,

(d) A1 ∩ A2 ∩ A3 , (e) A1 ∩ A2 ∩ A3 , (f) (A1 ∩ A2 ) ∪ A3
50. Una caja contiene diez bombillas, cuatro de las cuales están defectuosas. Si se seleccionan
aleatoriamente y sin reemplazo cuatro bombillas de la caja, ¿cuál es la probabilidad de que
el grupo contenga (a) dos (b) al menos dos bombillas defectuosas?
51. Una caja contiene cuatro focos rojos, cinco blancos y seis amarillos. Si se seleccionan uno
por uno, en orden aleatorio, ¿cuál es la probabilidad de que al menos se seleccionen dos
focos para obtener uno amarillo?
52. Una caja contiene diez tornillos, de los cuales tres están defectuosos. Se extraen tres tornillos
sin reemplazo. Calcule la probabilidad de que los tres tornillos no estén defectuosos.
53. Para un control de calidad se seleccionan aleatoriamente dos ventiladores, sin reemplazo,
de un lote. Si uno de los dos ventiladores está defectuoso, todo el lote será rechazado. Si
una muestra de 200 ventiladores tiene cinco defectuosos, calcule la probabilidad de que la
muestra sea rechazada.
54. Una biblioteca tiene cinco ejemplares (digamos, matemática, fı́sica, quı́mica, biologı́a y
estadı́stica), de los cuales hay dos ejemplares (digamos, matemática y fı́sica) que son de
primera edición, y el resto, de segunda edición. Serán seleccionados al azar dos ejemplares
para ser puestos en reserva durante 3 horas. ¿Cuál es la probabilidad de que
(a) ambos ejemplares seleccionados sean primeras ediciones?

(b) ambos ejemplares seleccionados sean segundas ediciones?
(c) al menos uno de los ejemplares seleccionados sea de primera edición?

(d) los ejemplares seleccionados sean de diferentes ediciones?
55. Se escoge un número comprendido entre 0 y 999. ¿Cuál es la probabilidad de que el dı́gito
central sea mayor que los otros dos?
56. En el menú del dı́a, un restaurante vegetariano ofrece una ensalada especial que contiene
tres tipos de verduras distintas que son las preferidas por ciertos habitantes de una ciudad:
Espárrago (A), brócoli (B) y coliflor (C). A continuación aparece el porcentaje de clientes
del restaurante que pide determinada(s) verdura(s):

70% A, 80% B, 75% C, 85% A o B,

90% A o C, 95% B o C, 98% A, B o C
en donde, por ejemplo, el evento A o C significa que por lo menos una de las opciones A o
C fue solicitada. Calcule las probabilidades de los siguientes eventos:
(a) El siguiente cliente pide, por lo menos, una de las tres opciones.
(b) El siguiente cliente no pide ninguna de las tres opciones.
(c) El siguiente comprador sólo pide la opción A y ninguna de las otras dos opciones.
(d) El siguiente cliente pide exactamente una de las tres opciones.
57. Supongamos que un determinado árbol puede tener tres tipos de enfermedades: Hojitis (H),
tallitis (T) y frutitis (F). Suponga que
P (H) = 0, 12, P (T ) = 0, 07, P (F ) = 0, 05, P (H ∪ T ) = 0, 15,

P (H ∪ F ) = 0, 14, P (T ∪ F ) = 0, 10, P (H ∩ T ∩ F ) = 0, 01
(a) ¿Cuál es la probabilidad de que el árbol no tenga hojitis?

(b) ¿Cuál es la probabilidad de que el árbol tenga hojitis y tallitis al mismo tiempo?
(c) ¿Cuál es la probabilidad de que el árbol tenga hojitis y tallitis al mismo tiempo pero
no frutitis?
(d) ¿Cuál es la probabilidad de que que el árbol tenga exactamente dos de esas enfer-
medades?
58. Una persona desea comprar un computador. De alguna manera, logra conseguir una lista
de las direcciones de 15 personas que quieren vender sus computadores. Pero la persona
tiene tiempo para ir sólo a cuatro direcciones de la lista.
(a) ¿En cuántas formas podrı́an escogerse las cuatro direcciones si se considera el orden de
visita?
(b) ¿En cuántas formas podrı́an escogerse las cuatro direcciones si el orden no importa?
(c) Si en siete direcciones los computadores son nuevos y en ocho ya han sido vendidos
previamente, y las cuatro direcciones por visitar se escogen al azar y sin orden, ¿cuál es
la probabilidad de que en las cuatro direcciones donde vaya la persona los computadores
sean nuevos?
59. Al poco tiempo de ponerse a funcionar, algunos computadores fabricados por ciertas compañı́as
presentan problemas con el funcionamiento de un determinado programa (digamos, Futbol-
net) que viene previamente instalado. Suponga que una pequeña empresa tiene 30 de estos
computadores y que ha habido problemas con el funcionamiento del Futbolnet en 7 de ellos.
(a) ¿Cuántas formas hay de seleccionar una muestra de 10 computadores de los 30 para
una revisión completa?

(b) ¿En cuántas formas puede una muestra de 10 computadores contener exactamente 3
con problemas en el funcionamiento del Futbolnet?
(c) Si se escoge al azar una muestra de 10 computadores, ¿cuál es la probabilidad de que
exactamente 3 de los 10 tengan problemas con el funcionamiento del Futbolnet?
(d) Si se escoge al azar una muestra de 10 computadores, ¿cuál es la probabilidad de que
al menos 6 de los seleccionados tengan problemas con el funcionamiento del Futbolnet?
60. En cierta bodega, una caja contiene ocho clavos de 1 pulgada, seis de 1 pulgada y media y
cinco de 2 pulgadas. Suponga que se seleccionan cuatro clavos al azar, sin reemplazo y sin
orden.
(a) ¿Cuál es la probabilidad de que exactamente tres de los clavos seleccionados sean de 2
pulgadas?
(b) ¿Cuál es la probabilidad de que los cuatro clavos seleccionados sean del mismo tamaño?
(c) ¿Cuál es la probabilidad de que entre los cuatro clavos seleccionados hallan dos de una
pulgada?
61. Un estante tiene 4 libros de quı́mica, 5 de estadı́stica y 3 de matemáticas. Si los libros de

estadı́stica son diferentes entre sı́, encuentre la probabilidad de que 2 libros determinados
de estadı́stica se encuentre juntos teniendo en cuenta cada una de las siguientes situaciones:
(a) Los libros de cada tipo son todos diferentes entre sı́.
(b) Los libros de quı́mica son iguales entre sı́, pero los de matemáticas son todos diferentes.
(c) Hay 2 libros de quı́mica que son iguales, pero todos los de matemáticas son iguales entre
sı́.
(d) A excepción de los de estadı́stica, los libros de cada tipo son todos iguales entre sı́.
2.4 Probabilidades condicionales

Supongamos que estamos interesados en dos sucesos A y B, y se nos da la información
adicional de que B ha ocurrido. Una pregunta de interés es, entonces ¿cuál es la probabilidad
de que A ocurra? La idea principal es que la posibilidad de que cualquier suceso ocurra es
probable que dependa de la ocurrencia o no ocurrencia de otros eventos.
Ejemplo 2.4.1 Analizemos las siguientes situaciones:
(a) Un fabricante que planea introducir una nueva marca puede poner a prueba el producto a
través de su venta en una serie reducida de almacenes particularmente escogidos. Es probable
que el fabricante confı́e mucho más en el éxito de la nueva marca en el mercado si el producto
resulta bien acogido en el test inicial que en caso contrario. El análisis de la empresa corres-
pondiente a la probabilidad de un elevado número de ventas estará, por tanto, condicionada
por el resultado de mercado.

(b) En un barrio hay personas que saben nadar, otras que saben manejar bicicletas, y otras,
ambas cosas. Se selecciona una persona al azar y deseamos la probabilidad de que la persona
sepa nadar dado que sabe manejar bicicleta.
Por tanto, en ambas situaciones tenemos que estar interesados en la ocurrencia de un determinado
evento, dada la ocurrencia de otro.
Ahora, analicemos otro ejemplo.
Ejemplo 2.4.2 Supongamos que en una empresa hay 100 empleados, de los cuales 30 son mujeres
y 70 hombres. Supongamos, además, que hay 21 mujeres y 33 hombres que fuman (compárese
con la tabla 2.3).
Tabla 2.3: Clasificación de 100 empleados de una empresa

Hombre (H) Mujer (M )
Fuma (F ) 33 21
No fuma (F ) 37 9
(a) Si se saca un individuo al azar, determinar la probabilidad de que sea mujer.
(b) Si se saca un individuo, determinar la probabilidad de que sea mujer y fume.
(c) Si del grupo de las 30 mujeres se saca un individuo, determinar la probabilidad de que fume.
SOLUCIÓN:
30
(a) La probabilidad de que sea mujer es P (M ) = 100 .
(b) La probabilidad de que sea una mujer y que fuma es P (M ∩ F ) = 21

100 .
(c) La probabilidad de que una mujer fume de un total de 30 la simbolizaremos por P (F/M ) y
es igual a
21 21/100 P (F ∩ M )
P (F/M ) = = =
30 30/100 P (M )
∩M )
Es decir, P (F/M ) = P P(F(M ) , que es la forma como se calcula la llamada probabilidad condi-
cional de un evento F , sabiendo que ya ha ocurrido M .
Estos tipos de problemas conllevan a considerar el concepto de probabilidad condicional.
Definición 2.4.3 Sean A y B dos eventos de un espacio muestral Ω = ∅. La probabi-

lidad condicional del evento A dado el evento B, simbolizada por P (A/B), se define
como
P (A ∩ B)
P (A/B) = , si P (B) > 0
P (B)
2.4. Probabilidades condicionales

Ejemplo 2.4.4 Una persona lanza una moneda tres veces, ¿cuál es la probabilidad de obtener 3
caras dado que salió por lo menos una cara?
SOLUCIÓN:
Los posibles resultados que se pueden obtener al lanzar la moneda tres veces son:
(C, C, C), (C, C, S), (C, S, C), (C, S, S), (S, C, C), (S, C, S), (S, S, C), (S, S, S)
Sean A y B los eventos “salió por lo menos una cara” y “obtener 3 caras” respectivamente.
Entonces, B = {(C, C, C)} y
A = {(C, C, C), (C, C, S), (C, S, C), (C, S, S), (S, C, C), (S, C, S), (S, S, C)}
Debido a que A ∩ B = {(C, C, C)}, entonces la probabilidad de obtener 3 caras sabiendo que salió
una cara es igual a
P (A ∩ B) 1/8 1
P (B/A) = = =
P (A) 7/8 7
Despejando P (B ∩ A) en las expresiones dadas en la definición 2.4.3 obtenemos el llamado
Teorema 2.4.5 (Teorema de multiplicación para 2 eventos) Si A y B son dos even-

tos de un espacio muestral Ω = ∅ y si P (B ∩ A) > 0, entonces
P (B ∩ A) = P (B/A) P (A) o por P (B ∩ A) = P (A/B) P (B)
Ejemplo 2.4.6 Supongamos que una caja tiene diez bolas, de las cuales tres están defectuosas.
Se sacan dos bolas, una detrás de la otra y sin reemplazo. ¿Cuál es la probabilidad de sacar una
bola defectuosa seguida de otra defectuosa?
SOLUCIÓN:
Sean A el evento “la primera bola sacada está defectuosa” y B el evento “la segunda bola sacada
está defectuosa”. Nos piden calcular P (A ∩ B). Debido a que tres de las diez bolas están defectu-
3
osas, se tiene que P (A) = 10 . Ahora, como ya se ha sacado 1 bola defectuosa de la caja, quedan
en total 9 bolas disponibles, de entre las cuales hay ahora 2 defectuosas. Por tanto, P (B/A) = 29 .
Por consiguiente, por el teorema de multiplicación (teorema 2.4.5), obtenemos que

3 2
P (A ∩ B) = P (A) P (B/A) = · = 0, 066
10 9
Es decir, la probabilidad de sacar una bola defectuosa seguida de otra bola defectuosa es aproxi-
madamente de 0,066.
La regla de multiplicación es más útil cuando el experimento consta de varias etapas suce-
sivas.

Teorema 2.4.7 (Teorema de multiplicación para n eventos) Si A1 , . . . , An son

eventos de un espacio muestral Ω = ∅ y si P (A1 ∩ · · · ∩ An ) > 0, entonces
P (A1 ∩ · · · ∩ An ) = P (A1 ) · P (A2 /A1 ) · P (A3 /A1 ∩ A2 ) · · · P (An /A1 ∩ · · · ∩ An−1 )
Como podemos observar claramente, en este teorema hemos considerando que A1 es el evento que sucede
primero, luego A2 , posteriormente A3 , y ası́ sucesivamente hasta que sucede el último evento, que en nuestro
caso es An .
Del teorema 2.4.7 obtenemos en particular que
• Si n = 2, se tiene que
P (A1 ∩ A2 ) = P (A1 ) · P (A2 /A1 )
P (A1 ∩ A2 ∩ A3 ) = P (A1 ) · P (A2 /A1 ) · P (A3 /A1 ∩ A2 )
P (A1 ∩ A2 ∩ A3 ∩ A4 ) = P (A1 ) · P (A2 /A1 ) · P (A3 /A1 ∩ A2 ) · P (A4 /A1 ∩ A2 ∩ A3 )
Ejemplo 2.4.8 Una caja contiene 6 fichas rojas, 4 blancas y 5 azules. Halle la probabilidad de
que se extraigan en el orden roja, blanca y azul si las fichas (a) se reemplazan, (b) no se reemplazan.
SOLUCIÓN:
Hay tres eventos que debemos considerar para el problema:
R = “roja en la primera extracción”.
B = “blanca en la segunda extracción”.
A = “azul en la tercera extracción”.
Nos piden calcular P (R ∩ B ∩ A). Al aplicar el teorema general de multiplicación (teorema 2.4.7)
para el caso de n = 3 eventos, tenemos:
P (R ∩ B ∩ A) = P (R) · P (B/R) · P (A/R ∩ B) (1)
Obsérvese que en la caja hay disponible, inicialmente, 6 + 4 + 5 = 15 fichas.
(a) Si los eventos se reemplazan, entonces reemplazando las correspondientes probabilidades en

la expresión (1), tenemos
6 4 5 8
P (R ∩ B ∩ A) = · · = = 0, 0355
15 15 15 225

(b) Si los eventos no se reemplazan, entonces reemplazando las correspondientes probabilidades

en la expresión (1), tenemos
6 4 5 4
P (R ∩ B ∩ A) = · · = = 0, 044
15 14 13 91
Los teoremas de multiplicación son útiles al resolver muchos problemas en los que el resul-
tado final de un experimento depende de los resultados de varias etapas intermedias. Ahora
presentaremos otro resultado importante, llamado teorema de la probabilidad total, que nos
será útil para presentar el llamado teorema o regla de Bayes.
Teorema 2.4.9 (Teorema de la probabilidad total) Si los eventos A1 , A2 , . . ., An

forman una partición de un espacio muestral Ω (compárese con la definición 2.1.11) y
si P (Ai ) > 0 para todo i = 1, . . . , n, entonces para cada evento B de Ω se tiene que
P (B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + · · · + P (B/An ) P (An )
Del teorema 2.4.9 se tiene en particular:
P (B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 )
P (B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + P (B/A3 ) P (A3 )
P (B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + P (B/A3 ) P (A3 ) + P (B/A4 ) P (A4 )
Podemos hacer dos comentarios acerca del teorema de la probabilidad total (teorema 2.4.9):
• El teorema de la probabilidad total está estrechamente relacionado con el siguiente teorema de la

mecánica: El centro de gravedad de un cuerpo se puede determinar descomponiendo el cuerpo en
cualquier cantidad de partes, suponiendo que la masa de cada una de estas partes está concentrada
en su respectivo centro de gravedad y tomando el centro de gravedad del sistema de puntos originados
por este método.
• El teorema de la probabilidad total también está relacionada con el siguiente análogo quı́mico: En
k recipientes se encuentran diferentes soluciones de la misma sal, en total, 1 litro. Supongamos
que P (An ) simboliza el volumen del n-ésimo recipiente y P (B/An ), la concentración de la solución
en el n-ésimo recipiente. Si se reúne el contenido de todos los recipientes en uno sólo y P (A)
significa la concentración de la solución originada de esta manera, entonces se cumple el teorema de
la probabilidad total.

Ejemplo 2.4.10 La caja I contiene 3 fichas rojas y 2 azules, en tanto que la caja II contiene
2 fichas rojas y 8 azules. Se lanza una moneda no falsa de tal forma que si cae cara, entonces
se saca una ficha de la caja I y, por el contrario, si cae sello, se saca una ficha de la caja II.
Supongamos que quien lanza la moneda no revela si resulta cara o sello (de tal forma que la caja
de la cual se sacó una ficha no se revela). Determine la probabilidad de haber sacado una ficha roja.
SOLUCIÓN:
Sea R el evento “sacar una ficha roja” y supongamos que I y II son los eventos “escoger la caja
I” y “escoger la caja II” respectivamente. Nos piden calcular P (R). En la figura 2.12 podemos
observar claramente estos eventos (obsérvese que el evento R corresponde a la región sombreada).
Figura 2.12: Diagrama para la situación del ejemplo 2.4.10
Ahora, en la caja I hay en total 3 + 2 = 5 fichas, y en la caja II, 2 + 8 = 10. Puesto que
una ficha roja se puede sacar de cualquiera de las cajas, entonces la probabildiad de sacar una
ficha roja de la caja I es P (R/I) = 35 y la de sacar una ficha roja de la caja II es P (R/II) = 10
2
= 15 .
Además, si C y S son los eventos “resultar cara” y “resultar sello”, respectivamente, entonces
la probabilidad de escoger la caja I es P (I) = P (C) = 12 y la de escoger la caja II es P (II) =
P (S) = 12 .
Por consiguiente, por el teorema de la probabilidad total (teorema 2.4.9) con n = 2, se obtiene
que
3 1 1 1 2
P (R) = P (R/I) P (I) + P (R/II) P (II) = · + · = = 0, 4
5 2 5 2 5
Ejemplo 2.4.11 Un editor envı́a propaganda de un libro de estadı́stica al 70% de aquellos pro-
fesores que están a cargo de esa materia. El 40% de aquellos que recibieron la propaganda se
decidieron a utilizar el libro, inclusive, el 20% de los que no recibieron la propaganda también
utilizarán el libro. ¿Cuál es la probabilidad de utilizar el libro?
SOLUCIÓN:
Consideremos los eventos “recibe la propaganda” y “no recibe la propaganda”. Entonces, tenemos
que P (“recibe”)= 0, 70 y P (“no recibe”)= 1 − 0, 70 = 0, 30. Además,
P (“utiliza el libro” / “recibe”) = 0, 40, P (“utiliza el libro” / “no recibe”) = 0, 20.

Nos piden calcular P (“utiliza el libro”). Esta la podemos calcular con ayuda del teorema de la
probabilidad total (teorema 2.4.9) de la siguiente manera:
P (“utiliza”) = P (“utiliza”/“recibe”) · P (“recibe”) + P (“utiliza”/“no recibe”) · P (“no recibe”)

= (0, 40)(0, 70) + (0, 20)(0, 30).
Los cálculos y las probabilidades anteriores se pueden observar claramente en el diagrama de árbol
de la figura 2.13. Junto a cada una de las cuatro ramas del diagrama aparecen probabilidades
(que llamaremos “totales”) que fueron calculadas con aplicación del teorema de multiplicación
(véase el teorema 2.4.5) y al final del diagrama aparece la probabilidad calculada que corresponde
a sumar sólo las probabilidades totales en donde aparece el evento “utiliza el libro”.
Teorema 2.4.12 (Regla o teorema de Bayes) Sea A1 , A2 , . . . , An una partición de un

espacio muestral Ω. Entonces, para cada evento B con P (B) > 0 y para todo k = 1, . . . , n,
se tiene
P (B/Ak ) P (Ak )
P (Ak /B) =
P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + · · · + P (B/An ) P (An )
Del teorema de Bayes se tiene, en particular:
P (B/Ak ) P (Ak )
P (Ak /B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 )
P (B/Ak ) P (Ak )
P (Ak /B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + P (B/A3 ) P (A3 )

P (B/Ak ) P (Ak )
P (Ak /B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + P (B/A3 ) P (A3 ) + P (B/A4 ) P (A4 )
A continuación se presenta el siguiente análogo quı́mico del teorema de Bayes: En k recipientes están
contenidas soluciones de la misma sal con diferentes concentraciones. El volumen total de la solución es
1 litro. Si P (Ak ) es el volumen de la solución en el n-ésimo recipiente y P (B/Ak ) es la concentración de
sal en el n-ésimo recipiente, entonces la fórmula que aparece en el teorema 2.4.12 nos permite calcular qué
porcentaje de la cantidad total de sal está en el k-ésimo recipiente.
La interpretación más importante del teorema de Bayes se basa en la utilización de las

probabilidades subjetivas. Supongamos que una determinada persona está interesada en la
ocurrencia del evento Ak y se forma una opinión subjetiva de la probabilidad de que Ak
ocurra. En este contexto, la probabilidad P (Ak ) se denomina probabilidad a priori.
Si después este individuo consigue información adicional (por ejemplo, que el evento B ha
ocurrido), este hecho puede provocar una modificación de su juicio inicial sobre la probabi-
lidad de ocurrencia de Ak . Dado que se sabe que B ha ocurrido, la probabilidad relevante
correspondiente a Ak es ahora la probabilidad condicional de Ak dado B, que se denota
probabilidad a posteriori. Desde este punto de vista se puede interpretar el teorema
de Bayes como un método que nos permite actualizar una probabilidad a priori cuando se
conoce la información adicional de que el evento Ak ha tenido lugar.
Ejemplo 2.4.13 Considere la situación del ejemplo 2.4.10. Determine la probabilidad de haber
escogido la caja I (es decir, que el resultado de la moneda sea cara).
SOLUCIÓN:
Sean R, I y II eventos definidos como en el ejemplo 2.4.10. Aquı́ nos piden calcular P (I/R)
(compárese con la figura 2.14). Del ejemplo 2.4.10, tenemos que P (R/I) = 53 , P (R/II) = 15 ,
P (I) = P (II) = 12 .
Por consiguiente, por el teorema de Bayes (teorema 2.4.12) con n = 2, se obtiene que
P (R/I) P (I) 3
5 · 12 3
P (I/R) = = = = 0, 75
P (R/I) P (I) + P (R/II) P (II) 3
5 · 1
2 + 15 · 1
2
4

De este modo, dada la información de que se ha sacado un ficha roja, la probabilidad de haber
escogido la caja I se ve modificada, pasando de P (I) = 0, 5 (a priori) a P (I/R) = 0, 75 (a
posteriori).
Ejemplo 2.4.14 En cierta ciudad, aproximadamente el 10% de los habitantes está afectado por
una rara enfermedad, para la cual se ha desarrollado una prueba de diagnóstico. A través de esta
prueba se ha determinado que el 85% de los individuos que padecen la enfermedad presentan un
resultado positivo, mientras que el 20% de los individuos sin la enfermedad muestran un resultado
positivo. Supongamos que se hace una prueba en un individuo seleccionado al azar.
(a) ¿Cuál es la probabilidad de que el resultado sea positivo? ¿Y negativo?
(b) Si el resultado es positivo, ¿cuál es la probabilidad de que el individuo tenga la enfermedad?
(c) Si el resultado es negativo, ¿cuál es la probabilidad de que el individuo tenga la enfermedad?
(d) Si el resultado es positivo, ¿cuál es la probabilidad de que el individuo esté sano?
(e) Si el resultado es negativo, ¿cuál es la probabilidad de que el individuo esté sano?
SOLUCIÓN:
Analizando las situaciones del problema, podemos identificar los siguientes eventos:
A = el individuo está enfermo.
A = el individuo está sano.
B = el individuo ha sacado un resultado positivo.
B = el individuo ha sacado un resultado negativo.
Por consiguiente, P (A) = 0, 1, P (A) = 0, 90, P (B/A) = 0, 85 y P (B/A) = 0, 2. Observe que
P (B/A) = 1 − P (B/A) = 0, 15 y P (B/A) = 1 − P (B/A) = 0, 80
Junto a cada una de las cuatro ramas del diagrama aparecen probabilidades (que ya hemos llamado
“totales”) que fueron calculadas con aplicación del teorema de multiplicación (véase el teorema
2.4.5). Todas estas probabilidades se pueden identificar fácilmente en el diagrama de árbol de la
figura 2.15.
En (a) nos piden calcular P (B) y P (B). Para calcular la probabilidad de que ocurra B, aplicaremos
el teorema de la probabilidad total con n = 2 (véase el teorema 2.4.9). De igual manera, también
aplicaremos este mismo teorema para calcular la probabilidad de que ocurra B. Esto lo haremos
de la siguiente manera:
• Sumando las dos probabilidades totales ubicadas en las ramas correspondiente a un resultado
positivo, obtenemos:
P (B) = P (A) P (B/A) + P (A) P (B/A) = 0, 085 + 0, 18 = 0, 265

Figura 2.15: Diagrama de árbol para los datos del ejemplo 2.4.13
• Sumando las dos probabilidades totales ubicadas en las ramas correspondiente a un resultado
negativo, obtenemos:
P (B) = P (A) P (B/A) + P (A) P (B/A) = 0, 015 + 0, 72 = 0, 735
Para calcular las probabilidades pedidas en (b)-(d) aplicaremos el teorema de Bayes con n = 2
(teorema 2.4.12) de la siguiente manera:
(b) Nos piden calcular P (A/B):

P (A ∩ B) 0, 085
P (A/B) = = = 0, 3207
P (B) 0, 265
(c) Nos piden calcular P (A/B):
P (A ∩ B) 0, 015
P (A/B) = = = 0, 0204
P (B) 0, 735
(d) Nos piden calcular P (A/B):

P (A ∩ B) 0, 18
P (A/B) = = = 0, 6792
P (B) 0, 265
(e) Nos piden calcular P (A/B):
P (A ∩ B) 0, 72
P (A/B) = = = 0, 979
P (B) 0, 735
Obsérvese que para C = B o C = B se cumple que P (A/C) = 1−P (A/C), propiedad que siempre
se cumple para todo par de eventos A y C de un espacio muestral.

Ejemplo 2.4.15 Un analista de bolsa examina las perspectivas de las acciones de un gran número
de compañı́as. Cuando se investigó el comportamiento de estas acciones un año antes, se descubrió
que el 15% experimentó un crecimiento superior al de la media, el 40% inferior y el 45% restante
se mantuvo alrededor de la media. El 30% de los valores que crecieron por encima de la media
fueron clasificados como “buenas adquisiciones” por el analista, al igual que el 15% de las que
crecieron alrededor de la media y el 20% de las que tuvieron un crecimiento inferior. ¿Cuál es
la probabilidad de que un valor clasificado como “buena adquisición” por el analista crezca por
encima de la media del mercado?
SOLUCIÓN:
Definiendo los eventos
A1 : “crecimiento superior a la media”,
A2 : “crecimiento alrededor de la media”,
A3 : “crecimiento inferior a la media”,
B : el valor se considera como “buena adquisición”,
tenemos las probabilidades P (A1 ) = 0, 15, P (A2 ) = 0, 40, P (A3 ) = 0, 35 y las probabilidades
condicionales P (B/A1 ) = 0, 30, P (B/A2 ) = 0, 15, P (B/A3 ) = 0, 20. Necesita calcular la probabi-
lidad de que un valor crezca por encima de la media, dado que fue considerado “buena adquisición”
por el analista. Es decir, buscamos la probabilidad condicional P (A1 /B), la cual se deduce ha-
ciendo uso del teorema de Bayes (teorema 2.4.12) de la siguiente manera:
P (B/A1 )P (A1 )
P (A1 /B) =
P (B/A1 )P (A1 ) + P (B/A2 )P (A2 ) + P (B/A3 )P (A3 )
(0, 30)(0, 25)
= = 0, 3658
(0, 30)(0, 25) + (0, 15)(0, 40) + (0, 20)(0, 35)
Ejemplo 2.4.16 Por un canal de comunicaciones afectado por ruido se transmite uno de dos
comandos de control en forma de palabras de código 11111 y 00000. Esto se transmite con pro-
babilidad a priori de 0,7 y 0,3 respectivamente. Por causa del ruido, la probabilidad de recepción
correcta de cada uno de los sı́mbolos disminuye a 0,6. Se supone que las palabras de código
se dañan o distorsionan independientemente. En la salida del receptor se registra la palabra de

código 10110. Determine qué comando fue transmitido.
SOLUCIÓN:
Consideremos los siguientes eventos:
A: “se registró la palabra de código 10110”;
H1 : “se transmitió 11111”;
H2 “se transmitió 00000”.

Por consiguiente, P (H1 ) = 0, 7 y P (H2 ) = 0, 3. Para poder saber cuál fue la palabra de código
transmitida, calcularemos P (H1 /A) y P (H2 /A) y decidiremos nuestra respuesta teniendo la pro-
babilidad de mayor valor. Ahora,
P (A/H1 ) = (0, 6)(0, 4)(0, 6)(0, 6)(0, 4) = 0, 035,

P (A/H2 ) = (0, 4)(0, 6)(0, 4)(0, 4)(0, 6) = 0, 023
Aplicando el teorema de Bayes (teorema 2.4.12) tenemos:

P (A/H1 )P (H1 )
P (H1 /A) =
P (A/H1 )P (H1 ) + P (A/H2 )P (H2 )
(0, 035)(0, 7)
= = 0, 78
(0, 035)(0, 7) + (0, 023)(0, 3)
De manera análoga, encontramos que P (H2 /A) = 0, 22. Por consiguiente, como P (H1 /A) = 0, 78
es mayor que P (H2 /A) = 0, 22, podemos afirmar que la palabra de código transmitida fue 11111.


62. Cierta empresa construye mesas de madera (M) o de vidrio (V) y se pueden adquirir en
uno de cuatro colores: azul (A), roja (R), blanca (B) y natural (N). Las probabilidades
correspondientes de las diversas combinaciones de tipo de material y color son las siguientes:
Mesas Azul Roja Blanca Natural

Madera 0,13 0,13 0,14 0,10
Vidrio 0,15 0,12 0,12 0,11
(a) Calcule e interprete P (R), P (M ) y P (R ∩ M ).

(b) Calcule P (R/M ) y P (M/R) e interprete los valores de cada una de las probabilidades.
(c) Calcule e interprete P (N/V ) y P (N/V ).
63. La siguiente tabla recoge las proporciones de adultos en cierta ciudad, clasificadas en aquellos
que fuma o no fuman y aquellos que tienen problemas de salud:
Problemas Fuman No fuman

Sı́ 0,15 0,09
No 0,18 0,58
(a) ¿Cuál es la probabilidad de que un adulto de esta población elegido al azar tenga
problemas de salud?
(b) ¿Cuál es la probabilidad de que un adulto de esta población elegido fume?
(c) ¿Cuál es la probabilidad de que un adulto de esta población elegido al azar que no fume
tenga problemas de salud?

64. La probabilidad de que Eduardo vea cierto programa de televisión es 0,4 y la probabilidad
de que su esposa Ana vea el programa es 0,5. La probabilidad de Eduardo vea el programa
sabiendo que Ana lo hace es 0,7. Encuentre la probabilidad de que
(a) Eduardo y Ana vean el programa;

(b) Ana vea el programa sabiendo que Eduardo lo hace;
(c) al menos uno de los dos vea el programa.
65. En cierta bodega, una caja contiene ocho clavos de 1 pulgada, seis de 1 pulgada y media
y cinco de 2 pulgadas. Suponga que se seleccionan tres clavos al azar, sin reemplazo y sin
orden.
(a) Si se ve que al menos uno de ellos es de 1 pulgada, ¿cuál es la probabilidad de que los
tres sean de 1 pulgada?
(b) Si al menos uno de los tres seleccionados no es de 2 pulgadas, ¿cuál es la probabilidad
de que los tres clavos tengan el mismo tamaño?
66. Una billetera tiene cinco billetes de $10.000 y siete de $20.000, y una segunda billetera
guarda ocho billetes de $10.000 y cuatro de $20.000. Se escoge al azar un billete de la
primera billetera y se coloca en la segunda. Después se selecciona un billete de la segunda
billetera y se coloca en la primera. ¿Cuál es la probabilidad de que se seleccione un billete
de $10.000 de la primera billetera y uno de $10.000 de la segunda?
67. Tres parejas de casados han comprado boletas para el cine y se sientan en una fila formada
por seis asientos. Supongamos que se sientan al azar.
(a) Utilice la regla de multiplicación para calcular la probabilidad de que una pareja (diga-
mos, José y Carmen) se siente junta en el extremo izquierdo y que otra pareja (digamos,
Jorge y Nubia) se siente junta en el medio.
(b) Sabiendo que Jorge y Nubia ya se han sentado juntos en el medio, ¿cuál es la proba-
bilidad de que los otros dos esposos (digamos, José, Ricardo) se sienten junto a sus
respectivas esposas (Carmen y Ana respectivamente).
(c) Sabiendo que Jorge y Nubia ya se han sentado juntos, ¿cuál es la probabilidad de que
todos los esposos se sienten junto a sus esposas?
68. Una entidad educativa ha propuesto tres proyectos para la mejora de la educación en cierta
región del paı́s. Para i = 1, 2, 3, sea Ai el evento que representa al evento “el proyecto i fue
aceptado”. Supongamos que
P (A1 ) = 0, 30, P (A2 ) = 0, 22, P (A3 ) = 0, 35, P (A1 ∩ A2 ) = 0, 08,

P (A1 ∩ A3 ) = 0, 09, P (A2 ∩ A3 ) = 0, 06, P (A1 ∩ A2 ∩ A3 ) = 0, 02
Determine las siguientes probabilidades y exprese verbalmente cada uno de los eventos cuya
probabilidad ha sido calculada:
(a) P (A2 /A1 )

(b) P (A2 ∩ A1 /A1 )

(c) P (A2 ∪ A3 /A1 )
(d) P (A1 ∩ A2 ∩ A3 /A1 ∪ A2 ∪ A3 )
69. Un lote contiene 15 piezas fundidas de un proveedor local y 25 piezas fundidas de un

proveedor del pueblo contiguo. Se seleccionan dos piezas fundidas al azar, sin reemplazo,
del lote de 40. Si A denota el evento de que la primera pieza fundida seleccionada es del
proveedor local y si B denota el evento de que la segunda pieza fundida seleccionada es del
proveedor local, determine:
(a) P (A), P (B), P (A ∩ B) utilizando las técnicas de conteo.

(b) P (B/A) y P (A/B) utilizando la definición de probabilidad condicional.
(c) P (A ∪ B) aplicando el teorema de adición para dos eventos.
70. En cierto batallón, 35% de los soldados reclutados son de estrato 1 y el resto, de estrato
2. De los soldados reclutados del estrato 1, el 85% no son hijos únicos, mientras que el
25% de los del estrato 2 lo son. Supongamos que se selecciona un soldado al azar para una
entrevista.
(a) Si es hijo único, ¿cuál es la probabilidad de que sea del estrato 1? ¿Del estrato 2?
(b) Si no es hijo único, ¿cuál es la probabilidad de que provenga del estrato 1? ¿Del estrato
2?
71. En cierta empresa, 31% de los empleados son europeos, 42% asiáticos y 27% latinoame-
ricanos. De los empleados europeos, 34% son mujeres; de los asiáticos, 42%, y de los
latinoamericanos, 72%.
(a) ¿Cuál es la probabilidad de que un empleado seleccionado al azar sea una (mujer)
europea? ¿(Hombre) asiático?
(b) ¿Cuál es la probabilidad de que un empleado seleccionado al azar sea una mujer? ¿Hom-
bre?
(c) Si un empleado seleccionado al azar es una mujer, ¿cuál es la probabilidad de que sea
europea? ¿Asiática? ¿Latinoamericana?

(d) Repita el inciso anterior teniendo en cuenta que el empleado seleccionado sea un hombre.
72. Una empresa fabrica computadores, cuyo disco duro tiene capacidad de 20 GB y otros de 30
GB. En el mes anterior, 35% de los computadores vendidos fueron los que tienen disco duro
de 20 GB. De los compradores de computadores con disco duro de 20 GB, 45% compran
los que tienen memoria RAM de 356 MB, mientras que el 30% de los compradores de
computadores con disco duro de 30 GB también lo hacen ası́. Si sabemos que un comprador
seleccionado al azar ha comprado un computador con memoria RAM de 356 MB, ¿cuál es
la probabilidad de que tenga un computador con disco duro de 30 GB?

73. Se envı́an lapiceros de diversos colores a un proveedor de artı́culos escolares en lotes de

20. Suponga que el 50% de estos lotes no tienen lapiceros defectuosos; 30%, un lapicero
defectuoso y el resto de los lotes, dos lapiceros defectuosos. Sin tener en cuenta el orden,
supongamos que el proveedor selecciona al azar dos lapiceros de un lote y los prueba. ¿Cuáles
son las probabilidades correspondientes de que haya 0, 1 y 2 lapiceros defectuosos en el lote
bajo cada una de las dos siguientes situaciones? (Sugerencia: Dibuje primero un diagrama
de árbol en donde las tres primeras ramas principales corresponden a los tres tipos diferentes
de lotes).
(a) Ningún lapicero probado está defectuoso.

(b) Uno de los dos lapiceros probados está defectuoso.
(c) Ambos lapiceros probados están defectuosos.
74. Una prestigiosa universidad de Barranquilla utiliza tres hoteles locales para proporcionar
hospedaje nocturno a sus profesores invitados. Supongamos que a 25% de los profesores
se les asignan habitaciones en el Hotel Las Nieves, al 45% en el Hotel El Mar y al 30% en
el Hotel San Felipe. Si hay una decorado especial en 3% de la habitaciones del Hotel Las
Nieves, 5% del Hotel El Mar y en 8%de las habitaciones del Hotel San Felipe, ¿cuál es la
probabilidad de que
(a) a un cliente se le asigne una habitación con decorado especial?

(b) a una persona con una habitación que tiene un decorado especial se le haya acomodado
en el Hotel El Mar?
75. Para clientes que compran una estufa especial en un almacén electrodoméstico considere los
siguientes eventos:
A =“La estufa comprada es colombiana”;

B =“El comprador quiere una estufa de gas”;
C =“El comprador quiere una estufa con 6 fogones”.
Supongamos que sean dadas las siguientes probabilidades: P (A) = 0.30, P (B/A) = 0, 75,
P (B/A) = 0, 89, P (C/A ∩ B) = 0, 90, P (C/A ∩ B) = 0, 55, P (C/A ∩ B) = 0, 62 y P (C/A ∩
B) = 0, 40.
(a) Construya un diagrama de árbol colocando cada evento en niveles diferentes y encima
de cada una de él, las probabilidades correspondientes.
(b) ¿Cuál es la probabilidad de que la estufa comprada sea colombiana, de gas y con 6
fogones?
(c) ¿Cuál es la probabilidad de que la estufa comprada sea de gas y con 6 fogones?
(d) ¿Cuál es la probabilidad de que la estufa comprada no sea de 6 fogones?
(e) ¿Cuál es la probabilidad de que la estufa comprada sea colombiana sabiendo que es de
gas y con 6 fogones?

76. Una emisora de bonos municipales tiene tres categorı́as de clasificación (A, B y C). Suponga
que el año pasado, de los bonos municipales que se emitieron en cierto paı́s, 70% tuvieron
clasificación A, 20% clasificación B y 10% clasificación C. De los bonos municipales con
clasificación A, 50% fueron emitidos en ciudades, 40% en suburbios y 10% en áreas rurales.
De los bonos municipales con clasificación B, 60% fueron emitidos en ciudades, 20% en
suburbios y 20% en áreas rurales. De los bonos municipales con clasificación C, 90% fueron
emitidos en ciudades, 5% en suburbios y 5% en áreas rurales.
(a) ¿Qué proporción de bonos municipales emiten las ciudades? ¿Los suburbios? ¿Las áreas
rurales?
(b) Si una ciudad emitiera un nuevo bono municipal, ¿cuál serı́a la probabilidad de que
tuviera clasificación A?
77. Se les preguntó a los suscriptores de un periódico local si leı́an regularmente, ocasionalmen-
te o nunca la sección de deportes y, también, si habı́an practicado fútbol durante el año
anterior. La proporciones obtenidas en la encuesta figuran en la siguiente tabla:
Fútbol Lee regularmente Lee ocasionalmente Nunca lee

Sı́ 0,21 0,16 0,31
No 0,10 0,04 0,18
(a) ¿Cuál es la probabilidad de que un suscriptor elegido al azar nunca lea la sección de
deportes?
(b) ¿Cuál es la probabilidad de que un suscriptor elegido al azar haya jugado fútbol durante
el año pasado?
(c) ¿Cuál es la probabilidad de que un suscriptor que nunca lea la sección de deportes haya
jugado fútbol durante el año pasado?
(d) ¿Cuál es la probabilidad de que un suscriptor que ha jugado fútbol durante el año
pasado nunca lea la sección de deportes?
(e) ¿Cuál es la probabilidad de que un suscriptor que no lea regularmente la sección de
deportes haya jugado fútbol durante el año pasado?
2.5 Independencia
En general, el concepto de que dos eventos A y B sean independientes significa que el suceso
de uno de los dos eventos no tiene ninguna influencia sobre la probabilidad de que suceda
el otro evento. Por consiguiente, podemos formular la siguiente definición:
Definición 2.5.1 Dos eventos A, B de un espacio muestral Ω = ∅ se llaman (es-

tocásticamente) independientes si y sólo si P (A/B) = P (A) y son dependientes en
cualquier otro caso. Es decir, el evento A es independiente del evento B si la probabilidad
de A no se ve afectada por la ocurrencia o no de B.
2.5. Independencia

Ejemplo 2.5.2 Considere lanzar un dado no falso y defina los eventos A = {2, 4, 6}, B = {1, 2, 3}
y C = {1, 2, 3, 4}. Entonces, tenemos
1 1 1
P (A) = , P (A/B) = y P (A/C) =
2 3 2
Lo anterior nos muestra que los eventos A y B son dependientes, mientras que los eventos A y C
son independientes.
Ejemplo 2.5.3 Las probabilidades de que llueva o nieve en una ciudad determinada el dı́a de
Navidad, el dı́a de año nuevo o en ambos dı́as son P (C) = 0, 60, P (N ) = 0, 60 y P (C ∩ N ) = 0, 42
respectivamente. Verifique si los eventos N y C son independientes.
SOLUCIÓN:
Por la definición de probabilidad condicional, tenemos que
P (C ∩ N ) 0, 42
P (N/C) = = = 0, 70
P (C) 0, 60
Ya que P (N/C) = 0, 70 no es igual que P (N ) = 0, 60, encontramos que los eventos N y C no son
independientes. Es decir, son dependientes.
En el caso en que los eventos A y B sean independientes, encontramos con ayuda del
teorema de multiplicación (teorema 2.4.5) el siguiente resultado especial: P (A ∩ B) =
P (A/B) P (B) = P (A)P (B). Por tanto, podemos formular el siguiente teorema:
Teorema 2.5.4 (Teorema de multiplicación para eventos independientes) Dos

eventos A, B de un espacio muestral Ω = ∅ son independientes si y sólo si
P (A ∩ B) = P (A)P (B)
Algunos autores definen “independencia” de acuerdo a este teorema, puesto que ası́ no excluyen el caso en
que uno de los eventos sea vacı́o.
Ejemplo 2.5.5 Considere lanzar un dado no falso y defina los eventos A = {2, 4, 6}, B = {1, 3, 5}.
Entonces, A ∩ B = ∅ y
1
P (A) = P (B) = y P (A ∩ B) = P (∅) = 0
2
Es decir, los eventos A y B no son independientes porque P (A ∩ B) = P (A) P (B). La conclusión

es que si dos eventos son mutuamente excluyentes y si las probabilidades de ambos eventos son
positivas, entonces no pueden ser independientes.

Ejemplo 2.5.6 La tabla de abajo contiene los resultados obtenidos al analizar 84 muestras de
aire con la finalidad de detectar dos moléculas raras. Sean A y B los eventos “todas las muestras
de aire contienen la molécula 1” y “todas las muestras contienen la molécula 2” respectivamente.
Molécula 1 (no) Molécula 1 (sı́) Total

Molécula 2 (no) 32 24 56
Molécula 2 (sı́) 16 12 28
Total 48 36 84
Entonces,
36 3 28 1 12 1
P (A) = = , P (B) = = y P (A ∩ B) = =
84 7 84 3 84 7
Es decir, los eventos A y B son independientes porque P (A ∩ B) = P (A) P (B).
Teorema 2.5.7 Sean A, B eventos de un espacio muestral Ω = ∅. Entonces, las siguientes

cuatro proposiciones son equivalentes:
(a) A y B son independientes (b) A y B son independientes
(c) A y B son independientes (d) A y B son independientes
Ejemplo 2.5.8 Considere lanzar un dado no falso y defina los eventos A = {2, 4, 6} y B =
{1, 2, 3, 4}. Verifique las cuatros proposiciones equivalentes del teorema 2.5.7.
SOLUCIÓN:
Debido a que, adicionalmente, A = {1, 3, 5} y B = {5, 6} tenemos:
1 2 1 1
P (A) = , P (B) = , P (A) = , P (B) =
2 3 2 3
Ahora, como
A ∩ B = {2, 4}, A ∩ B = {1, 3}, A ∩ B = {6}, A ∩ B = {5}

se concluye que
• Los eventos A y B son independientes porque P (A ∩ B) = 1

3 = P (A) P (B)

3 = P (A) P (B)

6 = P (A) P (B)

6 = P (A) P (B)
2.5. Independencia

Ejemplo 2.5.9 Se sabe que 30% de las lavadoras de cierta compañı́a requieren servicio cuando
están todavı́a en garantı́a, mientras que sólo 10% de las secadoras necesitan ese servicio. Si alguien
compra una lavadora y una secadora fabricadas por esta companı́a, ¿cuál es la probabilidad de
que ninguna de las dos máquinas necesite servicio dentro de la garantı́a? Suponga que las dos
máquinas funcionan de manera independiente.
SOLUCIÓN:
Señalemos como A el evento “la lavadora necesita servicio de garantı́a” y B, el evento “la secadora
necesita servicio de garantı́a”. Entonces, P (A) = 0, 30 y P (B) = 0, 10. Nos piden calcular
P (A ∩ B). Como las dos máquinas funcionan de manera independiente, entonces los eventos A y
B son independientes. Con esto y con el teorema 2.5.7 (en este teorema, si se cumple la proposición
(a), entonces también debe cumplirse (d)), los eventos A y B también son independientes. Por
consiguiente,
P (A ∩ B) = P (A) P (B) = (0, 70) · (0, 90) = 0, 63
El concepto de independencia se puede generalizar al caso en que se tengan más de dos

eventos.
Definición 2.5.10 Se dice que n eventos A1 , . . . , An de Ω son ( completamente) in-

dependientes si y sólo si
P (Aj1 ∩ Aj2 ∩ · · · ∩ Ajk ) = P (Aj1 ) · P (Aj2 ) · · · P (Ajk ) (2.3)
para todo 1 ≤ j1 < j2 < · · · < jk ≤ n, con 2 ≤ k ≤ n
En particular, por ejemplo,6
(a) si n = 3, entonces A, B y C son completamente independientes si y sólo si se cumplen las 2

condiciones siguientes:
• Tomando la intersección de cada 2 eventos se tiene que

P (A ∩ B) = P (A) P (B), P (A ∩ C) = P (A) P (C), P (B ∩ C) = P (B) P (C)

P (A ∩ B ∩ C) = P (A) P (B) P (C)
(b) si n = 4, entonces A, B, C y D son completamente independientes si y sólo si se cumplen las 3

condiciones siguientes:
P (A ∩ B) = P (A) P (B), P (A ∩ C) = P (A) P (C), P (A ∩ D) = P (A) P (D),

P (B ∩ C) = P (B) P (C), P (B ∩ D) = P (B) P (D), P (C ∩ D) = P (C) P (D)
6
El caso n = 2 ya se ilustró en el teorema 2.5.4.

P (A ∩ B ∩ C) = P (A) P (B) P (C), P (A ∩ B ∩ D) = P (A) P (B) P (D),

P (A ∩ C ∩ D) = P (A) P (C) P (D), P (B ∩ C ∩ D) = P (B) P (C) P (D)
P (A ∩ B ∩ C ∩ D) = P (A) P (B) P (C) P (D)
El siguiente ejemplo ilustra que una independencia fı́sica en la realidad no necesariamente

necesita corresponder con una independencia estocástica en el modelo.
Ejemplo 2.5.11 Supongamos que un dado se lanza dos veces y consideremos los eventos A :=“primer
lanzamiento es un 2”, B :=“segundo lanzamiento es un 5” y C :=“la suma de ambos lanzamientos
es 7”. Demuestre que (a) A y B son independientes, (b) B y C son independientes, (c) A y C son
independientes y (d) A, B y C no son independientes.
Este ejemplo demuestra también que A, B y C son independientes dos a dos, pero no completamente
independientes.
SOLUCIÓN:
(a) Debido a que A y B tienen 6 elementos, tenemos que P (A) = P (B) = 16 y, por consiguiente,
que
1 1 1
P (A ∩ B) = P escoger (2,5) = = · = P (A) P (B)
36 6 6
entonces podemos afirmar que A y B son independientes.
(b) El evento C es el conjunto

C = (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)
6
es decir, C tiene 6 elementos. Por consiguiente, P (C) = 36 = 16 . Ahora, debido a que
B ∩ C = {(2, 5)}, es claro ver que B ∩ C tiene un elemento. Por lo tanto,
Número de elementos de B ∩ C 1 1 1
P (B ∩ C) = = = = · = P (B) P (C)
Número de elementos de Ω 36 6 6
O sea que B y C son independientes.
(c) En forma semejante se puede demostrar que A y C son independientes.
(d) A, B y C no son completamente independientes porque
1 1
P (A ∩ B ∩ C) = P (2, 5) = = = P (A) P (B) P (C)
36 63
2.5. Independencia


78. Suponga que las proporciones de fenotipos sanguı́neos en determinada población son los
siguientes: A : 35%, B : 28%, AB : 13% y O : 24%. Supongamos que los fenotipos de dos
personas seleccionadas al azar son independientes entre sı́.
(a) ¿Cuál es la probabilidad de que ambos fenotipos sean O?

(b) ¿Cuál es la probabilidad de que sean iguales?
79. En su sistema de funcionamiento, una represa tiene cuatro puertas de seguridad idénticas.
La probabilidad de que una puerta en particular se abra cuando sea necesario es 0,97. Si
las puertas funcionan independientemente, calcule la probabilidad de que (a) al menos una
puerta se abra, (b) al menos una puerta no se abra.
80. La probabilidad de que Jeniffer cometa un error al marcar una pregunta de un examen de
opción múltiple es 0,2. Supongamos que hay 7 preguntas marcadas independientemente.
(a) ¿Cuál es la probabilidad de que Jeniffer no cometa error al marcar las 7 preguntas?
(b) ¿Cuál es la probabilidad de que Jeniffer cometa por lo menos un error al marcar las 7
preguntas?
81. Una costura en un chaleco antibalas necesita 10 puntos de seguridad. La costura tendrá
que volverse a realizar si cualquiera de los puntos de segudidad quedó débil. Suponga que
los puntos de seguridad están débiles independientemente unos de otros, cada uno con la
misma probabilidad.
(a) Si 20% de todas las costuras necesitan volver a efectuarse, ¿cuál es la probabilidad de
que un punto de seguridad esté defectuoso?
(b) ¿Qué tan pequeña debe ser la probabilidad de un punto de seguridad débil para asegurar
que sólo el 5% de todas las costuras necesiten volver a ejecutarse?
82. Una empresa de venta por correos considera tres posibles errores al enviarse un pedido:
A: el artı́culo enviado no es el solicitado.

B: el artı́culo se extravı́a.
C: el artı́culo sufre desperfectos en el transporte.
Supóngase que el suceso A es independiente de los sucesos B y C y que los sucesos B y C

son mutuamente excluyentes. Las probabilidades de los sucesos individuales son P (A) =
0, 03, P (B) = 0, 02 y P (C) = 0, 05. Calcule la probabilidad de que uno de estos errores
ocurra para al menos un pedido escogido al azar.
83. En cierta ciudad, el 70% de todas las personas examinadas en cierto consultorio odontológico
no tienen caries. Si se supone que personas sucesivas tienen o no tienen caries (por supuesto,
independientemente una de otra), calcule la probabilidad de los siguientes eventos:
(a) Las tres personas siguientes examinadas tienen caries.


Estadística Descriptiva y Distribuciones de Probab... - (PG 19 - 190)

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Estadística Descriptiva y Distribuciones de Probab... - (PG 19 - 190)

Загружено:

Авторское право:

Доступные форматы

CAPÍTULO 1

1.4 Análisis de datos en tablas de frecuencias agrupadas . . . . . . 66

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com

☞ Objetivos del capı́tulo

2. Distinguir entre estadı́stica descriptiva e inferencial.

3. Estudiar los tipos de datos.

4. Mostrar cómo organizar datos.

5. Construir tablas y gráﬁcas para datos numéricos y categóricos.

6. Describir las medidas de tendencia central, de posición relativa, de variación y de forma de

7. Describir las técnicas para realizar un análisis exploratorio de datos.

8. Presentar aplicaciones del uso de Statgraphics y de la calculadora en la estadı́stica.

1.1.1 Estadı́stica y sus aplicaciones

¿Qué signiﬁca “estadı́stica”?

En general, el término “estadı́stica” tiene tres acepciones gramaticales bien deﬁnidas:

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com

1. Estadı́stica, según su acepción más común, es una colección de datos numéricos

3. Finalmente, signiﬁca técnica o método cientı́ﬁco usado para recolectar, organizar,

Se considera fundador de la estadı́stica a Godofredo Achenwall (1719-1772;53), profe-

¿Por qué usted necesita conocer estadı́stica?

En general, el problema que enfrentan las compañı́as e industrias no es la escasez de in-

1. Presentar y describir la información en forma adecuada.

2. Inferir conclusiones sobre poblaciones grandes basándose solamente en la información

3. Utilizar modelos para obtener pronósticos conﬁables.

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com

Presentar y Obtener conclusiones acerca Obtener pronósticos

Figura 1.1: Esquema de rutas para aprender estadı́stica

Algunas aplicaciones de la estadı́stica

La importancia de la estadı́stica en la ingenierı́a ha sido subrayada por la participación

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com

productividad global de la compañı́a, en el mercado y la posición competitiva y, ﬁnalmente,

Las empresas de contadurı́a pública emplean procedimientos estadı́sticos de muestreo para

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com

Con el énfasis actual en la calidad, el control de calidad es una aplicación importante de

Los computadores, la calculadora y la estadı́stica

1.1.2 Términos comúnmente usados en estadı́stica

Deﬁnición 1.1.3 Una muestra es un subconjunto de la población.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com

Deﬁnición 1.1.7 Un parámetro es cualquier caracterı́stica medible de una población.

Deﬁnición 1.1.9 Un estadı́stico es cualquier caracterı́stica medible de una muestra.

1.1.3 Estadı́sticas descriptiva e inferencial

Los procedimientos y análisis que aparecen en estadı́stica se clasiﬁcan en dos categorı́as

Deﬁnición 1.1.13 La estadı́stica descriptiva se compone de aquellos métodos que

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com

Ejemplo 1.1.14 Las siguientes situaciones utilizan estadı́stica descriptiva:

Deﬁnición 1.1.15 La estadı́stica inferencial abarca aquellos métodos y conjuntos de

✍ Ejercicios de la sección 1.1

(a) Todos los periódicos publicados en Colombia.

Capı́tulo 1. Estadı́stica descriptiva

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com

(a) ¿Cuántos elementos hay en este conjunto de datos?

Tabla 1.1: Muestra de 10 empresas que publica una revista

(a) ¿Cuáles son la población y la muestra para este estudio?

(a) Identiﬁque la población, la muestra, un estadı́stico y un parámetro.

Llinás, S. H. (2017). Estadística descriptiva y distribuciones de probabilidad. Retrieved from http://ebookcentral.proquest.com

(a) Identiﬁque la población, la muestra, los parámetros y dos estadı́sticos.

1.2 Organización de datos

1.2.1 Organización de datos de acuerdo al tipo

Tipos de datos Tipos de pregunta Respuestas

Categóricas ¿Es la Universidad del Norte Sí No

Discretas ¿Cuántas universidades Número