Вы находитесь на странице: 1из 96

Guía Práctica de Estadística General |1

Estadística
General

Área de Estadística
Lima – Perú
2019
Guía Práctica de Estadística General |2

GUÍA DE PRÁCTICAS DE ESTADÍSTICA GENERAL

© Derechos Reservados 2019

© Área de Estadística

Primera Edición 2011


Segunda Edición 2013
Tercera Edición 2014
Cuarta Edición 2015
Quinta Edición 2016
Sexta Edición 2017
Séptima Edición 2018
Octava Edición 2019

Diseño y Diagramación

Universidad Científica del Sur

Panamericana Sur km 19 - Lima 42

. Lima-Perú 610-6400
Guía Práctica de Estadística General |3

Rector
Dr. Manuel Rossemberg

Presidente Ejecutivo
Luis Javier Cardó Soria

Gerente General
Javier Frisancho Pendavis

Director General Académico


José Agustín Ortiz Elías

Directos de Cursos Básicos


Álvaro Pinillos Osnayo

Coordinador de Matemática y Estadística


Sarita Bocanegra Gonzales
Guía Práctica de Estadística General |4

CONTENIDO

UNIDAD 1

Capítulo 1: Conceptos 6

Capítulo 2: Presentación de datos 9

UNIDAD 2

Capítulo 3: Medidas de Tendencia Central 22

Capítulo 4: Medidas de Posición No Central 25

Capítulo 5: Medidas de Dispersión 29

Capítulo 6: Asimetría y Curtosis 37

UNIDAD 3

Capítulo 7: Cálculo de Probabilidades 42

Capítulo 8: Distribución Binomial 54

Capítulo 9: Distribución Poisson 58

Capítulo 10: Distribución Normal 61

Capítulo 11: Distribución Muestral 68

UNIDAD 4

Capítulo 12: Tamaño de la muestra. 71

Capítulo 13: Regresión y Correlación Lineal 73

Capítulo 14: Tablas de Contingencia y Pruebas Chi – Cuadrado 83


Guía Práctica de Estadística General |5
Guía Práctica de Estadística General |6

Elaboración propia

CONCEPTOS BÁSICOS. PRESENTACIÓN DE


DATOS.
Guía Práctica de Estadística General |7

CONCEPTOS ESTADÍSTICOS

Población.-
Es la totalidad de individuos o de elementos (empresas, personas, objetos etc.) que cumplen o
satisfacen la o las características en estudio.
Por el número de elementos que la componen la población se clasifica en finita e infinita. La
población es finita si tiene un número determinado de elementos en caso contrario es infinita. En la
práctica una población finita con un gran número de elementos se considera como una población
infinita; por otro lado el tamaño de una población va a depender de objetivo trazado por el
investigador.

Muestra.-
Está constituida por una parte de los individuos o elementos que componen la población,
seleccionada de acuerdo a cierta técnica con el fin de obtener información acerca de la población, de
la cual proviene. La muestra debe ser seleccionada de manera que sea representativa, es decir tenga
características similares a las de su población.

Parámetro.-
Es una medida descriptiva que resume una característica de la población, es decir constituye el valor
real, verdadero; su cálculo implica utilizar toda la información contenida en la población; entre los
más conocidos tenemos:
La media poblacional ( μ )
La varianza poblacional ( σ2 )
La proporción poblacional ( P ) etc.

Estadístico.- Es una medida que describe una característica de la muestra, se calcula a partir de los
datos observados en la muestra; es decir constituyen los estimadores de cada uno de sus respectivos
parámetros; entre estos tenemos:
La media muestral ( X )
La varianza muestral ( S2 )
La proporción muestral ( p ˆ )

Variable.- Es una característica definida en la población de acuerdo a cierto interés en una


investigación estadística, que puede tomar dos o más valores (cualidades o números). Puede ser una
característica medible (peso, precio, ingresos, temperatura etc) o una cualidad no medible (estado
civil, calidad, color, sexo etc). Se representa con las letras X, Y, Z.

CLASIFICACIÓN DE LAS VARIABLES

SEGÚN LA NATURALEZA DE LA VARIABLE

a) VARIABLES CUALITATIVAS O CATEGÓRICAS


Son aquellas cuyos valores expresan cualidades o atributos; estas a su vez pueden ser:
Guía Práctica de Estadística General |8

VARIABLES NOMINALES.- Son aquellas en donde no existe un orden preestablecido entre las
categorías de las variable. Ejemplos:

VARIABLE CATEGORÏAS
Color Azul, rojo, blanco, verde, negro, amarillo etc.
Estado Civil Soltero, casado, conviviente, viudo, divorciado.
Distrito Lima, La Victoria, Breña, Miraflores, San Isidro, Lince etc
Sexo Masculino, femenino
Calidad Buena, mala.

VARIABLES ORDINALES.- Son aquellas en donde existe un orden preestablecido entre las
categorías de la variable.

Ejemplos:

VARIABLE CATEGORÏAS
Grado de Instrucción Primaria, Secundaria, Superior
Orden de Mérito Primero, Segundo, Tercero etc.
Nivel Socioeconómico Bajo, Medio, Alto etc.

También podemos considerar como variables ordinales por ejemplo grado de satisfacción de un
servicio (1 = Muy insatisfecho; 2 = Insatisfecho; 3 = Ni satisfecho ni insatisfecho; 4 =
Satisfecho; 5 = Muy satisfecho) o también el grado de depresión, etc.

b) VARIABLES CUANTITATIVAS
Son aquellas que se obtienen como resultado de mediciones o conteos; estas a su vez se
clasifican en:

VARIABLES DISCRETAS
Son aquellas cuyos valores resultan como consecuencia de conteos, y por lo tanto solo pueden
asumir valores enteros positivos, incluido el cero. Ejemplos
Número de empresas, número de hospitales, número de trabajadores, número de comprobantes
de pago, número de máquinas, número de conservas etc.

VARIABLES CONTINUAS
Son aquellas cuyos valores se obtienen por medición, pueden asumir valores decimales.
Ejemplos:
Los sueldos, el precio, la temperatura, el volumen, el tiempo, el peso, la estatura, la presión etc.

SEGÚN EL ROL QUE TIENEN EN LA INVESTIGACIÓN

a) VARIABLE DEPENDIENTE

La variable dependiente es aquella determinada por el investigador para estudiarla en función de


otras variables denominadas independientes. Generalmente se simboliza esta variable con la letra Y.

b) VARIABLE INDEPENDIENTE
Guía Práctica de Estadística General |9

La variable independiente es aquella que es controlada en un experimento por el investigador.


Generalmente se simboliza esta variable con la letra X.
En la mayoría de los experimentos el investigador está interesado en determinar el efecto que tiene la
variable X, sobre la variable Y; para esto el investigador controla los niveles de la variable X y mide
el efecto sobre la otra variable.
Ejemplo:
- La variación en los precios de un determinado artículo, motiva cambios en las ventas. En este
ejemplo las variables son:
Precio = X Venta = Y

- El costo de producción de un artículo, determina su precio de venta. En este caso las variables
son:
Costo de producción = X Precio de venta = Y

Podemos notar que el rol que asuma una determinada variable como dependiente o independiente en
una investigación, va a depender con qué variable se asocie.

E J ER C I C I O S PR O PU E STO S

1. Determinar, en cada caso el tipo de variable, de acuerdo a su naturaleza:

a. Tiempo que demora un paciente para ser atendido en un Centro Médico.


b. Carreras que quieren seguir las alumnas y los alumnos de un centro educativo al
terminar la Educación Secundaria.
c. Intención de voto para las elecciones presidenciales.
d. Horas que dedican a ver televisión los estudiantes de Primaria en Arequipa.
e. Número de aparatos de radio que hay en los hogares de Ayacucho.
f. Grado de instrucción de los trabajadores de una Empresa.
g. Número de televisores LCD vendidos durante el mes de diciembre del año
pasado.
h. Temperaturas registradas cada hora en un observatorio.
i. Número de pacientes atendidos por emergencia durante el mes pasado.

2. Clasificar cada una de las afirmaciones siguientes ya sea como inferencias o métodos
descriptivos.

a. El año pasado en la UCS el puntaje promedio del examen de admisión fue 85.
b. El Dr. García, un ecólogo, informó que en cierto río del oriente peruano, la carne de los
peces contienen un promedio de 300 unidades de mercurio.
c. La compañía “RM” predijo quién sería el ganador en una elección presidencial después de
conocer los resultados de las votaciones de 25 mesas de sufragio de las 2 800 mesas que
hubo en total.
Guía Práctica de Estadística General |
10

PRESENTACIÓN DE DATOS

En todo trabajo de investigación se requiere la recolección de datos para posteriormente realizar el


procesamiento del mismo. Estos datos pueden haber sido recogidos de fuentes primarias o
secundarias.

Luego de la recolección de información se debe clasificar u organizar los datos para realizar el
análisis y la interpretación de los resultados. Para facilitar este procedimiento se deberá agrupar la
información en categorías o clases.

Una forma sencilla de agrupar los datos es realizando tablas de distribución de frecuencias.

Presentación de tablas:
Todo gráfico debe presentar la siguiente
estructura:
1. Numeración
2. Título
3. Contenido
4. Fuente

Datos agrupados

Variable fi Fi hi Hi hi% Hi%

fi= frecuencia absoluta


Fi= frecuencia absoluta acumulada
hi= frecuencia relativa
Hi= frecuencia relativa acumulada
hi%= frecuencia relativa porcentual
Hi%= frecuencia relativa acumulada porcentual

Datos agrupados por clases o intervalos


Clases Xi f Fi hi Hi hi% Hi%
Guía Práctica de Estadística General |
11

TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS PARA VARIABLES CUANTITATIVAS


a) Tabla de frecuencias para Datos No Agrupados.- Es apropiada para datos cuyos valores
distintos no son muy numerosos.

Ejemplo:

Los siguientes datos corresponden a las edades de 50 estudiantes:

20 22 21 19 18 18 20 22 20 19 20 19
23 19 18 20 21 22 19 20 18 23 20 21
19 22 23 20 21 19 22 18 19 20 21 24
21 20 21 20 24 23 20 21 19 20 22 21
21 22

a) Presentar dichos datos en una tabla de frecuencias


b) Presentar los datos gráficamente a través de un Histograma
c) Presentar los datos gráficamente en un Polígono de Frecuencias

Solución:

En este caso notamos que la variable edad, apenas está tomando solamente siete
valores distintos que van desde 18 hasta 24

Variable: Xi
Frecuencias Absolutas: fi
Frecuencias Absolutas Acumuladas: Fi
Frecuencias Relativas: hi
Frecuencias Relativas Acumuladas: Hi

La siguiente tabla y el gráfico han sido obtenidos, usando el software MINITAB

Tabla de frecuencias para la variable edad:

Edad fi Fi Porcentaje % Acumulado

18 5 5 10.00 10.00
19 9 14 18.00 28.00
20 13 27 26.00 54.00
21 10 37 20.00 74.00
22 7 44 14.00 88.00
23 4 48 8.00 96.00
24 2 50 4.00 100.00
Total 50 100.00

Comentario: Se observa que el 26% de los estudiantes tienen 20años de edad mientras que solo un
4% tienen 24 años. También podemos ver que un 46% tienen entre 20 y 21 años.
Guía Práctica de Estadística General |
12

b) Histograma de Frecuencias

Distribución de los estudiantes según edad

25

20
Porcentaje

15

10

0
18 19 20 21 22 23 24
Edad (años )

c) Polígono de Frecuencias obtenido con SPSS

d) Tabla de frecuencias para Datos Agrupados.- Es apropiada cuando los valores distintos
que toma la variable es muy numeroso. Se siguen los siguientes pasos:
1) Calcular el rango de la variable: R = Valor máximo – Valor mínimo
2) Elegir el número de intervalos de clases: K se sugiere entre 5 y 10 inclusive
3) Calcular la amplitud de los intervalos de clases: C
C= R cuyo cociente en lo posible deberá ser exacto, caso contrario deberá
K trabajarse con los llamados “excesos”
Guía Práctica de Estadística General |
13

Ejemplo 1:

Los siguientes datos representan el contenido de yodo en la sangre de 40 pacientes adultos en


µg/100cc.

8.6 9.5 6.5 7.4 10.5 6.8 7.7 5.9 7.0 7.3 5.1 4.3 7.9
9.2 6.5 7.3 5.5 5.6 5.1 4.4 10.2 6.5 7.5 5.8 5.8 5.3
4.6 3.8 7.0 8.1 5.9 7.3 5.5 5.5 4.5 3.5 5.6 5.7 5.8
5.9

Presente los datos en una tabla de frecuencias

Solución

Rango: R

R = 10.5 – 3.5 = 7.0

K = 1 + 3.32 log 40 = 6.32 K = 5 ó 6 ó 7

Si k = 5 C = 7.0 = 1.4
5

Si k=7 C = 7.0 = 1.0


7

Observamos que para ambos valores de K; hemos obtenido un cociente exacto

Eligiendo K = 5 obtenemos la siguiente tabla de frecuencias según el Programa SPSS

Yodo (µg/100cc) Xi fi Fi hi Hi

3.5 - 4.9 4.2 6 6 0.150 0.150


4.9 - 6.3 5.6 15 21 0.375 0.525
6.3 - 7.7 7.0 12 33 0.300 0.825
7.7 - 9.1 8.4 3 36 0.075 0.900
9.1 - 10.5 9.8 4 40 0.100 1.000
TOTAL 40 1.000

Se observa que el 37.5% de los pacientes tienen un nivel de yodo en la sangre que varía entre 4.9 y
6.3 microgramos por 100 cc. También podemos decir que poco más del 50% han tenido entre 3.5 y
6.3 microgramos de yodo en la sangre.
Guía Práctica de Estadística General |
14

Ejemplo 2:

Como control de la ética publicitaria, se requiere que el rendimiento en millas/ galón, de gasolina
esté basado en un buen número de pruebas efectuadas en diversas condiciones. Al tomar una muestra
de 50 automóviles se registraron las siguientes observaciones en millas por galón

35.6 27.9 29.3 31.8 22.5 34.2 32.7 26.5 26.4 31.0 31.6 28.0 33.7
32.0 28.5 27.5 29.8 34.2 31.2 28.7 30.0 28.7 33.2 30.5 27.9 31.2
29.5 28.7 23.0 30.1 30.5 31.3 24.9 26.8 29.9 28.7 30.4 31.3 32.7
30.3 33.5 30.5 30.6 35.1 28.6 30.1 30.3 29.6 31.4 32.4

Presente los datos en una tabla de frecuencias

Solución:

Rango: R

R = 35.6 – 22.5 = 13.1

K = 1 + 3.32 log 50 = 6.64 K = 6 ó 7 u 8

Si k = 6 C = 13.1 = 2.1833………… : 2.2


6

Exceso E = (6 x 2.2) – 13.1 = 13.2 – 13.1 = 0.1

Si k=7 C = 13.1 = 1.8714………… : 1.9


7
Guía Práctica de Estadística General |
15

Exceso E = (7 x 1.9) – 13.1 = 13.3 – 13.1 = 0.2

Si k=8 C = 13.1 = 1.6375 : 1.7


8

Exceso E = (8 x 1.7) – 13.1 = 13.6 – 13.1 = 0.5

Eligiendo K=6 por tener el menor exceso

Las frecuencias han sido obtenidas según el Programa SPSS

Rendimiento Xi fi Fi hi Hi
(millas/galón)
22.5 - 24.7 23.6 2 2 0.04 0.04
24.7 - 26.9 25.8 4 6 0.08 0.12
26.9 - 29.1 28.0 10 16 0.20 0.32
29.1 - 31.3 30.2 20 36 0.40 0.72
31.3 - 33.5 32.4 9 45 0.18 0.90
33.5 - 35.7 34.6 5 50 0.10 1.00
T O T A L 50 1.00

Se observa que el 60% de los automóviles tienen un rendimiento entre aproximadamente 27 y 31.3
millas por galón de gasolina.

Ejemplo 3

Los siguientes son los puntajes logrados en un examen de cierta asignatura por 50 estudiantes:

61 50 65 70 45 60 80 65 60 65 64 54 65
67 48 64 56 60 61 62 62 57 75 53 58 59
56 54 67 68 60 63 56 53 61 62 69 70 44
47 65 56 57 58 55 51 43 79 72 48

Presentar los datos en una tabla de frecuencias

Solución

R = 80 – 43 = 37

K = 1 + 3.32 log 50 = 6.64 : 7 K = 6 ó 7 u 8

Si k=6 C = 37 = 6.1666………… : 7
6

Exceso E = (6 x 7) – 37 = 42 - 37 = 5
Guía Práctica de Estadística General |
16

Si k=7 C = 37 = 5.2857……….. : 6
7

Exceso E = (7 x 6) – 37 = 42 - 37 = 5

Si k=8 C = 37 = 4.625 : 5
8

Exceso E = (8 x 5) – 37 = 40 - 37 = 3

Eligiendo K = 8 por tener el menor exceso

Puntaje Xi fi Fi hi Hi
42 – 46 44 3 3 0.06 0.06
47 – 51 49 5 8 0.1 0.16
52 – 56 54 9 17 0.18 0.34
57 – 61 59 12 29 0.24 0.58
62 – 66 64 11 40 0.22 0.8
67 – 71 69 6 46 0.12 0.92
72 – 76 74 2 48 0.04 0.96
77 - 81 79 2 50 0.04 1
Total 50 1

Poco menos de la mitad de los estudiantes (46%) han obtenido entre 57 y 66 puntos.

TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS PARA VARIABLES CUALITATIVAS


O CATEGÓRICAS

Ejemplo 1.- Se realizó un estudio para determinar la cantidad de personas que obtienen un empleo.
La siguiente tabla incluye datos de 400 sujetos seleccionados al azar:

Fuentes de empleo Nº de Porcentaje


sujetos
Anuncios clasificados 56 14
Empresas de búsqueda de ejecutivos 44 11
Contactos profesionales 280 70
Correo masivo 20 5
Total 400 100

Gráfico de Barras Simples ( EXCEL )


Guía Práctica de Estadística General |
17

Gráfico de Sectores Circulares ( EXCEL )

Diagrama de Pareto ( MINITAB )

Fuentes de Empleo
100 100

80 80
Porcentaje

Porcentaje

60 60

40 40

20 20

0 0
Fuentes de Empleo

Ejemplo 2.- La siguiente información se refiere al número de estudiantes matriculados en tres


especialidades de Administración de Empresas, durante los años 2,000 y 2,005
Porcentaje 70 14 11 5
Porcentaje 70.0 14.0 11.0 5.0
% acumulado 70.0 84.0 95.0 100.0
Guía Práctica de Estadística General |
18

Especialidad 2000 2005


Finanzas 160 250
Marketing 140 200
Contabilidad 100 150

Gráfico de Barras Dobles

EJERCICIOS PROPUESTOS

1.- Al contar el número de materias reprobadas por los alumnos de cierta Universidad, se han
obtenido los siguientes datos:

1, 1, 2, 3, 2, 6, 0, 0, 1, 0, 4, 5, 0, 0, 0, 3, 2, 1, 3, 1, 1, 1, 0, 1, 2, 0,
0, 5, 4, 2.

Construya una tabla de frecuencias y el histograma correspondiente.

2.- En un colegio “X” se piensa en la posibilidad de cambiar el timbre por unos acordes de música
rock. Se ha preguntado a 20 alumnos cual es su opinión acerca de estos acordes, según la escala: No
me gusta nada ( 1 ), Me gusta poco ( 2 ), Me es indiferente ( 3 ), Me gusta bastante ( 4 )
Me gusta muchísimo ( 5 ). Estos han opinado la siguiente manera (codificada):

5, 4, 1, 2, 2, 4, 2, 5, 3, 5, 3, 5, 1, 1, 3, 1, 2, 5, 3, 3

Construir la tabla de distribución de frecuencias adecuada para responder las siguientes preguntas:
a) ¿A qué porcentaje de alumnos les gusta poco estos acordes?
b) ¿A cuántos alumnos les gusta bastante los acordes?
c) ¿Cuál es la proporción de alumnos a los que les es indiferente los acordes?
d) ¿Cuál es la proporción de alumnos a los que les gusta poco o no les gusta nada los acordes?
e) ¿Cuál es la proporción de alumnos a los que a lo más les gusta bastante los acordes?.
Guía Práctica de Estadística General |
19

3.- El gerente de una tienda comercial está interesado en el número de veces que 52 clientes han ido
a comprar en su almacén durante un período de dos semanas. Los datos que se registraron fueron:

5 3 3 1 4 4 5 6 4 2 6 6 1
1 14 1 2 4 4 5 6 3 5 3 6 8
4 7 6 5 9 11 3 12 4 7 14 1 1
10 8 9 2 12 5 7 6 4 5 6 5

a) Organice los datos en un cuadro de distribución de frecuencias


b) Presente los datos en una gráfica apropiada.

4.- Los siguientes datos proporcionan los ingresos anuales en miles de dólares de 50 personas:

7.9 10.3 45.7 9.5 43.0 56.0 38.0 6.7 48.0 30.5 25.0 40.0
30.0 25.5 50.0 17.1 25.5 43.5 31.6 59.0 41.5 13.5 12.0 9.2
42.0 41.9 35.0 11.7 55.3 27.0 58.4 57.0 29.6 38.5 26.0 16.5
18.0 24.9 20.0 28.0 28.5 36.4 39.5 5.0 9.0 5.0 6.9 7.0
12.0 8.3

a) Presentar dichos datos en una tabla de distribución de frecuencias, usando 6 intervalos de


clase.
b) Estime la proporción de ingresos que están entre 12,500 dólares y 52,500 dólares.
c) Estimar la proporción de ingresos que están debajo de 50,000 dólares.

5.- Los siguientes datos son calificaciones en la prueba de Miller de personalidad de 82 estudiantes.
22 22 20 27 30 23 29 21 26 31 21 23 25
29 18 22 31 30 28 16 28 33 25 23 31 23
18 24 26 25 17 22 25 28 19 24 20 23 26
21 31 25 24 33 29 20 27 21 25 28 24 23
25 30 27 23 26 22 24 17 33 26 24 19 18
33 25 28 31 29 27 28 24 26 24 22 26 24
18 21 29 22

a) Organice los datos en un cuadro de distribución de frecuencias


b) Presente los datos en una gráfica apropiada.
Guía Práctica de Estadística General |
20

6.- Cierto investigador especialista en salud pública afirma que el nivel de plomo en sangre en niños
en edad escolar de una cierta región, se ha incrementado. Para verificar este supuesto se toma una
muestra de 120 niños en edad escolar, obteniendo los siguientes resultados:

27.88 28.42 45.81 6.55 6.4 6.14 3.73 26.88 31.93 14.85 26.88 38.35
34.26 38.97 7.22 5.24 15.4 3.73 31.93 28.34 10.79 26.88 6.32 33.09
28.24 4.67 6.07 9.77 5.35 28.34 33.43 14.85 28.84 3.27 4.88 47
6.56 49.24 6.82 35.49 33.43 27.38 11.33 5.44 9.28 4.36 35.6 9.17
34.26 28.84 26.53 7.92 27.96 6.28 38.62 6.55 4.4 10.79 33.09 28.42
27.38 34.47 5.91 33.1 12.04 34.26 4.24 7.22 45.16 5.91 34.94 5.04
27.6 28.42 33.09 13.38 37.47 38.41 4.67 36.23 33.09 6.67 36.71 33.83
5.04 34.98 6.56 36.56 8.85 29.33 4.88 34.26 34.99 4.82 17.96 7.92
4.68 25.21 4.68 35 9.17 25.17 4.82 28.84 34.13 6.28 4.88 8.7
51.24 5.84 34.72 33.83 35.09 28.42 30.83 4.79 5.44 7.17 29.29 32.29

a) Construya una tabla de frecuencias


b) Obtenga un histograma y polígono de frecuencias.

7.- Se hizo un estudio sobre el cangrejo Xantido referente al número de huevos puestos por
individuo
Las siguientes son las observaciones obtenidas para 45 cangrejos.

1959 4534 7020 6725 6964 7428 2802 2462 4000 3378 7343 4189
2412 7624 1548 4801 737 5321 6837 8639 7417 6082 10241 962
5099 6627 4484 5633 4148 6588 6472 8372 8225 6142 12130 9359
8973 849 3894 5847 9166 4327 5749 1801 4632

Presentar en una tabla de frecuencias usando 6 intervalos de clase cerrados.

8.- En marzo de 1995 la inversión extranjera en el Perú y de acuerdo al país de origen fue como
sigue:
España 46% Países Bajos 6%
EE.UU. 16% Panamá 5%
Reino Unido 8% Chile 4%
Otros 15%

Representar gráficamente dicha información.

9.- Una tienda comercial, ubicada en Lima Metropolitana, vende ropa de moda para damas y
caballeros además de una amplia gama de productos domésticos. A continuación se presentan las
ventas netas observadas durante los años del 2002 al 2006. Represente gráficamente dicha
información.

Año Ventas netas (millones de S/.)


2002 500.0
2003 519.2
2004 535.8
2005 560.9
2006 544.1
Guía Práctica de Estadística General |
21

10.- Se ha hecho una encuesta para saber con qué regularidad se lee el periódico en Lima, y los
resultados fueron estos:

RESPUESTAS %
Todos los días 37.5
Una vez por semana 29
Una vez al mes 10.5
Alguna vez al año 12
Nunca
No contesta 0.4

a) ¿Qué tanto por ciento de personas respondieron “nunca”?


b) Si las personas que no contestaron fueron 6, ¿cuántas personas fueron encuestadas?
c) Las personas encuestadas, ¿son muestra o población?
Guía Práctica de Estadística General |
22

MEDIDAS DE TENDENCIA CENTRAL,


MEDIDAS DE POSICIÓN,
Guía Práctica de Estadística General |
23

MEDIDAS DE DISPERSIÓN, ASIMETRÍA Y


CURTOSIS.
Guía Práctica de Estadística General |
24

Ejercicios de Medidas de Tendencia Central

1.- Los salarios en una Empresa son en promedio S/. 380 semanales, con posterioridad se incorpora
a la Empresa un grupo de trabajadores igual al 25 % de los que estaban anteriormente. El nuevo
grupo ingresa a la Empresa con un salario medio igual al 60 % de los antiguos. Dos meses más
tarde, la Empresa concede un aumento de salarios de S/. 50. Hallar el salario promedio del total de
trabajadores.

Solución:
n1 : N º de trabajador es antiguos  x1 : Salario promedio de antiguos
0.25n1  n 2 : N º de trabajador es nuevos  x 2 : Salario promedio de los nuevos
X p  Salario promedio de todos los trabajador es

Sabemos que x1  380 x 2  0.6(380)  228

n1 (380)  0.25 n1 ( 228)


Xp   349.6  349.6  50  399.6
1.25n1

2.- En una Compañía que maneja cuatro productos; los márgenes de utilidad y las totales de ventas
observados durante el año pasado aparecen en la siguiente tabla.

Producto Margen de utilidad Venta total


A 4.2 % $ 30,000
B 5.5 % $ 20,000
C 7.4 % $ 5,000
D 10.1 % $ 3,000

Calcule el margen de utilidad promedio.

Solución:
Considerando que las ventas totales no son las mismas para cada producto, utilizaremos un promedio
ponderado

0.042 (30,000)  0.055 ( 20,000)  ...................................  0.101 (3,000)


Xp   0.0523
30,000  20,000  ........................  3,000

Por lo que el margen de utilidad promedio será del 5.23 %

3.- Una fábrica tiene 3 máquinas. La máquina B produce la mitad de lo que produce la máquina A y
la producción de la máquina C es inferior en un 20 % de lo que produce la máquina B. Los costos
de producción por unidad son: 3, 4 y 5 soles para las máquinas A, B y C respectivamente. Se desea
ganar el 20 % por unidad. Calcule el precio medio de venta.

Solución:
Guía Práctica de Estadística General |
25

Máquinas Costo por unidad Cantidad producida Precio de venta


A S/. 3 2x 3.6
B 4 x 4.8
C 5 0.8x 6.0

3.6 (2 x)  4.8 x  6 (0.8 x)


PV   4.42 soles
2 x  x  0.8 x

4.- El ingreso per cápita mensual de un país es $315. El sector público que constituye un 55% de la
población percibe 18% del ingreso total. Calcule el ingreso medio por habitante del sector público y
no público.

Solución: Consideremos:
n1 x1  n 2 x 2
Ingreso percápita : X p   $315  Ingreso total  315 n
n

Sector Público : n1  0.55 n  Sector no Público : n 2  0.45 n

x
x  n1 x1 Ingreso total del Sector Público   x1  0.18 (315 n)  56.7 n
1
x1   1
n1
.

luego x1 
x 1

56.7 n
 103.09 dólares ( Ingreso promedio del Sector Público)
n1 0.55n

Ahora hallaremos el ingreso promedio del Sector no Público

n1 x1  n 2 x 2 56.7 n  0.45 n ( x 2 )
315    315  56.7  0.45 x 2  x 2  574 dólares
n n

5.- Un grupo de 200 estudiantes, cuya estatura media es de 60.96 pulgadas se divide en dos grupos,
uno con estatura media de 63.4 pulgadas y otro con una estatura de 57.3 pulgadas. ¿Cuántos
estudiantes hay en cada grupo?.

Solución: Sea n1 = Nº de hombres y n2 = Nº de mujeres


Sabemos que n1  n 2  200  n1  200  n 2
además X p  60.96 X 1  63.4 X 2  57.3

( 200  n 2 ) 63.4  57.3 n 2


luego 60.96   n2  80 n1  120
200
Guía Práctica de Estadística General |
26

6.- Una estación de servicio automotriz gasta $500 en la compra de latas de aceite que cuestan $10
la docena; $500 en latas que cuestan $12.5 la docena; otros $500 en latas que cuestan $20 la docena
y $500 en otras que cuestan $25 la docena.
a) Determinar el costo promedio por docena de las latas de aceite.
b) En promedio ¿Cuántas docenas de latas de aceite compró?

Solución:

a) Hallaremos el costo promedio por docena

Monto Costo por docena Docenas compradas


500 10 50
500 12.5 40
500 20 25
500 25 20
Total = 2000 135

2000 dólares
X   14.8 dólares / docena
135 docenas

135
b) Pr omedio de docenas compradas :  33.75 docenas
4
Guía Práctica de Estadística General |
27

Ejercicios de Medidas de Posición No Central

Ejemplo:
Suponga que Juan obtiene 86 en la calificación de un examen de inglés. Si esta puntuación
corresponde al percentil 90, entonces 90% de los estudiantes obtuvieron una puntuación menor que
la de Juan y 10% de los estudiantes obtuvieron una puntuación mayor.

Ejemplo:
Determine el percentil 85 en los sueldos mensuales de la tabla siguiente:

Egresado 1 2 3 4 5 6 7 8 9 10 11 12
Sueldo
Mensual 3450 3550 3650 3480 3355 3310 3490 3730 3540 3925 3520 3480
inicial

Ejemplo:
Determine el percentil 50 en los sueldos mensuales:

Egresado 1 2 3 4 5 6 7 8 9 10 11 12
Sueldo
Mensual 3450 3550 3650 3480 3355 331 3490 3730 3540 3925 3520 3480
inicial 0

Ejemplo:
Determine el cuartil 25 y 75 en los sueldos mensuales de la tabla siguiente:

Egresado 1 2 3 4 5 6 7 8 9 10 11 12
Sueldo
Mensual 3450 3550 3650 3480 3355 3310 3490 3730 3540 3925 3520 3480
inicial

Ejemplo:
Determine el Deciles 1 y 7 en los sueldos mensuales de la tabla siguiente:

Egresado 1 2 3 4 5 6 7 8 9 10 11 12
Sueldo
Mensual 3450 3550 3650 3480 3355 3310 3490 3730 3540 3925 3520 3480
inicial
.4
Guía Práctica de Estadística General |
28

Ejemplo:
En la tabla siguiente se muestra la distancia recorrida por 65 automóviles en un día. Calcular
el percentil 35 de los datos agrupados.

Distancia recorrida Frecuencia Frecuencia


Acumulada
50-59 8 8
60-69 10 18
70-79 16 34
80-89 14 48
90-99 10 58
100-109 5 63
110-119 2 65

Ejemplo:
En la tabla siguiente se muestra la distancia recorrida por 65 automóviles en un día. Calcular el
cuartil 1 de los datos agrupados

Distancia recorrida Frecuencia Frecuencia


Acumulada
50-59 8 8
60-69 10 18
70-79 16 34
80-89 14 48
90-99 10 58
100-109 5 63
110-119 2 65

Ejemplo:
En la tabla siguiente se muestra la distancia recorrida por 65 automóviles en un día. Calcular el
Decil 6 de los datos agrupados

Distancia recorrida Frecuencia Frecuencia


Acumulada
50-59 8 8
60-69 10 18
70-79 16 34
80-89 14 48
90-99 10 58
100-109 5 63
110-119 2 65
Guía Práctica de Estadística General |
29

EJEMPLOS QUE DEBEN DE RESOLVERSE EN CLASES

1. El tiempo de viaje (en horas) de 5 pasajeros es :11, 10, 14, 9 y 13, Calcular los percentiles
20,25 y 65
2. Millones de estadounidenses trabajan para sus empresas desde sus hogares. A
continuación, se presenta una muestra de datos que dan las edades de estas personas
que trabajan desde sus hogares.
18 54 20 46 25 48 53 27 26 37
40 36 42 25 27 33 28 40 45 25

¿Calcule el percentil 50, cuartil 2 que conclusiones puede observar luego de efectuar el
cálculo?

3. Se analizan los salarios en una de las áreas de una compañía y se obtiene información de
7 salarios en nuevos soles: 850.000, 740.000, 1350.000, 5565.000,750.000, 650,000,
680.000. Calcular los deciles 6, 8 y 9.

4. En el Curso de estadística de un centro de formación bancaria se obtuvieron las notas de


15 estudiantes, las que se detallan a continuación: 12, 14, 15, 13, 16, 17, 19, 11, 13, 15, 16,
18, 13, 17, 14. Calcule el Percentil 45, cuartil 3 y decil 8 de las notas de los estudiantes.

5. Se analizó el impuesto que se aplica, en diversos países de Asia, a la compra de


instrumento de Musical. Los resultados obtenidos fueron los siguientes:

Intervalo Frecuencia Frecuencia


(años) (fi) Acumulada
(Fi)
50-54 7 7
54-58 10 17
58-62 16 33
22-66 20 53
66-70 18 71
70-74 11 82
74-78 8 90
Total 90

Calcule el percentil 36, el cuartil 2 y el decil 3.


Guía Práctica de Estadística General |
30

6. Se ha pasado un examen de 79 preguntas a 600 personas. El número de respuestas


correctas se refleja en la siguiente tabla:

Repuestas Frecuencia Frecuencia


(fi) Acumulada
(Fi)
0-10 40 40
10-20 60 100
20-30 75 175
30-40 90 265
40-50 105 370
50-60 85 455
60-70 80 535
70-80 65 600

Obtener los percentiles, cuartiles y deciles 30, 1 y 18 respectivamente


Guía Práctica de Estadística General |
31

Ejercicios de Medidas de Dispersión

1.- El coeficiente de variación de los ingresos mensuales de 100 empleados de una


compañía es 0.6. Después de un aumento general de S/. 90 mensuales para cada uno de los
trabajadores de la compañía, el coeficiente de variación es ahora de 0.55. Determinar la
cantidad de dinero que necesitará mensualmente la compañía para pagar los sueldos
después de hacer efectivos los aumentos.

Solución: Sea X: Sueldos antes del aumento


Antes Después

S S
C.V   0.6 C.V   0.55
X X  90

luego S  0.6 X S  0.55 ( X  90

Igualando las desviacion es estándar S

0.6 X  0.55 ( X  90)


0.6 X  0.55 X  49.5  0.05 X  49.5  X  990 (S

entonces X  90  1080 ( Sueldo promedio actual )


Luego : Dinero total para pagar los sueldos será 100(10

2.- Una muestra de 70 datos da una media de 120 y una desviación estándar de 6; otra muestra de 30
datos da una media de 125 y una desviación estándar de 5. Se reúnen las dos muestras formando una
sola muestra de 100 datos. Calcule el coeficiente de variación de esta muestra de 100 datos.

Solución: Se tiene que:

n1  70 n2  30
X 1  120 X 2  125
S1  6 S2  5

S
Hallaremos : C.V . 
X

70 ( 120 )  30 ( 125 )
n1 X 1  n 2 X 2 =  121.5
en este caso X  70  30
n1  n2
Guía Práctica de Estadística General |
32

 X  2

Sabemos que : S2 
X2  n
n 1

 X 2 2 X X 
X   1 2
2

en este caso por tratarse de dos grupos : S2 


1 2 n
n 1

 X  2

 X 12   X 12   8400
2
1
n1 70
S12 
n1  1
 36 
69
 X 1
2
 1010484

 X  2

 X 22   X 22   3750
2
2
n2 30
S 22 
n 2
 25 
29
 X 2
2  469475

1479959  12150
2

Luego S2  100  37.72  S  6.14


99

6.14
Por lo tan to C.V  x 100%  5.05%
121.5
Guía Práctica de Estadística General |
33

EJERCICIOS PROPUESTOS

1.- Una firma comercial afirma que el salario promedio mensual pagado a su personal es de $640,
esto sugiere que dicha firma paga bien. Sin embargo, un análisis posterior indicó que se trata de una
pequeña empresa, que emplea 4 jóvenes con haberes mensuales de $300 c/u y el gerente general con
un haber de $2000 mensuales. ¿Ud. puede seguir afirmando que la firma paga bien?

2.- En cierto hospital se encuentran en observación en el Departamento de Urología: 5 adultos de 51 kg


de peso; 8 de 53; 10 de 62; 7 de 64; 3 de 70; 8 de 72; 15 de 75 y 2 de 79 kg de peso. Hallar la
mediana y la moda. Interprete.

3.- Las temperaturas medias de 40 días del año, registradas en la localidad de Monteagudo han sido:
(en grados centígrados):
-9 -8 -5 -2 2 1 6 7 9 12 13 17 16
15 18 17 14 17 23 22 25 25 28 26 29 31
35 38 37 36 29 25 24 18 16 8 7 3 -1
-3
a) Construya la tabla de frecuencias clasificando la temperatura en cinco clases.
b) Calcule la media aritmética
c) ¿Cuántos días han registrado temperaturas entre X  8º C y X  8º C
d) ¿Cuál es el porcentaje de días con temperaturas entre  3º C y 33º C ?
e) ¿Cuál es la proporción de días con temperaturas mayores a 26ºC ?.

4.- Una población industrial tiene 4 fábricas: M, N, O y P. Los 50 obreros de la fábrica M ganan, en
promedio $24 por día; los 35 obreros de N, $38 por día, los 25 obreros de O, $43 por día y los 72
empleados de P, $36 por día. Hallar el ingreso promedio por día de esa población industrial.
Rpta. 34.05

5.- Ciertos inspectores de salubridad examinan toneladas de mariscos. El inspector A examinó 30


toneladas de las cuales 10 no sirven. El inspector B examinó 50 de las cuales 40 están en perfectas
condiciones. El inspector C examina 80 de las cuales el 25% no sirve. ¿Qué porcentaje de los
mariscos están en buenas condiciones?. Rpta. 75%

6.- Para evaluar como influye el consumo de alcohol en el deterioro de la inteligencia, se realizó una
investigación en la ciudad de Trujillo sobre un cierto número de personas de entre 25 y 55 años. Se
tomó entre otras técnicas el test de Wais que mide el CI; los resultados obtenidos se muestran en la
tabla. ¿Se puede calcular la mediana? ¿y la moda? de ser así hallar el valor de dichos estadígrafos e
interpretar los resultados obtenidos. Rpta. Me = 121.5

C. Intelectual 100-110 110-120 120-130 130-140 140-150


Hi 0.14 0.44 0.85 0.97 1.00

7.- Seis mecanógrafas escriben a las siguientes velocidades 45, 37, 30, 38, 35 y 42 palabras por
minuto. Si cada una de ellas escribe un mismo texto calcular la velocidad media. Rpta. 37.2
palab/min

8.- Las notas de 50 alumnos se clasificaron en una tabla de frecuencias con siete intervalos de clase
de igual amplitud. Se pide calcular la mediana y la moda sabiendo además que: x 5 = 75; f2 = f5 =
7;
F1 = 6; f7 = 4; F3 = 22; F5 = 41 y x = 62.6.
Guía Práctica de Estadística General |
34

9.- Hallar e interpretar la moda de la distribución siguiente:

Intervalo de clase 34 -36 36 - 38 38 - 40 40 - 42 42 - 44 44 – 46


Frecuencia absoluta 2 5 30 40 20 3

10.- Dado los siguientes datos: 20, 9, 25, 4, 13, 15, 20, 27, 22, 18, 30, 7, 10 .
Hallar: Me, Mo, Q3, y P85

11.- De las mediciones biométricas efectuadas con cierto número de estudiantes se han extraído los
siguientes datos:
Los varones de 17 años tienen un peso medio de 60.8 kg. con una desviación estándar de 6.69 kg.
Los varones de 10 años tienen un peso medio de 30.5 kg y una desviación estándar de 5.37 kg
A partir de los datos anteriores se puede afirmar que el peso es más variable a los 10 años que a los
17 años. Rpta. Efectivamente el peso es más variable a los 10 años

12.- Se tiene la siguiente información sobre una distribución de frecuencias de los pesos en kg de 50
elementos de un determinado material. La amplitud de los intervalos de clase es igual a 20:

[Li-1 - Li> xi fi Fi xifi


850
1710
27 2730
9
- 260 1500
50

a. Realiza el histograma de frecuencias absolutas y el polígono de frecuencias.


b. Determinar la media y la mediana.
c. Hallar el número de datos que se estima pertenezcan al intervalo [200, mediana].
d. Hallar el primer cuartil y el 85avo percentil. Interpretar los resultados obtenidos.

13.- Suponga que la siguiente tabla de distribución representa los salarios diarios de los trabajadores
de construcción civil de Lima:

Salarios diarios (en S/.) Frecuencia


De 24 a 36 360
De 36 a 42 420
De 42 a 60 510
De 60 a 72 660
De 72 a 84 570
De 84 a 96 480
Total 3000

a. El sindicato de construcción civil solicita que en el nuevo pacto colectivo se establezca un


salario diario mínimo de S/. 42. ¿Qué porcentaje de trabajadores se beneficiarán con este
pacto?

b. Los trabajadores que reciben más de 90 soles diarios, se supone son muy calificados
(maestros de obra). ¿Cuál es ese porcentaje?

c. Estime el número de trabajadores que ganan entre 45 y 81 soles diarios.


Guía Práctica de Estadística General |
35

14.- En la tabla siguiente se tiene los datos del número de seguidores de diferentes religiones en el
mundo, según una estimación de www.adherents.com

a. Elaborar la distribución de frecuencias relativas


b. ¿Se puede calcular la media, la mediana o la moda de estos datos? Si es así, obtenerlos y
explicar el significado de tus cálculos.

Millones de
Religión
personas
Cristianismo 2000
Islam 1300
Hinduismo 900
Ateos-agnósticos-sin religión 850
Budismo 360
Confucionismo / Maoísmo 225
Animismo y religiones
245
tradicionales africanas
Otras 93
Total 5880

15.- Dada la siguiente distribución respecto a edades de un grupo de personas: 18, 39, 33, 28,
29, 40, 21, 26, 23, 48, 22, 43, 24, 46, 19, 27, 38, 12, 36, 32.

Calcular e interpretar: Q1, y P87.

16.- El Ministerio de Educación realiza un estudio para determinar el monto de las subvenciones
anuales entregadas a colegios de Arequipa. Para ello selecciona una muestra de 40 de ellos; los
montos por subvención son los que a continuación de se detallan (expresados en millones de soles):

Subvención Nº colegios
(millones de soles)
6–7 1
7–8 5
8–9 3
9 – 10 4
10 – 11 5
11 – 12 7
12 – 13 5
13 – 14 7
14 – 15 3

Calcular e interpretar:

a. La subvención mínima del 25% de los colegios con mayor subvención.


b. La subvención máxima del 40% de los colegios con menor subvención
c. El numero de colegios del intervalo [P40, P85].
Guía Práctica de Estadística General |
36

17.- Cierta fábrica tiene un departamento de producción y otro de ventas. Las tablas que se muestran
a continuación muestran los salarios percibidos hasta fines de mayo de este año (expresado en miles
de soles):

Dpto. producción Dpto. ventas


Nº Nº
Intervalos Intervalos
trabajadores trabajadores
1 – 1.5 12 6-8 4
1.5 – 2 28 8 – 10 6
2 – 2.5 32 10 – 12 12
2.5 – 3 24 12 – 14 15
3 – 3.5 12 14 – 16 3

a. Hallar la desviación típica correspondiente a cada departamento.

b. Determinar cual de los departamentos presenta mayor dispersión relativa.

18.- Dos países son igual de ricos, porque tienen la misma renta per cápita (o renta media), de 8.000
dólares al año. Pero en el país A la desviación típica es de 1.000 dólares y en el país B es de 4.000
dólares. ¿Qué podemos decir sobre la distribución de la riqueza de ambos países gracias a este dato?

19.- Los pesos de los jugadores de un equipo de fútbol son los siguientes: 76 78 75 72 81 75
82 71 68 71
a. Calcula el peso medio del equipo.
b. ¿Cuál es la mediana?

20.- Determinar la varianza del conjunto de observaciones x 1, x2, x3, x4, x5, a los cuales se les ha
restado 4, obteniéndose el siguiente conjunto: 3, 0, 2, 4, 1.

21.- Se ha realizado un estudio a través de una prueba que mide el CI (coeficiente de inteligencia) de
90 personas. Los resultados se recogen en la tabla siguiente:

C. Intelectual 100-110 110-120 120-130 130-140 140-150


Nº de
10 26 40 12 2
estudiantes

a) ¿Qué porcentaje de personas tuvieron a lo más un CI de 118?. Rpta. 34.4% aprox


b) ¿Cuál es el CI mínimo que se requiere tener para pertenecer al quinto superior? Rpta.
129

22.- Un comerciante vende cinco tipos de limpiadores para desagües. En la tabla se muestra cada
tipo junto con la utilidad por lata y el número de latas vendidas.

Limpiador Utilidad por lata Volumen de ventas en latas


A $ 2.00 3
B 3.50 7
C 5.00 15
D 7.50 12
E 6.00 15

Calcular la utilidad promedio por lata.


Guía Práctica de Estadística General |
37

23.- En una clase hay 70 estudiantes varones con una edad promedio de 21.8 años y 30 mujeres las
cuales en promedio son 15% más jóvenes. Calcular la edad promedio de los estudiantes. Rpta.
20.82

24.- Los siguientes datos son los haberes básicos en dólares del mes de agosto de 20 empleados de
un Ministerio.

210 200 220 150 190 100 160 150 170 190 150
180 230 210 160 140 180 120 200 190.

Para el mes de setiembre se decreta un aumento del 10% sobre los haberes del mes de agosto y un
descuento del 2% de los haberes del mes de setiembre pro fondos de compensación social. Se pide
calcular la media y la desviación estándar de los nuevos haberes.
Rpta. 188.65 y 35.51

25.- El cuadro siguiente presenta la distribución (en porcentajes) de volúmenes de ventas anuales en
las empresas de cerámicas de la provincia de Lima durante el año pasado:

Ventas (dólares) Empresas (%)


Menos de 2500 19,8
2500 – 5000 13,2
5000 – 10000 13,0
10000 – 20000 17,7
20000 – 40000 11,0
40000 – 100000 14,4
100000 – 250000 8,5
250000 – 500000 1,8
500000 ó más 0,6

a) Calcule el volumen de venta promedio anual de las empresas


b) Determine el volumen de ventas mínimo observado por el 25% de las empresas que
registraron mayores ventas.

26.- Se pretende lanzar un producto del hogar al mercado para ser vendido en las grandes tiendas de
Lima. Se hizo una encuesta en la salida de dichas tiendas a 200 personas y se le preguntó por el
precio que estarían dispuestos a pagar por el producto. Los resultados fueron los siguientes:

Precio (soles) Nº de
personas
1400 - 1800 40
1800 - 2200 45
2200 - 2600 44
2600 - 3000 39
3000 - 3400 32
Total 200

a) Determine el precio promedio que una persona está dispuesto a pagar por el producto.
Guía Práctica de Estadística General |
38

b) El precio mínimo en que conviene lanzar el producto al mercado es de S/. 2180 y solo se
lanzará si por lo menos la mitad de los encuestados están dispuestos a pagar dicho precio.
¿Qué decisión se toma según la información anterior?.

27.- Los precios de una artículo, el mes pasado tenía una media de S/. 45.8 y una desviación estándar
de 8.2. En el presente mes hubo un aumento en los precios equivalente a un 3 % de los precios del
mes pasado. Calcule los nuevos valores de la media y la desviación estándar.
Guía Práctica de Estadística General |
39

ASIMETRÍA Y CURTOSIS

ASIMETRÍA

Recuperado de: http://www.spssfree.com/curso-de-spss/analisis-descriptivo/medidas-de-distribucion-curtosis-


asimetria.html

Índice de Simetría de Pearson

As<0 Asimetría negativa


As = 0 Simétrica
As>0 Asimetría positiva

El coeficiente varía de -3 y 3
Si:
As<0 Distribución Asimetría negativa
As = 0 Distribución Simétrica
As>0 Distribución Asimetría positiva
b) Medida de Yule Bowley o Medida Cuartílica

La medida de Bowley varía entre -1 y 1


Si:
As<0 Distribución Asimetría negativa
As = 0 Distribución Simétrica
As>0 Distribución Asimetría positiva
Guía Práctica de Estadística General |
40

c) Medida de Fisher
Datos sin agrupar:

Cálculo en el SPSS:

CURTOSIS

K<0 Platicurtica
K = 0 Mesocurtica
K>0 Leptocurtica

Recuperado de: http://www.spssfree.com/curso-de-spss/analisis-descriptivo/medidas-de-distribucion-curtosis-


asimetria.html
Guía Práctica de Estadística General |
41

Ejercicios

La Dirección General de ESSALUD está interesada en estudiar los casos de varicela en los
niños. Para ello selecciona una muestra aleatoria de niños que acaban de salir del proceso de
la enfermedad (grupo I) del distrito de Miraflores y otro grupo de niños que (grupo II) del
distrito de Breña. Se registró la edad en que se presentó la mencionada enfermedad en
ambos grupos de niños. Los datos se muestran a continuación:

Grupo I 1 2 4 1
1=2 = 1.5
Grupo II 2 7 7 8 = 5.5
2=6

Calcule los índices de asimetría y curtosis para cada grupo de niños


Guía Práctica de Estadística General |
42

Los siguientes datos corresponden a la cantidad de goles realizados por el Club Alianza
Lima en el último Torneo de la Copa Perú.

2 5 3 4 1 2 0 3 4 2

Determine el coeficiente de asimetría y curtosis. Realice la gráfica respectiva.

2. Se evalúo a una sección estudiantes que llevaron el curso de Estadística en el Ciclo


Verano de una Universidad Peruana. Determine el tipo de distribución que presentan los
siguientes datos.

Notas fi
0–5 3
5 – 10 5
10 – 15 12
15 - 20 10
Total

3. Los siguientes datos corresponden al número de hijos de las trabajadoras del sexo
femenino del Centro de Salud “El Olivar”
Número de hijos Número de trabajadoras
0 13
1 20
2 25
3 20
4 11
5 7
6 4

Analiza la forma de la distribución calculando los coeficientes adecuados.

4. Se evaluó a un grupo de estudiantes de la carrera de Estomatología para establecer la


cantidad de piezas dentales extraen por día.

2 1 3 3 4 5 7 2

Determine el tipo de distribución que presentan los datos.


Guía Práctica de Estadística General |
43

PROBABILIDADES
DISTRIBUCIONES:
BINOMIAL, POISSON,
NORMAL, MUESTRAL.
Guía Práctica de Estadística General |
44

OPERACIONES CON EVENTOS Y PROBABILIDADES

1.- En una compañía hay 6 varones y 4 damas que aspiran a ser miembros de un comité. Si se debe
escoger dos al azar. ¿Cuál es la probabilidad de que:
a) Los dos sean hombres
b) Sean un hombre y una mujer o dos mujeres.
Solución:

a) Sea el evento A = {Los dos sean hombres}

6
 
 2 1
P(A)  
 10  3
 
2 

b) Sean los eventos:

B = {Sean un hombre y una mujer} C = {Sean dos mujeres} luego hallaremos:


Guía Práctica de Estadística General |
45

64 4
     
1 1 2 246 2
(BP C)  BP )(  CP )(  (BP C)  
1 0  4 5 3
 
2 
2.- Un lote contiene 100 artículos de los cuales 20 son defectuosos. Se inspecciona del siguiente
modo. Se sacan 5 artículos del lote: si los 5 son buenos se acepta el lote; en otro caso se rechaza.
¿Cuál es la probabilidad de rechazar el lote?.

Solución: Sea X: Nº de artículos defectuosos en la muestra de tamaño 5

P(Rechazar el lote) = P ( X = 1 ) + P ( X = 2 ) + P ( X = 3 ) + P ( X = 4 ) + P ( X = 5 )

= 1 – P ( X = 0 ) = 1 – P ( Aceptar el lote )
Guía Práctica de Estadística General |
46

 80 
 
 5
en donde P(Aceptar)  0.32  P(Rechaz r)  1 0.32  0.68
 10 
 
5 
3.- Un recién graduado solicita empleo en la compañía A y en la B. Se estima que la probabilidad de
ser contratado por A es 0.7 y de ser contratado por B es 0.5. En tanto que la probabilidad de que se
rechace por lo menos una de sus solicitudes es de 0.6. ¿Cuál es la probabilidad de ser contratado al
menos por una de las compañías?

Solución Sean los eventos:


A  {El recien graduado sea contratado por la compañía A}  P ( A )  0.7
B  {El recien graduado sea contratado por la comañía B }  P ( B )  0.5
A'  B '  {Sea rechazado en al menos una de las compañías}  P ( A'  B ' )  0.6
Hallaremos P ( A  B )  P ( Sea contratado en al menos una de las compañias)
P( A  B )  P ( A )  P( B )  P( A  B )
Por otro lado P ( A' B ' )  P ( A  B )'  1  P ( A  B )  0.6  P ( A  B )  0.4
Luego P ( A  B )  0.7  0.5  0.4  0.8

4.- Suponga que en un sorteo la probabilidad de ganar el primer premio es 2/5 y la de ganar el
segundo premio es 3/8. Si la probabilidad de ganar al menos uno de los dos premios es 3/4. Calcular
la probabilidad de ganar:
a) Sólo uno de los dos premios
b) Ninguno de los dos premios

Solución Sean los eventos:


Guía Práctica de Estadística General |
47

2
A   Ganar el primer premio   P( A ) 
5
3
B   Ganar el segundo premio   P( B ) 
8
A  B   Ganar al menos uno de los dos premio   P( A  B )  3 / 4
P( A  B )  P( A )  P ( B )  P ( A  B )
3 / 4  2 / 5  3 / 8  P( A  B )  P( A  B )  1 / 40

15 1 14
40 40 40

15  14 29
Luego P ( A B '  B A' )    0.725
40 40

b) P( A'  B' )  P ( A  B )'  1  P ( A  B )  1  3 / 4  1 / 4  0.25

5.- Un banco de sangre dispone de 10 unidades de sangre tipo A. De ellas cuatro están contaminadas
con suero de hepatitis. Se seleccionan aleatoriamente 3 de estas unidades para utilizarlas con tres
pacientes diferentes.
a) ¿Cuál es la probabilidad de que los tres pacientes estén expuestos a contraer hepatitis por esta
razón?
b) ¿Que al menos dos de ellos no estén expuestos a contraer hepatitis?

Solución:
a) P ( X = 3 ) en donde X: Nº de pacientes expuestos a contraer hepatitis
Guía Práctica de Estadística General |
48

 4
 
 3 4
P( X 3)   0. 3
10 120
 
3 
Guía Práctica de Estadística General |
49

b) P ( X  2 )  P  X  2 )   P ( X  3 ) X : N º de pacientes no expuestos a contraer

6  4 6
     
2 1  60 3 20
P( X 2)   P ( X  3)  
10 120 10 120
   
3  3 

60  20
Luego P ( X  2 )   .0 667
120
Guía Práctica de Estadística General |
50

b) P ( X  2 )  P  X  2 )   P ( X  3 ) X : N º de pacientes no expuestos a contraer

6  4 6
     
2 1  60 3 20
P( X 2)   P ( X  3)  
10 120 10 120
   
3  3 

60  20
Luego P ( X  2 )   .0 667
120
Guía Práctica de Estadística General |
51

PROBABILIDAD CONDICIONAL

Se trata de dos eventos A y B definidos en un mismo espacio muestral, en donde uno de ellos
(evento B) ya ocurrió, es decir se conoce su resultado.

P ( A �B )
P( A / B ) 
P( B )
Ejemplo 1.- Una cierta compañía compra insumos de tres proveedores A, B y C.
Proveedor A abastece con 40% de los insumos, de los cuales el 8% son defectuosos.
Proveedor B abastece con el 35% de los cuales el 9% son defectuosos.
Proveedor C abastece con el 25% de los cuales el 10% son defectuosos.
Si se elige un insumo al azar:
a) ¿Cuál es la probabilidad de que este sea defectuoso?
b) Si el insumo salió defectuoso. ¿Cuál es la probabilidad de que haya sido adquirido del proveedor
A?
Solución: Proveedor Calidad Total
Defectuoso No Defectuoso
A 0.032 0.368 0.40
B 0.0315 0.3185 0.35
C 0.025 0.225 0.25
Total 0.0885 0.9115 1.00

a) Según la tabla: P (Defectuoso) = 0.0885

P( A  D ) 0.032
b) P ( A / D )    0.36
P( D ) 0.0885

OTRO MÉTODO: DIAGRAMA DEL ÁRBOL

D
P(D/A) = 0.08

A P(D’/A) = 0.92
P(A) = 0.40
D’
P(B)=0.35 P(D/B) = 0.09
B D
Guía Práctica de Estadística General |
52

P(D’/B) = 0.91
P(C) = 0.25
D’
C P(D/C) = 0.10
D
P(D’/C) = 0.9

D’
a) Ahora hallaremos la probabilidad de obtener un artículo defectuoso
P ( D )  P ( A ) P ( D / A )  P ( B ) P ( D / B )  P (C ) P ( D / C )
P ( D )  (0.40 x 0.08 )  (0.35 x 0.09 )  (0.25 x 0.10 )  0.0885

b) Ahora hallaremos la probabilidad que un artículo sea proveniente del proveedor A, sabiendo
que el artículo seleccionado salió defectuoso.
P( A  D ) P( A ) P( D / A ) 0.40 x 0.08
P( A / D )     0.36
P ( D) P( D ) 0.0885

Ejemplo 2.- Una cierta prueba médica tiene una efectividad de 99% para descubrir la presencia o no
de una enfermedad (resultado positivo cuando realmente lo tiene o negativo cuando realmente no lo
tiene). Se aplica masivamente la prueba a una población en la cual hay 1% de individuos con la
enfermedad; se desea saber qué porcentaje de los individuos con resultados positivos tendrán
efectivamente la enfermedad.

Solución: Sean los eventos


Guía Práctica de Estadística General |
53

P  { Re sultado sea posiivo }

E  { Persona tenga la enfermedad }  P ( E )  0.01

E
Se pide hallar P  
P

P P E  P 
Se sabe que : P    0.99   P E  P   0.99 x 0.01  0.0099
E P E 

 P' P  E '  P '


P    0.99   P  E '  P '  0.99 x 0.99  0.9801
 E '  PE' 

Tiene la enfermedad: E No tiene la enfermedad: E’ Total


Resultado Positivo: P 0.0099 0.0099 0.0198
Resultado Negativo: P’ 0.0001 0.9801 0.9802
Total 0.01 0.99 1.000

E PE  P  0.0099


Luego P     0.5
P PP  0.0198

MÉTODO DEL DIAGRAMA DEL ÁRBOL:

P
P ( P/E ) = 0.99

E P ( P’/E ) = 0.01
P ( E ) = 0.01
P’

P
P ( E’) = 0.99 P ( P/E’ ) = 0.01

E’
P ( P’/E’) = 0.99

P’
Guía Práctica de Estadística General |
54

Ahora hallaremos la probabilidad que un resultado sea positivo, sabiendo que realmente tiene la
enfermedad.

P (E  P ) P (E ) P (P / E ) 0.01 x 0.99
P (E / P )     0.50
P(P) P (P ) 0.0198

EVENTOS INDEPENDIENTES

Son eventos en donde el resultado de uno de ellos en nada afecta al resultado del siguiente evento o
que en nada se ve afectado por el resultado del evento que le antecedió.
Ejemplo 1.- La proporción general de artículos defectuosos en un proceso continuo es 0.10. Cuál es
la probabilidad de que elegidos dos al azar:
a) Ninguno sea defectuoso
b) Cuando menos uno no tenga defectos

Solución Sean los eventos:


A   El artículo A tenga defectos   P ( A )  0.10
B   El artículo B tenga defectos   P ( B )  0.10
A'   El artículo A no tenga defectos   P ( A' )  0.90
B '   El artículo B no tenga defectos   P ( B ' )  0.90
a) Hallaremos la probabilidad que ninguno sea defectuoso
P ( A'  B ' )  P ( A' ) x P ( B ' ) Por ser eventos independientes
 0.90 x 0.90  0.81

b) Ahora hallaremos la probabilidad de que cuando menos uno no tenga defectos

P ( A'  B ' )  P ( A  B )'  1  P ( A  B )


 1  ( 0.10 ) x ( 0.10 )  1  0.01  0.99
OtroMétodo :
Esto implica que por lo menos uno de los dos artículos no tenga defectos
 P ( A'  B )  P ( A  B ' )  P ( A'  B ' )
 ( 0.09 ) ( 0.10 )  ( 0.10 x 0.90 )  ( 0.90 ) ( 0.90 )  0.99

Ejemplo 2.- La probabilidad de que se alivie un resfriado con el antibiótico A es de 0.7 y con el
antibiótico B es de 0.8. Se tienen dos pacientes resfriados, uno toma el antibiótico A y el otro el B.
¿Cuál es la probabilidad de que:
a) Ambos se curen
b) Uno se cure y el otro no se cure
Guía Práctica de Estadística General |
55

Solución Sean los eventos:


A   El paciente A se cure con el antibiótico A   P ( A )  0.70
B   El paciente B se cure con el antibiótico B   P ( B )  0.80
A '   El paciente A no se cure con el antibiótico A   P ( A' )  0.30
B '   El paciente B no se cure con el antibiótico B   P ( B ' )  0.20
a) Hallaremos la probabilidad de que ambos pacientes se curen
P ( A  B )  P ( A ) x P ( B )  0.7 x 0.8  0.56
b) Ahora hallaremos la probabilidad de que uno se cure y el otro no se cure
P( A  B ' )  P( A'  B )  P ( A ) x P ( B' )  P ( A' ) x P ( B )
 ( 0.7 x 0.2 )  ( 0.3 x 0.8 )  0.14  0.24  0.38
Guía Práctica de Estadística General |
56

EJERCICIOS PROPUESTOS

1.- En un grupo de alumnos de la especialidad de contabilidad se ha determinado de que el 40 %


tienen dificultades en el curso de análisis matemático (M), 20% tienen dificultades en el curso de
estadística aplicada (E) y el 5% tienen dificultades en ambos cursos (M y E). De este grupo de
alumnos de contabilidad seleccionamos uno al azar se pide contestar preguntas
a) Calcular la probabilidad de que tenga dificultad en el curso de análisis matemático o estadística
aplicada.
b) Calcular la probabilidad de que el alumno tenga dificultad en el curso de estadística dado que
tiene dificultad en el curso de análisis matemático.
c) Calcular la probabilidad de que el alumno de contabilidad no tenga dificultad en el curso de
análisis matemático ni en el curso de estadística aplicada.

2.- A continuación se presenta una tabla en el Hábito de Rendimiento en


cual se han clasificado a 100 alumnos según fumar matemáticas Total
hábito de fumar y rendimiento en el curso de Malo Bueno
matemática:
Si 25 5 30
De este grupo seleccionamos un estudiante al
azar, se pide contestar las preguntas: No 15 55 70
a) Calcular la probabilidad de que tenga un
rendimiento malo en matemáticas dado de Total 40 60 100
que fuma cigarrillos.

b) Calcular la probabilidad de que no fume cigarrillos si se sabe que tiene un buen rendimiento en
matemáticas.

3.- La UCS recientemente lanzó una campaña publicitaria para el examen de admisión 2012,
instalando cuatro anuncios panorámicos en la panamericana norte. Se sabe por experiencia que la
probabilidad de que el primer anuncio sea visto por un conductor es de 0.75. La probabilidad de que
el segundo sea visto es de 0.82, la probabilidad para el tercero es de 0.87 y la del cuarto es de 0.90.
Suponiendo que el evento de que un conductor vea uno cualquiera de los anuncios publicitarios es
independiente de si ha visto o no los demás. ¿Cuál es la probabilidad de que:
a) Los cuatro anuncios sean vistos por un conductor?
b) El primero y el cuarto sean vistos, sin que el segundo y el tercero sean notados?
c) Exactamente uno de los anuncios sea visto?
d) Ninguno de los anuncios sea visto?
e) El tercero y cuarto anuncios no sean vistos?

4.- Se estima que el 30% de los habitantes de EE.UU son obesos y que el 3% sufre de diabetes. El
2% son obesos y sufren de diabetes. ¿Cuál es la probabilidad de que una persona elegida al azar.
a) Sea obesa o sufra de diabetes? Rpta. 0.31
b) Sea obesa pero no sufra de diabetes?. Rpta 0.28

5.- De todos los pacientes con cáncer, el 52% son mujeres. El 40% de todos los pacientes sobrevive
al menos 5 años desde el momento del diagnóstico. No obstante, esta tasa de sobrevivencia es válida
solamente para el 35% de las mujeres. ¿Cuál es la probabilidad de que un paciente con cáncer
seleccionado aleatoriamente sea mujer y sobreviva al menos 5 años?. Rpta. 0.182
Guía Práctica de Estadística General |
57

6.- Una empresa constructora del programa MI VIVIENDA descubrió que sólo el 20% de todos los
trabajos se terminaban a tiempo; mientras que el 30% sufrían sobrecostos. Además, los sobrecostos
se presentaban el 75% de las veces en las que se terminaban el trabajo a tiempo. El propietario de la
empresa desea conocer la probabilidad de que un trabajo:
a) Tenga sobrecostos y se termine a tiempo Rpta. 0.15
b) Tenga sobrecostos o se termine a tiempo. Rpta. 0.35
c) Se termine a tiempo, dado que no tiene sobrecostos. Rpta. 0.0714

7.- La distribución de los tipos de sangre en EE.UU entre los individuos de raza blanca es
aproximadamente la siguiente: A: 40% B = 11% AB = 4% O = 45%

Tras un accidente automovilístico, un individuo de raza blanca es conducido a una clínica de


emergencia. Se le hace un análisis de sangre para establecer el grupo al que pertenece. ¿Cuál es la
probabilidad de que sea del tipo A o del B? Rpta. 0.51

8.- En un estudio sobre alcohólicos se informa que el 40% de los mismos tiene padre alcohólico y
que el 6% tiene madre alcohólica. El 42% tiene al menos uno de los padres alcohólicos. ¿Cuál es la
probabilidad de que elegido uno al azar:
a) Tenga ambos padres alcohólicos. Rpta. 0.04
b) Tenga un padre alcohólico, pero no una madre alcohólica. Rpta. 0.36
c) Tenga una madre alcohólica, si el padre no lo es. Rpta. 0.033

9.- De 1000 jóvenes de 18 años, 600 tienen empleo y 800 son bachilleres. De los 800 bachilleres,
500 tienen trabajo. ¿Cuál es la probabilidad de que un joven de 18 años tomado aleatoriamente sea:
a) Un bachiller empleado
b) Empleado pero no bachiller
c) Desempleado o un bachiller
d) Desempleado o no bachiller

10.- El Sr. Conti, propietario de un restaurante, ha mejorado la infraestructura para una buena
presentación. Observa que el 25% de todos los autos que pasan por allí, se detienen para consumir
algún alimento.
a) ¿Cuál es la probabilidad de que los próximos cuatro carros se detengan?
b) ¿Cuál es la probabilidad de que el primer auto pare, que el segundo y tercero no lo hagan y el
cuarto pare?

11.- LLusol compra tres acciones diferentes. La probabilidad de que la primera aumente su valor es
1/3, la probabilidad de que la segunda aumente es de 3/4 y la probabilidad de que la tercera aumente
su valor es de 1/10. Determine la probabilidad de que:
a) Todas aumenten de valor
b) Una aumente su valor

12.- Con base en su experiencia un médico ha recabado la siguiente información, relativa a


las enfermedades de sus pacientes: 5 % creen tener cáncer y lo tienen; 45 % creen tener
cáncer y no lo tienen; 10 % no creen tener pero sí lo tienen; y finalmente 40 % creen no
tenerlo, lo cual es cierto. De entre los pacientes del doctor se seleccionó uno al azar
a) Cuál es la probabilidad que el paciente tenga cáncer?. Rpta. 0.15
b) Cuál es la probabilidad de que el paciente tenga cáncer, si cree no tenerlo?. Rpta. 0.2

13.- Se estima que el 15 % de la población adulta padece de hipertensión, además se sabe que el 75%
de todos los adultos creen no tener este problema. Se estima también que el 6 % de la población tiene
hipertensión pero no es consciente de padecer dicha enfermedad.
Guía Práctica de Estadística General |
58

a) Si un paciente adulto cree que no tener hipertensión. ¿ Cuál es la probabilidad de que la


enfermedad, de hecho exista?. Rpta. 0.08
b) Si la enfermedad existe. ¿Cuál es la probabilidad de que el paciente lo sospeche?. Rpta. 0.60

14.- Sólo el 60% de los estudiantes de la clase de matemática del Profesor X pasaron la primera
prueba. De quienes pasaron el 80% estudiaron, el 20% de quienes no pasaron si estudiaron.
a) ¿Cuál es la probabilidad de que un estudiante pase o estudie?
b) ¿Cuál es la probabilidad de que un estudiante pase pero no estudie?

15.- El 5% de las unidades producidas en una fábrica se encuentran defectuosas cuando el proceso de
fabricación se encuentra bajo control. Si el proceso se encuentra fuera de control, se produce un 30%
de unidades defectuosas. La probabilidad marginal de que el proceso se encuentre bajo control es de
0.92. Si se escoge aleatoriamente una unidad y se encuentra que es defectuosa, ¿Cuál es la
probabilidad de que el proceso se encuentre bajo control?

16.- Una planta armadora recibe microcircuitos provenientes de tres distintos fabricantes B1, B2 y
B3. El 50% del total se compra a B1, mientras que a B2 y B3 se les compra un 25% a cada uno. El
porcentaje de circuitos defectuosos para B1, B2 y B3 es 5, 10 y 12% respectivamente. Si un circuito
está defectuoso, ¿cuál es la probabilidad de que haya sido vendido por el proveedor B2 ?

17.- Se estima que la probabilidad de que una Cía. B tenga éxito al comercializar un producto es de
0.95 si su competidora la compañía A no interviene en el mercado; y es de 0.15 si la compañía A
interviene en el mercado. Si se estima que A intervendría en el mercado con probabilidad de 0.7
a) ¿Cuál es la probabilidad de que la compañía B tenga éxito?. Rpta. 0.39
b) Si la Cía. B no tuviera éxito ¿En cuánto se estima la probabilidad de que A intervenga en el
mercado?. Rpta. 0.975

18.- Contratistas S.A. está negociando dos contratos. La Gerencia piensa que la probabilidad de
ganar el primer contrato es de 60% y que el ganador tendrá ventaja definitiva en la negociación del
segundo contrato. La Gerencia cree que si Contratistas S.A gana el primer contrato va a tener un 70%
de probabilidad de ganar el segundo contrato, en caso contrario disminuirá a 0.10.
a) ¿Cuál es la probabilidad de que Contratistas S.A. pierda ambos contratos?. Rpta. 0.36
b) ¿Cuál es la probabilidad que gane el segundo contrato?. Rpta. 0.46

19.- Una Compañía tiene 1000 repuestos para cierto ensamblado. El 20% de las partes son
defectuosas; además el 40% se compraron a proveedores de fuera y el resto fue fabricado por la
misma compañía. De los comprados fuera de la compañía el 80% son buenos. Si se elige un repuesto
al azar entre esta existencia. ¿Cuál es la probabilidad de que :
a) Sea fabricado por la Compañía y esté buena. Rpta. 0.48
b) Sea defectuosa o comprada. Rpta. 0.52
c) No sea fabricada por la Compañía ni sea buena. Rpta. 0.08
d) Sea comprada, siendo defectuosa. Rpta. 0.4

20.- En un cajón hay 80 artículos buenos y 20 malos; en un 2ª cajón el 30% son malos y en un tercer
cajón el 25% son malos. Se sabe que el número de artículos del tercer cajón es el triple de los que
hay en el segundo y que en total hay 260 artículos. Se mezclan los artículos de las cajas.
a) Si se extrae al azar un artículo. Calcule la probabilidad de que sea malo si se sabe que pertenece al
2ª cajón. Rpta. 0.3
b) Si se extraen al azar dos artículos. Calcule la probabilidad de que el primero y el segundo sean
malos. Rpta. 0.056
Guía Práctica de Estadística General |
59

21.- Se ha determinado que el porcentaje de televidentes que ven los programas A, B y C son
respectivamente 0.4. 0.5 y 0.3. Cada televidente ve los programas independientemente uno del otro.
Si se elige al azar a uno de tales televidentes. ¿Qué probabilidad hay de que vea:
a) Dos de los tres programas. Rpta. 0.29
b) Al menos uno de los tres programas. Rpta. 0.79

22.- En cierta región la probabilidad de que llueva en cualquier día del año es 0.1. Suponiendo la
independencia de un día con otro. ¿Cuál es la probabilidad de que la primera lluvia ocurra después
de 14 días sin lluvia?. Rpta. 0.023
Guía Práctica de Estadística General |
60

DISTRIBUCIÓN BINOMIAL

Estudia a eventos independientes que se repiten varias veces y cuyos resultados tienen solo dos
alternativas; así por ejemplo: masculino-femenino, sano-enfermo, bueno-defectuoso, aprobado-
desaprobado, compra-no compra etc.

n
��
P [ X  x ]  ��p q x nx
x  0, 1, 2, 3,..........................., n
x
��
Ejemplo 1.- Un fabricante envía sus productos en lotes de 20 unidades a sus clientes. El sabe que la
probabilidad de que cualquier artículo esté defectuoso es de 0.05. Cual es la probabilidad de que
determinado lote:
a) No contenga artículos defectuosos
b) ¿Cuál es el número de artículos defectuosos que se espera encontrar en un lote?.

Solución:

a) Hallaremos P ( X = 0 ) en donde X: Nº de artículos defectuosos en un lote

n
��
P [ X  x ]  ��p q
x nx
x  0, 1, 2, 3,.................................n
x
��

�20 �
P( X  0)  � �(0.05) (0.95)  0.36
0 20

�0 �

b) Ahora hallaremos el Nº promedio de artículos defectuosos por lote


E( X )  n p
E ( X )  20 ( 0.05 )  1 artículo defectuoso por lote

Ejemplo 2.- El 20% de todas las mujeres que reciben a un vendedor de aspiradoras en sus hogares
terminan por comprar una. ¿Cuál es la probabilidad de que entre 6 mujeres que admiten la
demostración del vendedor en sus casas:
a) Exactamente dos compren una aspiradora
b) Al menos una acabe por comprar la aspiradora
c) A lo más una no compre una aspiradora

Solución:
Guía Práctica de Estadística General |
61

Exactamente dos compren una aspiradora


luego hallaremos P( X  2 ) en donde X : N º de mujeres que compran
a) 6 2 4
P( X  2 )    (0.2) (0.8)  0.24576
 2

b)

P( X  1)  P( X  1)  P( X  2 )  P( X  3 )  P( X  4 )  P( X  5 )  P ( X  6 )
luego P( X  1 )  1  P( X  0 ) en donde X : N º de mujeres que compran
 6 0 6
P( X  0 )    (0.2) (0.8)  0.26214
 0
Por lo tan to P( X  1)  1  0.26214  0.738
c) Ahora hallaremos la probabilidad que a lo más una no compre
Guía Práctica de Estadística General |
62

P( X  1 )  P ( X  0 )  P( X  1 ) X : N º de amas de casa que no compran la aspiradora


 6 0 6
P( X  0 )    ( 0.8 ) ( 0.2 )  0.000064
 0
 6 1 5
P( X  1)    ( 0.8 ) ( 0.2 )  0.001536
1 
Luego P ( X  1)  0.0016
Ejemplo 3.- En una empresa donde los empleados son 80% hombres y 20% mujeres; están aptos
para jubilarse el 10% de las mujeres y el 15% de los hombres. De 5 solicitudes para jubilarse ¿Cuál
es la probabilidad de que al menos dos estén aptos para jubilarse?

Solución:
Sea X : N º de empleados aptos para jubilarse

P ( X �2)  1   P ( X  0)  P( X  1)
5
��
P ( X  0)  ��( p) (q)
0 5
en donde p : probabilidad que una persona esté apto para jubilarse
0
��
luego p  0.15 ( 0.8)  0.1 ( 0.2)  0.14
5
��
En con sec uencia P ( X  0)  �� ( 0.14 ) ( 0.86)  0.4704
0 5

0
��
5
��
P ( X  1)  �� ( 0.14) ( 0.86)  0.3829
1 4

1
��
Por lo tan to P ( X �2)  1  0.8533  0.1467

Ejemplo 4.- El jefe de la sección de recaudación de cierto municipio observa que, de todas las
multas de aparcamiento que se ponen, se pagan el 78%. La multa es de $2. En la semana mas
reciente, se han puesto 620 multas.
a) Halle la media y la desviación estándar del número de multas que se pagan.
b) Halle la cantidad de dinero que se obtiene por el pago de estas multas; así como también su
desviación estándar.

Solución:
Guía Práctica de Estadística General |
63

a) Sea X: Nº de multas impuestas


E( X ) = n p = 0.78 ( 620) = 483.6 multas o sea aproximadamente 484 multas serán
pagadas

V( X ) = n p q = 620 x 0.78 x 0.22 = 106.392 luego σ = 10.315 multas

b) Recaudación por el pago de multas = 483.6 x 2 = 967.2 dólares

La desviación estándar será: 10.315 ( 2 ) = 20.63

Ejemplo 5.- La probabilidad de cura de una enfermedad normalmente mortal con cierto
medicamente, se estima en 0.30. Si cinco enfermos se tratan con este medicamento. ¿Cuál es la
probabilidad de que al menos cuatro se curen?

Solución:

a) Hallaremos P( X ≥ 4 ) en donde X: Nº de pacientes que se curan

 n  x nx
P[ X  x ]    p q x  0, 1, 2, 3,. . . . . . . . . . . . . . . . .n
 x

P ( X  4 )  P( X  4 )  P ( X  5 )

5  4 1
P( X  4 )    ( 0.3) ( 0.7 )  0.02835
 4

 5 5 0
P ( X  5 )    (0.3) ( 0.7 )  0.00243
 5
Guía Práctica de Estadística General |
64

Luego P ( X  4 )  0.02835  0.00243  0.03078

Ejemplo 6.- Se somete a un estudiante a un examen del tipo verdadero – falso que contiene 10
preguntas; para que apruebe debe responder correctamente a 8 preguntas o más. Si el estudiante está
adivinando. ¿Cuál es la probabilidad de que apruebe el examen?.

Solución: Sea X: Nº de preguntas contestadas correctamente

P( X  8 )  P( X  8 )  P( X  9 )  P( X  10 )

10  8 2
P( X  8 )    (0.5) (0.5)  0.043945
8 

10  9 1
P( X  9 )    (0.5) (0.5)  0.009765
9 

10  10 0
P( X  10)    (0.5) (0.5)  0.000976
10 

Por lo tan to P( X  8 )  0.0547


Guía Práctica de Estadística General |
65

DISTRIBUCIÓN DE POISSON

Estudia a los eventos independientes que suceden con muy poca frecuencia y que ocurren en un
determinado espacio, volumen o tiempo.

X= 0, 1, 2, 3.4 ……………….

Ejemplo 1.- El promedio de llamadas telefónicas en una hora es de 3. ¿Cuál es la probabilidad de


recibir:
a) Exactamente 2 llamadas en una hora
b) Dos o más llamadas en 90 minutos

Solución:

a) Hallaremos P ( X = 2) X: Nº de llamadas en una hora

Según la distribución de Poisson

e 3 3 2
Luego P (X  2)   0.224
2!

b) Enseguida hallaremos la probabilidad de que ocurran dos o más llamadas en 90 minutos

P ( X  2 )  1  {P ( X  0 )  P ( X  1)} X : N º de llamadas en 90 min utos


 4. 5 0
e ( 4. 5 )
P (X  0)   e  4.5
0!
e  4 . 5 ( 4 .5 ) 1
P ( X  1)   4.5e 4.5
1!
Luego P ( X  2 )  1  5.5e  4.5  1  0.0611  0.9389

Ejemplo 2.- Una fábrica envía al depósito 500 artículos. La probabilidad de deterioro de un artículo
en el camino es de 0.002. Hallar la probabilidad de que en el camino se deterioren:
a) Menos de tres artículos
Guía Práctica de Estadística General |
66

b) Por lo menos un artículo

Solución:

a) Dado que np ≤ 1 usaremos la aproximación de la Binomial a la de Poisson en donde µ= np

En este caso µ = np = 500(0.002) = 1

P ( X  3 )  P ( X  0 )  P ( X  1)  P ( X  2 )

e 1 10
P(X  0)   e 1
0!
e 111
P ( X  1)   e 1
1!
1
e 112 e
P(X  2)  
2! 2
Luego P ( X  3 )  2.5 e 1  0.92

b) P ( X  1)  1  P ( X  0 )  1  e 1  1  0.36788  0.63212

Ejemplo 3.- Un líquido contiene cierta bacteria con un promedio de 3 bacterias por centímetro
cúbico. Calcular la probabilidad de que:
a) No contenga bacteria alguna una muestra de 1/3 de cc.
b) Contenga por lo menos una bacteria una muestra de 2 cc.

Solución:

a) Hallaremos P ( X = 0 ) X: Nº de bacterias en 1/3 de cc.

Según la Distribución de Poisson

Donde:
µ= Promedio de bacterias en 1/3 de cc = 1

e 1 10
Luego P(X  0)   e 1  0.368
0!

b) P ( X  1 )  1  P ( X  0 ) X : N º de bacterias en una muestra de 2 cc

e 6 6 0
P(X  0)   e 6
0!

luego 1  e 6  0.9975
Guía Práctica de Estadística General |
67

Ejemplo 4.- Una vacuna produce inmunidad contra la polio en un 99.99%. Suponiendo que la
vacuna ha sido administrada a 10,000 niños.
a) ¿Cuál es el número esperado de niños que no han sido inmunizados?.
b) ¿Cuál es la probabilidad que menos de 2 niños no sean inmunes?

Solución:

a) Dado que np ≤ 1 usaremos la aproximación de la Binomial a la de Poisson en donde


µ = np

En este caso µ = np = 10,000 (0.0001) = 1 niño

b) P ( X  2 )  P ( X  0 )  P ( X  1 )

e 1 10
P(X  0)   e 1
0!
e 111
P ( X  1)   e 1
1!
Luego P ( X  2 )  2 e 1  0.7358
Guía Práctica de Estadística General |
68

DISTRIBUCIÓN NORMAL

Es una distribución de probabilidad que se diferencia de las anteriores por ser de variable aleatoria
continua. Es una de las más importantes ya que la mayoría de los trabajos de investigación están
basados en muestras aleatorias provenientes de poblaciones que se distribuyen normalmente
.
Ejemplo1.- Una máquina expendedora de refrescos se regula de manera que descargue un promedio
de 196 gr. por vaso. La cantidad descargada tiene aproximadamente distribución normal con una
desviación estándar de 14 gramos.

c) ¿Cuál es la probabilidad de obtener un vaso con más de 218.4 gramos?.

Solución:
Consideremos a X: Cantidad descargada por la máquina vendedora de refrescos, la cual se distribuye
normalmente con µ = 196 gr y σ = 14 gr.
Hallaremos:

P ( X  218.4 ) es tan darizando el valor de X mediante la fórmula :

X  218.4  1 96
Z   Z   1.6
 14

P ( Z  1.6 )  0.0548

Interpreta ción.  El 5.48% de los vasos tendrán una cantidad mayor de 218.4 gr

b) Si los vasos pueden contener solo 224 gramos sin que haya derrame. ¿En cuántos vasos de 200
vendidos es probable que el líquido se derrame?.

Solución:
224  196
P ( X  224 )  Z  2 luego P ( Z  2)  0.0228
14

por lo tan to 200 ( 0.0228 )  4.56 es decir se derramarán aproximadamente 5 vasos

Ejemplo 2.- La puntuación media en un examen final de una asignatura fue de 72 y la varianza 81.
El 10% superior de los alumnos reciben calificación A. ¿Cuál es la puntuación mínima que un
estudiante debe tener para recibir un calificación A?.

Solución:
Guía Práctica de Estadística General |
69

X  X  72
Z  1.28   X  83.5
 9

Ejemplo 3.- Una variable aleatoria tiene una distribución normal con σ = 21.5. Hallar su media si la
probabilidad de que la variable aleatoria tome un valor menor que 120.5 es de 0.8849

Solución:
Se sabe que P ( X  120.5)  0.8849

X  120.5  
Z   1.2     94.7
 21.5

Ejemplo 4.- Suponga que las puntuaciones obtenidas en un examen de un curso tienen distribución
normal con µ = 80. Si el 95% de los examinados obtienen puntajes entre 60.4 y 99.6

a) Calcule el valor de la desviación estándar

X  99.6  80
Z   1.96     10
 

b) ¿Qué porcentaje de los examinados obtuvieron entre 55 y 98 puntos

55  80 98  80
Z1    2.5 Z2   1.8
10 10

P (2.5  Z  1.8 )  0.4938  0.4641  0.9579  95.79 %


Guía Práctica de Estadística General |
70

Ejemplo 5.- Los puntajes del coeficiente de inteligencia tomados a un grupo de personas adultas, en
un proceso de selección de personal están distribuidos normalmente con una media de 105 y una
desviación estándar de 12.
a) Si el puntaje mínimo para aprobar es 90. ¿Cuál es el porcentaje de no aprobados?.
b) Si han aprobado el 80% de las personas. ¿Cuál es el puntaje mínimo aprobatorio?.

Solución:
a) Consideremos a X: Puntaje del coeficiente de inteligencia, la cual se distribuye normalmente
con µ = 105 y σ = 12

Hallaremos
P ( X  90 ) es tan darizando el valor de X mediante la fórmula :

X  90  1 05
Z   Z    1.25
 12

P ( Z  1.25 )  0.1056 o sea 10.56%

b) Ahora hallaremos el puntaje mínimo aprobatorio


80%

X  105
 0.84   X  94.92 o sea aproximadamente 95 puntos
12

Ejemplo 6.- En una distribución normal hay 47 % de valores inferiores a 47 y 28% superiores a 70.
Calcular la proporción de valores entre 57 y 86.

Solución
Guía Práctica de Estadística General |
71

47   70  
 0.08  0.58 
 

  0.08   47   0.58   70

Luego   0.08   47 (1)


  0.58   70 (2)

Re solviendo ecuaciones (1) y (2) obtenemos   49.79   34.85

57  49.79 86  49.79
Ahora Z1   0.21 Z2   1.04
34.85 34.85

P ( 0.21  Z  1.04 )  P ( 0  Z  1.04 )  P ( 0  Z  0.21 )


 0.3508  0.0832  0.2676  26.76 %

EJERCICIOS PROPUESTOS

1.- Para estudiar la regulación hormonal de una línea metabólica se inyectan ratas albinas con un
fármaco que inhibe la síntesis de proteínas del organismo. En general 4 de cada 20 ratas mueren a
causa del fármaco antes de que el experimento haya concluido. Si se trata a 10 animales con el
fármaco. ¿Cuál es la probabilidad:
a) Que exactamente 3 no lleguen vivas al final del experimento. Rpta. 0.2013
b) Que al menos 8 lleguen vivas al final del experimento. Rpta. 0.6778

2.- Se determina que un 25% de los niños expuestos a un determinado agente infeccioso contraerán
la enfermedad producida por dicho agente. Entre un grupo de 4 niños igualmente expuestos al agente
infeccioso. ¿Cuál es la probabilidad de que:
a) Exactamente 2 niños se enfermen. Rpta. 0.211
b) Por lo menos un niño se enferme. Rpta. 0.684

3.- En cierto país en desarrollo el 30% de los niños están desnutridos; en una muestra aleatoria de 25
niños de esa área. ¿Cuál es la probabilidad de que el número de niños desnutridos sea:
a) Menos de cinco. Rpta. 0.0905
b) Menos de 7; pero más de 4? Rpta. 0.2502
Guía Práctica de Estadística General |
72

4.- La probabilidad de que un paciente se recupere de una rara enfermedad sanguínea es 0.4.
Si se sabe que 15 personas contraen esta enfermedad. ¿Cuál es la probabilidad:
a) Que sobrevivan de 4 a 7
b) No sobrevivan exactamente 5

5.- Un prominente médico afirma que 70% de las personas con cáncer de pulmón son
fumadores empedernidos. Si su afirmación es correcta:
Encuentre la probabilidad de que de 10 de tales pacientes admitidos recientemente en un
hospital, menos de 3 sean fumadores empedernidos

6.- Si la probabilidad de que un individuo sufra una reacción desfavorable por una inyección de
cierto suero es de 0.001. Determinar la probabilidad de que de 200 personas:
a) Exactamente 3 sufran la reacción. Rpta. 0.0011
b) Dos o más sufran la reacción. Rpta. 0.0175

7.- De la población de valores de Z seleccionamos uno al azar, se pide:


I. Determinar las probabilidades siguientes:
a) P ( Z > 1.37 )
b) P ( Z < - 0.84 )
c) P ( Z ≥ - 2.05 )
d) P ( 1.64 < Z < 1.96 )
e) P ( - 0.84 < Z < 0.84 )
f) P ( -1.24 < Z < 1.63 )
g) P ( - 1 < Z < 2)

II. Calcular el valor de Zo en las siguientes expresiones:


a) P ( Z > zo ) = 0.025
b) P ( Z < zo ) = 0.15
c) P ( Z ≥ zo ) = 0.85
d) P ( Z < zo ) = 0.10
e) P ( - zo < Z < zo ) = 0.8
f) P ( - zo < Z < zo ) = 0.98

8.- Supóngase que se sabe que los pesos de 300 individuos están distribuidos en forma normal con
media de 68 Kg. y una desviación estándar de 11.5 Kg.
a) Cuál es la probabilidad de que una persona seleccionada al azar pese 70 Kg. O menos?
b) Cuántas personas se espera encontrar que pesen 70 Kg o menos?

9.- Las notas de un examen del curso de bioestadística se distribuye normalmente con una media de
13.5 y una desviación estándar de 4.3
a) Cuál es el porcentaje de estudiantes cuyas notas están entre 11 y 15?
b) Cuál es la probabilidad de que un alumno elegido al azar no tenga una nota mayor de 10?
c) Determinar el valor de la nota debajo el cual se ubica el 15% inferior de los alumnos.

10.- Supóngase que se sabe que los niveles de glucosa en sangre extraída a 150 niños en ayunas están
distribuidos normalmente con una media de 66 y una varianza de 42.
a) Cuál es la probabilidad de un niño seleccionado al azar presente un nivel de glucosa en sangre
mayor o igual a 71?
b) Cuántos niños presentan un nivel de glucosa en sangre menor o igual a 61?
c) Determinar la mediana y la moda de la distribución.
Guía Práctica de Estadística General |
73

11.- Los puntajes del Coeficientes de Inteligencia tomados a un grupo de personas adultas, en un
proceso de selección de personal están distribuidos normalmente con una media de 105 y una
desviación estándar de 12.
a) Si el puntaje mínimo para aprobar es 90, ¿Cuál es el porcentaje de no aprobados?
b) Si han aprobado el 75% de las personas, ¿Cuál es el puntaje mínimo aprobatorio?

12.- Supóngase que la estancia promedio de internación en un hospital es de 5.5 días, con una
desviación estándar de 1.8 días. Si se supone que la duración de la internación se distribuye
normalmente, encuentre la probabilidad de que un paciente seleccionado al azar de dicho grupo
tenga una duración de internación:
a) De más de 6 días
b) Entre 4 y 7 días.
c) De menos de 3 días.

13.- El nivel de colesterol en los trabajadores administrativos tiene distribución normal. Por otro lado
se sabe que el 5% superior de los trabajadores su colesterol está por encima de 280 y que el 10%
inferior de los trabajadores su colesterol está por debajo de 170. Se pide determinar los valores de la
media y varianza de la distribución normal. Si de esta población seleccionamos un trabajador al azar,
cuál es la probabilidad de que su colesterol sea mayor a 250.

14.- Calcular k si P ( X ≤ k ) = 0.6141 y X sigue una N(15,4).

15.- De una variable normal N(µ; σ) se sabe que P (X ≤ 7 ) = 0.9772 y P (X ≤ 6.5) = 0.8413.
Calcular:
a) µ y σ.
b) P ( 5.65 ≤ X ≤ 6.25 )
c) El numero k tal que P ( X > k ) = 0.3

16.- La presión arterial sistólica de los cobayos tiene distribución normal con una media de 95 y una
desviación estándar de 9. Si de esta población seleccionamos un cobayo al azar, ¿cuál es la
probabilidad de que:
a) Su presión arterial sistólica sea menor a 75?
b) Su presión arterial sistólica esté comprendida entre 75 y 120?
c) Si el número de cobayos es de 1000, ¿Cuántos cobayos se espera que su presión arterial sistólica
sea mayor a 120?
d) A qué valor de presión arterial sistólica se localiza el 25% inferior de la población de cobayos?

17.- Las calificaciones de una prueba final de una cierta signatura tienen distribución normal con
media de 12. Si el 95.44% de los examinados obtuvieron calificaciones entre 8 y 16.
a) Calcule la desviación estándar. Rpta. 2
b) Si la nota aprobatoria es 11. ¿Qué porcentaje de alumnos aprobaron el curso? Rpta. 69.15%
c) ¿Qué nota mínima deberá tener un alumno para estar ubicado en el quinto superior? Rpta. 13.7

18.-. El número promedio de personas que comen en un restaurante es aproximadamente normal, con
una media de 250 y una desviación estándar de 20 por día.
a) Si el consumo promedio por cliente es de $4 ¿Cuál es el consumo diario esperado? Rpta. $1000
b) ¿Cuál es la probabilidad de que el consumo exceda a $1,100? Rpta. 0.1056

19.- Suponga que la demanda mensual de un bien de consumo se distribuye normalmente con una
media de 650 kg y una desviación estándar de 100 kg.
a) ¿Qué probabilidad hay de que la demanda no supere los 500 kg? Rpta. 0.0668
b) ¿Qué cantidad del bien debe haber mensualmente a fin de satisfacer la demanda en un 89.8 %?
Rpta. 813. kg
Guía Práctica de Estadística General |
74

20.- Trescientas estudiantes tienen talla media de 65 pulgadas y desviación estándar de 2 pulgadas.
Las 300 tallas presentan distribución normal y se miden a la pulgada más cercana.
a) ¿Cuántas estudiantes tienen talla de 64 pulgadas o menos?.
b) ¿Debajo de qué talla están el 30% de las estudiantes?.
c) ¿Cuántas de las estudiantes tienen talla que difiere de la media por más de una desviación
estándar?.

21.- En base a pruebas y la experiencia, un fabricante de lavadoras mecánicas modelo 101XE, decide
que la vida media con uso familiar normal es de 5.8 años, con desviación estándar de 2 años. Si la
vida de este modelo presenta distribución normal:
a) ¿Qué garantía debe ofrecer si está dispuesto a reparar únicamente al 1% de las lavadoras
vendidas?.
b) Si da una garantía de dos años ¿Qué porcentaje de las máquinas necesitarán reparación antes que
expire el período de garantía?.

22.- Una máquina automática que expende café llena los vasos con 6 onzas de café, con desviación
estándar de 0.40 onzas. Si se usan vasos de 7 onzas ¿Qué porcentaje de ellas se derramarán?

23.- Suponga que el ingreso familiar mensual en una comunidad tiene distribución normal con media
de $400 y desviación estándar $50.
a) Si el 10% de las familias debe pagar un impuesto. ¿A partir de qué ingreso familiar se debe pagar
el impuesto? Rpta. $464
b) Si el ahorro familiar está dado por la relación Y = X - 50
4
¿Cuál es la probabilidad de que el ahorro sea superior a $75? Rpta. 0.0228

24.- Si el 20% de los residentes en una ciudad prefiere un teléfono blanco que cualquier otro color
disponible. ¿Cuál es la probabilidad de que entre los siguientes 1000 teléfonos que se instalen en esa
ciudad:
a) Más de 185 sean blancos. Rpta 0.883
b) Al menos 210 pero no más de 225 sean blancos. Rpta. 0.2049

25.- Si el 40% de los clientes de una estación de servicio utilizan tarjetas de crédito. ¿Cuál es la
probabilidad de que entre 400 clientes; más de 250 paguen en efectivo?. Rpta. 0.142
Guía Práctica de Estadística General |
75

DISTRIBUCIÓN MUESTRAL

1. Un estudio reciente de un organismo de vigilancia ambiental determinó que la cantidad de


contaminantes en el río Rímac (en partes por millón) tiene una distribución normal con media de 64
ppm y varianza de 17.6. Suponga que se seleccionan al azar y se toman muestras de 35 ríos.
Encuentre la probabilidad de que el promedio muestral de la cantidad de contaminantes sea:
a) Mayor que 72 ppm.
b) Entre 64 y 72 ppm.
c) Exactamente 64 ppm.
d) Mayor que 94 ppm.

5. La distribución de los ingresos anuales de todos los administrativos de una determinada


institución educativa y con cinco años de experiencia sigue una distribución normal, tiene una media
de $19,000 y una desviación estándar de $2,000. Si extraemos una muestra aleatoria de 30
administrativos ¿cuál es la probabilidad de que sus ganancias promedien más de $19,750
anualmente?

3. En una muestra de 25 observaciones a partir de una distribución normal con media 98.6 y
desviación estándar 17.2,
a) ¿Cuánto vale P(92 < < 102)?
b) Encuentre la probabilidad correspondiente dada una muestra de 36.

4. Dionisio Romero Paoletti dueño de una gran compañía de tarjetas de crédito sabe que el saldo
promedio mensual de un cliente dado es $112 y la desviación estándar es $56. Si Dionisio audita 50
cuentas seleccionadas al azar, encuentre la probabilidad de que el saldo promedio mensual de la
muestra sea:
a) Menor que $100.
b) De entre $100 y $130.

5. Para una muestra de 19 observaciones de una distribución normal con media 18 y desviación
estándar 4.8, calcule
a) P(16 < . < 20).
b) P ( > 21)
c) Suponga un tamaño de muestra de 40. ¿Cuál es la nueva probabilidad en el inciso a)?

6. A partir de una población de 125 artículos con media de 105 y desviación estándar de 17, se
eligieron 64 artículos.
a) ¿Cuál es el error estándar de la muestra?
b) ¿Cuál es la P(107.5 < < 109)?
Guía Práctica de Estadística General |
76
Guía Práctica de Estadística General |
77

7. Luisa Aliaga Ricaldi, investigadora de la Colombian Cofee Corporation, está interesada en


determinar la tasa de uso de café por hogar en Estados Unidos. Ella cree que el consumo anual por
hogar tiene distribución normal con media desconocida y desviación estándar cercana a 1.25
libras.

Si Luisa toma una muestra de 36 hogares y registra su consumo de café durante un año, ¿cuál es la
probabilidad de que la media de la muestra se aleje de la media de la población no más de media
libra?

8. De una población de 75 elementos con media de 364 y varianza de 18, se seleccionaron 32


elementos al azar sin reemplazo.
a) ¿Cuál es el error estándar de la media?
b) ¿Cuál es la P(363 < < 366)?

9. Suponga que la proporción p de padres asistentes a las reuniones del colegio “Saco Oliveros” en la
población es en realidad igual a 0.55. ¿Cuál es la probabilidad de observar una proporción muestral
igual de grande o mayor que el valor observado ˆp = 0 .60

10. Reportajes en periódicos nos dicen que el estadounidense promedio tiene sobrepeso. Muchos de
nosotros hemos tratado de bajar de peso cuando terminamos la preparatoria o la universidad. Y, en
efecto, sólo 19% de adultos dicen que no sufren de problemas de pérdida de peso. Suponga que la
cifra de 19% es correcta y que se selecciona una muestra aleatoria de n= 100 adultos.
a. La distribución de ˆp, es decir, la proporción muestral de adultos que no sufren de excesos de peso,
¿tiene una distribución normal aproximada? Si es así, ¿cuál es su media y desviación estándar?
b. ¿Cuál es la probabilidad de que la proporción muestral ˆp exceda de .25?
Guía Práctica de Estadística General |
78

TAMAÑO DE LA MUESTRA Y
MUESTREO.REGRESIÓN Y
CORRELACIÓN LINEAL. CHI
CUADRADO
Guía Práctica de Estadística General |
79

TAMAÑO DE LA MUESTRA Y MUESTREO

Ejemplo: Se quiere hacer una encuesta para estimar el tiempo promedio por semana que los niños
ven televisión. Por estudios anteriores se sabe que la desviación estándar de dicho tiempo es de 3
horas. Con el nivel de confianza del 95%.
a) ¿Qué tamaño de muestra se debe elegir, de tal manera que el error de estimación no sea superior a
media hora?.
Solución
2 2
Z    1.96 x 3 
n    /2      138.3  n  139 niños
 e   0.5 

b) ¿Qué costo se debe presupuestar para hacer la encuesta, si esta tiene un costo fijo de $5,000 más
un costo variable de $2 por cada entrevista?.
Solución:
5,000 + 2 ( 139 ) = $5,278

Ejemplo: La oficina de Planificación Familiar de cierto distrito desea determinar la proporción de


familias con un ingreso mensual inferior a S/. 800. Estudios previos han indicado que esta
proporción era del 20%. ¿Qué tamaño muestral se requiere para asegurar con una confianza del 95%
que el error en la estimación de esta proporción no sobrepase a 0.03?.

Solución:

Z 2 / 2 p q ( 1.96 ) 2 ( 0.2 ) ( 0.8 )


n  n   683 familias
e2 ( 0.03 ) 2

EJERCICIOS PROPUESTOS

1. Se ha proyectado una encuesta para determinar los gastos médicos anuales promedio por familia
de los empleados de una gran compañía. La administración de la compañía desea tener una confianza
del 95% de que el promedio de la muestra esté correcto en una escala de ± $50 de los gastos reales
promedio por familia. Un estudio piloto señala que la desviación estándar se puede estimar como
$400. ¿Qué tamaño de muestra se necesita?

2. Si un gerente de control de calidad quisiera estimar la vida promedio de un producto en una


escala ± 20 horas con una confianza del 95% y también supone que la desviación estándar del
proceso permanece en 100 horas ¿qué tamaño de muestra se necesita?
Guía Práctica de Estadística General |
80

3. Si una cadena de supermercados quisiera estimar el importe promedio de ventas en una escala de
± $100 con una confianza del 99% y si se supone que la desviación estándar de la población es
$200 ¿qué tamaño de muestra se necesita?

4. Si una compañía de gas quisiera estimar el tiempo de espera promedio en días, dentro de ±5 días
con una confianza del 95% y si se supone que la desviación estándar de la población es de 20 días
¿qué tamaño de muestra se necesita?

5. Un analista político quisiera estimar la proporción de votantes que elegirán al candidato


demócrata en una campaña presidencial. El analista quisiera tener una confianza del 90% de que su
predicción esté correcta en una escala de ±0.04 de la proporción real. ¿Qué tamaño de muestra se
necesita?

6. El gerente de un banco quiere tener una confianza del 90% de estar en lo correcto en una escala
de ± 0.05 de la proporción real de depositantes, que tienen al mismo tiempo cuentas de ahorro y de
cheques. ¿Qué tamaño de muestra se necesita?

7. ¿Qué tamaño de muestra se necesitará si una compañía de autobuses quisiera realizar una
encuesta, en la que desearía tener una confianza del 95% de estar en lo correcto en una escala de ±
0.02 de la proporción real de viajeros que utilizarían el servicio de autobús?. En base a la
experiencia con otras rutas, se supone que la proporción real es de aproximadamente 0.40.

8. Un equipo de investigación médica está seguro sobre un suero que han desarrollado, el cual
curará cerca del 75% de los pacientes que sufren de ciertas enfermedades. ¿Qué tamaño debe ser la
muestra para que el grupo pueda estar seguro en un 98% que la proporción muestral de los que se
curan esté dentro de más menos 0.04 de la proporción de todos los casos que el suero
curará?.Rpta. n = 637
Guía Práctica de Estadística General |
81

Ejercicios de Regresión y Correlación Lineal

Ejemplo 1.- El costo de fabricar un lote de cierto producto depende del tamaño del lote, como se
aprecia en el siguiente conjunto de datos:
Costo ($10): 30 70 140 270 530 1010 2500 5020
Tamaño del lote: 1 5 10 25 50 100 250 500
(100 unidades)

a) Grafique un diagrama de dispersión


b) Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.
c) Grafique sobre el diagrama de dispersión, la línea de regresión.
d) Estime el costo para un lote cuyo tamaño es de 500 unidades
e) Calcule el error estándar de estimación
f) Calcule e interprete el coeficiente de correlación.
g) Interprete el coeficiente de determinación.

Solución

a) Diagrama de Dispersión

Gráfica de dispersión de Y vs. X

5000

4000
Costo ( 10 dólares ): Y

3000

2000

1000

0 100 200 300 400 500


Tamaño del lote ( 100 unidades): X
Guía Práctica de Estadística General |
82

b) Determinación de la Ecuación de regresión lineal: Yˆ  a  b X

a
 X Y   X  X i
2
i i i Yi
n  X   X  2 2
i i

n  X Y   X Y i i i i
b
n  X   X  2 2
i i

en donde : X i  941 Y i  9570 X Y


i i  3271030 X i
2
 325751

325751 ( 9570 )  941 ( 3271030 )


Luego a   22.8987
8 ( 325751 )   941  2

8 ( 3271030 )  ( 941 ) ( 9570 )


b   9.975
8 ( 325751 )  ( 941 ) 2
Por lo tan to la ecuación de regresión lineal será : Yˆ  22.8987  9.975 X

Interpretación: Al aumentar el tamaño del lote en 100 unidades, el costo aumentará en 9.975
decenas de dólar o sea aproximadamente en 100 dólares.

c) Gráfica de la línea de regresión lineal

Gráfica de línea ajustada


Y = 22,90 + 9,975 X
S 12,0374
5000
R-cuad. 100,0%
R-cuad.(ajustado) 100,0%

4000
Costo ( Y )

3000

2000

1000

0 100 200 300 400 500


Tamaño del lote ( X )

d) Costo estimado para un lote de 500 unidades: Yˆ  22.8987  9.975 ( 5 )  72.8

Es decir el costo estimado sería de 728 dólares.


Guía Práctica de Estadística General |
83

e) Cálculo del Error Estándar de Estimación: Sy/x

Sy/x 
Y 2
 a Y b  XY
n  2

32849700  22.8987 ( 9570 )  9.975 ( 3271030 )


Sy/x   12.0374 decenas de dólares
8  2

f) Cálculo del Coeficiente de Correlación: r


n XY   X Y
r 
[n  X i2   X  2
 ][
n  Yi 2  Y  2
]
8 ( 3271030 )  ( 941) ( 9570 )
r   1.00
[ 8 ( 325751)  ( 941) 2 ] [ 8 ( 32849700 )  ( 9570 ) 2 ]
Interpretación: Existe una correlación lineal positiva perfecta; a medida que el tamaño del lote
se incrementa, el costo también crecerá.
g) Cálculo del Coeficiente de Determinación: r 2 = 1
Interpretación: Las variaciones que se observa en el costo, se debe únicamente a la variación del
tamaño del lote.

Ejemplo 2.- Se llevó a cabo un experimento para estudiar el efecto de cierto medicamento para
disminuir la frecuencia cardíaca en adultos. La variable independiente es la dosis en miligramos
del medicamento y la variable dependiente es la diferencia entre la frecuencia cardíaca más baja
después de la administración del medicamento y un control antes de administrarlo. Se reunieron
los siguientes datos:

Dosis Disminución de la frecuencia


(mg) cardíaca (latidos/min)
0.50 10
0.75 08
1.00 12
1.25 12
1.50 14
1.75 12
2.00 16
2.25 18
2.50 17
2.75 20
3.00 18
3.25 20
3.50 21
Guía Práctica de Estadística General |
84

a) Grafique un diagrama de dispersión


b) Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.
c) Grafique sobre el diagrama de dispersión, la línea de regresión.
d) Estime la disminución de la frecuencia cardíaca para una dosis de 2 mg
e) Calcule el error estándar de estimación
f) Calcule e interprete el coeficiente de correlación.
g) Calcule e interprete el coeficiente de determinación

Solución:

a) Diagrama de Dispersión

Gráfica de dispersión de Y vs. X


Y: Disminución de la frecuencia cardíaca (lat/min)

22

20

18

16

14

12

10

0.5 1.0 1.5 2.0 2.5 3.0 3.5


X: Dosis ( mg )

b) Determinación de la Ecuación de regresión lineal: Yˆ  a  b X

 X Y   X  X
2
Yi n  X i Yi   X Y
i i
a
i i i i
b
n  X   X  X   X 
2 2 2 2
i i n i i

en donde : X i  26 Y i  198 X Y i i  442.5 X i


2
 63.375

63.375 ( 198 )  26 ( 442.5 )


Luego a   7.055
13 ( 63.375 )   26  2

13 ( 442.5)  ( 26) ( 198 )


b   4.088
13 ( 63.375 )  ( 26 ) 2

Por lo tan to la ecuación de regresión lineal será : Yˆ  7.055  4.088 X

Interpretación: Al aumentar la dosis del medicamento en 1 mg.la reducción de los latidos del
corazón, se incrementan en 4 lat/min aproximadamente; es decir por cada mg de la dosis, los
latidos del corazón se reducen en 4 aproximadamente.
Guía Práctica de Estadística General |
85

c) Gráfica de la línea de regresión lineal

Gráfica de línea ajustada


Y = 7.055 + 4.088 X
22 S 1.35579
Reducción de la frecuencia cardíaca: Y

R-cuad. 90.4%
20 R-cuad.(ajustado) 89.5%

18

16

14

12

10

0.5 1.0 1.5 2.0 2.5 3.0 3.5


Dosis: X

d) Disminución estimada de la frecuencia cardíaca para una dosis de 2 mg:


Yˆ  7.055  4.088 ( 2 )  15

Es decir para una dosis de 2 mg de dicho medicamento, se espera que la frecuencia cardíaca
disminuya en 15 lat/min aproximadamente.
e) Cálculo del Error Estándar de Estimación: Sy/x

Sy/x 
Y 2
 a Y b  XY
n  2

3226  7.055 ( 198 )  4.088 ( 442.5 )


Sy/x   1.3558 latidos
13  2

r 
n XY   X Y
f) Cálculo del Coeficiente de Correlación: r [n  X i
2
  X  ] [ n  Y    Y 
2
i
2 2
]

13 ( 442.5 )  ( 26 ) (198 )
r   0.9507
[ 13 ( 63.375 )  ( 26 ) 2 ] [ 13 ( 3226 )  ( 198 ) 2 ]

Interpretación: Existe una correlación lineal positiva entre la dosis del medicamento y la
reducción de la frecuencia cardíaca; a medida que se aumenta la dosis del medicamento entonces
la reducción de la frecuencia también aumentará.
g) Cálculo del Coeficiente de Determinación: r 2 = 0.904

Interpretación: El 90.4% de las variaciones que se observa en la reducción de la frecuencia


cardíaca, se debe a la variación de la dosis del medicamento; el 9.6% restante se debe a la
influencia o efecto de alguna otra variable no tomada en cuenta en el presente estudio.
Guía Práctica de Estadística General |
86

EJERCICIOS PROPUESTOS

1. Una muestra aleatoria de cinco familias da la siguiente información en relación al ingreso


familiar mensual y los gastos mensuales en gastos en seguros de salud.

FAMILIA Ingreso mensual Gastos en seguros de salud


Ávila 3500 320
Benavides 2800 280
Calderón 4700 410
Díaz 2100 120
Ercilla 3150 340

a) Grafique un diagrama de dispersión


b) Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.
Grafique sobre el diagrama de dispersión, la línea de regresión.
c) Pruebe otros modelos de regresión y elija el mejor a base del coeficiente de determinación.
d) Estímese el gasto anual en prevención de la salud de una familia cuyo ingreso mensual es
2500 soles.
e) Calcule el error estándar de la estimación del modelo
f) Calcule e interprete el coeficiente de determinación

2.- Con la siguiente información:

Horas-hombre por mes de instrucción 200 500 450 800 900 150 300 600
Accidentes por millón de Horas- 7.0 6.4 5.2 4.0 3.1 8.0 6.5 4.4
hombre

a) Grafique el diagrama de dispersión


b) Determine una ecuación que describa la relación entre la frecuencia de accidentes y el nivel de
educación preventiva. Grafique esta ecuación.
c) Interprete los valores de los coeficientes de regresión.
d) Calcule el error estándar de la estimación del modelo.
e) Calcule e interprete el coeficiente de correlación.
f) Calcule e interprete el coeficiente de determinación.
g) Estime el número de accidentes si el número de horas de instrucción fuese 340.

3.- El editor en jefe de un importante periódico metropolitano ha intentado convencer al dueño del
periódico para que mejore las condiciones de trabajo en el taller de prensas. Está convencido de que,
cuando trabajan las prensas, el grado de ruido crea niveles no saludables de tensión y ansiedad.
Recientemente hizo que un psicólogo realizara una prueba durante la cual los prensistas se situaron
en cuartos con niveles variables de ruido y luego se le hizo otra prueba para medir niveles de humor
y ansiedad. La siguiente tabla muestra el índice de su grado de ansiedad o nerviosismo y el nivel de
ruido al que se vieron expuestos. (1,0 es bajo y 10,0 es alto).

Nivel de ruido 4 3 1 2 6 7 2 3
Grado de ansiedad 39 38 16 18 41 45 25 38
Guía Práctica de Estadística General |
87

a) Represente gráficamente estos datos.


b) Desarrolle una ecuación de estimación que describa los datos.
c) Pronostique el grado de ansiedad que podríamos esperar cuando el nivel de ruido es 5.
d) Calcule e interprete el coeficiente de correlación
e) Calcule e interprete el coeficiente de determinación
f) Calcule el error estándar de la estimación

4.- El Gerente de una Clínica dispone de la siguiente información:

Año 2001 2002 2003 2004 2005 2006


Cirugías 120 143 150 170 162 158

a) Grafique y determine la ecuación de la tendencia


b) Proyecte las cirugías al corazón para el año 2007

5.- Se ha medido la variación de creatinina en pacientes tratados con Captopril (droga


antihipertensión) tras la suspensión del tratamiento con diálisis, resultando la siguiente tabla:

Días tras la diálisis: X 1 5 10 15 20 25 35


Creatinina (mg/dl): Y 5.7 5.2 4.8 4.5 4.2 4 3.8

a) Calcule el modelo de regresión lineal


b) Interprete la variación de creatinina, en función de los días transcurridos tras la diálisis.
c) Si un individuo presenta 8 días tras la suspensión del tratamiento con diálisis, que sucede con la
creatinina (mg/dl).

6.- En un grupo de 8 pacientes se registran las medidas antropométricas peso (kg) y edad (años)
obteniendo el modelo de regresión:

Yˆ  20.61  2.83 X

a) Interprete la recta de regresión lineal


b) ¿Cómo cree Ud. que será el diagrama de dispersión?

7.- Una cadena de restaurantes de comida rápida decide llevar a cabo un experimento para medir la
influencia del gasto en publicidad sobre las ventas. En 8 regiones del país, se realizaron diferentes
variaciones relativas en el gasto de publicidad, comparado con el año anterior y se observaron las
variaciones en los niveles de ventas resultantes. La tabla muestra los resultados:

Incremento del gasto


en publicidad ( % ) 0 4 14 10 9 8 6 1
Incremento en las ventas 2.4 7.2 10.3 9.1 10.2 4.1 7.6 3.5
(%)

a) Calcule el coeficiente de correlación lineal.


b) Estimar la ecuación regresión lineal del incremento en las ventas sobre el incremento del gasto en
publicidad
c) Calcule el error estándar de estimación.
d) Estime el incremento en las ventas, si el gasto en publicidad es del 10%.
Guía Práctica de Estadística General |
88

8.- Los siguientes datos se refieren al número de horas de estudio invertidas por los estudiantes fuera
de clase durante un período de tres semanas para cierto curso, junto con las calificaciones que
obtuvieron en un examen aplicado al final de ese período.

Calificaciones 64 61 84 70 88 92 72 77
Horas de estudio 20 16 34 23 27 32 18 22

a) Calcule el coeficiente de correlación lineal.


b) Estimar la ecuación regresión lineal
c) Calcule el error estándar de estimación.
d) Estime la calificación para un estudiante que estudió 24 horas durante dicho período de tiempo.

9.- Un editor tomó una muestra de 7 libros anotando el precio y el número de páginas respectivo,
obteniendo los siguientes datos.

Número de páginas 630 550 400 250 370 320 610


Precio ( $10 ) 10 8 7 4 6 6 9

a) Calcule el coeficiente de correlación lineal.


b) Estimar la ecuación regresión lineal
c) Calcule el error estándar de estimación.
d) Estimar el precio de un libro de 300 páginas. Si a este libro se le incrementa 20 páginas en una
segunda edición. ¿En cuánto se incrementará su precio?.

10.- Un investigador de una fábrica de refrescos ha tomado al azar 8 semanas del año observando en
cada semana la temperatura media (ºC ) y la cantidad de refrescos (miles) pedidos durante cada uno
de dichos períodos. La información es la siguiente:

Temperatura 10 28 12 31 30 19 24 15
Pedidos 21 65 19 72 75 36 67 24

a) Calcule el coeficiente de correlación lineal.


b) Halle la ecuación regresión lineal
c) Calcule el error estándar de estimación.
d) Estimar el pedido de refrescos para una semana cuya temperatura media es de 20ºC.

11.- Se efectúa un experimento médico para determinar el efecto de la droga efedrina en las
pulsaciones del corazón. Un paciente recibe diversas dosis diarias de la droga durante seis días. La
tabla que sigue resume los resultados del experimento.
Dosis diaria total Nº de pulsaciones
de efedrina (granos) por minuto
3 70
2 60
1 50
3 80
5 100
4 90
Nota. 1 grano = 0.06 gramos
a) Grafique un diagrama de dispersión
b) Determine la ecuación de regresión lineal. Interprete los coeficientes de regresión lineal.
Grafique sobre el diagrama de dispersión, la línea de regresión.
c) Estímese el número de pulsaciones para una dosis diaria de 4 granos de efedrina.
Guía Práctica de Estadística General |
89

d) Calcule el error estándar de la estimación del modelo


e) Calcule e interprete el coeficiente de correlación.
f) Calcule e interprete el coeficiente de determinación

12.- La siguiente tabla ilustra los valores del consumo de metil mercurio y la cantidad total de
mercurio en la sangre de 12 individuos expuestos a la primera sustancia por haber consumido peces
contaminados.

Consumo de metil Mercurio en la sangre


mercurio ( ng/g )
(µgHg/día)
180 90
200 120
230 125
410 290
600 310
550 290
275 170
580 375
105 70
250 105
460 205
650 480

a) Calcule el coeficiente de correlación lineal.


b) Estimar la ecuación regresión lineal de la cantidad de mercurio en la sangre sobre el
consumo de metil mercurio
c) Calcule el error estándar de estimación.
d) Estime la cantidad de mercurio en la sangre, considerando una ingesta de 300 µg de
mercurio.

13.- Se quiere determinar la relación entre la experiencia en ventas y el volumen de ventas para cada
vendedor basado en un grupo de 10 vendedores de una compañía de seguros. Los años de
experiencia en ventas y los volúmenes de ventas son:

Experiencia en ventas Volumen de ventas


(años) ($10,000)
1 3
2 2
3 5
4 4
5 6
6 8
7 9
8 9
9 12
10 10

a) Halle la ecuación de regresión lineal. Interprete el coeficiente de regresión


b) Estime las ventas para un vendedor con 5 años de experiencia
c) Calcule e interprete el coeficiente de correlación
d) Interprete el coeficiente de determinación
Guía Práctica de Estadística General |
90

14.- En una muestra de 8 pacientes se miden las cantidades antropométricas peso y edad
obteniéndose los siguientes resultados

Edad (años) 12 8 10 11 7 7 10 14
Peso (kg) 56 42 51 54 40 39 49 58

a) Calcule e interprete el coeficiente de correlación


b) Halle la ecuación de regresión lineal
c) Estime el peso para un paciente de 10 años de edad
d) Determine e interprete el coeficiente de determinación

15.- Consideremos los siguientes datos respecto al precio de venta ($1,000) de una muestra de
viviendas y sus áreas (100 pies2) correspondientes a cada una de ellas, en cierta ciudad.

Precio de venta: 41 32 24 44 42 36 35 40 29 26
Área de la vivienda: 13 10 08 14 14 12 10 12 10 08

a) Hallar la ecuación de regresión lineal


b) Interprete el coeficiente de regresión lineal
c) Estime el precio de venta para una vivienda cuya área es de 1,000 pies 2
d) Calcule e interprete el coeficiente de correlación lineal
e) Interprete el coeficiente de determinación
Guía Práctica de Estadística General |
91

PRUEBA DE INDEPENDENCIA
Tiene por objeto probar si dos variables cualitativas o categóricas no están relacionadas o asociadas;
también una de ellas podría ser cuantitativa.

O E 
2
r c

c  ��
2 ij ij

i 1 j 1 E
ij

Ejemplo 1.- En una empresa se desea estudiar si existe una relación entre el nivel de las
remuneraciones y los años de experiencia del personal de su planta de profesionales. Con este objeto,
se clasifican las remuneraciones según su monto, en tres categorías: bajo, medio y alto; asimismo los
años de experiencia de acuerdo a su número en cuatro categorías: A, B, C y D.
Al nivel de 0.05. ¿Hay alguna relación entre los años de experiencia y las remuneraciones que
perciben los 100 empleados de la empresa?.

AÑOS DE EXPERIENCIA
REMUNERACIONES A B C D Total
Bajo 4 9.88 11 9.88 9 9.12 14 9.12 38
Medio 12 8.58 9 8.58 8 7.92 4 7.92 33
Alto 10 7.54 6 7.54 7 6.96 6 6.96 29
Total 26 26 24 24 100

Solución:

H 0 : No existe relación entre las remuneraciones y los años de exp eriencia


H 1 : Si existe relación entre las remuneraciones y los años de exp eriencia
Nivel de significancia   0.05

( 4  9.88) 2 (12  8.58) 2 (6  6.96) 2


c2    ....................................   10.814
9.88 8.58 6.96

Re gla de decisión : Re chazar H 0 si c 2  Vt ( Valor hallado en la tabla c 2 con 6 g ..l


en este caso Vt  12.592. Por lo tan to no rechazarem os H 0
Conclusión : No existe relación entre las remuneraci ones y los años de exp eriencia.

Ejemplo 2.- Se tiene la siguiente información obtenida de una muestra de 5,000 fallecidos.

DIAGNÓSTICO
Muerte por cáncer de pulmón Muerte por otras causas Total

Fumadores 348 301 3,152 3199 3,500


No Fumadores 82 129 1,418 1371 1,500
Total 430 4,570 5,000

Se desea probar la hipótesis de que el fumar y la muerte por cáncer pulmonar son independientes con
α = 0.01

Solución
Guía Práctica de Estadística General |
92

H 0 : No existe relación entre el hábito de fumar y la muerte por cáncer pulmonar


H 1 : Si existe relación entre el hábito de fumar y la muerte por cáncer pulmonar
Nivel de significancia   0.01

(348  301) 2 (3,152  3,199) 2 ( 82  129 ) 2 (1,418  1,371) 2


c2      26.764
301 3,199 129 1,371

Re gla de decisión : Re chazar H 0 si c 2  Vt ( Valor hallado en la tabla c 2 con 1 g ..l


En este caso Vt  6.635 Por lo tan to rechazarem os H 0
Conclusión : Ambos factores están relacionad os.

PRUEBA DE HOMOGENEIDAD

Ejemplo 1.- El Director de compras de una fábrica grande debe decidir por la compra de una de las
cuatro marcas que hay en el mercado. Para probar si existe diferencia significativa en la calidad de
las máquinas, obtiene una muestra de la producción de 150 artículos para cada una de ellas y observa
el número de defectuosos. Los resultados se dan en la siguiente tabla:

M A Q U I N A S
CALIDAD A B C D Total
Defectuosos 21 16.5 12 16.5 15 16.5 18 16.5 66
Buenos 129 133.5 138 133.5 135 133.5 132 133.5 534
Total 150 150 150 150 600

Solución
H 0 : p A  p B  p C  p D ( La proporción de defectuosos son las mismas en cada una de las máquinas)
H 1 : Al menos en una de las máquinas la proporción de defectuosos no es la misma.
Nivel de significancia   0.05
( 21  16.5 ) 2 ( 129  133.5 ) 2 ( 132  133.5 ) 2
c2    ....................................   3.064
16.5 133.5 133.5

Re gla de decisión : Re chazar H 0 si c 2  Vt ( Valor hallado en la tabla c 2 con 3 g ..l


en este caso Vt  7.815. Por lo tan to no rechazarem os H 0
Conclusión : La proporción de defectuosos sí es la misma.

Ejemplo 2.- Se sostiene que una droga determinada es efectiva para la curación del catarro común.
En un experimento con 164 personas con catarro, a la mitad de ellas se le suministró la droga y a la
otra mitad se le suministró píldoras azucaradas. Las reacciones de los pacientes aparecen anotadas en
la siguiente tabla:

REACCIONES
Mejorado Empeorados Efecto Nulo Total
s
Droga 52 48 10 11 20 23 82
Guía Práctica de Estadística General |
93

Azúcar 44 48 12 11 26 23 82

Total 96 22 46 164

Solución
H 0 : La droga y las píldoras tienen igual efecto
H 1 : La droga y las píldoras no tienen igual efecto.
Nivel de significancia   0.05

( 52  48 ) 2 (10  11 ) 2 ( 26  23 ) 2
c2    ....................................   1.631
48 11 23

Re gla de decisión : Re chazar H 0 si c 2  Vt ( Valor hallado en la tabla c 2 con 2 g..l


en este caso Vt  5.991 Por lo tan to no rechazarem os H 0
Conclusión : La droga y las píldoras azucaradas producen reacciones similares.
Guía Práctica de Estadística General |
94

EJERCICIOS PROPUESTOS

1.- Una encuesta realizada en 378 hospitales por el Colegio de Cirujanos Americanos produjo los
datos de la tabla siguiente:
Tipo de tumor Total
Benigno Maligno
Usan 138 49 187
anticonceptivos
No usan 39 41 80
No conocen su uso 35 76 111
Total 212 166 378
Proporcionan los datos evidencia
suficiente para indicar una dependencia entre el tipo de tumor y el uso de anticonceptivos orales?.
Use α = 0.05 Rpta. Sí

2.- Sobre una muestra de 500 niños de cierta escuela primaria se hizo un estudio acerca de su estado
de nutrición y el desempeño académico, obteniéndose los siguientes resultados:

Desempeño Académico Estado de Nutrición Total


Pobre Bueno
Malo 105 15 120
Satisfactorio 80 300 380
Total 185 315 500

Existe relación entre el desempeño académico y el estado de nutrición. Use α = 0.01 Rpta. Sí

3.- Se llevó a cabo una encuesta con respecto a la preferencia del consumidor para determinar si
existía alguna predilección entre las tres marcas competitivas (A, B y C ) dependiendo de la región
geográfica en la que habita el consumidor. La información obtenida es la siguiente:

Región I Región II Región III Total


Marca A 40 52 25 117
Marca B 52 70 35 157
Marca C 68 78 60 206
Total 160 200 120 480

Con esta información ¿La preferencia por una determinada marca depende de la región geográfica?
Rpta. No

4.- Los puntajes obtenidos en una muestra de 218 estudiantes en el examen de ingreso a una
universidad, así como los promedios finales durante el primer semestre de la universidad fueron
clasificados en cuatro categorías: A, B, C y D. Estos aparecen en la siguiente tabla:

Promedios del Puntajes de Ingreso


Primer Semestre A B C D Total
A 20 10 17 8 55
B 17 16 18 7 58
C 19 4 15 12 50
D 12 8 12 23 55
Total 68 38 62 50 218
Guía Práctica de Estadística General |
95

Se puede decir que los puntajes obtenidos en ambos exámenes son independientes? Use α = 0.05

5.- Se tomó una muestra de 400, 500 y 400 compradores de las ciudades de Piura, Trujillo y
Chiclayo respectivamente con la finalidad de determinar si la proporción verdadera de compradores
que se inclinan por el producto A en lugar del B, es la misma en las tres ciudades. Use α = 0.05

Producto A Producto B Total


Piura 232 168 400
Trujillo 260 240 500
Chiclayo 197 203 400
Total 689 611 1300

6.- Se examinó una muestra de 2,000 registros médicos los cuales dieron los siguientes resultados:

Muerte por cáncer Muerte por otras causas Total


del intestino
Fumadores 22 1,178 1,200
No Fumadores 26 774 800
Total 48 1,952 2,000

Probar la hipótesis que las dos clasificaciones son independientes con α = 0.05

7.- Cierta compañía desea determinar si el ausentismo se relaciona con la edad. Se toma una muestra
de 200 empleados al azar y se clasifica según su edad y causa de ausentismo:

CAUSA EDAD
Menos de 30 30 - 50 Más de 50
Enfermeda 40 28 52
d 20 36 24
Otras
¿Está la edad relacionada con el
ausentismo? Use α = 0.01

8.- Una fábrica de automóviles quiere averiguar si el sexo de sus posibles clientes no tiene relación
con la preferencia del modelo. Se toma una muestra aleatoria de 2,000 posibles clientes y se
clasifican así:
SEXO MODELO
I II III
Contrastar la hipótesis de que el Masculino 350 270 380 sexo no tiene relación con la
preferencia hacia un Femenino 340 400 260 determinado modelo para un α =
0.01

9.- Se desea determinar si existe algún tipo de relación entre la concentración de procaína usada en
operaciones del molar mandibular y el porcentaje de casos satisfactorios (efectividad clínica de la
anestesia). Se tuvo la siguiente información:

Solución de procaína Casos satisfactorios Casos no satisfactorios


1.0 % 07 18
Más de 1.0 % 63 12

Use α = 0.05
Guía Práctica de Estadística General |
96

10.- Un investigador estudia el nivel de efectividad de tres remedios R1, R2 y R3 para aliviar cierta
enfermedad. Para esto escogió tres muestras aleatorias de tamaños 50, 70 y 60 pacientes con la
enfermedad, suministrando a la primera el remedio R1, a la segunda muestra el remedio R2 y a la
tercera el remedio R3; y midiendo la efectividad de los remedios en tres niveles: Sin alivio, cierto
alivio y alivio total. Los resultados del experimento se dan en la tabla que sigue:

Efectividad Remedios para la alergia


R1 R2 R3
Sin alivio 10 20 15
Cierto 30 20 20
alivio 10 30 25
Alivio total

¿Puede inferir que los tres remedios para la alergia son igualmente efectivos?.

11.- El ingeniero quiere saber si hay diferencias en la calidad de los productos procesados en los tres
turnos operativos de una fábrica. Para esto se tomó una muestra aleatoria de tamaño 100 de cada
turno del día anterior y las clasificó según el turno de su producción: mañana, tarde y noche; y según
su calidad: defectuoso o no defectuoso. Los resultados se dan en la siguiente tabla:

Calidad Turnos de producción


Mañana Tarde Noche
Defectuosos 3 12 15
No defectuosos 97 88 85

Pruebe al nivel de significación del 5% la hipótesis de la igualdad de las tres proporciones reales de
producción defectuosa.