Академический Документы
Профессиональный Документы
Культура Документы
=
=
k
j
j i
n N
1
Frecuencia relativa acumulada. Es el cociente entre la frecuencia absoluta
acumulada y el tamao de la muestra.
N
N
F
i
i
=
N
n
k
j
i
=
=
1
PROBABILIDAD Y ESTADISTICA. 30
Diagrama de tallo y hojas. Es un diagrama de frecuencias donde la clase esta
caracterizada como el valor entero del dato y la hoja est caracterizada por el valor
decimal. Se seala adems la frecuencia en tal clase.
PROBABILIDAD Y ESTADISTICA. 31
Tallo Hoja Frecuencia
Tabla de distribucin de frecuencias. Es una tabla donde se muestra las clases en que
se divide el rango, las marcas de clases, y las frecuencias absolutas y relativas.
PROBABILIDAD Y ESTADISTICA. 32
Creacin de una distribucin de frecuencias
La estadstica descriptiva se utiliza para organizar la informacin de diversas
maneras, a fin de sealar el lugar donde los valores de los datos tienden a
concentrarse y ayudar a distinguir los valores ms altos y ms bajos.
El primer paso que seguimos para describir un conjunto de datos es una
distribucin de frecuencias.
DISTRIBUCIN DE FRECUENCIAS.- Agrupacin de los datos en clases
mutuamente excluyentes mostrando el nmero de observaciones en cada
una.
Cmo desarrollamos una distribucin de frecuencias?
EJERCICIO 1:
La seora Kathryn Ball de AutoUSA quera desarrollar algunas tablas y grficas para
mostrar el precio de venta tpico en diversas distribuidoras. La siguiente tabla reporta slo
el precio de los 80 vehculos vendidos el mes pasado en Whitner Autoplex. Cul es el
precio de venta tpico? Cul es el precio de venta ms alto ? Cul es el precio de venta
ms bajo? Alrededor de qu valor tienden a agruparse los precios de venta?
$23 197 23 372 20 454 23 591 26 651 27 453 17 266
18 021 28 683 30 872 19 587 23 169 35 851 19 251
20 047 24 285 24 324 24 609 28 670 15 546 15 935
19 873 25 251 25 277 28 034 24 533 27 443 19 889
20 004 17 357 20 155 19 688 23 657 26 613 20 895
20 203 23 765 25 783 26 661 32 277 20 642 21 981
24 052 25 799 15 794 18 263 35 925 17 399 17 968
20 356 21 442 21 722 19 331 22 817 19 766 20 633
20 962 22 845 26 285 27 896 29 076 32 492 18 890
21 740 22 374 24 571 25 449 28 337 20 642 23 613
24 220 30 655 22 442 17 891 20 818 26 237 20 445
21 556 21 639 24 296
A la informacin de la tabla sin organizar se la llama datos en bruto o datos
no agrupados.
PASOS PARA ORGANIZAR UNA DISTRIBUCION DE FRECUENCIA.
Paso 1. Decidir el nmero de clases. El objetivo es utilizar suficientes grupos o
clases para revelar la forma de la distribucin.
n = k
k nmero de clases
n - nmero de observaciones
En nuestro ejemplo se vendieron 80 vehculos entonces n = 80, y hay que encontrar k
80 = 8.9.
Por lo tanto el nmero recomendado de clases es 9.
PASO 2. Determinar el intervalo o ancho de clase . El intervalo o ancho de clase debe ser
el mismo para todas las clases. Se utilizar la siguiente frmula.
i H - L
Donde i es el intervalo de clase, H es el valor observado ms alto, L es el valor
observado ms bajo y k es el nmero de clases.
k
Para nuestro ejemplo
H = $ 35 925. L = $ 15 546. k = 9
i ( 35 925 15 546) / 9 = $ 2 264.33
En la prctica un intervalo de este tamao se redondea a cifras convenientes,
como mltiplos de 5 o 10 o 100. Por lo tanto podramos utilizar el valor de
$ 2 265.
PASO 3. ESTABLECER LOS LIMITES DE CADA CLASE.
15 546 A 17811
17811 A 20076
20076 A 22341
22341 A 24606
24606 A 26871
26871 A 29136
29136 A 31401
31401 A 33666
33666 A 35931
PASO 4. Contar el nmero de elementos de cada clase. El nmero de
observaciones en cada clase se conoce como frecuencia de clase.
Precios de venta
FRECUENCIA
ABSOLUTA
15 546 A 17811
17811 A 20076
20076 A 22341
22341 A 24606
24606 A 26871
26871 A 29136
29136 A 31401
31401 A 33666
33666 A 35931
TOTAL
6
14
17
18
11
8
2
2
2
80
Distribucin de frecuencia de los precios de venta en Whitner Autoplex el mes
pasado.
Resumen del patrn en los precios de venta de los
vehculos para el lote AutoUSA de Whitner
AutoPlex.
1. Los precios de venta van de aproximadamente $15 546 a
alrededor de $35 931.
2. Los precios de venta estn concentrados entre $20 076 y
24 606. En este rango se vendieron 35 vehculos en total o
43.75%.
3. La mayor concentracin o la frecuencia ms alta, se
encuentra en la clase de $22 341 a $24 606. El punto
medio de esta clase es $23 473.50 . Entonces decimos
que $23 473.50 es el precio de venta tpico.
4. Dos de los vehculos se vendieron en $33 666.00 o ms y 6
se vendieron en menos de $17 811.00
Distribucin de frecuencias relativas
Es conveniente convertir las frecuencias de clase en frecuencias de clase
relativas para mostrar la fraccin del nmero total de observaciones o
porcentaje en cada clase.
Para convertir una distribucin de frecuencia en una distribucin de
frecuencia relativa, cada una de las frecuencias de clase se divide entre el
nmero total de observaciones.
PRECIOS DE VENTA
FRECUENCIA
ABSOLUTA
FRECUENCIA
RELATIVA
OPERACION
15 546 A 17 811 6 0.075 6/80
17 811 A 20 076 14 0.175 14/80
20 076 A 22 341 17 0.2125 17/80
22 341 A 24 606 18 0.225 18/80
24 606 A 26 871 11 0.1375 11/80
26 871 A 29 136 8 0.100 8/80
29 136 A 31 401
31 401 A 33 666
33 666 A 35 931
2
2
2
0.025
0.025
0.025
2/80
2/80
2/80
TOTAL 80 1.0000 80/80
PRECIOS DE VENTA
FRECUENCIA
ABSOLUTA
FRECUENCIA
RELATIVA
FRECUENCIA
ABSOLUTA ACUMULADA
15 546 A 17 811 6 0.075 6
17 811 A 20 076 14 0.175 20
20 076 A 22 341 17 0.2125 37
22 341 A 24 606 18 0.225 55
24 606 A 26 871 11 0.1375 66
26 871 A 29 136 8 0.100 74
29 136 A 31 401
31 401 A 33 666
33 666 A 35 931
2
2
2
0.025
0.025
0.025
76
78
80
TOTAL 80 1.0000
FRECUENCIA
ABSOLUTA ACUMULADA
41
PRECIOS DE VENTA
FRECUENCIA
ABSOLUTA
FRECUENCIA
RELATIVA
FRECUENCIA
RELATIVA ACUMULADA
15 546 A 17 811 6 0.075 0.075
17 811 A 20 076 14 0.175 0.250
20 076 A 22 341 17 0.2125 0.4625
22 341 A 24 606 18 0.225 0.6875
24 606 A 26 871 11 0.1375 0.825
26 871 A 29 136 8 0.100 0.925
29 136 A 31 401
31 401 A 33 666
33 666 A 35 931
2
2
2
0.025
0.025
0.025
0.950
0.975
1.000
TOTAL 80 1.0000
FRECUENCIA
RELATIVA ACUMULADA
Ejercicio 2. Se registran las siguientes mediciones para el tiempo de secado
(en horas) de cierta marca de pintura esmaltada.
3.4, 2.5, 4.8, 2.9, 3.6
2.8, 3.3, 5.6, 3.7, 2.8
4.4, 4.0, 5.2, 3.0, 4.8
Construya:
1. Una tabla de frecuencias agrupando los datos, comenzando la primera
clase en 2.0 y terminando la ltima en 6.0.
2. Incluir en la tabla: las frecuencias relativas, frecuencias absolutas
acumuladas, frecuencias relativas acumuladas.
PROBABILIDAD Y ESTADISTICA. 42
Ejercicio 3. Se le hizo una prueba de hemoglobina a un grupo de pacientes
diabticos, los resultados son
6.5, 5.0, 5.6, 7.6, 4.8, 8.0, 7.5, 7.9, 8.0, 9.2
6.4, 6.0, 5.6, 6.0, 5.8, 9.2, 8.1, 8.0, 6.5, 6.6
5.0, 8.0, 6.5, 6.1, 6.4, 6.6, 7.2, 5.9, 4.0, 5.8
7.9, 6.0, 5.6, 6.0, 6.2, 7.8, 6.8, 7.8, 8.2, 9.0
Construya una tabla de frecuencias agrupando los datos.
PROBABILIDAD Y ESTADISTICA. 43
Ejercicio 4. La siguiente muestra tiene los ingresos ganados cierto sbado por los
estudiantes universitarios que trabajan. Las datos estn en dlares.
30, 11, 42, 8, 30, 18, 25, 25, 17, 30, 39, 21, 23, 25, 15, 35,
26,13, 21, 26.
Si las marcas de clase son 10, 15, 20, 25, 30, 35 y 40, representa los datos en una
Tabla de Distribucin de Frecuencias.
Ejercicio 5. La divisin de servicios alimenticios de Cedar River Amusement Park,
Inc. Estudia la cantidad que gastan al da en alimento y bebida las familias que
visitan el parque de diversiones. Una muestra de 40 familias que visit el parque
ayer revela que stas gastan las siguientes cantidades:
$77, 18, 63, 84, 38, 54, 50, 59, 54, 56, 36, 26, 50, 34, 44, 41, 58, 58, 53, 51, 62, 43,
52, 53, 63, 62, 62, 65, 61, 52, 60, 60, 45, 66, 83, 71, 63, 58, 61, 71.
a) Organice los datos en una distribucin de frecuencia utilizando 7 clases y el 15
como lmite inferior de la primera clase.
b) Describa la distribucin.
PROBABILIDAD Y ESTADISTICA. 44
Tipos de variables
Tipos de variables
Cualitativas
Cuantitativas
Marca de PC
Estado Civil
Color de cabello
Discretas Continuas
Hijos en la familia
Golpes en un hoyo
de golf
Televisores que
tiene
Cantidad de impuesto
sobre el ingreso
pagado.
Peso de un estudiante.
Precipitacin pluvial
anual en Puebla
Representacin grfica.
Datos cuantitativos.
Histograma de frecuencias. Grfica donde el eje horizontal (abscisas)
representa el eje de los datos, clasificados en clases, mientras que el eje
vertical (ordenadas) representa la frecuencia de cada clase.
Nota. Es difcil manejar un histograma de frecuencias cuando las clases no tiene la
misma longitud.
PROBABILIDAD Y ESTADISTICA. 46
Polgono de frecuencias. Serie de segmentos que unen los puntos cuyas
abscisas son las marcas de clase y cuyas ordenadas son las frecuencias
asignadas a tal clase.
PROBABILIDAD Y ESTADISTICA. 47
Ojiva de frecuencias. Es una representacin grfica donde el eje horizontal
(abscisas) representa los datos y el eje vertical las frecuencias
acumuladas. Se ubican los puntos cuyas abscisas son los limites
superiores de cada clase y cuyas ordenadas son las frecuencias
acumuladas de tal clase.
PROBABILIDAD Y ESTADISTICA. 48
Datos cualitativos.
Grfica de sectores (pastel o pie). Se forma al dividir un crculo en sectores
circulares de manera que:
a) Cada sector circular equivale al porcentaje correspondiente al dato o grupo
que representa.
b) La unin de los sectores circulares forma el crculo y la suma de sus
porcentajes es 100.
PROBABILIDAD Y ESTADISTICA. 49
Grfica de barras. Se utilizan rectngulos separados, que tienen como base a
cada uno de los datos y como altura la frecuencia de ese dato.
PROBABILIDAD Y ESTADISTICA. 50
PROBABILIDAD Y ESTADISTICA. 51
PROBABILIDAD Y ESTADISTICA. 52
PROBABILIDAD Y ESTADISTICA. 53
Datos Cualitativos.
Ejercicio. A continuacin se muestra la distribucin de frecuencias
absolutas, relativas y porcentuales de las mascotas mas comunes de los
nios, representar los datos en una grfica de barras y una grfica de
pastel.
Mascota Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
porcentual
Perro
7 0.35 35%
Pjaro
4 0.20 20%
Hmster
4 0.20 20%
Gato
5 0.25 25%
PROBABILIDAD Y ESTADISTICA. 54
PROBABILIDAD Y ESTADISTICA. 55
Grfica de barras.
Grfica de pastel.
Medidas estadsticas.
Medidas de centralizacin (o de tendencia central): Sirven para determinar
los valores centrales o medios de la distribucin.
Indican valores alrededor de los cuales los datos parecen agruparse.
Media aritmtica.
Mediana.
Moda.
PROBABILIDAD Y ESTADISTICA. 56
Medidas de dispersin. Indican la mayor o menor concentracin de los datos
con respecto a las medidas de centralizacin.
Nos dan una idea sobre que tan representativos son las medidas centrales de
los datos. A mayor dispersin menor representatividad.
Una dispersin pequea indica un alto grado de uniformidad en las
observaciones y una dispersin grande indica poca uniformidad.
Varianza.
Desviacin estandar.
Coeficiente de variacin.
Rango.
PROBABILIDAD Y ESTADISTICA. 57
Medidas de posicin. Dividen un conjunto ordenado de datos en grupos con
la misma cantidad de elementos.
tiles para una clasificacin de los elementos de la muestra.
Cuartiles.
Percentiles.
PROBABILIDAD Y ESTADISTICA. 58
Media aritmtica. Es el promedio de las mediciones observadas.
Cantidad total de la variable distribuida en partes iguales entre todas las
observaciones.
Para datos agrupados m
i
es la marca de clase, f
i
es la frecuencia de clase y p
es el nmero total de clases.
59
n
X X X
X
n
+ + +
=
2 1
n
X
n
i
i
=
=
1
Datos no agrupados
MUESTRA
Datos agrupados
n
f m f m f m
X
p p
+ + +
=
2 2 1 1
n
f m
p
j
j j
=
=
1
Medidas de centralizacin
N
X X X
N
+ + +
=
2 1
N
X
N
i
i
=
=
1
Datos no agrupados
POBLACION
Mediana. La mediana de un conjunto de observaciones es el valor que queda
en la parte central de un grupo de observaciones arregladas en orden de
magnitud.
La mediana deja el mismo nmero de datos antes y despus de ese dato.
PROBABILIDAD Y ESTADISTICA. 60
2
1 +
=
n e
x m
2
1 `
2 2
+
|
|
.
|
\
|
+
=
n n
e
x x
m
Datos no agrupados
n par n impar
Datos agrupados
A
|
|
|
|
.
|
\
|
+
+ =
M
M e
f
T
n
L m
2
1
mediana. la de clase la de ancho el Es
mediana. la de clase la de antes estn que clase de
intervalos los en s frecuencia las de total el Es
mediana. la de clase de frecuencia la Es
mediana. la
de clase llamado mediana, la contiene que
clase de intervalo del inferior Lmite
= A
=
=
=
T
f
L
M
M
PROBABILIDAD Y ESTADISTICA. 61
Moda: Se define como el valor o clase que tiene la mayor frecuencia en
un conjunto de observaciones.
Algunas veces dos clases o categoras tienen un nmero de observaciones
igualmente grande. A esto se le denomina distribucin bimodal.
Si tiene una sola moda se llama unimodal.
Cuando las mediciones de una variable continua se agrupan como un
histograma de frecuencias o de frecuencias relativas, la clase que
tiene la frecuencia ms alta se llama clase modal y el punto medio de
dicha clase se toma como la moda.
A
|
.
|
\
|
+
+ =
b a
a
L m
MO o
PROBABILIDAD Y ESTADISTICA. 62
moda. la de clase la de ancho el Es
siguiente. clase la y moda la de clase la entre
frecuencia en diferencia la de absoluto Valor
anterior. clase la y moda la de clase la entre
frecuencia en diferencia la de absoluto Valor
moda. la de clase la de inferior Lmite
= A
=
=
=
b
a
L
MO
PROBABILIDAD Y ESTADISTICA. 63
PROBABILIDAD Y ESTADISTICA. 64
LAS POSICIONES RELATIVAS DE LA MEDIA, LA
MEDIANA Y LA MODA.
Se llama DISTRIBUCIN SIMTRICA, a la distribucin que tiene la misma
forma hacia cualquier lado del centro.
Para una distribucin simtrica, en forma de campana, la moda, la mediana y
la media se localizan en el centro y siempre son iguales.
Hay distribuciones simtricas que no tienen forma de campana.
Ejemplo
Simtrica ( cero sesgo )
Aos
F
r
e
c
u
e
n
c
i
a
Media = 20
Mediana = 20
Moda = 20
Si una distribucin es no simtrica o sesgada, cambia la relacin entre
las tres medidas.
En una distribucin con sesgo positivo, la media aritmtica es la
mayor de las tres medidas, por lo general, la mediana es la medida
siguiente y la moda es la menor de las tres.
Sesgada a la derecha
Ingreso semanal
F
r
e
c
u
e
n
c
i
a
Moda Mediana Media
Si una distribucin tiene un sesgo negativo, la media es la menor
de las tres medidas, la mediana es mayor que la media aritmtica y
el valor modal es el mayor.
Media Mediana Moda
Varianza: Medida de la desviacin de las mediciones muestrales respecto a
su media. Es la media del cuadrado de las desviaciones de las
mediciones respecto a su media.
PROBABILIDAD Y ESTADISTICA. 67
( )
1
1
2
2
=
=
n
X X
s
n
i
i
Datos no agrupados
MUESTRA
( )
1
1
2
2
=
=
n
f X m
s
p
j
j j
Datos agrupados
( )
n
X
n
i
i
=
=
1
2
2
o
Datos no agrupados
POBLACION
Desviacin estndar. Tambin es una medida de la desviacin de los datos
respecto a la media. Es al raz cuadrada de la varianza.
PROBABILIDAD Y ESTADISTICA. 68
( )
1
1
2
=
=
n
X X
s
n
i
i
Datos no agrupados
MUESTRA
( )
1
1
2
=
=
n
f X m
s
p
j
j j
Datos agrupados
( )
N
X
n
i
i
=
=
1
2
o
Datos no agrupados
POBLACION
Rango. Se define como la diferencia entre la medicin mayor y la menor.
R = x
mx
-x
mn
PROBABILIDAD Y ESTADISTICA. 69
EJERCICIO
PROBABILIDAD Y ESTADISTICA. 70
El sndrome de inmunodeficiencia adquirida (SIDA) se ha convertido en
una de las enfermedades ms devastadoras en la sociedad moderna.
Las cantidades de casos de SIDA (en miles) registrados en 25 ciudades
principales de los Estados Unidos en 2010 aparecen a continuacin:
38.3 6.2 3.7 2.6 2.1
14.6 5.6 3.7 2.3 2.0
11.9 5.5 3.4 2.2 2.0
6.6 4.6 3.1 2.2 1.9
6.3 4.5 2.7 2.1 1.8
Construya los histogramas de frecuencias absoluta y polgono de
frecuencias para relativas y las ojivas. Utilice el entero superior de
para el nmero de clases. Adems calcule y analice todas las
medidas estadsticas correspondientes (media, moda, mediana,
varianza, desviacin estndar)
Coeficiente de variacin
PROBABILIDAD Y ESTADISTICA. 71
En estadstica el coeficiente de variacin (de Pearson) es una
medida de dispersin til para comparar dispersiones a escalas
distintas pues es una medida invariante ante cambios de escala.
Por otro lado presenta problemas ya que a diferencia de la
desviacin tpica este coeficiente es variable ante cambios de
origen. Por ello es importante que todos los valores sean positivos
y su media de por tanto un valor positivo.
Exigimos que:
Se calcula:
Donde es la desviacin tpica. Se puede dar en tanto por ciento
calculando:
0 ) x
o
=
V
C
100 - =
o
V
C
El coeficiente de variacin permite comparar las dispersiones de
dos distribuciones distintas, siempre que sus medias sean
positivas.
Se calcula para cada una de las distribuciones y los valores que
se obtienen se comparan entre s.
La mayor dispersin corresponder al valor del coeficiente de
variacin mayor.
PROBABILIDAD Y ESTADISTICA. 72
Ejemplo.
Una distribucin tiene una media de 140 y = 28.28 y otra
con media de 150 y = 25. Cul de las dos presenta mayor
dispersin?
PROBABILIDAD Y ESTADISTICA. 73
PROBABILIDAD Y ESTADISTICA. 74
El Coeficiente de asimetra, se representa mediante la ecuacin
matemtica,
(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe
aproximadamente la misma cantidad de valores a los dos lados de la media.
Este valor es difcil de conseguir por lo que se tiende a tomar los valores que
son cercanos ya sean positivos o negativos ( 0.5).
(g1 > 0): (distribucin asimtrica positiva; existe mayor concentracin de
valores a la derecha de la media que a su izquierda)
(g1 < 0): (distribucin asimtrica negativa; existe mayor concentracin de
valores a la izquierda de la media que a su derecha)
Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la
distancia que separa la aglomeracin de los valores con respecto a la media.
3
1
3
1
) ( ) / 1 (
s
x x n
g
n
i
i
=
=
PROBABILIDAD Y ESTADISTICA. 75
CURTOSIS
Esta medida determina el grado de concentracin que presentan los
valores en la regin central de la distribucin. Por medio del
Coeficiente de Curtosis, podemos identificar si existe una gran
concentracin de valores (Leptocrtica), una concentracin normal
(Mesocrtica) una baja concentracin (Platicrtica).
PROBABILIDAD Y ESTADISTICA. 76
Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de
los valores, la media de la muestra y (ni) la frecuencia de cada
valor. Los resultados de esta frmula se interpretan:
(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra
es bastante difcil encontrar un coeficiente de Curtosis de cero (0),
por lo que se suelen aceptar los valores cercanos ( 0.5 aprox.).
(g2 > 0) la distribucin es Leptocrtica
(g2 < 0) la distribucin es Platicrtica
Cuando la distribucin de los datos cuenta con un coeficiente de
asimetra (g1 = 0.5) y un coeficiente de Curtosis de (g2 = 0.5),
se le denomina Curva Normal. Este criterio es de suma importancia
ya que para la mayora de los procedimientos de la estadstica de
inferencia se requiere que los datos se distribuyan normalmente.
X
3
) ( ) / 1 (
4
1
4
2
=
=
s
x x n
g
n
i
i
EJEMPLO: Los clculos para la media aritmtica para datos
agrupados en una distribucin de frecuencias. En la siguiente tabla
tenemos una distribucin de frecuencias para los precios de venta de
los vehculos. Determinar el precio de venta medio aritmtico de los
vehculos.
Precios de venta
(miles de $) FRECUENCIA
15 A 18 8
18 A 21 23
21 A 24 17
24 A 27 18
27 A 30 8
30 A 33 4
33 A 36 2
TOTAL 80
Precio de venta
(Miles de $)
Frecuencia
( f )
Punto medio
( m )
f m
De 15 hasta 18 8 $16.5 $132.0
De 18 hasta 21 23 19.5 448.5
De 21 hasta 24 17 22.5 382.5
De 24 hasta 27 18 25.5 459.0
De 27 hasta 30 8 28.5 228.0
De 30 hasta 33 4 31.5 126.0
De 33 hasta 36 2 34.5 69.0
Total 80 $1 845.0
Al calcular la media aritmtica utilizando la frmula obtenemos:
De modo que, llegamos a la conclusin de que el precio de venta medio de los
vehculos es aproximadamente de $23 100
(miles) $23.1
80
$1845
n
m f
X = = =
Precio de
venta
(miles $)
Frecuencia
( f )
Punto
Medio
( m )
(m- )
( m - )
De 15.0
hasta 18.0
8 16.5 -6.6 43.56 348.48
De 18.0
hasta 21.0
23 19.5 -3.6 12.96 298.08
De 21.0
hasta 24.0
17 22.5 -0.6 0.36 6.12
De 24.0
hasta 27.0
18 25.5 2.4 5.76 103.68
De 27.0
hasta 30.0
8 28.5 5.4 29.16 233.28
De 30.0
hasta 33.0
4 31.5 8.4 70.56 282.24
De 33.0
hasta 36.0
2 34.5 11.4 129.96 259.92
80 1531.80
X
X ( )
2
- m f X
Aplicando la frmula tenemos:
La desviacin estndar para datos agrupados es de $ 4 403, que
difieren por $49 o 1.1 % ($ 4 354 valor real (toda la poblacin)).
Con base en el diferencia porcentual los estimados estn muy cerca
de los valores reales.
EJERCICIO. Los ingresos netos de una muestra de grandes
importadores de antigedades se organizaron en la siguiente tabla:
( )
4.403
1 - 80
1531.8
1
- m f
2
= =
=
n
X
s
Ingreso neto
(millones de $)
Nmero de
importadores
De 2 hasta 6 1
De 6 hasta 10 4
De 10 hasta 14 10
De 14 hasta 18 3
De 18 hasta 22 2
a) Cmo se llama la tabla?
b) Cul es el estimado del ingreso
neto medio aritmtico?
c) Cul es el estimado de la
desviacin media estndar?
TAREA 1. Se realiza un estudio acerca de los efectos del tabaquismo sobre los
patrones de sueo. La medicin que se observa es el tiempo, en minutos, que
toma quedarse dormido. Se obtienen estos datos para una muestra.
Fumadores: 69.3, 56.0, 22.1, 47.6,
53.2, 48.1, 52.7, 34.4,
60.2, 43.8, 23.2, 13.8
No fumadores 28.6, 25.1, 34.9
29.8, 38.5, 30.2
31.8, 41.6, 21.1
36.0, 37.9, 13.9
a) Encuentre la media, la mediana y la desviacin estndar para cada grupo.
b) Encuentre la media, la mediana y la desviacin estndar para datos
agrupados
c) Comparar los resultados.
PROBABILIDAD Y ESTADISTICA. 81
La desviacin estndar o tpica se interpreta utilizando
dos medidas:
a)Teorema de Chebyshev o Tchebycheff
b)La Regla Emprica o la regla de la normal
TEOREMA DE CHEBYSHEV.
La desviacin tpica de un conjunto de observaciones se emplea para medir las
variaciones con respecto a la media de los valores de las observaciones.
Mientras ms pequea sea la desviacin tpica, es ms probable obtener un
valor cercano a la media; mientras mayor sea la desviacin tpica, es ms
probable obtener un valor alejado de la media.
El matemtico ruso P. L. Chebyshev (1821 1894) desarroll un
teorema que nos permite determinar la proporcin mnima de los
valores que se encuentran en un nmero especfico de desviaciones
estndar de la media.
Teorema de Chebyshev. Para cualquier grupo de observaciones (muestra o
poblacin), la proporcin de los valores que se encuentran dentro de k
desviaciones estndar de la media es por lo menos 1 1/ k, donde k es
cualquier constante mayor que 1.
La proporcin de veces que cualquier posible valor de X caer dentro del
intervalo construido es de al menos 1 1/k. De acuerdo con esto, la
proporcin de veces que los valores de X caern dentro del intervalo formado
por dos desviaciones tpicas medidas a partir de es 1 1/2 = 1 =
; la proporcin de veces que los valores de X caern dentro de 3
desviaciones tpicas medidas a partir de es de al menos 1 1/3 = 1
1/9 = 8/9.
EJEMPLO: La cantidad media aritmtica quincenal con la que
contribuyen los empleados de Dupree Paint al plan de participacin de
utilidades de la compaa fue $51.54 y la desviacin estndar es
$7.51. Qu porcentaje de las contribuciones se encuentra entre ms
3.5 desviaciones estndar y menos 3.5 desviaciones estndar de la
media?
SOLUCIN.
Alrededor de 92 %.
( )
0.92
25 . 12
1
1
5 . 3
1
1
1
1
2 2
= = =
k
X
X
EJEMPLOS:
1. Al menos, qu porcentaje de un conjunto de observaciones caer
a) Dentro de cinco desviaciones tpicas medidas a partir de la media.
b) Dentro de diez desviaciones tpicas medidas a partir de la media?
Solucin.
a) Al menos 1 1/5 = 1 0.04 = .96, esto es 96%, de las
observaciones caern dentro de cinco desviaciones tpicas medidas a
partir de la media.
b) Al menos 1 1/10 = 1 0.01 = 0.99, esto es 99% de las
observaciones caern dentro de diez desviaciones tpicas medidas a
partir de la media.
2. A lo ms, qu porcentaje de un conjunto de observaciones caer
a) Ms all de dos desviaciones tpicas medidas a partir de la media.
b) Ms all de tres desviaciones tpicas medidas a partir de la media?
Las palabras ms all se refieren a las partes de la distribucin que
quedan fuera del intervalo indicado. Entonces, la proporcin de la
distribucin que cae ms all del intervalo es igual a:
1 proporcin dentro del intervalo.
SOLUCIN.
a) La proporcin de observaciones que cae ms all de 2 desviaciones
tpicas medidas a partir de la media es 1 (1 1/2) = 1 =
25%.
a) La proporcin de la distribucin que cae ms all de tres
desviaciones tpicas medidas a partir de la media es 1 (1 1/3)
= 1 8/9 = 1/9 11%.
Teorema de Chebyshev
El 75% de los datos se encuentran a dos desviaciones estndar.
El 88.89% de los datos se encuentran a tres desviaciones estndar.
86
Para cualquier distribucin de los datos con respecto a la media. La
proporcin de los datos que se encuentran K desviaciones estndar
de la media es al menos:
Por lo cual,
1 -
1
k
2
1 -
1
2
2
1 -
1
4
3
4
= 75% = = =
1 -
1
k
2
1 -
1
3
2
1 -
1
9
8
9
= 88.9% = = =
1 -
1
k
2
87
x
x + 2s x + 3s x - 2s x - 3s
Al menos
75%
Al menos
89%
LA REGLA EMPRICA
El Teorema de Chebyshev se ocupa de cualquier grupo de valores, esto
es, la distribucin de los valores puede tener cualquier forma.
Sin embargo, para una distribucin simtrica en forma de campana,
podemos ser ms precisos al explicar la dispersin en relacin con la
media.
La REGLA EMPRICA, que en ocasiones se conoce como la REGLA de
la NORMAL, describe aquellas relaciones que comprenden la
desviacin estndar y la media.
REGLA EMPRICA. Para una distribucin de la frecuencia simtrica en forma de
campana, aproximadamente 68 % de las observaciones estarn entre ms y
menos una desviacin estndar de la media; alrededor de 95% de las
observaciones se encontrarn ente ms y menos dos desviaciones estndar de
la media y prcticamente todas (99.7%) estarn entre ms y menos tres
desviaciones estndar de la media.
89
X X + 1s X + 2s X + 3s X - 3s X - 2s X -1s
68%
95%
99.7%
Ejemplo:
Una muestra de las tarifas de renta en los departamentos University
Park se asemeja a una distribucin simtrica en forma de
campana. La media de la muestra es $500; la desviacin
estndar es $20. Utilizando la Regla emprica, responder las
siguientes preguntas:
1. Entre qu par de cantidades se encuentra alrededor de 68 % de
los gastos mensuales en alimentos?
2. Entre qu par de cantidades est 95 % de los gastos mensuales
en alimentos?
3. Entre qu par de cantidades estn casi todos los gastos
mensuales?
SOLUCIN:
1. Alrededor de 68 % se encuentra entre $480 y $520, calculado como sigue:
2. Aproximadamente 95 % est entre $460 y $540, calculando como sigue:
( ) $20 1 $500 s 1 = X
( ) $20 2 $500 s 2 = X
3. Casi todos (99.7%) se encuentran entre $440 y $560, calculado
como sigue:
( ) $20 3 $500 s 3 = X
PROBABILIDAD Y ESTADISTICA. 92
EJERCICIO1. Pitney Pipe Company es uno de varios fabricantes nacionales de
tubera PVC. El departamento de control de calidad tom una muestra de 600
tubos de 10 pies. A la distancia de un pie del extremo del tubo se midi el
dimetro exterior; la media fue 14.0 pulgadas y la desviacin estndar 0.1
pulgadas.
a) Si la forma de la distribucin se desconoce, por lo menos, qu porcentaje de
las observaciones estar entre 13.85 pulgadas y 14.15 pulgadas?
b) Si suponemos que la distribucin de los dimetros es simtrica y que tiene
forma de campana, entre qu par de valores estarn 95% de las
observaciones?
EJERCICIO 2. De acuerdo con el teorema de Chebyshev, qu
porcentaje de las observaciones debe caer
Dentro de 2.0 desviaciones estndar?
Dentro de 3.5 desviaciones estndar?.
Dentro de 5.0 desviaciones estndar?