Вы находитесь на странице: 1из 20

Distribuciones de frecuencias

DATOS SUELTOS
Se les llama datos sueltos a los datos recolectados que no mente. Un ejemplo es e conjunto de las estaturas e Ce han sido organizados numricaestu

registounva,qerdnofmalbtic antes hombres, obtenidas del ,

ORDENACIN
un conjunto de datos numricos en orden creciente o decreciente de magnitud. A la diferencia entre el nmero mayor y el menor se le conoce como rangoes de60, los datos. Por ejemplo, si la estatura mayor de los 100 estudiantes es 74 pulg y la menor el rango es 74 60 = 14 pulg. Una pznariz es

DISTRIBUCIONES DE FRECUENCIAS
se renen grandes cantidades de datos sueltos es til distribuirlos en y determinar el nmero de indiv . clases o categoras, os ue rtenecen a cada cate orla a frecuencia de clase. e le llama A una disposicin tabular de los datos por clases, con sus correspondientes frecuencias de clase, se e conoce como cuencias. La istri ucun e ecuenczas o tabla de fre2-1 es una distribucin de frecuencias de las estaturas de 100 estudiantes hombres de latabla universidad XYZ. La primera clase (o categora), por ejemplo, comprende las estaturas entre 60 y 62 pulg y se indica con el rango 60-62. Como hay cinco estudiantes en esta clase, la correspondiente frecuencia de clase es 5. A los datos asllama organizados y reunidos en clases, como en la anterior distribucin de frecuencias, se les datos agrupados. Aunque el proceso de agrupamiento generalmente quita detalles originales de los datos, es muy ventajosa pues proporciona una visin amplia y clara, adems de que se obtienen relaciones evidentes.
Si

36

CAPTULO 2

Distribuciones de frecuencias

Tabla 2-1 Estaturas de 100 estudiantes hombres de la universidad XYZ


Estatura (pulg)
rn 1, L-1.3.,

Nmero de estudiantes 5 18 42 27 8 Total 100


74(1907,)C2/0 '

60-62 63-65 66-68 69-71 72-74

1~~100~1~ INTERVALOS DE CLASE Y LMITES DE CLASE


El smbolo que define una clase, como el 60-62 de la tabla 2-1, se llama intervalo de clase. A los nmeros 60 y 62 se les conoce como lmites de clase; el nmero ms pequeo (60) es el lmite inferior de clase, mientras que el nmero ms grande (62) es el lmite superior de clase. Se acostumbra usar los trminos clase e intervalo de clase indistintamente, aunque el intervalo de clase es en realidad un smbolo de la clase. A un intervalo de clase que, por lo menos tericamente, no tiene lmite de clase inferior o lmite de clase superior se le llama intervalo de clase abierto. Por ejemplo, en grupos de edades de individuos, el intervalo de clase "65 aos o ms" es un intervalo de clase abierto.

:,w a . .
. ,

FRONTERAS DE CLASE
Si se miden estaturas con exactitud de 1 pulg, en teora el intervalo de clase 60-62 incluye todas las medidas desde 59.5000 hasta 62.5000 pulg. Estos nmeros, indicados brevemente por los nmeros exactos 59.5 y 62.5 se llaman fronteras de clase o lmites verdaderos de clase; el nmero menor (59.5) es la frontera inferior de clase y el nmero mayor (62.5), la frontera superior de clase. En la prctica, las fronteras de clase se obtienen promediando los lmites superior e inferior de un intervalo de clase. Algunas veces se emplean las fronteras para simbolizar clases. Por ejemplo, las clases en la primera columna de la tabla 2-1 se podran indicar mediante 59.5-62.5, 62.5-65.5, etctera. Para evitar ambigedad al usar tal notacin, las fronteras de clase no deben coincidir con observaciones posibles. Si una observacin fuera 62.5 no sera posible decidir si pertenece al intervalo de clase 59.5-62.5 o al 62.5-65.5.

1.1111111/011~~ TAMAO O AMPLITUD DE UN INTERVALO


DE CLASE
El tamao o la amplitud de un intervalo de clase es la diferencia entre las fronteras de clase inferior y superior y se le conoce como amplitud, tamao o longitud de clase. Si todos los intervalos de una distribucin de frecuencia son de la misma amplitud, a esta amplitud comn se le denota por c. En tal caso, c es igual a la diferencia entre dos lmites inferiores (o superiores) de clases sucesivas. Para los datos de la tabla 2-1, por ejemplo, la amplitud del intervalo de clase es c = 62.5 - 59.5 = 65.5 - 62.5 = 3.

Histogramas y polgonos de frecuencias

37

MARCA DE CLASE
La marca de clase, que es el punto medio del intervalo de clase, se obtiene promediando los lmites inferior y superior de clase. De este modo, la marca de clase del intervalo 60-62 es ( 60 + 62)/2 = 61. la marca de clase tambin se le denomina punto medio de la clase. f Para efectos de anlisis matemticos subsiguientes, se asume que todas las observaciones pertenecientes a un mismo intervalo de clase coinciden con la marca de clase; de esta manera, todas las estaturas en el intervalo de clase 60-62 pulg se considerarn de 61 pulg.

REGLAS GENERALES PARA CONSTRUIR DISTRIBUCIONES DE FRECUENCIA


1. Determinar el nmero mayor y el menor en los datos sueltos con el fin de especificar el rango (la diferencia entre ambos). 2. Dividir el rango en un nmero adecuado de intervalos de clase del mismo tamao. Si esto no es posible, usar intervalos de clase de distintos tamaos o intervalos de clase abiertos (vase problema 2.12). Se suelen tomar entre 5 y 20 intervalos de clase, segn los datos. Los intervalos de clase se eligen tambin de modo tal que las marcas de clase (o puntos medios) coincidan con los datos realmente observados. Ello tiende a disminuir el llamado error de agrupamiento que se produce en anlisis matemticos posteriores. No obstante, las fronteras de clase no debieran coincidir con los datos realmente observados. 3. Determinar el nmero de observaciones que corresponden a cada intervalo de clase; es decir, hallar las frecuencias de clase. Esto se logra mejor con una hoja de recuentos o registro de marcas (vase el problema 2.8).

HISTOGRAMAS Y POLGONOS DE FRECUENCIAS


Los histogramas y los polgonos de frecuencias son dos representaciones grficas de las

distribuciones de frecuencias.
1.

2.

n histograma o histograma de frecuencias consiste en un conjunto de rectngulos que tienen a) sus bases en el eje X horizontal, sus centros en las marcas de clase y longitudes iguales a los tamaos de los intervalos de clase, y b) reas proporcionales a las frecuencias de clase. Si todos los intervalos de clase son del mismo tamao, las alturas de los rectngulos son proporcionales a las frecuencias de clase. Entonces se acostumbra tomar las alturas numricamente iguales a las frecuencias de clase. Si los intervalos de clase no son todos del mismo tamao, hay que ajustar las alturas (vase el problema 2.13). n p olgono de frecuencia es una grfica de lnea de las frecuencias de clase dibujada conlespecto a la marca de clase. Puede obtenerse uniendo los puntos medios de las partsuDeriores de los rectngulos del histograma.

El histograma y el polgono de frecuencias correspondientes a la distribucin de frecuencias de las estaturas de la tabla 2-1 se muestran en los mismos ejes de la figura 2-1. Suelen aadirse las longitudes PQ y RS a las siguientes marcas de clase menor y mayor, las cuales tienen frecuencias de clase iguales a cero. En tal caso, la suma de las reas de los rectngulos del histograma es igual al rea total limitada por el polgono de frecuencias y el eje X (vase el problema 2.11).

38

CAPTULO 2

Distribuciones de frecuencias

FIGURA 2-1

58

61

64

67

70

73

76

Estatura (pulg)

DISTRIBUCIONES DE FRECUENCIAS RELATIVAS


La[recuencia relativa de una clase es su frecuencia dividida entre la frecuencia total de .,o un sorcentaje. Por ejemplo, la frecuencia todas las clases se ex re relativa de la clase 66-68 en la tabla 2-1 es 42/100 = 42%. Es claro que la suma de todas las frecuencias relativas de las clases es 1, es decir, 100 por ciento. Si se sustituyen las frecuencias de la tabla 2-1 por las correspondientes frecuencias relativas, a la tabla resultante se le llama distribucin de frecuencias relativas, distribucin de porcentajes o tabla de frecuencias relativas. Una representacin grfica de distribuciones de frecuencias relativas se puede obtener, a partir del histograma o del polgono de frecuencias, con slo cambiar la escala vertical de frecuencias a frecuencias relativas y manteniendo exactamente el mismo diagrama. Las grficas resultantes se denominan histogramas de frecuencias relativas (o histogramas de porcentajes) y polgonos de frecuencias relativas (o polgonos de porcentajes), en ese orden.

DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS Y OJIVAS


La frecuencia total de todos los valores menores que la frontera de clase superior de un intervalo de clase dado se conoce como frecuencia acumulada hasta ese intervalo de clase, inclusive. Por ejemplo, la frecuencia acumulada, incluyendo hasta el intervalo de clase 6668 de la tabla 2-1, es 5 + 18 + 42 = 65, lo que significa que 65 estudiantes tienen estaturas por debajo de 68.5 pulg. Una tabla que presenta tales frecuencias acumuladas se llama una distribucin de frecuencias acumuladas, tabla de frecuencias acumuladas o, brevemente, una distribucin acumulada. En la tabla 2-2 se muestra una distribucin acumulada para la distribucin de las estaturas de los estudiantes de la tabla 2-1. Una grfica que recoja las frecuencias acumuladas por debajo de cualquiera de las fronteras de clase superiores respecto de dicha frontera es denominada un polgono de frecuencias acumuladas u ojiva; en la figura 2-2 se ilustra esta grfica para la distribucin de estaturas de los estudiantes de la tabla 2-1. Para ciertos propsitos, es deseable considerar una distribucin de frecuencias acumuladas de todos los valores mayores o iguales que la frontera de clase inferior de cada intervalo de clase. Como de este modo se obtienen estaturas de 59.5 pulg o ms, de 62.5 pulg o ms, etctera, se le suele conocer como una distribucin acumulada "o ms",

Curvas de frecuencia y ojivas suavizadas

39

mientras que la antes considerada es una distribucin acumulada "menor que". Es fcil deducir una de otra (vase el problema 2.15). Las correspondientes ojivas se conocen, entonces, como ojivas "o ms" y "menores que". Siempre que se hable de distribuciones acumuladas u ojivas, sin especificar el tipo, se estar mencionando el caso "menor que".
100 -

Frecuenc ia acumula da

Tabla 2-2

so 60

Estatura (pulg) Menor que 59.5 Menor que 62.5 Menor que 65.5 Menor que 68.5 Menor que 71.5 Menor que 74.5

Nmero de estudiantes

4020-

59.5 62.5

65.5

68.5

71.5

74.5

5 23 65 92 100

Estatura (pulg)

DISTRIBUCIONES DE FRECUENCIAS RELATIVAS ACUMULADAS Y OJIVAS DE PORCENTAJES


es la frecuencia acumulada dividida entre la frecuencia total. As, la frecuencia relativa acumulada de estaturas menores que 68.5 pulg es 65/100 = 65%, lo que significa que 65% de los estudiantes mide menos de 68.5 pulg. Si se usan frecuencias relativas acumuladas en la tabla 2-2 y en la figura 2-2, en vez de frecuencias acumuladas, los resultados se llaman distribuciones de frecuencias relativas
La frecuencia relativa acumulada o frecuencia acumulada en porcentajes

acumuladas (o distribuciones acumuladas en porcentajes) y polgonos de frecuencias relativas acumuladas (u ojivas en porcentajes), respectivamente.

CURVAS DE FRECUENCIA Y OJIVAS SUAVIZADAS


Los datos recolectados suelen considerarse como pertenecientes a la muestra tomada de una poblacin grande. Ya que son posibles muchas observaciones sobre esa poblacin, en teora es posible (para datos continuos) escoger intervalos de clase muy pequeos y, an as, tener un nmero razonable de observaciones en cada clase. De esta manera, cabe esperar que el polgono de frecuencias o el polgono de frecuencias relativas correspondiente a una poblacin grande contenga tantos pequeos segmentos de lnea que se aproxime a curvas a las que se les conoce como curva de frecuencias o curva de frecuencias relativas, respectivamente. Conviene esperar aproximaciones a dichas curvas tericas si se suavizan los polgonos de frecuencias o los polgonos de frecuencias relativas de la muestra; la aproximacin se mejora conforme crece el tamao de la muestra. Por esa razn, una curva de frecuencias se designa a veces como polgono de frecuencia suavizado. De forma anloga, al suavizar los polgonos de frecuencias acumuladas u ojivas se obtienen ojivas suavizadas. Suele ser ms fcil suavizar una ojiva que un polgono de frecuencias (vase el problema 2.18).

40

CAPTULO 2

Distribuciones de frecuencias

10~111~1110~
FIGURA 2-3

TIPOS DE CURVAS DE FRECUENCIAS


Las curvas de frecuencias que aparecen, en la prctica adoptan ciertas formas caractersti-

cas, como se ilustra en la figura 2-3.

Simtrica o en forma de campana

Sesgada a la derecha (sesgo positivo)

Sesgada a la Izquierda (sesgo negativo)

En forma de J

En forma de J invertida

En forma de U

Bimodal

Multimodal

1. Las curvas de frecuencias simtricas o en forma de campana se caracterizan porque las observaciones equidistantes del mximo central tienen la misma frecuencia. Un ejemplo importante es la curva normal. 2. En las curvas de frecuencias moderadamente asimtricas, o sesgadas, la cola de la curva a un lado del mximo central es ms larga que al otro lado. Si la cola ms larga est a la derecha, se dice que la curva es sesgada a la derecha o que tiene asimetra positiva. En caso contrario, se afirma que la curva es sesgada a la izquierda o que es de asimetra negativa. 3. En una curva en forma de J o de J invertida hay un mximo en un extremo. 4. Una curva de frecuencias en forma de U tiene mximos en ambos extremos. 5. Una curva de frecuencias bimodal tiene dos mximos. 6. Una curva de frecuencias multimodal tiene ms de dos mximos.

Problemas resueltos
Ordenacin
2.1

~IP

a) Escriba los nmeros 17, 45, 38, 27, 6, 48, 11, 57, 34 y 22 en una lista ordenada. b) Determine el rango de estos nmeros.
SOLUCIN

a) En orden creciente de magnitud, el arreglo es: 6, 11, 17, 22, 27, 34, 38, 45, 48, 57. En orden decreciente de magnitud, el arreglo es: 57, 48, 45, 38, 34, 27, 22, 17, 11, 6. b) El nmero menor es 6 y el mayor, 57; por lo tanto, el rango es 57 6 = 51.

1
ti-

Problemas resueltos 2.2

41

Las calificaciones finales en matemticas de 80 estudiantes universitarios se reportan en la tabla siguiente: 68 73 61 66 96 79 65 86 84 79 65 78 78 62 80 67 75 88 75 82 89 67 73 73 82 73 87 75 61 97 57 81 68 60 74 94 75 78 88 72 90 93 62 77 95 85 78 63 62 71 95 69 60 76 62 76 88 59 78 74 79 65 76 75 76 85 63 68 83 71 53 85 93 75 72 60 71 75 74 77

A partir de esta tabla, encuentre: a) La calificacin ms alta. b) La calificacin ms baja. c) El rango. d) Las cinco calificaciones ms altas. e) Las cinco calificaciones ms bajas. La calificacin del alumno que obtuvo el dcimo lugar ms alto. g) El nmero de estudiantes con calificaciones de 75 o ms. h) El nmero de estudiantes con calificaciones menores que 85. .as mla a ra de i) El porcentaje de estudiantes con calificaciones mayores que 65, pero menores a 85. Las calificaciones que no aparecen en la tabla.
SOLUCIN

f)

Algunas de estas preguntas son tan detalladas que se contestan mejor mediante la construccin de una ordenacin, que consiste en subdividir los datos en clases y colocar cada nmero en su clase, como en la tabla 2-3, llamada tabla de entrada. Despus, se ordenan los de cada clase, como en la tabla 2-4, y se obtiene la tabla deseada. Con la tabla 2-4, es relativamente fcil contestar las preguntas anteriores.
a) b) La calificacin ms alta es 97. La calificacin ms baja es 53.

c)

El rango es 97 - 53 = 44. Las cinco calificaciones ms altas son: 97, 96, 95, 95 y 94.

1
50-54 55-59 60-64 65-69 70-74 75-79 80-84 85-89 90-94 95-99

d)

Tabla 2-3 53 59, 57 62, 60, 61, 62, 63, 60, 61, 60, 62, 62, 63 68, 68, 65, 66, 69, 68, 67, 65, 65, 67 73, 73, 71, 74, 72, 74, 71, 71, 73, 74, 73, 72 75, 76, 79, 75, 75, 78, 78, 75, 77, 78, 75, 79, 79, 78, 76, 75, 78, 76, 76, 75, 77 84, 82, 82, 83, 80, 81 88, 88, 85, 87, 89, 85, 88, 86, 85 90, 93, 93, 94 95, 96, 95, 97

la.

En

42

CAPTULO 2

Distribuciones de frecuencias
Tabla 2-4 50-54 55-59 60-64 65-69 70-74 75-79 80-84 85-89 90-94 95-99 53 57, 60, 65, 71,

59 60, 60, 61, 61, 62, 62, 62, 62, 63, 63 65, 65, 66, 67, 67, 68, 68, 68, 69 71, 71, 72, 72, 73, 73, 73, 73, 74, 74, 74

75, 80, 85, 90, 95,

75, 81, 85, 93, 95,

75, 82, 85, 93, 96,

75, 75, 75, 75, 76, 76, 76, 76, 77, 77, 78, 78, 78, 78, 78, 79, 79, 79 82, 83, 84 86, 87, 88, 88, 88, 89 94 97

e) Las cinco calificaciones ms bajas son 53, 57, 59, 60 y 60.

fl La calificacin del alumno que obtuvo el dcimo lugar es 88.


g) El nmero de estudiantes con calificacin 75 o ms es de 44. h) El nmero de estudiantes con calificaciones menores que 85 es de 63. i) El porcentaje de estudiantes con calificaciones mayores que 65, pero menores a 85 es 49/80 = 61.2 por ciento. i) Las calificaciones que no aparecen en la tabla son: 52, 54, 55, 56, 58, 64, 70, 91, 92, 98, 99 y 100.

Distribuciones de frecuencias, histogramas y polgonos de frecuencias


2.3

La tabla 2-5 muestra una distribucin de frecuencias de los salarios semanales de 65 empleados de la empresa P&R. De acuerdo con esta tabla, determine: a) b) c) d) e) f) El lmite inferior de la sexta clase. El lmite superior de la cuarta clase. La marca de clase (o punto medio) de la tercera clase. Las fronteras de clase del quinto intervalo. El tamao del quinto intervalo de clase. La frecuencia de la tercera clase. g) La frecuencia relativa de la tercera clase. h) El intervalo de clase con la mayor frecuencia. Este intervalo se llama intervalo de clase modal. Su frecuencia se denomina frecuencia de clase modal.
Tabla 2-5

Salarios $25010-5259.99 260.00-269.99 270.00-279.99 280.00-289.99 290.00-299.99 300.00-309.99 310.00-319.99

Nmero de empleados 8 10 16 14 10 5 2 Total 65

Problemas resueltos

43

i) El porcentaje de empleados que ganan menos de $280.00 a la semana. j) El porcentaje de empleados que reciben por semana ms de $260.00, pero menos de $300.00.
SOLUCIN

a) $300.00 b) $289.99
c) La marca de clase de la tercera clase = ($270.00 + $279.99) = $274.995. Para

efectos prcticos, se redondear a $275.00. d) La frontera de clase inferior de la quinta clase = ($290.00 + $289.99) = $289.995. La superior = 1($299.99 + $300.00) = $299.995.

e) El tamao del quinto intervalo de clase = frontera superior de la quinta clase frontera inferior de la quinta clase = $299.995 $289.985 = $10.00. En este caso, todos los intervalos de clase tienen el mismo tamao, $10.00. 1) 16. g) 16/65 = 0.246 = 24.6%. h) $270.00-$279.99. i) El nmero total de empleados que ganan, por semana, menos de $280 = 16 + 10 + 8 = 34. El porcentaje de empleados que ganan menos de $280 por semana = 34/65 = 52.3%. j) El nmero total de empleados que ganan, por semana, ms de $260.00, pero menos de $300.00 = 10 + 14 + 16 + 10 = 50. El porcentaje de empleados que ganan, por semana, ms de $260.00, pero menos de $300.00 = 50/65 = 76.9%.
2.4

Si las marcas de clase en una distribucin de frecuencias de pesos de estudiantes son 128, 137, 146, 155, 164, 173 y 182 libras (lb), encuentre: a) el tamao del intervalo de clase, b) las fronteras de clase y c) los i:mites de clase, suponiendo que los pesos se midieron con 1 libra de precisin.
SOLUCIN

a) El tamao del intervalo de clase = diferencia comn entre marcas de clase sucesivas = 137 128 = 146 137 = etctera = 9 lb. b) Como todos los intervalos de clase son del mismo tamao, las fronteras de clase estn a la mitad de distancia entre las marcas de clase, por lo tanto, tienen los valores. 128 + 137), 1(137 + 146),...,1(173 + 182) o 132.5, 141.5, 150.5,..., 177.5 lb

La primera frontera de clase es 132.5 9 = 123.5 y la ltima 177.5 + 9 = 186.5, ya que el tamao comn de los intervalos de clase es de 9 lb. As, pues, las fronteras de clase son:
123.5, 132, 141.5, 150.5, 159.5, 168.5, 177.5, 186.5 lb c) Como los lmites de clase son enteros, se eligen los enteros ms cercanos a las fron-

teras de clase, es decir, 123, 124, 132, 133, 141, 142,... Entonces, la primera clase cuenta con los lmites 124-132; la siguiente es 133-141, etctera.

2.5

Represente grficamente los resultados del problema 2.4


SOLUCIN

124 128

132

1 133
i 137

141

142 146

150 151

159 160 155 164

141 5

150.5

11

168 169 j3

177 , 178 182

1 159 5

1 168.5

1775 '

11

186

1 186.5

La grfica se observa en el diagrama anterior. Las marcas de clase 128, 137, 146,..., 182 se localizan en el eje X. Las fronteras de clase se indican con los segmentos verticales discontinuos y los lmites de clase, con segmentos verticales slidos.

44

CAPTULO 2

Distribuciones de frecuencias

2.6

La menor de 150 mediciones es 5.18 pulg y la mayor 7.44 pulg. Determine un conjunto apropiado de a) intervalos de clase, b) fronteras de clase, c) marcas de clase que puedan usarse para formar una distribucin de frecuencias de estas mediciones.
SOLUCIN

El rango es 7.44 5.18 = 2.26 pulg. Para un mnimo de cinco intervalos de clase, el tamao de stos es 2.26/5 = 0.45 aproximadamente y para un mximo de 20 intervalos de clase el tamao es 2.26/20 = 0.11 aproximadamente. Las elecciones convenientes del tamao de los intervalos de clase, entre 0.11 y 0.45, podran ser 0.20, 0.30 o 0.40. a) Las columnas I, II y III de la tabla adjunta muestran intervalos de clase adecuados de tamaos 0.20, 0.30 y 0.40, respectivamente:
I 5.10-5.29 5.30-5.49 5.50-5.69 5.70-5.89 5.90-6.09 6.10-6.29 6.30-6.49 6.50-6.69 6.70-6.89 6.90-7.09 7.10-7.29 7.30-7.49 II 5.10-5.39 5.40-5.69 5.70-5.99 6.00-6.29 6.30-6.59 6.60-6.89 6.90-7.19 7.20-7.49 III

5.10-5.49 5.50-5.89 5.90-6.29 6.30-6.69 6.70-7.09 7.10-7.49

Obsrvese que el lmite inferior de clase de cada primera clase podra haber sido distinto de 5.10; por ejemplo, si en la columna I se hubiera partido de 5.15, como lmite inferior, el primer intervalo de clase hubiera sido 5.15-5.34. b) Las fronteras de clase correspondientes a las columnas 1, II y III del inciso a) son, en ese orden:
II III

5.095-5.295, 5.295-5.495, 5.495-5.695, 5.095-5.395, 5.395-5.695, 5.695-5.995, 5.095-5.495, 5.495-5.895, 5.895-6.295,

, 7.295-7.495 , 7.195-7.495 , 7.095-7.495

Vase que tales fronteras de clase son correctas, pues no coinciden con las mediciones obtenidas. c) Las marcas de clase correspondientes a las columnas I, II y III del inciso a) son, respectivamente: I 5.195, 5.395, , 7.395 II 5.245, 5.545, , 7.345 III 5.295, 5.695, , 7.295

Estas marcas de clase tienen la desventaja de no coincidir con mediciones obtenidas.


2.7

Al contestar el problema 2.6a), un estudiante escogi los intervalos de clase 5.10-5.40, 5.40-5.70,..., 6.90-7.20 y 7.20-7.50. Hubo algo incorrecto en su eleccin?
SOLUCIN

Esos intervalos de clase se traslapan en 5.40, 5.70 ..... 7.20. Luego, una medicin anotada como 5.40, por ejemplo, podra ser colocada en cualquiera de los dos primeros intervalos de clase. Algunos justifican esta eleccin decidiendo asignar la mitad de los casos dudosos a una clase y la otra mitad a la otra. La ambigedad desaparece escribiendo los intervalos de clase como 5.10 hasta 5.40, 5.40 hasta 5.70, etctera. En este caso, los lmites de clase coinciden con las fronteras de clase, en tanto que las marcas de clase pueden coincidir con los datos observados.

Problemas resueltos

45

En general, es deseable evitar traslapamientos de intervalos de clase si es posible y escogerlos de tal modo que las fronteras de clase no coincidan con los datos observados. Por ejemplo, los intervalos de clase del problema 2.6 podan haberse escogido como 5.0955.395, 5.395-5.695, etctera, sin ambigedad. Una desventaja de esta eleccin particular es que las marcas de clase no coinciden con los datos observados.
2.8

En la tabla que sigue se registran los pesos de 40 estudiantes hombres de una universidad, con precisin de una libra. Construya una distribucin de frecuencias.

138 146 168 146 161


SOLUCIN

164 158 126 173 145

150 140 138 142 135

132 147 176 147 142

144 136 163 135 150

125 148 119 153 156

149 152 154 140 145

157 144 165 135 128

El mayor peso es de 176 lb y el menor es 119 lb. Por ello, el rango es 176 -119 = 57 lb. Si se usan cinco intervalos de clase, su tamao ser 57/5 = 11, aproximadamente; si se usan 20 intervalos de clase, su tamao ser de 57/20 = 3. Una eleccin conveniente del tamao de clase es de 5 lb. Asimismo, resulta adecuado seleccionar las marcas de clase como 120, 125, 130, 135,... lb. De este modo, los intervalos pueden tomarse como 118-122, 123-127, 128-132,... Con tal eleccin, las fronteras de clase son 117.5, 122.5, 127.5,..., que no coinciden con los datos observados. La distribucin de frecuencias requerida se muestra en la tabla 2-6. La columna central, llamada registro de marcas, se usa para tabular las frecuencias de clase y se omite en la presentacin final de la distribucin de frecuencias. No es necesario hacer una ordenacin, aunque si se dispone de ella puede utilizarse para tabular las frecuencias.
Otro mtodo

Naturalmente, existen otras distribuciones de frecuencias. La tabla 2-7, por ejemplo, contiene una distribucin de frecuencias con 7 clases, en la que el tamao del intervalo de clase es de 9 lb.
2.9

Construya: a) una grfica de tallo y hojas y b) un histograma para la distribucin de peso en el problema 2.8 usando el programa de cmputo Minitab.
Tabla 2-6 Tabla 2-7

Peso (lb) 118-122 123-127 128-132 133-137 138-142 143-147 148-152 153-157 158-162 163-167 168-172 173-177

Conteo / // // //// thil / 7/# ///

Frecuencia

Peso (lb) 118-126 127-135 136-144 145-153 154-162 163-171 172-180

Conteo /// //// ii# ## // 71 //// //

Frecuencia
env-1

ii# i/i/

cv

00

ifil
//// // /// / //
t Ien

Total 40

Total 40
SOLUCIN

El comando de Minitab para la grfica de tallo y hojas produjo el resultado mostrado en la figura 2-4a). La grfica est compuesta por tres columnas. La segunda comprende el tallo y

46

CAPTULO 2

Distribuciones de frecuencias

FIGURA 2-4
MTB > Stem-and-Leaf weIght

la tercera contiene la hoja para un nmero determinado. En la primera fila, 1 11 9. el nmero 11 es el tallo y e19 es la hoja para el peso 119. La segunda fila: 1 12, indica que los pesos 120, 121, 122, 123 y 124 no aparecen en los datos, ya que no se muestran hojas. La tercera fila, 4 12 568, contiene el tallo 12 en la segunda columna, lo mismo que las hojas 5, 6 y 8 en la tercera columna. Los nmeros 125, 126 y 128 se representan en la tercera fila. Observe que generalmente la segunda columna contiene uno de los tallos II, 12, 13, 14, 15, 16 017. La tercera columna puede incluir tanto las hojas 0, 1, 2, 3 o 4, como las hojas 5, 6, 7, 8 o 9. La primera columna contiene frecuencias acumuladas, tanto de la porcin superior como de la inferior de la grfica de tallo y hojas. Por ejemplo, el 5, en la fila 5 13 2, indica que hay 5 pesos que son iguales o menores a 132 libras. El nmero 7 en la fila 7 16 134, indica que hay 7 pesos iguales o mayores a 161 libras. La fila donde la frecuencia acumulada primero excede la mitad de los valores de los datos es la fila 8 14 55667789. El 8 significa que hay 8 nmeros en esta fila. La figura 2-4b) es el histograma producido con Minitab. .
8 7 6

Character Stem-and-Leaf Display


Stem-and-leaf of weight N = 40 Leaf Un it = 1.0 1 1 4 5 11 17 15 10 7 4 2 11 9

Frecu enc ia

12 12 568 13 2 13 555688 14 002244 15 00234 15 678 16 134 16 58 17 3 17 6

5 4 3 2 1 O

(8) 14 55667789

P
120
130 140 150

160

170

180

Peso

a)

2.10

Con los datos de la tabla 2-5, del problema 2.3, construya: a) una distribucin de frecuencias relativas, b) un histograma, c) un histograma de frecuencias relativas, d) un polgono de frecuencias y e) un polgono de frecuencias relativas.
SOLUCIN

a) La distribucin de frecuencias relativas demostrada en la tabla 2-8 se obtiene de la distribucin de frecuencias de la tabla 2-5 dividiendo cada frecuencia de clase entre la frecuencia total (65), y cuyo resultado se expresa como porcentaje. Tabla 2 - 8 Frecuencia relativa (como porcentaje) 12.3 15.4 24.6 21.5 15.4 7.7 3.1 Total 100.0

Salarios $250.00-5259.99 260.00-269.99 270.00-279.99 280.00-289.99 290.00-299.99 300.00-309.99 310.00-319.99

Problemas resueltos b) y c)

47

El histograma y el histograma de frecuencias relativas estn en la figura 2-5. Obsrvese que para pasar de un histograma a un histograma de frecuencias relativas slo es necesario aadir al histograma una escala vertical con las frecuencias relativas, como se ve a la derecha de la figura 2-5.

30

20
10

Ir; LO

8 8 8 8 8 8 8
vi id
ID N

vi

CD

Salarios (en dlares)

d) y e)

El polgono de frecuencias y el polgono de frecuencias relativas se indican con la grfica de segmentos discontinuos en la figura 2-5. As, pues, para convertir un polgono de frecuencias en un polgono de frecuencias relativas basta aadir una escala vertical que muestre las frecuencias relativas.

Obsrvese que si slo se desea un polgono de frecuencias relativas, por ejemplo, la figura adjunta no incluira el histograma y el eje de frecuencias relativas aparecera del lado izquierdo en lugar del eje de frecuencias. 2.11

Pruebe que el rea total de los rectngulos en un histograma es igual al rea total limitada por el correspondiente polgono de frecuencias y el eje X.
SOLUCIN

Se probar para el caso de un histograma con tres rectngulos (figura 2-6) y el polgono de frecuencias correspondiente, que se indica con trazo discontinuo. rea total de los rectngulos = rea sombreada + rea II + rea IV + rea V + rea VII = rea sombreada + rea I + rea III + rea VI + rea VIII = rea total limitada por el polgono de frecuencias y el eje X Ya que rea I = rea II, entonces rea III = rea IV, rea V = rea VI y rea VII = rea VIII.

2.12

En la empresa P&R (problema 2.3) se han contratado cinco nuevos trabajadores con salarios semanales de $285.34, $316.83, $335.78, $356.21 y $374.50. Construya una distribucin de frecuencias de los salarios de los 70 trabajadores.
SOLUCIN

La tabla 2-9 muestra las posibles distribuciones de frecuencias. En la tabla 2-9a) se us un mismo tamao de intervalo de clase, $10.00. En consecuencia, hay demasiadas clases vacas y la informacin es, en exceso, detallada en el extremo superior de la escala de salarios.

48

CAPTULO 2

Distribuciones de frecuencias

En la tabla 2-9b) se han evitado las clases vacas y el detalle fino mediante el uso del intervalo de clase abierto "$320.00 y ms", con la desventaja de que la tabla se vuelve intil para realizar ciertos clculos matemticos. Por ejemplo, es imposible determinar la cantidad total pagada a la semana, ya que "$320.00 y ms" podra implicar que los individuos podran ganar tanto como $1 400.00 a la semana.
Tabla 2-9a) Tabla 2-9b)

Salarios $250.00$259.99 260.00-269.99 270.00-279.99 280.00-289.99 290.00-299.99 300.00-309.99 310.00-319.99 320.00-329.99 330.00-339.99 340.00-349.99 350.00-359.99 360.00-369.99 370.00-379.99

Frecuencia
000 s0 ,r) c>,r1rnO ^- C> ---. O --. -- ,

Salarios $250.00$259.99 260.00-269.99 270.00-279.99 280.00-289.99 290.00-299.99 300.00-309.99 310.00-319.99 Ms de 320.00

Frecuencia 8 10 16 15 10 5 3 3 Total 70

Total 70
Tabla 2-9c) Tabla 2-9d)

Salarios $250.00$269.99 270.00-289.99 290.00-309.99 310.00-329.99 330.00-349.99 350.00-369.99 370.00-389.99

Frecuencia 18 31 15 3 1 1 1
Total 70

Salarios $250.00-5259.99 260.00-269.99 270.00-279.99 280.00-289.99 290.00-299.99 300.00-319.99 320.00-379.99

Frecuencia 8 10 16 15 10 8 3 Total 70

En la tabla 2-9c) se ha usado un tamao de intervalo de clase de $20.00, con la desventaja de que se pierde mucha informacin del extremo inferior en la escala de salarios y el detalle sigue siendo demasiado fino en el extremo superior de la escala. En la tabla 2-9d) se usaron tamaos de intervalos de clase diferentes. Una desventaja es que ciertos clculos matemticos posteriores se complican al perder la simplicidad que se consigue cuando los intervalos de clase son del mismo tamao. Adems, mientras mayor sea el tamao del intervalo de clase mayor es el error de agrupamiento.
2.13

Construya un histograma para la distribucin de frecuencias de la tabla 2-9d).


SOLUCIN

La figura 2-7 contiene el diagrama requerido. Para construirlo, se utiliza el hecho de que el rea es proporcional a la frecuencia. Suponga que el rectngulo A corresponde a la primera clase [vase tabla 2-9d)] con frecuencia de clase 8. Como la sexta clase tiene tambin frecuencia 8, entonces el rectngulo B ser de la misma rea que A. Y ya que B es del doble de ancho que A, tendr la mitad de su altura, tal como se ve en la figura 2-7.

Problemas resueltos

49

De manera semejante, el rectngulo C, de la ltima clase en la tabla 2-9d), tiene media unidad de altura en la escala vertical.

FIGURA 2-7
15-

1OLL

255

265

275

285

295

305

315

325

335

345

355

365

375

385

Salarios (en dlares)

Distribuciones de frecuencias acumuladas y ojivas


2.14

Construya, para la distribucin de frecuencias del problema 2.3 (tabla 2-5): a) una distribucin de frecuencias acumuladas, b) una distribucin de porcentajes acumulados, c) una ojiva y d) una ojiva de porcentajes.
Tabla 2-10

Salarios Menor que $250.00 Menor que $260.00 Menor que $270.00 Menor que $280.00 Menor que $290.00 Menor que $300.00 Menor que $310.00 Menor que $320.00
SOLUCIN

Frecuencia acumulada O 8 18 34 48 58 63 65

Distribucin porcentual acumulada 0.0 12.3 27.7 52.3 73.8 89.2 96.9 100.0

a) y b)

La distribucin de frecuencias acumuladas y la distribucin acumulada en porcentajes (o distribucin de frecuencias relativas acumuladas) se combinan en la tabla 2-10.

Obsrvese que cada entrada de la columna 2 se obtiene sumando entradas sucesivas de la columna 2 de la tabla 2-5. As 18 = 8 + 10, 34 = 8 + 10 + 16, etctera. Cada entrada en la columna 3 se obtiene de la anterior dividiendo entre 65 la frecuencia total y expresando el resultado como porcentaje. As, 34/65 = 52.3%. Las entradas en esta columna tambin podan haberse obtenido sumando entradas sucesivas de la columna 2 de la tabla 2-8. Es decir, 27.7 = 12.3 + 15.4, 52.3 =12.3 + 15.4 + 24.6, etctera.
c) y d) La ojiva (o polgono de frecuencias acumuladas) se muestra en la figura 2 8a) y la ojiva de porcentajes (o polgono de frecuencias relativas acumuladas) se mues-

tran en la figura 2-8b). Ambas grficas fueron generadas en Minitab. Las anteriores suelen llamarse ojiva o distribucin acumuladas "menor que", por la manera de acumular las frecuencias.

50

CAPTULO 2

Distribuciones de frecuencias

FIGURA 2-8
70

e
e

c 100

-o 3" E

e 60

8.

c o 30 o

e 50

= 20 u it 10

u
e

0
25 O 260 270 280 290 300 310 320

u
u-

O
250 260 280 290 300 310 320

Salarios (en dlares)

Salarios (en dlares)

a)
2.15

b) A partir de la distribucin de frecuencias de la tabla 2-5 del problema 2.3, construya a) una distribucin de frecuencias acumuladas "o ms" y b) una ojiva "o ms".
SOLUCIN

a)

Obsrvese que cada entrada de la columna 2, en la tabla 2-11, se obtiene sumando entradas sucesivas de la columna 2 en la tabla 2-5, comenzando por abajo; as, pues, 7 = 2 + 5, 17 = 2 + 5 + 10, etctera. Estas entradas pueden obtenerse tambin restando cada entrada de la columna 2 en la tabla 2-10 de la frecuencia total, 65, es decir, 57 = 65 8, 47 = 65 18, etctera.
Tabla 2-11 Salarios $250.00 o ms $260.00 o ms $270.00 o ms $280.00 o ms $290.00 o ms $300.00 o ms $310.00 o ms $320.00 o ms Frecuencia acumulada "o ms" 65 57 47 31 17 7 2 O

b) La figura 2-9 muestra una ojiva "o ms".

FIGURA 2-9

0) ma
-

E 60

c5 50 V

E
co

40

u 30 20
4) 10

LL

250 260 270 280 290 300 310 320

Salarios (en dlares)

Problemas resueltos 2.16

51

De las ojivas en las figuras 2-8 y 2-9 (de los problemas 2.14 y 2.15, respectivamente) estime el nmero de empleados que cobran por semana: a) menos de $288.00, b) $296.00 o ms y c) al menos $263.00, pero menos de $275.00.
SOLUCIN

a)

Con referencia a la ojiva "menor que" de la figura 2-8, trace una recta vertical que intersecte al eje de "salarios" en $288.00. Esa recta corta a la ojiva en el punto de coordenadas (288, 45); por lo tanto, 45 empleados cobran menos de $288.00 por semana. En la ojiva "o ms" de la figura 2-9, dibuje una recta vertical en $296.00. Esta recta corta a la ojiva en el punto (296, 11); por lo tanto, 11 empleados ganan $296.00 o ms. Esto podra haberse obtenido de la ojiva "menor que" de la figura 2-8. Trazando una recta a partir de $296.00, se observar que 54 empleados reciben menos de $296.00, de modo que 65 54 =11 empleados cobran $296.00 o ms.

b)

c)

Usando la ojiva "menor que", de la figura 2-8, se tiene el nmero requerido de empleados = los que ganan menos de $275.00 los que ganan menos de $263.00 semanales = 26 11 = 15.

Ntese que los resultados anteriores se obtendran con el proceso de interpolacin en las tablas de frecuencias acumuladas. En el inciso a), por ejemplo, como $288.00 est a 8/10, o sea a 4/5 del camino entre $280.00 y $290.00, el nmero requerido deber ubicarse en 4/5 del camino entre los valores correspondientes 34 y 48 (vase tabla 2-10). Pero 4/ 5 del camino entre 34 y 48 es (48 34) = 11. As, el nmero requerido de empleados es 34 + 11 = 45.
2.17

Se lanzan cinco monedas 1 000 veces y en cada lanzamiento se registra el nmero de caras ubicado. El nmero de lanzamientos en los que se observan 0, 1, 2, 3, 4 y 5 caras se muestra en la tabla 2-12. a) Grafique los datos de la tabla 2-12. b) Construya una tabla que contenga los porcentajes de lanzamientos que han dado un nmero de caras menor que 0, 1, 2, 3, 4. 5 o 6. c) Grafique los datos del inciso b).
Tabla 2-12

Nmero de caras O 1 2 3 4 5

Nmero de lanzamientos (frecuencia) 38 144 342 287 164 25 Total 1 000

SOLUCIN

a)

Los datos suelen presentarse de manera grfica como se muestra en las figuras 2-10 o2-11.

52

CAPTULO 2

Distribuciones de frecuencias

La figura 2-10 parece ms correcta, ya que el nmero de caras no puede ser 1.5 o 3.2. sta es una grfica de barras, donde las barras tienen amplitud cero. Tambin se le llama grfica de varillas y se utiliza especialmente para datos discretos.

FIGURA 2-10
Nmero de la nzam ientos
350 300 250 200 150 100 -

FIGURA 2-11
Nmero de lanzamientos
350 300 250 200 150 100 50

so o
2 3 4

1
0 2
3 4 5

Nmero de caras

Nmero de caras

La figura 2-11 es un histograma de los datos. Obsrvese que el rea total del histograma es la frecuencia total, 1000, como debe ser. Al usar la representacin en histograma, o el correspondiente polgono de frecuencias, se tratan los datos como si fueran continuos. Luego se ver que tal planteamiento es til. Recurdese que ya se han utilizado el histograma y el polgono de frecuencias para datos discretos en el problema 2.10. b) Con referencia a la tabla 2-13 requerida, obsrvese que contiene simplemente una distribucin de frecuencias acumuladas y una distribucin de porcentajes acumulados del nmero de caras. Debe notarse que las expresiones "menor que 1", "menor que 2", etctera, podran haberse sustituido por las expresiones "menor o igual que 1", "menor o igual que 0". Tabla 2-13

Nmero de caras Menor que 0 Menor que 1 Menor que 2 Menor que 3 Menor que 4 Menor que 5 Menor que 6
c)

Nmero de lanzamientos (frecuencia acumulada) 0 38 182 524 811 975 1 000

Porcentaje de nmero de lanzamientos (frecuencia acumulada en porcentaje) 0.0 3.8 18.2 52.4 81.1 97.5 100.0

La grfica requerida puede presentarse como en la figura 2-12 o como en la figura 2-13. La figura 2-12 es ms adecuada para presentar datos discretos, pues el porcentaje de lanzamientos con menos de 2 caras ha de ser igual que para menos de 1.75, 1.56 o 1.23 caras, de manera que debe tenerse el mismo porcentaje (18.2%) para esos valores (indicado por un segmento horizontal). La figura 2-13 muestra el polgono de frecuencias acumuladas, u ojiva, para los datos y, en esencia, trata los datos como si fueran continuos. Obsrvese que las figuras 2-12 y 2-13 corresponden, respectivamente, a las figuras 2-10 y 2-11 del inciso a).

Problemas resueltos

53

FIGURA 2-12
100 -

FIGURA 2-13
100

o o
2 80
N
69

92
CD N

80

60 -

60

e c o. "
20

e e
CO 40 -

c e a
0- 20 2

1 4

Nmero de caras

Nmero de caras

Curvas de frecuencia y ojivas suavizadas


2.18

Los 100 estudiantes hombres de la universidad XYZ (tabla 2-1) son, en realidad, una muestra de los 1 546 estudiantes hombres de esa universidad. a) Con los datos de esa muestra, construya un polgono de frecuencias en porcentajes suavizado (curva de frecuencias) y una ojiva suavizada en porcentajes "menor que". b) Con los resultados de las grficas del inciso a), estime el nmero de estudiantes con estaturas entre 65 y 70 pulg. Qu consideraciones debe hacer? c) Puede utilizar los resultados para estimar la proporcin de hombres en Esta,dos Unidos con estaturas entre 65 y 70 pulg?
SOLUCIN

a)

En las figuras 2-14 y 2-15 las grficas discontinuas representan los polgonos de frecuencias y las ojivas, que se han obtenido de las figuras 2-1 y 2-2, respectivamente. Las grficas suavizadas requeridas (en trazo slido) se obtienen aproximando stas por medio de curvas suavizadas. En la prctica, como es ms sencillo suavizar una ojiva, se obtiene primero la ojiva suavizada y despus el polgono de frecuencias suavizado, leyendo los valores en la citada ojiva.

b)

Si la muestra de 100 estudiantes es representativa de la poblacin, que es de 1 546, las curvas suavizadas de las figuras 2-14 y 2-15 pueden considerarse como la curva de frecuencias en porcentajes y la ojiva de porcentajes de esa poblacin. Esta suposicin es correcta slo si la muestra es aleatoria (es decir, si cada estudiante cuenta con la misma probabilidad de ser elegido en la muestra). Como las alturas registradas entre 65 y 70 pulg, con precisin de 1 pulg, en realidad representan alturas entre 64.5 y 70.5 pulg, el porcentaje de estudiantes en la poblacin con esas alturas se encuentra dividiendo el rea sombreada de la figura 2-14 entre el rea total acotada por la curva suavizada y el eje X. No obstante, es ms sencillo usar la figura 2-15, en la cual se ve que Porcentaje de estudiantes con estaturas menores que 70.5 pulg = 82% Porcentaje de estudiantes con estaturas menores que 64.5 pulg = 18% Luego, el porcentaje de estudiantes con estaturas de entre 64.5 y 70.5 pulg = 82% 18% = 64%. As, pues, el nmero de estudiantes de esa universidad que miden entre 65 y 70 pulg es de 64% de 1 546 = 989.

54

CAPTULO 2 III

Distribuciones de frecuencias

FIGURA 2-14
te
.7Z.

50 40 O 30 20
-

0.

E
LL

10

61

67

70

76

Estatura (en pulg)

FIGURA 2-15
100 te

WW W W

E1ro' =

60

c
7 G/

40

20

59.5

32.5

65.5

68.5

71.5

74.5

Estatura (en pulg)

Otra forma de decir lo anterior es afirmar que la probabilidad de que una persona, elegida al azar de entre 1 546 estudiantes, mida una altura comprendida entre 65 y 70 pulg, ser de 64%, 0.64 o 64 de cada 100. A causa de la relacin con las probabilidades (tratadas en el captulo 6), las curvas de frecuencia relativa se conocen como curvas de probabilidad o distribuciones de probabilidad. c) Es posible estimar la proporcin requerida en 64% (ahora con mucho ms margen de error) slo si existiera la certeza de que los 100 estudiantes constituye realmente una muestra aleatoria de la poblacin masculina de Estados Unidos. Sin embargo, esto es improbable por razones tales como: 1) algunos estudiantes no habrn alcanzado an sus estaturas mximas y 2) las generaciones jvenes tienden a ser ms altas que sus padres.

Problemas complementarios
a) Ordene los nmeros 12, 56, 42, 21, 5, 18, 10, 3, 61, 34, 65 y 24; b) determine su rango. _1.20 La tabla 2-14 muestra la distribucin de frecuencias del nmero semanal de minutos que pasan viendo la televisin 400 estudiantes de secundaria. Con referencia en esta tabla, determine: a) El lmite superior de la quinta clase. b) El lmite inferior de la octava clase. c) La marca de clase de la sptima clase. d) Las fronteras de clase de la ltima clase.

Вам также может понравиться