Вы находитесь на странице: 1из 33

Distribucin de frecuencias

Se ha sugerido que este artculo o seccin sea fusionado con Frecuencia estadstica (discusin).
Una vez que hayas realizado la fusin de artculos, pide la fusin de historiales aqu.

En estadstica, se le llama distribucin de frecuencias a la agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de observaciones en cada categora.1 Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.
ndice
[ocultar]

1 Caractersticas 2 Tipos de frecuencias

o o o o o

2.1 Frecuencia absoluta 2.2 Frecuencia relativa 2.3 Frecuencia acumulada 2.4 Frecuencia relativa acumulada 2.5 Distribucin de frecuencias agrupadas

3 Referencias

[editar]Caractersticas
Una distribucin de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una caracterstica de los [datos] y muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el nmero de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representarse grficamente en un histograma(Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos devalores. La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.

[editar]Tipos

de frecuencias

Vase tambin: Frecuencia estadstica.

[editar]Frecuencia

absoluta

La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por ni. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria. puesto que es mentira se hace el intercambio en la nterfaz de la frecuencia absoluta.

[editar]Frecuencia

relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por fi. La suma de las frecuencias relativas es igual a 1.

[editar]Frecuencia

acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fa.

[editar]Frecuencia

relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27

[editar]Distribucin

de frecuencias agrupadas

La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Lmites de la clase. Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros. Construccin de una tabla de datos agrupados:

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1. Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48. 2. Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos queramos establecer. Es conveniente que el nmero de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos. Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no no pertenece intervalo, se cuenta en el siguiente intervalo.

ci [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50) Total: 2.5 1 7.5

fi 1 1 3 3 3 6 7 10 4 2

Fi 2 5 8 11 17 24 34 38 40

ni 0.025

Ni 0.025 0.025 0.075 0.075 0.075 0.150 0.175 0.250 0.100 0.050 1 0.050 0.125 0.200 0.2775 0.425 0.600 0.850 0.950 1

12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5

Una distribucin una ordenacin en forma

de

frecuencias o tabla los datos

de

frecuencias es asignando a

de tab la de

estadsticos ,

cada dato su frecuencia correspondiente .

Tipos de frecuencia
Frecuencia absoluta

La frecuencia

absolu ta es

el nmero

de

veces que

aparece

un

determinado valor en un estudio esta dstico.

Se representa por f i .

La suma de las frecuencias abso lutas es igual al nmero tota l de datos, que se representa por N .

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.

Frecuencia relativa

La frecuencia relativa es el coc iente entre la f recuencia absolu ta de un determinado valor y el nmero to tal de datos .

Se puede expresa r en tantos por ciento y se representa por n i .

La suma de las frecuencias relativas es igua l a 1.

Frecuencia acumulada

La frecuencia acumulada es la suma d e las frecuencias absolu tas de todos los valores inferiores o iguales a l valo r considerado.

Se representa por F i .

Frecuencia relativa acumulada

La frecuencia

relativa

acumulad a es

el co ciente entre

la frecuencia

acumulad a de un determina do valo r y el nmero total de datos . Se puede expresar en tantos por ciento.

Ejemplo

Durante el mes de julio, en una ciuda d se han registra do las siguientes temperaturas mximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

xi

Recuento

fi

Fi

ni

Ni

27

0.032

0.032

28

II

0.065

0.097

29

0.194

0.290

30

16

0.226

0.516

31

24

0.258

0.774

32

III

27

0.097

0.871

33

III

30

0.097

0.968

34

31

0.032

31

Este tipo de tablas de frecuencias se utiliza con variables disc retas .

Distribucin de frecuencias agrupadas


La distribucin de frecuencias agru padas o tabla con datos

agrupados se emplea si las variables toman un nmero grande de valo res o la variable es continua .

Se agrupan los valores en in tervalos que amplitud denominados clases . correspondiente . A cada clase se le

tengan asigna

la misma su frecuencia

Lmites de la clase

Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase .

Amplitud de la clase

La amplitud

de

la

clase es

la d iferencia entre

el lmite

superio r

inferior de la clase .

Marca de clase

La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo pa ra el c lculo de algunos parmetro s .

Construccin de una tabla de datos agrupados


3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38 , 41, 48, 15, 32, 13.

1 se loca lizan los va lores menor y mayor de la distribucin. En este caso son 3 y 48.

2 Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos de queramos poner.

Es conveniente que el nmero de intervalos oscile entre 6 y 15.

En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 interva los.

Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece a l intervalo, pero el lm ite superior no pertenece interva lo, se cuenta en el siguiente interva lo.

ci

fi

Fi

ni

Ni

[0, 5)

2.5

0.025

0.025

[5, 10)

7.5

0.025

0.050

[10, 15)

12. 5

0.075

0.125

[15, 20)

17. 5

0.075

0.200

[20, 25)

22. 5

11

0.075

0.2775

[25, 30)

27. 5

17

0.150

0.425

[30, 35)

32. 5

24

0.175

0.600

[35, 40)

37. 5

10

34

0.250

0.850

[40, 45)

42. 5

38

0.100

0.950

[45, 50)

47. 5

40

0.050

40

Distribuciones de frecuencia
Cuando se dispone de gran nmero de datos, es til el distribuirlos en clases o categoras y determinar el nmero de individuos pertenecientes a cada clase, que es la frecuencia de clase. Una ordenacin tabular de los datos en clases, reunidas las clases y con as frecuencias correspondientes a cada una, se conoce como

una distribucin de frecuencias o tabla de frecuencias. La Tabla 1 es una distribucin de frecuencias de alturas (registradas con aproximacin de pulgada) de 100 estudiantes de la Universidad XYZ.

La primera clase o categora, por ejemplo, comprende las alturas de 60 a 62 pulgadas y viene indicada por el smbolo 60 - 62. Puesto que 5 estudiantes tienen una altura perteneciente a esta clase, la correspondiente frecuencia de clase es 5. Los datos ordenados y resumidos como en la distribucin de frecuencia anterior, se suelen llamar datos agrupados. Aunque con el proceso de agrupamiento generalmente se pierde parte del detalle original de los datos, tiene la importante ventaja de presentarlos todos en un sencillo cuadro que facilita el hallazgo de las relaciones que pueda haber entre ellos, puestas as de manifiesto.

Intervalos de clase y lmites de clase


Un smbolo que define una clase, tal como 60 - 62 de la tabla anterior, se conoce como intervalo de clase. Los nmeros extremos, 60 y 62, son los lmites de clase; el nmero menor 60 es el lmite inferior de la clase y el mayor 62 es el lmite superior. Los trminos clase e intervalo de clase se utilizan a menudo indistintamente, aunque el intervalo de clase es realmente un smbolo para la clase. Un intervalo de clase que, al menos tericamente, no tiene lmite superior o inferior, se conoce como intervalo de clase abierto. Por ejemplo, al referirse a la edad de grupos de individuos el intervalo de clase, mayores de 65 aos es un intervalo de clase abierto.

Lmites reales de clases


Si las alturas se registran con aproximacin de pulgada, el intervalo de clase 60 - 62 tericamente incluye todas las medidas desde 59,5000... a 62,5000 pulgadas. Estos nmeros, representados brevemente por los nmeros exactos 59,5 y 62,5, se conocen como lmites reales de clase o lmites verdaderos de clase; el menor de ellos, 59,5, es el lmite real inferior y el mayor de ellos, 62,5, es el lmite real superior. Prcticamente, los lmites reales de clase se obtienen sumando al lmite superior de un intervalo de clase el lmite inferior del intervalo de clase contiguo superior y dividiendo por 2. A veces, los lmites reales de clase se utilizan para simbolizar las clases. Por ejemplo, las diferentes clases de la primera columna de la Tabla 1 podran indicarse por 59,5 - 62,5, 62,5 - 65,5, etc. Sin embargo, con tal notacin aparece una ambigedad, pues los lmites reales de clase no coincidiran con las observaciones reales. As si una observacin fuese 62,5 no sera posible discernir si pertenece al intervalo de clase 59,5 62,5 o al 62,5 - 65,5. TAMAO O ANCHURA DE UN INTERVALO DE CLASE El tamao o anchura de un intervalo de clase es la diferencia entre los lmites reales de clase que lo forman y se conoce como anchura de clase, tamao de clase o longitud de clase. Si todos los intervalos de clase de una distribucin de frecuencias tienen igual anchura, esta anchura comn se representa por c. En tal

caso, c es igual a la diferencia entre dos sucesivos lmites de clase inferiores o superiores. Para los datos de la Tabla 1, por ejemplo, el intervalo de clase es c = 62,5 - 59,5 = 65,5 - 62,5 = 3.

Marca de clase
Leer ms: http://www.monografias.com/trabajos72/distribucion-frecuencias/distribucionfrecuencias.shtml#distribuca#ixzz2NB3LnIPj

DISTRIBUCIONES DE FRECUENCIAS
Las distribuciones o tablas de frecuencias permiten resumir los datos en una tabla que recoge:
valores de la variable o modalidades del atributo,

frecuencia absoluta o nmero de veces que aparece cada valor o modalidad en la muestra,

porcentaje de veces que aparece cada valor de la variable o modalidad del atributo sobre el total de observaciones,

porcentaje vlido calculado sobre el total de observaciones excluidos los valores missing,

porcentaje acumulado hasta cada uno de los valores de la variable ordenados de menor a mayor. Este porcentaje tiene interpretacin slo en los casos en que la variable sea susceptible de medida por lo menos en una escala ordinal.

Para obtener la tabla de frecuencias se procede con el men:

Analizar Estadsticos Descriptivos Frecuencias

En el cuadro de dilogo Frecuencias se seleccionan las variables para las que se quiere obtener sus correspondientes tablas de frecuencias unidimensional y se trasladan al cuadro Variables con el botn . Para obtener la distribucin de frecuencias debe estar activada la opcin Mostrar tablas

de frecuencias. La tabla que aparece en el visor de resultados no agrupa en intervalos o clases los valores de la variable; si se desea agruparlos es necesario recodificar previamente la variable (en otra variable) definiendo los lmites de los intervalos* Adems, el cuadro de dilogo Frecuencias permite activar otras opciones con los botones:
Estadsticos

Grficos

Formato

Estas opciones pueden utilizarse teniendo o no activada la opcin Mostrar tablas de frecuencias.

ESTADSTICOS La opcin Estadsticos abre un cuadro de dilogo que permite la obtencin de las principales medidas de sntesis o estadsticos de una distribucin unidimensional de frecuencias. stos se presentan agrupados en cuatro clases: Valores percentiles, Tendencia central, Dispersin y Distribucin.

Valores percentiles son aquellos valores de la variable que dividen a la distribucin de frecuencias en partes con igual nmero de observaciones: as, los cuartiles la dividen en cuatro partes guales y se obtienen directamente activando la opcin Cuartiles. Si interesan los valores que dividen la distribucin en k partes iguales se activa la opcin Puntos de corte para (por defecto 10) grupos iguales, lo que proporciona los deciles de la distribucin. En la opcin Percentiles es necesario indicar cuales de ellos se desean, incluyndolos de uno en uno con el botn Aadir.

Tendencia central permite seleccionar Media, Mediana y Moda de la distribucin, as como la Suma de todos los valores de la distribucin.

Dispersin permite seleccionar las siguientes medidas: Varianza, como resultado del clculo de la

expresin,

y Desviacin tpica; el error tpico de la media (E.T.media) que se

define como variable.

, as como los valores Mnimo y Mximo de la variable y la Amplitud o recorrido de la

Por ltimo, en Distribucin pueden obtenerse las siguientes medidas relativas a la forma de la distribucin: coeficiente de Asimetra, error tpico de asimetra, coeficiente de Curtosis y error tpico de curtosis, calculadas mediantelas siguientes expresiones:

Asimetra

Error

tp.

de

asimetra

Curtosis

Error tp.de curtosis

GRFICOS Los grficos asociados a la tabla de frecuencias que recoge del cuadro de

dilogo Frecuencias son: Grficos de barras,Grficos de sectores o Histogramas. Para seleccionar el que interesa se activa la opcin Grficos que abre el siguiente cuadro de dilogo:

Si la caracterstica objeto de anlisis es un atributo los grficos adecuados son el grfico de barras o de sectores; en ambos casos pueden realizarse con frecuencias absolutas o con relativas seleccionando Frecuencias o Porcentajes, respectivamente. Si la caracterstica es cuantitativa el grfico adecuado es el histograma que, a su vez, puede obtenerse superponindole la Curva de la distribucin normal activando la opcin correspondiente.

FORMATO Para modificar el aspecto de los resultados, ya sean, tablas o estadsticos, se activa la opcin Formato que abre el cuadro de dilogo siguiente:

Con las siguientes opciones:


Ordenar por: se puede elegir entre distintos criterios de ordenacin de los valores de la variable en la tabla de frecuencias. Por defecto, los valores aparecen en orden ascendente; pero tambin es posible una ordenacin descendente o una ordenacin por frecuencias, tanto ascendente como descendente, activando las opciones correspondientes.

Mltiples variables: se puede seleccionar el tipo de presentacin de los cuadros de estadsticos cuando se realiza simultneamente el anlisis unidimensional de dos o ms variables. Por defecto, est activada la opcin Comparar variables que proporciona un nico cuadro que contiene los estadsticos seleccionados correspondientes a todas las variables. Si se selecciona la opcin Organizar resultados segn variables se obtiene un cuadro de estadsticos para cada variable por separado.

El cuadro Frecuencias: Formato tambin ofrece la posibilidad de limitar la elaboracin de tablas de frecuencias slo para Aquellas variables que presentan un nmero reducido de valores o categoras. Para ello se debe indicar en el recuadroSuprimir tablas con ms de (por defecto 10) categoras el nmero de categoras a partir del cual no se desea la elaboracin de la tabla.

EJEMPLOS
Ejemplo 1. Con la base de datos Enctran.sav obtener la tabla de frecuencias, el diagrama de barras y los estadsticos media, mediana, moda, desviacin tipo, varianza y las medidas de forma (asimetra y curtosis) de las variables: Como, Rapi e Inde.

Vamos a realizar la descripcin de la variable Como, dejando al lector la descripcin de las variables Rapi e Inde. Con la secuencia Analizar > Estadsticos Descriptivos > Frecuencias se abre un cuadro de dilogo donde se selecciona la variable Como; con el botn Estadsticos se activan las medidas que se desean obtener y con el botn Grficos se activa la opcin Grficos de barras. Se obtienen los siguientes cuadros:

En base a estos resultados se concluye:


- La base de datos no presenta para esta variable ningn valor missing, de forma que las 114 observaciones son todas vlidas.

- Las medidas de posicin (media, mediana y moda) indican el valor central de la distribucin, y en este caso aproximadamente coinciden los tres estadsticos en el valor 5. Esto significa que la distribucin es bastante simtrica y que la valoracin media de la comodidad del medio de transporte no es ni buena ni mala.

- La desviacin tpica es 2,52 que sobre una media de 5,1 indica que la dispersin de los datos con respecto a la media es moderada.

- El coeficiente de asimetra toma el valor 0,182 que no es significativo ya que presenta un error estndar 0,226 y, por lo tanto, puede considerarse que la distribucin es simtrica. La curtosis de esta variable es 0,126 con un error estndar de 0,449 lo que indica que la distribucin es mesocrtica.

- La distribucin de la variable es unimodal, prcticamente simtrica y campaniforme como se observa en el grfico.

Ejemplo 2. Con la misma base de datos Enctran.sav obtener la tabla de frecuencias y el diagrama de barras de la variable Trans.

Entre otros resultados se observa que los porcentajes correspondientes a las tres modalidades de transporte pblico acumulan el 83,3% de los estudiantes y, nicamente, el 12,2% utiliza transporte

privado. Al ser una variable cualitativa el nico estadstico representativo de la distribucin es la moda que, en este caso, es la modalidad Metro que representa un 46,5% del total.
Ejemplo 3. Con la base de datos Enctran.sav obtener la tabla de frecuencias y la representacin grfica adecuada para la variable Coste, agrupando los valores en los siguientes intervalos: [0,5000) [5000,10000) [10000,15000) [15000, 20000).

Para obtener la tabla con los valores agrupados en intervalos es necesario, en primer lugar, recodificar los valores en una nueva variable. Para ello, se activa la opcin Recodificar > En distintas variables del men Transformar. En el cuadro de dilogo que aparece:
Se selecciona la variable Coste.

En Variable de Resultado se indica el nombre elegido para la nueva variable, por ejemplo, 'Coste1'. Se etiqueta la nueva variable, 'Coste recodificado'. Se definen los intervalos activando Valores antiguos y nuevos. Para definir el primer intervalo se activa enValor antiguo la opcin Rango: Del menor hasta 5000 y se le asigna como Valor nuevo 1; los siguientes intervalos se definen activando Rango lmite inferior hasta lmite superior, asignndoles los valores 2 y 3. El ltimo intervalo se define mediante Rango 15000 hasta el mayor y se le asigna Valor nuevo 4.

Se etiquetan los valores de la variable Coste1. En la ventana Vista de variable o bien con doble clic sobre la variable Coste1, introducimos las etiquetas de los valores. En Valores se indica:
Valor 1 2 3 4 Etiqueta de valor 0-5000 5000-10000 10000-15000 15000-20000

Por ltimo, con Analizar > Estadsticos Descriptivos > Frecuencias se obtiene la tabla de frecuencias y el histograma, que es el adecuado dada la naturaleza continua de la variable.

Distribucion de frecuenciasPresentation Transcript

1. Probabilidad y Estadstica Distribucin de frecuencias Ing. Gerardo Valds Bermdes CBTis 224

2. Distribuciones de frecuencias Cuando se trabaja con conjunto grandes de datos, con frecuencia es til organizarlos y resumirlos por medio de construccin de una tabla que liste los distintos valores posibles de los datos (de forma individual o por grupos), junto con las frecuencias correspondientes, es decir, el numero de veces que ocurren dichos valores.

3. Ejemplo Niveles de Cotinina en un grupo de fumadores. 1 0 131 173 265 210 44 277 32 3 35 112 477 289 227 103 222 149 313 491 130 234 164 198 17 253 87 121 266 290 123 167 250 245 48 86 284 1 208 173 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores

4. Distribucin de frecuencias Definicin: Lista de valores de datos (ya sea de manera individual o por grupos de intervalos), junto con sus frecuencias (o conteos) correspondientes. 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores

5. Elementos de una distribucin de frecuencias La frecuencia de una clase particular es el numero de valores originales que caen dentro de esa clase. Ejemplo: La primera clase de la tabla tiene una frecuencia de 11, lo que significa que 11 de los valores de los datos estn entre 0 y 99 11 12 14 1 2 0-99 100-199 200-299 300-399 400499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores

6. Elementos de una distribucin de frecuencias Los Lmites de clases inferiores son las cifras mas pequeas que pueden pertenecer a las diferentes clases. Ejemplo: Los limites de clase inferiores de la tabla son: 0, 100, 200, 300 y 400. 0 -99 100 -199 200 -299 300 -399 400 -499 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores

7. Elementos de una distribucin de frecuencias Los Lmites de clases superiores son las cifras mas grandes que pueden pertenecer a las diferentes clases. Ejemplo: Los limites de clase superiores de la tabla son: 99, 199, 299, 399 y 499. 0- 99 100- 199 200- 299 300399 400- 499 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores

8. Elementos de una distribucin de frecuencias Las fronteras de clase son las cifras para separar las clases, aunque sin los espacios creados por los limites de clases. Se calculan de la siguiente manera: 1. Se determina el tamao del espacio entre el limite de clase superior de una clase y el limite de clase inferior de la siguiente Para ste caso el espacio es de una unidad 11 12 14 1 2 0-99 100199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores

9. Elementos de una distribucin de frecuencias Las fronteras de clase son las cifras para separar las clases, aunque sin los espacios creados por los limites de clases. 2. Se suma la mitad de esa cantidad a cada limite de clase superior , para obtener las fronteras de clases superiores y se resta la mitad de esa cantidad a cada limite de clase inferior, para obtener las fronteras de clases inferiores. +0.5 +0.5 +0.5 +0.5 +0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5-99.5 99.5-199.5 199.5-299.5 299.5-399.5 399.5-499.5 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores

10. Elementos de una distribucin de frecuencias Las marcas de clases son los puntos medios de las clases. Se calculan sumando el limite de clase inferior con el limite de clase superior y dividiendo la suma entre dos. 49.5 149.5 249.5 349.5 449.5 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores

11. Elementos de una distribucin de frecuencias La anchura de clase es la diferencia entre dos limites de clase inferiores consecutivos o dos fronteras de clase consecutivas. En sta tabla, la achura de clase es igual a 100 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores

1. Escalas de medicin:
Corresponde a la Situacin 1, es decir, es una escala en que se establece un nmero determinado de clases o categoras de tal modo que cada elemento de la poblacin pertenece a una y slo una clase. Matemticamente se dice que se ha establecido una relacin de equivalencia entre los elementos de la poblacin. Si slo existen dos clases se denomina escala dicotmica. La nica operacin matemtica que se puede realizar con las clases de cualquier escala nominal es determinar las cantidades de elementos que les corresponden determinar sus frecuencias. Por ejemplo:

Sexo: las clases son masculino o femenino. Especialidad: las diferentes especialidades (carreras) del CRUSAM. Nmero de cedula de identidad personal. Temperatura de una persona: sanguneo, flemtico, melanclico, colrico. Nmero de placa de automviles del pas. a. Escala Nominal:

Corresponde a la Situacin 1, es decir, es una escala en que se establece un nmero determinado de clases o categoras de tal modo que cada elemento de la poblacin pertenece a una y slo una clase. Matemticamente se dice que se ha establecido una relacin de equivalencia entre los elementos de la poblacin. Si slo existen dos clases se denomina escala dicotmica. La nica operacin matemtica que se puede realizar con las clases de cualquier escala nominal es determinar las cantidades de elementos que les corresponden determinar sus frecuencias.

Por ejemplo:

Sexo: las clases son masculino o femenino. Especialidad: las diferentes especialidades (carreras) del CRUSAM. Nmero de cedula de identidad personal. Temperatura de una persona: sanguneo, flemtico, melanclico, colrico. Nmero de placa de automviles del pas. a. Escala Ordinal:

Corresponde a la Situacin 2. Es una escala nominal entre cuyas clases est definido un orden, de modo que cualquiera que sean dos de ellas, una ser mayor o superior, en algn sentido, que la otra. Por ejemplo:

Evaluaciones en un examen: 5, 4, 3 y 2. Grado de satisfaccin de una necesidad: alto, medio, bajo Conocimiento de un idioma: excelente, bien, regular, mal a. Escala de Intervalos:

Corresponde a la situacin 3 y no es ms que una escala ordinal con una distancia, una unidad de medida entre sus clases de modo tal que dado dos puntajes cualesquiera se puede saber cuan distante est uno del otro. La unidad de medida es arbitraria, pero comn y el punto de inicio (cero) es tambin arbitrario. Cuando se tiene una escala de intervalo se pueden realizar las operaciones de adicin y sustraccin, pero no necesariamente la multiplicacin y divisin dentro de la escala. Por ejemplo:

La temperatura del aire. (caluroso, fresco, agradable, etc.) a. Escala de Razones:

Corresponde a la situacin 4 y es una escala de intervalos donde existe un cero absoluto que marca la ausencia total del atributo en estudio.La proporcin entre los atributos de dos individuos cualesquiera es independiente de la escala de medida utilizada. En ella la razn entre dos clases (puntajes) cualesquiera permanece invariable ante toda la transformacin de la escala de razn, o sea ante toda transformacin del tipo y=(x). De aqu que siempre el cero de la escala transformada coincide con el cero de la escala original. En las escalas de razones es posible realizar todas las operaciones aritmticas con los puntajes. Por ejemplo:

Estatura de los alumnos: la estatura en metros es proporcional a la estatura en pulgadas. Peso de los alumnos: (en libras o kilogramos) El tiempo invertido en una prueba de velocidad en educacin fsica (en minutos o segundos). 1.

2. La representacin de los datos: FRECUENCIAS.


Cuando se rene gran cantidad de datos primarios es til distribuirlos en clases y categoras y determinar las frecuencias de las clases, o sea, el nmero de elementos que pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente con las frecuencias de clases se denomina distribucin de frecuencias El caso que se describe a continuacin, variables discretas se denomina distribucin por conteo de valores individuales. Supongamos que un determinado colectivo, representado por la variable estadstica Xi, que para mayor sencillez consideraremos como unidimensional; sean los datos de esta variable (representativo cada uno de ellos de un suceso) X1, X2, , Xn (supuesto que sean n los valores de la variable considerada.)

Definiremos como frecuencia de un dato el nmero de veces que este aparece en el colectivo; consecuentemente, si una variable estadstica toma r valores, cada uno de los cuales puede repetirse un cierto nmero de veces, podramos decir que el nmero de datos representado por la variable seran N, siendo N la suma de las respectivas frecuencias de cada dato ( N=Xi). Este valor N ser denominado como frecuencia total, mientras que la frecuencia de cada dato recibir el nombre de frecuencia absoluta o simplemente frecuencia (fi). La frecuencia absoluta nos habla del nmero de veces que un dato aparece en un colectivo, ms ello no nos dice demasiado en orden al establecimiento de comparaciones sobre la importancia de este dato. Para obtener una idea de la importancia que un dato posee en el seno de un colectivo, puesto que no es suficiente concepto de frecuencia, se utiliza el concepto frecuencia relativa, que se definir como: el coeficiente entre la frecuencia absoluta del dato considerado y la frecuencia total (fr=fi/Xi). Para efectos prcticos, asumiremos las siguientes definiciones de frecuencias:

frecuencias absolutas : es el nmero de veces que aparece en la muestra dicho valor de la variable y se representa por fi. frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos por fri frecuencias absoluta acumulada: para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el clculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el nmero de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por fa, se puede acumular, en la tabla estadstica) en orden ascendente (fa) o descendente (fa). frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamao de la muestra (N) y la denotaremos por fra. Resumiendo lo expuesto, si Xi es un valor de la variable, podemos representar por fi a su frecuencia y por fi/Xi a su frecuencia relativa (siendo Xi=N o la frecuencia total). Para el conjunto de los valores de la variable Xi tendramos, as la tabla #1, compresiva de la informacin sobre dicha variable, a travs de las respectivas frecuencias: Tabla #1: Variables Discretas Valores de la variable Xi (datos) X1 X2 Xn Donde: N=fi y fi/N=1 Otro es el caso de las clases representadas en forma de intervalos, variables continuas, llamados intervalos de clases que poseen extremos llamados limite inferior y limite superior, Un intervalo se dice que es abierto o no cerrado, por un extremo si no contiene el lmite correspondiente. La longitud, tamao o amplitud de un intervalo de clases (C) es la diferencia entre los limites superior e inferior (C=lim sup lim inf). El Recorrido (R) es la diferencia entre el dato mayor y el menor del conjunto da datos en estudio (R=Xn X1) En el caso de variables continuas ser necesario fijar intervalos de frecuencias para llegar a un resumen efectivo de la informacin original. A menudo es necesario representar una clase, o ms particularmente, un intervalo por un nico valor, este representar a todo el intervalo y se denominar marca de clases. Matemticamente el punto medio de cada intervalo corresponde a lo que denominamos marca de clase, se frecuencias absolutas fi f1 f2 fn frecuencias relativas fi/N f1/N f2/N fn/N

denotar por Xi, y constituir el valor representativo de cada intervalo. El nmero de observaciones que correspondan a cada intervalo se denominar frecuencias absolutas. Tabla #2: Variables Continuas Intervalos (C) X1-X2 X2-X3 Xn-1-Xn Donde Marcas de Clases Xi X1 X2 Xn Frecuencias Absolutas fi f1 f2 fn

N = fi = Nmero de observaciones C = X X" = Amplitud del intervalo Por ltimo, en el caso de variables no mensurables, dicha tabla adoptar una forma como la siguiente: Tabla #3: Variable Ordinales Variable Caracterstica A Caracterstica B Caracterstica Z 1. 1. Frecuencias fA fB fZ

2. Reglas Generales para construir las distribuciones de frecuencias por intervalos


A = ( X1, X2, , Xn ) 2. 3. Efectuar el arreglo ordenado (Ascendente o Descendente) de la poblacin o muestra Obtener la frecuencia absoluta mediante la tabulacin o conteo de los datos (homogenizar los datos) R = (valor mayor valor menor) = Xn X1 4. Encontrar el rango o recorrido (R) de los datos:

5.

Encontrar el nmero de clases o intervalos de clases (K). El nmero de clases debe ser tal que se evite el detalle innecesario, pero que no conduzca a la perdida de ms informacin de la que puede ser convenientemente ignorada. Para este clculo se utiliza la formula de Sturges K = 1 + 3.322(log. N)

5- Determinar la amplitud de la clase ( C ): R C = -------K Nota: el resultado siempre se aproxima al siguiente entero si excede al nmero entero obtenido, no importa el monto de la fraccin excedida al entero C = se lee "se aproxima a" 6. El dato menor (X1) ser el limite inferior de la primera clase. A l se le suma C y se obtiene el limite superior de la primera clase que tambin ser el limite inferior de la segunda clase. Luego se suma nuevamente C y se obtiene el limite superior del segundo intervalo e inferior del tercero. Y as sucesivamente hasta que el limite superior corresponda o supere ligeramente el valor mayor ( Xn ), la cantidad de clases obtenidas deber corresponder con el nmero K calculado mediante la formula de Sturges. Una vez construidos los intervalos se calculan, mediante tabulacin de acuerdo a los limites inferiores y superiores de las clases, las frecuencias absolutas, relativas, porcentuales y acumuladas correspondientes. Con los datos obtenidos se procede a construir la tabla de distribucin de frecuencia.

7.

8. 1.

2. Tabla de distribucin de frecuencias.


Una de los primeros pasos que se realizan en cualquier estudio estadstico es la tabulacin de resultados, es decir, recoger la informacin de la muestra resumida en una tabla, que denominaremos distribucin de frecuencias, en la que cada valor de la variable se le asocian determinados nmeros que representan el nmero de veces que ha aparecido, su proporcin con respecto a otros valores de la variable, etc. Por tanto, llamaremos distribucin de frecuencias a un agrupamiento de datos en clases acompaada de sus frecuencias: frecuencias absolutas, frecuencias relativa o frecuencia porcentuales. En caso de que las variables estn al menos en escala ordinal aparecen opcionalmente las frecuencias acumuladas absolutas, y frecuencias acumuladas porcentuales. Las distribuciones de frecuencias varan en dependencia si corresponden a una variable discreta o a una variable continua. Ejemplo #1: Variable Continua: La tienda CABRERAS Y ASOCIADOS estaba interesada en efectuar un anlisis de sus cuentas por comprar. Uno de los factores que ms interesaba a la administracin de la tienda era el de los saldos de las cuentas de crdito. Se escogi al azar una muestra aleatoria de 30 cuentas y se anot el saldo de cada cuenta (en unidades monetarias) como sigue: 77.97 13.02 17.97 89.19 12.18 8.15 34.40 43.13 79.61 90.99 43.66 29.75 7.42 93.91 20.64 21.10 17.64 81.59 60.94 43.97 32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68 Solucin: 1. donde: X1 = valor mnimo = 7.42 Xn= valor mximo = 93.91 2. Efectuar el arreglo ordenado de la poblacin o muestra: R = valor mayor valor menor = Xn X1 = 93.91 7.42 = 86.49 A= ( 7.42, 8.15, , , , 90.99, 93.91 )

3.

Encontrar el rengo o recorrido de los datos: "R" K=1+3.322(log N) Nota: en el ejemplo en estudio N=30 por cuanto que son 30 clientes en la muestra: K = 1 + 3.322 (log 30) = 1 + 3.322 (1.477) el log fue obtenido segn calculadora = 1+ 4.9069 = 5.9069 ~6 aproximado al siguiente entero

4. 5.

Encontrar en nmero de clases "K" , segn la frmula de Sturges: Determinar la amplitud de la clase: "C"

Nota: obsrvese que se va a trabajar con una cifra significativa ms cmoda, o sea como los datos estn dados en centsimos, se calculo C hasta los milsimos para evitar que algn dato coincida con el lmite de clases Clases P.M. Xi 7.420 21.835 14.628 10 0.33 21.835 36.250 29.043 36.250 50.665 43.458 50.665 65.080 57.873 65.080 79.495 72.288 79.495 93.910 86.703 Total XXX 4 5 3 3 5 0.13 0.17 0.10 0.10 0.17 10 14 19 22 25 30 30 20 16 11 8 5 0.33 1.00 0.46 0.67 0.63 0.54 0.73 0.37 0.83 0.27 1.00 0.17 fi fr fa fa fra fra

30 1.00 XXX XXX XXX XXX

Simbologa utilizada: XI = Punto medio o marca de clases fi = frecuencia absoluta fr = frecuencia relativa fa = frecuencia absoluta acumulada descendente fa = frecuencia absoluta acumulada ascendente fra = frecuencia relativa acumulada descendente fra = frecuencia relativa acumulada ascendente Nota: i. ii. iii. 1. Obsrvese que el lmite inferior de la primera clase es el valor mnimo ( X1=7.42 ) y el lmite superior es el resultado de X1+C = 7.42+14.415 = 21.835. El lmite inferior de la siguiente clase es igual al lmite superior de la clase anterior y el lmite superior es el resultado de adicionarle nuevamente la amplitud de la clase ( C ). Obsrvese que el lmite superior de la ltima clase es igual al valor mayor ( Xn=93.91 )

2. Representaciones Grficas de la Distribucin de Frecuencias


a. Los Cuadros estadsticos: La estadstica es una disciplina que nos ensea a organizar los datos recogidos para poder analizar sus caractersticas y posteriormente inferir, a partir de las muestras tomadas, las caractersticas de la poblacin investigada. Los cuadros o tablas corresponden a arreglos sistemticos de los datos por filas y columnas y son un buen complemento del texto en los informes El primer procedimiento estadstico consiste en tabular los datos segn el tipo de escala de medicin utilizada. La tabulacin de los datos conlleva a representar la informacin a travs de tablas que de forma general contiene las siguientes partes fundamentales: 1. 2. Numeracin (siempre que se presenten dos o ms cuadros)

3.

4.

5. 6.

Ttulo: es la descripcin que precede al cuadro, la cul deber estar redactada en forma breve y clara, de tal manera que exprese su contenido, siguiendo el ordenamiento del mismo. Es necesario abarcar las caractersticas: Qu, Dnde, Cmo y Cundo Encabezamiento: se refiere al nmero de atributos o variables que se quieren representar en el cuadro y se anotan como denominaciones de las columnas y subcolumnas; puede ser unidimensional, bidimensonial o multidimensional. Los ttulos de las columnas van en maysculas y los subttulos en minsculas Cuerpo: es el conjunto de columnas y lneas que contiene el cuadro en orden vertical y horizontal, donde se colocan los datos sobre los hechos observados Pie: se refiere a la informacin adicional necesaria a saber: notas, llamadas, fuentes de informacin y otras. Se anotan en el espacio debajo de la lnea inferior que limita el cuerpo del cuadro. Los Grficos Estadsticos:

a.

El grfico es quizs el auxiliar ms valioso y utilizado para expresar datos estadsticos, este elemento no le aade novedad a las tablas o cuadros estadsticos, es de fcil comprensin y accesible a un nmero mayor de usuarios. El grfico adems de expresar visualmente los hechos ms importantes de la informacin numrica, permite una mejor y ms fcil comprensin y ahorra tiempo y esfuerzo en el anlisis de datos estadsticos al facilitar su apreciacin visual en forma conjunta: -Histogramas de frecuencias: Un histograma es un grfico que sirve para representar una distribucin de frecuencias. Este grfico est formado por un conjunto de rectngulos (caso de variables continuas) que tienen como base un eje horizontal (generalmente el eje de las abscisas o de las X), y como centro los puntos medios de las clases. Los anchos de las clases y las reas de los rectngulos son proporcionales a las frecuencias de las clases. En el caso de las variables discretas el grfico consiste de un conjunto de barras verticales en lugar de rectngulos, hallndose cada barra sobre la observacin respectiva y con una altura proporcional a la frecuencia de la observacin

- Polgono de frecuencias: El polgono de frecuencias es un grfico formado por lneas quebradas, que tiene los centros de las clases representadas en un eje horizontal (eje de las X) y las frecuencias de las clases en un eje vertical (eje de las Y). La frecuencia correspondiente a cada centro de clase se seala mediante un punto y luego los puntos consecutivos se unen por lneas rectas. Del correspondiente histograma se puede lograr el polgono de frecuencia uniendo los puntos medios de las bases superiores de cada rectngulos mediante lneas rectas.

-Ojivas: Las ojivas se refieren a los grficos que se construyen utilizando una distribucin acumulativa de frecuencias, el orden de acumulacin se aplica al cuadro de distribucin de frecuencia y puede ser descendente (fa, fra) o ascendente (fa, fra). La figura que se forma al unir los puntos del polgono de frecuencias acumulativas es lo contrario del orden anunciado (por ejemplo si se utiliz el orden descendente en la acumulacin de los datos en el cuadro, la ojiva resulta ser ascendente).

LABORATORIO
(Resolver y entregar en grupos de tres estudiantes, equivalen a nota de un parcial) Problema #1: Variable Continua En la siguiente tabla se presentan los pesos de 40 estudiantes de la Universidad de Panam, con una aproximacin de una libra. 138 164 150 132 144 125 149 157 146 164 140 147 136 148 152 144 168 126 138 176 163 118 154 165 146 173 142 147 135 153 140 135 161 145 135 142 150 156 145 126 a. b. Construya una tabla de distribucin de frecuencias, indicando las frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas. Construya un histograma, un polgono de frecuencias y una ojiva de la distribucin.

Problema #2: Variable Discreta: Una encuesta entre un grupo de madres-solteras, para analizar los problemas econmicos que enfrentan, en determinada comunidad; arroj los siguientes resultados acerca del nmero de nios en el hogar. 1 4 2 3 5 3 5 3 3 5 1 1 2 1 4 1 2 1 4 1

2 1 1 2 1 2 3 2 3 3 3 1 3 4 1 1 3 5 4 2 2 5 1 4 2 3 1 2 5 1 a. Construya una tabla de distribucin de frecuencias y sus respectivas representaciones grficas.

Problema #3: Una compaa de transmisiones electrnicas registro como sigue el nmero de recibos de servicios prestados por cada una de sus 20 sucursales en el ltimo mes: 808 641 628 731 641 446 342 545 910 568 335 459 727 848 229 347 309 649 575 757 La compaa piensa que una tienda realmente no puede esperar alcanzar financieramente el punto de equilibrio con menos de 456 servicios prestados mensualmente. Adems su poltica es dar un bono financiero al gerente que genere ms de 683 servicios al mes. Disponga los datos en una arreglo e indique cuntas sucursales no estn consiguiendo el punto de equilibrio y cuntas ganan el bono. Problema #4: Una agencia de viajes ofrece precios especiales en ciertas travesas por el Caribe. Planea ofrecer varios de estos paseos durante la prxima temporada invernal en el hemisferio norte y desea enviar folletos a posibles clientes. A fin de obtener el mayor provecho por cada unidad monetaria gastada en publicidad, necesita la distribucin de las edades de los pasajeros de travesas anteriores. Se consider que si participaban pocas personas de un grupo de edad en los paseos no sera econmico enviar un gran nmero de folletos a personas de ese grupo de edad. La agencia seleccion una muestra de 40 clientes anteriores de sus archivos y se registr sus edades, como sigue: 77 18 63 84 38 54 50 59 54 56 36 50 50 34 44 41 58 58 53 62 62 43 52 53 63 62 62 61 61 52 60 60 45 66 83 63 63 58 61 71 a. b. c. Organice los datos en una tabla de distribucin de frecuencias de las edades de los clientes en la muestra Cul grupo de edad presenta la mayor frecuencia relativa? Cul la menor frecuencia relativa?. Saque conclusiones que puedan ayudar a la agencia a planear una campaa de publicidad para los paseos invernales.