You are on page 1of 44

Distribucin de Frecuencias

Objetivos a identificar Frecuencias absolutas Frecuencias relativas Frecuencia acumulada. Tablas. Medidas de Tendencia Central. Histogramas y polgonos. Grficos Ejercicios y Aplicaciones.

Objetivos a identificar:

Conocer la definicin de frecuencias y sus tipos. Aplicacin de las frecuencias Conocer la distribucin de frecuencias Aprender a ubicar los intervalos de clase y su utilidad. Medidas de tendencia central en datos agrupados. Conocer los percentiles y cuartiles. Aplicaciones.

Resumiendo los datos

Tanto las variables cualitativas como las cuantitativas, originan observaciones, las cuales se conocen como: series cualitativas o series cuantitativas. Mientras que los datos que originan estas series, (vectores o conjuntos de datos) son pocos, basta solo ordenarlos para saber el valor mayor y menor, la existencia de concentraciones alrededor de algunos valores

Tipos de Distribucin

Por ejemplo una distribucin simple sera: Provincias de nacimiento de 10 ticos: (atendiendo al cdigo de la provincia) 1,2,3,4,5,6,7,7,7,7 Esta es una forma ordenada de expresar esa distribucin

No obstante, el problema se crea cuando el conjunto de datos es muy voluminoso.

Concepto de Distribucin de Frecuencias

La Distribucin de Frecuencias es un conjunto de elementos ordenados, resumidos o distribuidos en las diferentes categoras de una serie de datos determinada. El nmero que aparece resumiendo cada categora es conocido como la frecuencia y cada categora tiene una frecuencia, denominada absoluta. La suma de estas frecuencias absolutas, nos da el nmero de unidades observadas en todas las categoras

Caractersticas de las Clases, para datos agrupados

Las Clases o Intervalos o Categoras seleccionadas tienen que ser exhaustivas y mutuamente excluyentes. Eso significa que ningn elemento del conjunto a la hora de clasificar, puede encontrar ambigedad en la definicin del intervalo. Ejemplo: Un intervalo de la variable No. de hijos, pudiera ser: 1-4 hijos: Se entiende que en ese intervalo clasifican todos los encuestados que tienen 1,2,3, y hasta 4 hijos. Los que no tienen hijos, no estn aqu, al igual si el nmero de hijos es mayor a 4.

Ejemplo de una distribucin de frecuencias

Estudiamos el nmero de embarazos anteriores de 20 parturientas (discreta) en el Hospital de la Mujer Adolfo Carit en abril de 2012. El vector obtenido de la revisin realizada de estos 20 elementos es como sigue en la tabla preparada para el efecto

Ejemplo de distrib..... cont

Tabla de Recoleccin de Datos sobre E.A


No
1 2 3

E.A
4 6 9

No.
6 7 8

E.A
8 4 11

No
11 12 13

E.A
5 3 4

No
16 17 18

E.A
3 3 14

4
5

4
9

9
10

7
8

14
15

7
1

19
20

3
3

Ordenando los datos


Serie sin Ordenar: 4, 6, 9, 4, 9, 8, 4, 11, 7, 8, 5, 3, 4, 7, 1, 3, 3, 14, 3, 3

Serie Ordenada: 1, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 11, 14 Ahora se debe seleccionar el nmero de intervalos de clases que vamos a tener . Nunca deben ser menores de 4 y no mayores de 10, pues no tiene razn el resumen hecho. Para ello tambin calculamos la amplitud de la serie (14-1) y la dividimos entre el nmero de clases que deseamos (4) 14-1 / 4 = 3.25 ~ 4

Resultados de la tabla de distribucin con frecuencias absolutas

Distribucin de Embarazos anteriores


No. Embarazos Anteriores 1-4 embarazos 5-8 embarazos 9-12 embarazos 13- 16 embarazos TOTAL No. Madres 10 6 3 1 20

Calculemos la Frecuencia Relativa

Para ello tomamos la frecuencia de la clase y la dividimos entre el total de elementos observados. El resultado es un %. Ejemplo: Para el intervalo de 1-4 embarazos, donde la frecuencia absoluta es =10, la Frecuencia relativa es: (10 / 20) x 100 = 50 % As tendremos en todo el cuadro anterior:

Cuadro de frecuencias absolutas y relativas Frecuencias absolutas y relativas


No. Embarazos Anteriores No. Madres (f) Porcentaje (%) (fr)

1-4 embarazos
5-8 embarazos 9-12 embarazos 13- 16 embarazos

10
6 3 1

50
30 15 5

TOTAL

20

100

Calculemos la Frecuencia Acumulada

A medida que vamos analizando cada intervalo de clase, con su frecuencia absoluta, esta se va sumando a la frecuencia anterior. Ayuda a conocer en donde estn concentrados los valores en los intervalos. Vemoslo, en este ejemplo

Ejemplo de Frecuencia absoluta acumulada (FAA) y Frecuencia Relativa Acumulada (FRA)

Distribucin de frecuencias (fa), (faa),(fr),(fra) del ejemplo anterior

IC
1-4 embarazos 5-8 embarazos 9-12 embarazos

fa
10 6 3

Fr (%)
50 30 15

faa 10 16 19

fra 50 80 95

13- 16 embarazos

20

100

TOTAL

20

100

Caractersticas de las distribuciones de variables discretas y continuas


1.- Las distribuciones de variables discretas son fciles de realizar, mientras que las de variables continuas deben tener en cuenta los limites reales indicados de sus intervalos de clase. Ejemplo: ( intervalo de clase de peso) Lmite indicado Lmite Real 30-34 kg 29.5 34,5 Kg 2.- Todos los intervalos de clase deben estar cerrados. Las clases abiertas deben evitarse, pues los clculos de datos agrupados en distribuciones, pueden ser inexactos

Medidas de Tendencia Central o de Posicin

La Media, La Moda y La Mediana, en conjuntos de datos no agrupados

Principal funcin

El propsito de estas medidas es el de tratar de resumir en un solo nmero, la posicin o localizacin de la distribucin.

La Media o Promedio

La media o el promedio, es el resultado de sumar todos los valores que toma la variable en el conjunto y dividir el nmero de elementos de ese propio conjunto entre esa cantidad sumada anteriormente.

Por definicin, cada conjunto tiene un solo promedio.


Ejemplo: X= variable en estudio N= nmero de elementos en el conjunto = promedio de la variable en el conjunto total = simbolo de sumatoria Xi= X1 + X2+ X3.... XN = todos los valores de la variable X en los N elementos del conjunto.

Ejemplo de la media

Siendo el conjunto de estudio la frecuencia cardiaca (pulsaciones por minuto) de 6 estudiantes de la clase: 55,64,53,79,64,68 Aplicando la frmula: 55+64+53+79+64+68 = = 63.8~ 64 pul/min 6

La Moda

Esta medida se asocia con el valor mas comn, ms tpico que ocurre mas frecuentemente en un conjuntos de datos. Es el valor de mayor frecuencia. Ejemplo:
1, 3, 3, 3, 4, 4, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 11, 14

En este caso, la Moda (Mo)= 4 Puede suceder que no est definida la Moda en un conjunto o que existan varias Modas (igual nmero de frecuencias ), para lo que la utilidad de la Moda es reducida. La Moda tambin es til con las variables cualitativas (el diagnstico mas frecuente en emergencias en el da de hoy fue la EDA)

La Mediana

Es el valor central de una serie de datos ordenados y su ubicacin equidista de los limites mayor y menor del conjunto. Ej.: 55,63,53,79,64,68,78 ( N=7) Ordenando el conjunto: 53, 55, 63, 64, 68, 78, 79

Me = N +1/2 = 7 + 1/ 2 = 8/2 =4 (lo que quiere expresar que en este caso, el 4to. Elemento de la serie ordenada, que en este caso es 64

La Mediana... cont

En el caso de que la serie sea par: 55,63,53,79,64,68 donde N = 6 Se ordena tambin: 53, 55, 63,64,68,79

Se calcula promediando los dos valores centrales: Me = 63+64/ 2 = 63.5 lo que significa que el 50% de los elementos estudiados tienen una frecuencia cardiaca menor o igual a 63.5

Ventajas y desventajas de las medidas de posicin

La Media depende del valor exacto de cada observacin y estos valores se pierden cuando los datos se agrupan, por lo que hay que estimarla. La Mediana no tiene en cuenta la magnitud exacta de la mayora de las observaciones y por ello es que es menos eficaz que la Media porque implica una prdida de informacin La Mediana es mucho menos manejable que la Media para el tratamiento matemtico y se utiliza poco en las tcnicas estadsticas complejas. La Mediana resulta til para el trabajo descriptivo. La Moda no se toma muy en cuenta, por la variabilidad de sus observaciones.

Medidas de Tendencia Central con datos agrupados


Clculos y Aplicaciones

Caractersticas de las medidas de posicin en datos agrupados


1.- Cuando los datos se agrupan, las observaciones individuales pierden su identidad. 2.- En una distribucin de frecuencia, es posible determinar el nmero de observaciones que caen dentro de varios intervalos de clase, pero los valores reales no se pueden determinar. 3.- Es por ello, que los valores obtenidos son suposiciones y estos resultados son nicamente aproximaciones a los valores reales.

Clculo de la Media en datos agrupados


Aqu se supone que todos los valores que caen dentro de un intervalo de clase especfico se localizan en el punto medio del intervalo. El punto medio del intervalo se calcula, promediando los limites inferior y superior del intervalo de clase. ( Li + Ls) / 2 Ejemplo: Si el Intervalo de Clase est entre 0 y 4; (0+4) / 2= 2 El punto medio (Pm) ser 2

Clculo de la Media... cont

Obtenido el Punto medio (pm), se multiplica la frecuencia (f) de cada intervalo por su Pm y posteriormente, se realiza una sumatoria de todos los productos obtenidos por Intervalo de Clase (IC) y esa suma se divide entre la sumatoria de las f obtenidas y esa ser la Media ( ) de estos datos. Vemoslo en un ejemplo:

Ejemplo de Media en datos agrupados


IC
1-4 Embarazos 5-8 Embarazos 9-12 Embarazos 13- 16 Embarazos

Pm
2.5 6.5 10.5 14.5

fa
10 6 3 1

Pm x fa 25 39 31.5 14.5

TOTAL

20

110

Ejemplo... final
= 110 / 20 = 5.5 ~ 6

Lo que significa que el promedio de embarazos anteriores de ese grupo de 20 parturientas fue de 6

Clculo de la Mediana en datos agrupados


Aqu se supone que los valores estn distribuidos uniformemente a travs del intervalo. Pasos a seguir para el clculo: 1.- n / 2, o sea, se divide la sumatoria de las frecuencias absolutas entre 2. Este paso ubica el valor de la mediana en el intervalo de clase (IC) correspondiente 2.- Se procede a la sustraccin del Ls-Li del IC. 3.- Se aplica entonces la siguiente frmula:

Frmula para el clculo de la mediana en datos agrupados Me = Li + (n/2) Fa X Fi c

Donde: n = es la sumatoria de las frecuencias absolutas Me = Mediana Li = Lmite inferior real de la clase donde esta la Me Fi = Frecuencia absoluta de la clase donde est la Me Fa = Frecuencia acumulada de la clase anterior a la clase donde est la Me C = la diferencia del Ls Li del IC donde est la Me

Ejemplo del clculo de la Me para datos agrupados


Utilicemos el de las 20 parturientas, anteriormente citado. N = 20 ; n/2 = 10, lo que quiere decir que la Me est en el intervalo 1-4 embarazos Aplicando la frmula: 1 + [(10 0) / 10] * 3 = 1+ (1) (3) = 4 Me = 4

Esto nos recuerda que menos del 50% de las parturientas tuvieron 4 embarazos anteriores y mas del 50% tuvieron mas de esa cifra.

Aspecto importante a tener en cuenta con el uso de variables continuas en datos agrupados

Recordar que en el caso de las V.C, los intervalos de clase tienen valores reales y valores indicados. Hay que definir antes de efectuar los clculos, con cual de estos valores vamos a trabajar. Esto es aplicable para cualquier medida de posicin que se quiera calcular.

Calculando la moda en datos agrupados

La Moda (Mo), pierde su definicin, al ser aplicada a datos agrupados, donde se aplica entonces el concepto de Clase Modal, o sea, aquella clase donde se concentra la mayor densidad de frecuencias por unidad de intervalo y es por eso que se dice que en estos casos la Mo se estima.

Frmula de clculo de la Mo
Mo = Li + [ d1 / ( d1+ d2)] * C, siendo Mo = Moda Li = Lmite inferior de la clase modal (C.M) d1= diferencia entre la f de la C.M y la f de la clase anterior. d2= diferencia entre la f de la C.M y la f de la clase posterior C = Ls Li del intervalo de la C.M

Ejemplo del clculo de la Mo

Tomemos una distribucin de resultados de Papanicolau Positivo en 40 mujeres de 30 a 75 aos.


Grupos de Edades No. Mujeres (f)

29.5- 34.5 34.5- 39.5 39.5- 44.5 44.5- 49.5 49.5- 54.5 54.5- 59.5 59.5- 64.5 64.5- 69.5 69.5- 74.5 TOTAL

1 3 8 9 7 4 3 3 2 40

Aplicando la frmula para el clculo de la Moda


Clase Modal (C.M)= 44.5 49.5 Li = 44.5 D1= 9-8 = 1 D2= 9-7 = 2 C = 49.5-44.5= 5 Entonces : 44.5 + [(1/ 3) * 5] = 44.5+1.67 Mo = 46.17

Otras Medidas de Posicin

Los Percentiles y Cuartiles

Cuartiles y Percentiles

Los cuartiles son valores que dividen el conjunto de una variable en cuatro partes: Q1= toma en cuenta el primer cuarto Q2= es la mediana Q3= toma en cuenta las partes Q4= toma todo el conjunto. Ese mismo conjunto puede dividirse en deciles, quintiles y percentiles ( 5, 10 y 100 unidades, respectivamente)

Usos de los percentiles

Los percentiles se utilizan como parmetros de ubicacin y solo se calculan para grandes conjuntos de datos. Ejemplo: los grandes estudios de crecimiento y desarrollo, donde se buscan construir parmetros para una poblacin de sujetos determinada, ubican a travs de la edad, sexo, peso y talla, los percentiles adecuados en los que debe crecer y desarrollarse saludablemente una persona. (Ver tablas de crecimiento y desarrollo del pas).

Clculo de los percentiles

En un conjunto de datos agrupados, para ubicar un percentil, se usa : Pk = ( k / 100)* n


Por ejemplo: Si queremos ubicar el P72 en un conjunto de 40 elementos:
P72= ( 72 / 100) * 40 = 28,8

lo que significa que el septuagsimo segundo percentil est ubicado en la medida # 28,8. Analizando las fac de los intervalos de clases del conjunto agrupado, ubicamos de inmediato donde esta ubicada esta cifra (28,8)

Calculando los perc.....cont

Tomemos la distribucin de resultados de Papanicolau Positivo en 40 mujeres de 30 a 75 aos.


Grupos de Edades 29.5- 34.5 34.6- 39.5 39.6- 44.5 44.6- 49.5 49.6- 54.5 54.6- 59.5 59.6- 64.5 64.6- 69.5 69.6- 74.5 TOTAL No. Mujeres (f) 1 3 8 9 7 4 3 3 2 40 fac 1 4 12 21 28 32 35 38 40

Aplicando la frmula para perc...


Pk= Li + [ (k/100)*n] fa * c fi
Donde: Li = lmite inferior de la clase donde est el Pk fa = frecuencia acumulada de la clase anterior fi = frecuencia absoluta de la clase donde esta Pk C = la diferencia del intervalo de clase donde est Pk

Sustituyendo en la frmula
P72= 54.5 + ( 28.8-28) * 5 4 P72 = 54.5 + 1.0 = 55.5 Lo que significa que un 72 % de las mujeres positivas al Papanicolau tienen edades inferiores a los 55.5 aos y un 28% son positivas por encima de esa edad.