Вы находитесь на странице: 1из 29

Facultad de Derecho -Tecnicatura en Relaciones Laborales

ESTADISTICA LABORAL
Profesores: Mariela Quiones y Mariana Cabrera

Objetivos del mdulo 2:


1. Introducir el concepto de distribucin univariada y caracterizacin de una poblacin en base a
una variable.
2. Entender el uso de la matriz de datos originales para elaborar tablas y grficas como resumen de
la informacin contenida en una variable.
3. Conocer distintos tipos de presentaciones tabulares, su uso de acuerdo a las caractersticas de
la poblacin y de las variables, as como sus componentes.
4. Conocer distintos tipos de presentaciones grficas y su uso de acuerdo a las caractersticas de
la poblacin y de las variables.

Conceptos clave del mdulo 2:


Distribucin de frecuencias
Tablas de frecuencias simples y con datos agrupados en clases
Clases, intervalos, lmites y amplitud de clase
Frecuencias simples y acumuladas; frecuencias absolutas, relativas y relativas
porcentuales
Grficos para variables cualitativas: de barras, de sectores y pictogramas
Variables cuantitativas discretas y continuas
Grficos para variables cuantitativas discretas: de barras y acumulado
Grficos para variables cuantitativas continuas: histogramas y polgonos de
frecuencia y polgonos de frecuencia acumulados (ojivas)

2.1 INTRODUCCION
La matriz de datos que vimos en el mdulo I no es habitualmente la manera en que
presentamos la informacin que caracteriza a una poblacin.
Imagina una encuesta, por ejemplo, en la cual obtenemos informacin para 100
personas, a las cuales caracterizamos en base a 15 preguntas. Es una encuesta
pequea tanto en tamao como en el nmero de variables. Sin embargo seguramente
ser de poca utilidad para nosotros y para quienes quieran conocer las caractersticas
de esa poblacin el presentar la matriz como resultado final.
En este mdulo veremos dos tipos de herramientas que permiten presentar la
informacin de forma que pueda ser fcilmente leda y analizada: las tablas y las
grficas. Estas herramientas nos permiten comenzar a describir una poblacin en base
a cada una de sus caractersticas, por separado.

2.2 TABLAS DE DISTRIBUCIN DE FRECUENCIAS


Cuando pasamos de la matriz de datos originales a los distintos tipos de presentacin
(tabular, grfica y numrica), estamos realizando una reduccin de esa matriz. Si bien
ganamos en claridad y simplicidad para realizar la lectura de los resultados, tambin,
como veremos ms adelante en este mdulo y en los siguientes, esta reduccin implica
en la mayor parte de los casos una prdida de informacin.
La primer prdida se da al pasar de la matriz en la cual tenemos a todas las unidades y
todas la variables, a quedarnos slo con una de ellas. Perdemos la informacin
conjunta que caracteriza a cada unidad (compuesta por los valores que asumieron
todas las variables para cada unidad). Cuando lleguemos al mdulo 5, veremos
algunas herramientas que nos permitirn analizar dos caractersticas de la poblacin en
forma conjunta. Existen herramientas estadsticas que permiten realizar anlisis con
mchas variables simultneamente (anlisis multivariado) pero no las vamos a tratar en
este curso.
De la matriz nos hemos quedado con una sola de sus columnas, que corresponde a los
valores asumidos por todas las unidades para una determinada variable.
Para llegar a la elaboracin de las tablas y las grficas, es necesario construir la
DISTRIBUCION DE FRECUENCIAS de la variable a estudiar.

La distribucin de frecuencias un una forma de organizar y resumir un conjunto de


datos agrupados en categoras, en las cuales se muestra el nmero de observaciones
que contiene cada categora.
Es una funcin que asocia en forma grfica o tabular los valores observados de la
variable con sus respectivas frecuencias (nmero de observaciones).
En el caso de resumir la informacin de una sola variable, hablamos de
DISTRIBUCION UNIVARIADA DE FRECUENCIAS. Con este tipo de distribuciones
trabajaremos en este y en los prximos dos mdulos.
Una TABLA es una presentacin ordenada de los distintos valores de una variable en
base a los datos originales, es decir, una forma de presentar la distribucin univariada
de frecuencias.
Esta presentacin puede variar de acuerdo a algunas caractersticas de la distribucin;
fundamentalmente dos, el nmero de observaciones y el recorrido de la variable
estadstica.
El RECORRIDO o RANGO de la variable es la distancia entre el valor ms alto y el
ms bajo (volveremos sobre este concepto en el mdulo 4).
De acuerdo a este criterio, podemos distinguir los siguientes tipos de tablas
estadsticas:

Tablas tipo I: datos originales


Cuando el tamao de la poblacin o muestra y el recorrido de la variable son
pequeos, no hay que hacer nada especial, simplemente anotarlas de manera
ordenada en filas o columnas.
Nos quedamos con la columna correspondiente a esa variable en la matriz de datos, y
ordenamos sus valores en el caso que el sistema de categoras sea de nivel ordinal o
mayor.
Por ejemplo, si tenemos una muestra de las edades de 5 miembros de una
familia: 45, 8, 5, 16, 38 slo cabe ordenarlos en forma ascendente en su presentacin:
5-8-16-38-45.
Si en cambio tenemos una variable cualitativa, por ejemplo Departamento de
residencia: Montevideo, Canelones, San Jos, Treinta y Tres, Cerro Largo, podemos, a
lo sumo, buscar algn criterio para ordenar la presentacin de los datos (por ejemplo
por rden alfabtico).

Tablas tipo II: tablas de distribucin de frecuencias simples


Se apela a estas tablas cuando el tamao de la poblacin y/o muestra es grande y el
recorrido de la variable es pequeo, por lo que hay valores de la variable que se
repiten.
Por ejemplo, si preguntamos el nmero de personas activas que hay en 50 familias
obtenemos la siguiente tabla:

Nmero de integrantes del hogar

Fuente: datos ficticios

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que
precisaremos una tabla en la que resumamos estos datos obtenindose la siguiente
tabla de frecuencias.

Distribucin de frecuencias simples de integrantes del hogar

Integrantes
del hogar

Nmero
hogares

16

20

Total

50

de

Fuente: datos ficticios


Denominamos FRECUENCIA SIMPLE ABSOLUTA a las veces que se repite el mismo
valor (categora) de la variable.
En las variables como SEXO o ESTADO CIVIL que normalmente toman pocos valores
lo usual es resumirlas en tablas de frecuencias simples.

Distribucin de frecuencias simple de Sexo del jefe de la familia

Sexo

Nmero
jefes

Masculino

30

Femenino

20

Total

50

de

Fuente: datos ficticios


En realidad, las tablas de tipo I, son un caso especial de las tablas de tipo II: cuando
cada categora tiene frecuencia 1, por lo cual no agrega informacin el presentar la
columna de frecuencias.

Tablas tipo III: tablas de frecuencias con datos agrupados en


clases
Cuando el tamao de la poblacin y/o muestra y el recorrido de la variable son
grandes, ser necesario agrupar en intervalos los valores de la variable.
Por ejemplo, si a un grupo de 30 alumnos les preguntamos el dinero que en ese
momento llevan encima, nos encontramos con los siguientes datos:

450

115

250

300

17

18

200

675

50

37

78

159

230

500

120

100

18

125

31

42

56

110

25

268

60

15

20

985

Evidentemente, la variable tiene un recorrido muy grande, 980 pesos, por lo que si
queremos hacer una tabla con estos datos tendremos que tomar clases que agrupen
los valores. A estas clases le debemos definir un recorrido. Para decidir el recorrido
de las clases, necesitaremos decidir cuntas clases queremos?. Normalmente se
suele trabajar con no ms de 10 o 12 clases. Tomemos entonces 10.
recorrido =985 0 = 985
Dividimos el recorrido entre 10 (985/10)= 98,5. Por lo que podramos pensar que una
buena decisin es tomar clases de recorrido 99 (ms cmodo que 98,5)

Construccin de la clases:
Hay diferentes modalidades para construir clases
a) Se toman los limites superior e inferior reales de la distribucin de datos. Es decir, el
primer intervalo es 0 99; el segundo 100 a 199; el tercero 200 a 299, y as
sucesivamente.. (ver tabla)
b) Se toman los denominados lmites tericos sumando al lmite superior y restando al
lmite inferior 0,5 unidades. ( Li 0,5) (Ls + 0,5). Esto significa que el primer intervalo
tiene un recorrido de -0,5 a 99,5; el segundo de 99,5 a 199,5. Sin embargo, se podr
observar a travs de la recoleccin de ejemplos que no es usual usar decimales en la
presentacin de las clases, por lo que cuando se construye una tabla en base a los
lmites tericos, encontraremos estas cifras redondeadas de tal forma que veremos: el
primer intervalo va de 0 a 100; el segundo de 100 a 200, el tercero, de 200 a 300 y, as
sucesivamente. Habr que tener en cuenta, sin embargo, que si bien la primer clase

se define como (0 a 100) no incluye el 100; esta cifra esta incluida en la segunda
clase. Lo mismo con el 200, 300, etc..De esta forma respetaremos el criterio antes
mencionado de definicin exhaustiva y mutuamente excluyente de cada clase.

Ejemplo de tabla construida en base a lmites


reales:
Primer clase:
- Lmite inferior de la primer clase (L i = 0). Primer
valor de la variable ordenada
- Lmite superior de la primer clase (L s =99)
Escribimos entonces las siguientes clases y sus
respectivas frecuencias (veces que se repite el
valor):

NOTACION: A las frecuencias simples absolutas las


identificamos con fi

Ejemplo de tabla construida en


base a lmites tericos:
Primer clase:
- Lmite inferior de la primer
la variable ordenada
- Lmite superior de la primer
Escribimos entonces las
respectivas frecuencias (veces
2, . Hasta 99, excluyendo al

Elementos a considerar en la
frecuencias de clases

Frecuencia
simple
absoluta (fi)

- 99

15

100 - 199

200 - 299

300 - 399

400 - 499

500 - 599

600 - 699

700 - 799

[ Li-1 , Li )

fi

800 - 899

[ 0 100 )

15

900 - 999

[ 100 - 200)

[ 200 - 300)

[ 300 400)

[ 400 - 500)

[ 500 - 600)

[ 600 - 700)

clase (L i = 0). Primer valor de


clase (L s =100).
siguientes clases y sus
que se repiten los valores 0, 1,
100):

construccin de una tabla de


[ 700 - 800)

Debemos tener en cuenta, sin


de las clases hay algunas

Clases

embargo, que en la construccin


[ 800 - 900)

otras consideraciones a tener en

cuenta.
[ 900 - 1000) 1

Agrupar la informacin en intervalos permite resumir la informacin


contenida en una matriz de datos pero tambin implica una prdida de

informacin. A partir de entonces conoceremos entre cuales valores se


agrupan los datos pero perderemos el detalle del valor concreto del dato.

Tomar pocas clases implica que la "prdida de informacin" sea mayor.

Las clases tienen una LIMITE INFERIOR, un LIMITE SUPERIOR, y una


AMPLITUD

Los lmites pueden ser reales o tericos

La AMPLITUD es la diferencia entre los el lmite superior y el lmite inferior


TERICOS

Para solucionar el problema antes mencionado de prdida de informacin


(siempre y cuando la prdida sea real; es decir, no dispongamos de los
valores originales para reconstruir la verdadera distribucin de los datos se
suele asumir el supuesto que todos los valores de la clase tienden a
coincidir con el valor medio de la misma, tambin llamada MARCA DE
CLASE (Xc). Este valor medio se calcula sumando los lmites inferior y
superior TEORICOS

y dividiendo el resultado entre dos.

Tomaremos como ejemplo la tabla anterior para poder representar el calculo de todos
estos valores. Seleccionamos esta tabla porque la misma esta construida en base a los
limites TEORICOS que son los adecuados para calcular la AMPLITUD y la MARCA DE
CLASE de cada clase.
Tabla de frecuencias de la variable dinero disponible en el momento
CLASES

MARCA DE
CLASE

[ Li-1 , Li )

FRECUENCIA
ABSOLUTA

AMPLITUD
Ai

Xc
fi
100
[ 0 100 )

50

15
100

[ 100 - 200)

150

[ 200 - 300)

250

100

100
[ 300 400)

350

1
100

[ 400 - 500)

450

100
[ 500 - 600)

550

[ 600 - 700)

650

100

100
[ 700 - 800)

750

[ 800 - 900)

850

100

100
[ 900 - 1000)

950

30

Observa que la suma de las frecuencias absolutas debe coincidir con el total
poblacional (N);

En esta tabla distinguimos:


Li-
Ls
Ai
Xc

Intervalo de clase (con lmite inferior de clase y lmite


superior de clase. Se trata de lmites tericos y no reales.
Amplitud del intervalo: diferencia entre Li y Ls TEORICOS
Marca de clase: Punto medio del intervalo de clase. Es el
punto ms representativo de los valores incluidos en el
intervalo. Se obtiene promediando los dos lmites tericos del
intervalo (Li +Ls)/2

2.3 TIPOS DE FRECUENCIAS


Recuerde:
Las tablas de frecuencia nos permiten presentar la distribucin de los datos
observados de una forma resumida y ordenada en funcin de las categoras de la
variable de inters
Por eso, distintos tipos de frecuencias pueden expresarse en la tabla. Estas son:
frecuencias:
absolutas / relativas / relativas porcentuales,
simples / acumuladas

10

Se llama frecuencia absoluta (simple) (fi) de un valor de la variable al nmero


de veces que se presenta dicho valor. La representaremos por fi. En el ejemplo
anterior el valor tener en el bolsillo entre 900 y 1000 pesos obtuvo en la
medicin una frecuencia absoluta de 1. La suma de todas las frecuencias
absolutas es igual al total de la poblacin.
Se llama frecuencia relativa (simple) (fr) de un valor a la frecuencia absoluta
dividida por el nmero total de individuos que conforman la poblacin o muestra
(N o n). Es por tanto, una proporcin. La representaremos por f r . En el ejemplo
anterior la frecuencia relativa de esta clase o intervalo [ 900 - 1000) es 1/30 =
0,033. La suma de todas las frecuencias relativas es igual a la unidad (1).
Se llama frecuencia absoluta acumulada (Fi) al nmero de veces que se
presenta un valor y todos los anteriores a l. Se representa por F i. En el caso del
ejemplo anterior el intervalo [ 0 100 ) acumula 15 casos; el intervalo [ 100 - 200)
acumula 21 casos (6 que corresponden a este intervalo + 15 casos que se le
agregan por corresponder al intervalo anterior; el intervalo [ 200 - 300) acumula 25
casos (4 que corresponden a este intervalo + 21 casos que se le agregan por
corresponder a los dos intervalos que le preceden. Las frecuencias absolutas
acumuladas llegan a acumular N en el ltimo valor o clase considerada.
Se llama frecuencia relativa acumulada (Fr) a la frecuencia absoluta acumulada
dividida por el nmero total de observaciones. La representaremos por FR Las
frecuencias relativas acumuladas llegan a acumular 1 en el ltimo valor o clase
considerada
Se llama frecuencia porcentual (%) al tanto por ciento de las veces que se ha
obtenido un determinado resultado. Se obtiene multiplicando por 100 la frecuencia
relativa y se representa por n%. Se puede calcular la frecuencia porcentual tanto
para frecuencias simples como para frecuencias acumuladas. (% acumulado)
Ejemplo: Completamos la Tabla dinero disponible en el momento:

Tabla de frecuencias de la variable dinero disponible en el momento


[ Li-1 , Li )
fi
Fr
%
Fi
Fr
%
acumulado
[ 0 100 )
15
0,50
50
15
0,5
50
[ 100 - 200)
6
0,20
20
21
0,70
70
[ 200 - 300)
4
0,13
13
25
0,83
83
[ 300 400)
1
0,03
3
26
0,87
87

11

[ 400 - 500)
[ 500 - 600)
[ 600 - 700)
[ 700 - 800)
[ 800 - 900)
[ 900 - 1000)

1
1
1
0
0
1
30

0,03
0,03
0,03
0,00
0,00
0,03
1,00

3
3
3
0
0
3
100

27
28
29
29
29
30

0,90
0,93
0,97
0,97
0,97
1,00

90
93
97
97
97
100

En esta tabla tenemos cada una de las frecuencias representada por la notacin
correspondiente.
Ejemplos:
Considere el ejemplo de la variable Escolaridad con valores 0, 1, 2 3 en una base de
datos que contiene 200 datos
0 = bachillerato,
1 = licenciatura sin ttulo;
2 = licenciatura con ttulo y
3 = postgrado.
En esta variable la informacin que es relevante es la que se refiere a:
1. Los valores distintos que se presentan en la matriz de datos originales (columna 1)
2. El orden de estos valores
3. La frecuencia con que cada uno de esos valores se presenta en la matriz de datos
originales .
4. Los distintos valores acumulados a medida que crece el valor de la variable. En esta
variable tiene sentido la idea de acumular pues los valores guardan un orden que da
un criterio de acumulacin.
As, el resumen eficiente para este tipo de variables es una tabla de frecuencias simple que
brinde informacin tanto a partir de las frecuencias absolutas, relativas y porcentuales,
simples como acumuladas. Seleccionamos una tabla de frecuencias simple porque la
poblacin es grande (200) y su recorrido pequeo (no es necesario agrupar los valores en
clases)
Xi
0 = bachillerato,
1 = licenciatura sin
ttulo;
2 = licenciatura con
ttulo
3 = postgrado

30
120

fi

fr
0,15
0,6

15
30

f%

Fi
30
150

Fr
0,15
0,75

F%
15
75

40

0,2

120

190

0,95

95

10
200

0,05
1

40
100

200

1,00

100

Ahora considere el ejemplo de la variable Estado Civil con valores 0, 1, 2 3 en una


base de datos que contiene 200 datos
0 = viudo,
1 = casado;
2 = soltero y
3 = divorciado

12

En esta variable la informacin que es relevante es la que se refiere a:


1. Los valores distintos que se presentan en la matriz de datos originales (columna 1)
2. La frecuencia con que cada uno de esos valores se presenta en la matriz de datos
originales .
No interesa:
1. el orden en que se presentan los datos y, por tanto, tampoco
2. los distintos valores acumulados a medida que crece el valor de la variable
As, el resumen eficiente para este tipo de variables es una
brinde informacin a partir de las frecuencias absolutas,
simples. No calculamos frecuencias acumuladas porque
valores ya que entre ellos no existe un criterio de orden
agruparlos.
Xi

fi

fr

tabla de frecuencias que


relativas y porcentuales
no tiene sentido juntar
o jerarqua que permita

f%

0 = viudo,
1 = casado
2 =soltero

30
120
40

0,15
0,6
0,2

15
30
120

3 = divorciado

10
200

0,05
1

40
100

Una tabla de distribucin de frecuencias es una forma de presentar los datos sobre una
caracterstica de la poblacin en estudio; por tanto debe contener la informacin necesaria
para que el lector pueda analizarla.

Esto implica que debe tener explcitamente:


Ttulo, en el cual se describe qu variable se est presentando, qu tipo de tabla es
(frecuencia simple, acumulada, porcentual, etc.) y cul es la poblacin que se est
caracterizando (Por ejemplo: Trabajadores ocupados de Montevideo, ao 2007;
Personal administrativo de la empresa XXX, ao 2006)
Fuente de donde proviene la informacin: cul es el origen de la matriz de datos
que se est resumiendo. (Por ejemplo: Encuesta Continua de Hogares, INE;
Encuesta a la empresa XXX, realizada por el autor del informe)
Las columnas deben estar encabezadas por el tipo de frecuencia que contienen.

13

2.4 GRFICOS
Los grficos son considerados el mtodo de presentacin de la informacin ms simple
para el lector porque puede captar el panorama general o la tendencia de los datos de
una sola mirada. Es mucho ms fcil de comprender que una tabla o un texto. La
sencillez de lneas, una atractiva manera de presentacin, la posibilidad de usar las tres
dimensiones (3D), junto con colores, hacen de los grficos una de las herramientas
ms poderosas para transmitir ideas en forma rpida y simple al lector. Su desventaja
ms notoria es la prdida de precisin y exactitud, si se lo compara con una tabla.

Recomendaciones:
-

antes de efectuar el grfico definitivo, conviene hacer varios modelos diferentes en


borrador para poder elegir entre ellos al ms adecuado;

la disposicin del grfico debe hacerse de izquierda a derecha;

debe colocarse siempre el cero de la escala cuando es usado en la misma;

para las comparaciones conviene emplear una sola dimensin, antes que dos o tres;

en los grficos de porcentaje acumulativo adems del nivel cero se debe colocar el
100%;

la lnea ms gruesa de todas debe ser la del grfico o curva que se muestre, para
subordinar las dems a la principal

la lnea de ayuda visual en el grfico debe ser la ms fina de todas;

debe tener un ttulo claro, conciso y completo;

debe estar numerado con respecto a los otros grficos

debe indicar la fuente de donde se extrajo la informacin;

deben colocarse siempre la escala empleada y las unidades de las magnitudes


mostradas;

la escala de un grfico debe adaptarse para que entre toda la informacin en el mismo;

no se debe usar un grfico para mostrar la informacin en modo tendencioso;

si un grfico no resulta claro para el autor, mucho menos lo ser para el lector.
Basado en Bioestadstica aplicada , Azzimonti Renzo, JC.

2.4.1. Grficos para variables cualitativas


Los grficos ms usuales para representar variables de tipo cualitativas son los
siguientes:
Diagramas de barras:
Siguiendo la figura 1, representamos en el eje de ordenadas las categoras y en
abscisas las frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el
grfico se intenta comparar varias poblaciones entre s, existen otras modalidades,

14

como las mostradas en la figura 2. Cuando los tamaos de las dos poblaciones son
diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podran
resultar engaosas, como veremos en el siguiente mdulo.

Figura1 : Diagrama de barras para una variable cualitativa.

Figura 2: Diagramas de barras para comparar una variable


cualitativa en diferentes poblaciones. Se ha de tener en
cuenta que la altura de cada barra es proporcional al nmero
de observaciones (frecuencias relativas).

Poblacin A

Poblacin B

Otras modalidades de presentacin de los grficos de barras: Ejemplo variable


cobertura de salud

En estas figuras se muestra un ejemplo de diagrama de barras en dos dimensiones,


usando un ejemplo ficticio sobre la variable cobertura de salud (1. estatal; 2. privada; 3.
sin cobertura de salud). La lnea punteada ayuda a ver mejor los datos numricos, y un
ligero sombreado destaca mejor las barras. Al grfico tridimensional se lo gira en cierto
ngulo para obtener una mejor apreciacin por parte del lector. Adems, se han
engrosado las escalas para obtener una mejor sensacin de profundidad. Por ltimo, se

15

muestra un grfico tridimensional apilando las barras una encima de otra. Todo esto se
puede hacer pues slo se representan tres categoras; cuando stas son muchas ms, no
conviene apilar ni recargar tanto de informacin al eje de abcisas. Las grandes ventajas
del grfico de barras son: sencillez de construccin y facilidad de captacin por parte del
lector. Esto ltimo se debe a que visualmente se compara una sola dimensin: la altura,
pues como las bases son todas iguales no se les presta atencin.

Diagramas de sectores (tambin llamados grfico circular tartas o pie-chart).


Se divide un crculo en tantas porciones como clases existan, de modo que a
cada clase le corresponde un arco de crculo proporcional a su frecuencia absoluta
o relativa (figura 3). Se muestra el diagrama en dos y tres dimensiones; para una
mejor ilustracin se le pueden agregar colores.
Figura 3: Diagrama de sectores.

El arco de cada porcin se calcula usando la regla de tres:

16

Por ejemplo, si se deben presentar tres tipos diferentes cuyos porcentajes del total
sean respectivamente: 50%, 30% y 20%, entonces se divide el crculo en tres sectores
de superficie proporcional. El sector circular de la primera deber tener un ngulo que
sea el 50% de los 360 del ngulo total, o sea, abarcar la mitad del crculo con un
ngulo de 180. El segundo ocupar el 30% del total con un sector de ngulo de 108.
Y el tercero tendr un ngulo de 72. En el ejemplo anterior se presentan seis formas
de ilustrar la misma informacin. En la primera se ha trazado un grfico en 3D al modo
tradicional. El semicrculo ms grande corresponde a la categora estatal referidos a la
variable cobertura de salud en el ltimo ao. El restante sector, de un 30%,
corresponde a los que se atienden en la salud privada y el resto a los que carecen de
cobertura.
Todos estos elementos se captan ms rpido dando una ojeada al grfico que leyendo
todo el prrafo anterior, e ilustra sobre las ventajas de este mtodo con respecto al
textual. Se presentan tambin otros tres crculos usando el modo tridimensional, pero
con tcnicas diferentes, para ilustrar al alumno sobre algunas de las posibilidades
disponibles para poder elegir entre ellas.

Pictogramas
Expresan con dibujos alusivos al tema de estudio las frecuencias de las categoras de
la variable. Estos grficos se hacen representando a diferentes escalas un mismo
dibujo, como vemos en la figura 4.

17

Figura 4: Pictograma. Las reas son proporcionales a las frecuencias.

Tomado de www.comenius.usach.cl

El escalamiento de los dibujos debe ser tal que el rea de cada uno de ellos sea
proporcional a la frecuencia de la modalidad que representa. Este tipo de grficos suele
usarse en los medios de comunicacin, para que sean comprendidos por el pblico no
especializado, sin que sea necesaria una explicacin compleja.

2.4.2 Grficos para variables cuantitativas


Conviene, antes de adentrarnos en la descripcin de los grficos ms apropiados para
variables cuantitativas introducir una distincin que suele ser de uso muy extendido en
Estadstica. Es la distincin entre variables discretas y continuas.

18

Variables discretas y variables continuas


Una distribucin de los datos en categoras que ha demostrado ser til al
organizar los procedimientos estadsticos, es la distincin entre variables
discretas y variables continuas.
Una variable discreta es sencillamente una variable para la que se dan de modo
inherente separaciones entre valores observables sucesivos. Dicho con ms rigor,
se define una variable discreta como la variable tal que entre 2 cualesquiera
valores observables (potencialmente), hay por lo menos un valor no observable
(potencialmente). Por ejemplo, un recuento del nmero de familias que habitan en
una vivienda es una variable discreta. Mientras que cuentas de 3 y 4 son
potencialmente observables, no lo es una de 3,5.
Una variable continua tiene la propiedad de que entre 2 cualesquiera valores
observables (potencialmente), hay otro valor observable (potencialmente). Una
variable continua toma valores a lo largo de un continuo, esto es, en todo un
intervalo de valores. Longitudes y pesos son ejemplos de variables continuas. La
estatura de una persona, pude ser 1,70 mts. 1,75 mts., pero en potencia al
menos podra tomar cualquier valor intermedio como 1,73 mts. por ejemplo.
Un atributo esencial de una variable continua es que, a diferencia de lo que
ocurre con una variable discreta, nunca se la puede medir exactamente. Con una
variable continua debe haber inevitablemente un error de medida.
Un importante principio sobre variables continuas es que siempre se registran en
forma discreta, quedando la magnitud de la distancia entre valores registrables
adyacentes determinada por la precisin de la medicin.

Grficos para variables discretas:


Cuando representamos una variable discreta usamos el diagrama de barras si
pretendemos hacer una grfica diferencial. Las barras deben ser estrechas para
representar el que los valores que toma la variable son discretos. El diagrama
acumulado (o integral) tiene, por la naturaleza de la variable, forma de escalera. Un
ejemplo de diagrama de barras as como su diagrama acumulativo correspondiente
estn representados en la figura 5

19

Figura 5 Diagrama diferencial (barras) y acumulativo para una


variable discreta. Obsrvese que el diagrama integral
(acumulativo) contabiliza el nmero de observaciones de la
variable inferiores o iguales a cada punto del eje de abcisas.

xi

fi

fr Fi

Fr

1/8

1/8

3/8

4/8

3/8

7/8

1/8

8/8

n=8

Ejemplo
Clasificadas 12 familias por su nmero de hijos se obtuvo:
Nmero de hijos
(xi)

Frecuencias (fi

20

En primer lugar, escribimos la tabla de frecuencias en el modo habitual:


Variable

F. Absolutas

F. Relativas

F. Absolutas
Acumuladas

F. Relativas
Acumuladas

xi

ni

fi

Fi

Fr

0,08

0,08

0,25

0,33

0,42

0,75

0,25

12

Total

12

Con las columnas relativas a xi y fi realizamos el diagrama de barras para frecuencias


absolutas, lo que se muestra en la figura 6. Como puede verse, es idntico (salvo un
cambio de escala en el eje de ordenadas) al diagrama de barras para frecuencias
relativas y que ha sido calculado usando las columnas de xi y fr. El diagrama
escalonado (acumulado) se ha construido con la informacin procedente de las
columnas xi y Fi.

Figura 6 : Diagramas de frecuencias para una variable discreta

Grficos para variables continuas:


Cuando las variables son continuas, utilizamos como diagramas diferenciales los
histogramas y los polgonos de frecuencias.

21

Un histograma se construye a partir de la tabla estadstica, representando sobre cada


intervalo un rectngulo que tiene a este segmento como base. El criterio para calcular
la altura de cada rectngulo es el de mantener la proporcionalidad entre las frecuencias
absolutas (o relativas) de cada intervalo y el rea de los mismos.
El polgono de frecuencias se construye fcilmente si tenemos representado
previamente el histograma, ya que consiste en unir mediante lneas rectas los puntos
del histograma que corresponden a las marcas de clase. Para representar el polgono
de frecuencias en el primer y ltimo intervalo, suponemos que adyacentes a ellos
existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una lnea
recta los puntos del histograma que corresponden a sus marcas de clase, como hemos
ya mencionado. Obsrvese que de este modo, el polgono de frecuencias tiene en
comn con el histograma el que las reas de la grfica sobre un intervalo son idnticas.
Vanse ambas grficas diferenciales representadas en la parte superior de la figura 7.
El diagrama acumulado para una variable continua se denomina tambin polgono de
frecuencias acumulado, y se obtiene como la poligonal definida en abcisas a partir de
los extremos de los intervalos en los que hemos organizado la tabla de la variable, y en
ordenadas por alturas que son proporcionales a las frecuencias acumuladas. Vase la
parte inferior de la figura 7, en la que se representa a modo de ilustracin los
diagramas correspondientes a la variable cuantitativa continua expresada en la tabla
siguiente:
Li-1 - Li

Xc

fi

Fi

0 -- 2

2 -- 4

4 -- 6

6 -- 8

10

8 - 10

12

..

12

Figura 7: Diagramas diferenciales e integrales


para una variable continua.

22

Ejemplos:
La siguiente distribucin se refiere a las horas trabajadas anualmente por 500
trabajadores zafrales:
Horas

trabajadores

300 -- 500

50

500 -- 700

150

700 -- 1.100

275

ms de 1.100

25

Total

500

En primer lugar observamos que la variable en estudio es discreta (horas completas),


pero al tener un rango tan amplio de valores resulta ms conveniente agruparla en
intervalos, como si de una variable continua se tratase. La consecuencia es una ligera
prdida de precisin. El ltimo intervalo est abierto por el lmite superior. Dado que en
l hay 25 observaciones puede ser conveniente cerrarlo con una amplitud ``razonable''.
Todos los intervalos excepto el tercero tienen una amplitud de 200 horas, luego
podramos cerrar el ltimo intervalo en 1.300 horas- . Una decisin alternativa es cerrar
el intervalo con la misma amplitud que el intervalo inmediatamente anterior (si es el
ltimo) o el inmediatamente posterior (si es el primero). Tener en cuenta, sin embargo,
que ante una decisin de este tipo, muchas veces prima un criterio terico; por lo que
se recomienda un conocimiento profundo del fenmeno del que estamos dando cuenta
estadsticamente.

23

Antes de realizar el histograma conviene hacer una observacin importante. El


histograma representa las frecuencias de los intervalos mediante reas y no
mediante alturas. Sin embargo nos es mucho ms fcil hacer representaciones
grficas teniendo en cuenta estas ltimas. Si todos los intervalos tienen la misma
amplitud no es necesario diferenciar entre los conceptos de rea y altura, pero en
este caso el tercer intervalo tiene una amplitud doble a los dems, y por tanto hay
que repartir su rea en un rectngulo de base doble (lo que reduce su altura a la
mitad). As ser conveniente aadir a la habitual tabla de frecuencias una
columna que represente a las amplitudes ai de cada intervalo, y otra de
frecuencias relativas rectificadas, fr', para representar la altura del histograma.
Esto es posible apreciarlo en la ficha 8.

Intervalos

ai

fi

fr

fr

Fr

300 -- 500

200

50

0,10

0,10

0,10

500 -- 700

200

150

0,30

0,30

0,40

700 -- 1.100

400

275

0,55

0,275

0,95

1.100 -- 1.300

200

25

0,05

0,05

1,00

N=500

f`r Tambin denominada densidad de frecuencia se define como el cociente


entre la frecuencia absoluta o relativa y la amplitud. En el ejemplo anterior es
275/200*100 o bien 0,55/200*100 = 0,275

24

Figura 8 Histograma. Obsrvese que la altura del histograma en cada


intervalo es fr' que coincide en todos con fr salvo en el intervalo 700 -1.100 en el que la amplitud es doble a la de los dems .

Figura 9 : Diagrama acumulativo de frecuencias relativas

Por otro lado, mirando la figura se ve que sumando frecuencias relativas, se puede
calcular la cantidad de trabajadores (o porcentaje) con, por ejemplo, no ms de las 900
horas de trabajo anual
0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los trabajadores zafrales.
Esta cantidad se obtiene de modo ms directo viendo a qu altura corresponde al valor
900 en el diagrama de frecuencias acumuladas (figura 9).
Como en total son 500 trabajadores zafrales, el nmero de stos con una duracin
igual o menor que 900 horas es 0,675 * 500 =337,5, redondeando, 338 trabajadores.

25

Un tipo especial de histograma son las pirmides de poblacin. En las pirmides de


poblacin se usan dos histogramas, uno para hombres y otro para mujeres, que se
ubican en forma vertical y enfrentados uno con otro como se puede ver en la figura
10 . Las edades se agrupan en intervalos de 5 aos de edad; el primero de 0 a 4 aos,
el segundo de 5 a 9 aos y as sucesivamente (eje de rdenadas). Mientras que en el
eje horizontal se representa el porcentaje de ese grupo de edades en la poblacin total.
Este diagrama, llamado tambin pirmide de edades, se emplea mucho en
Demografa.
Figura 10: Pirmide de poblacin

Resumen de presentaciones grficas segn tipo de variable:


Tabla: Principales grficos segn el tipo de variable.
Tipo de variable
Grfico
V. Cualitativa
Barras, sectores, pictogramas
V. Cuantitativa
V. Discreta
Diferencial (barras)
Acumulativo (en escalera)
V. Continua
Diferencial (histograma, polgono de frecuencias,
pirmides de poblacin)
Acumulativo (Ojiva o polgono de frecuencias
acumuladas)

26

PARA SEGUIR LEYENDO


Barn Lpez, Francisco. Apuntes y vdeos de Bioestadstica
http://ftp.medprev.uma.es/libro/node10.htm#SECTION00152100000000000000
Para quienes quieran acceder a una explicacin sobre como construir tablas y grficas
en el programa EXCEL, les recomendamos el ejemplo que se encuentra en Mata, H.L.
(Abril, 2002). Tabla de Distribucin de Frecuencias. Material de Enseanza no
Publicado, Facultad de Ciencias Econmicas y Sociales. Universidad de los Andes,
Mrida.
http://webdelprofesor.ula.ve/economia/hmata/Notas/Tabla%20de%20Distribuci%F3n
%20de%20Frecuencias.pdf

27

EJERCICIOS
1. Propone representaciones tabulares (lo ms completas posibles) y grficas (puede
ser de ms de un tipo) para los siguientes casos:

Distribucin de frecuencias de la variable Departamento de residencia de una


poblacin compuesta por 10 personas, en Uruguay, 2007.

Distribucin de frecuencias de la Edad de las personas desempleadas en la


ciudad de Montevideo en 2007. Toma en cuenta que la situacin de empleo se
le pregunta slo a las personas de 14 aos y ms.

Esa misma poblacin se ha desagregado segn el sexo. Qu representacin


grfica propondras para visualizar la estructura por edad y sexo de los
desempleados?

Distribucin del Nmero de accidentes laborales en el ltimo ao que han


tenido 50 empresas del ramo de la construccin en el pas. Se conoce para
cada empresa el nmero de accidentes.

Distribucin de frecuencias del Salario mensual en el ltimo ao de los 120


empleados de una empresa, sabiendo que el salario menor es de $3500 y el
salario mayor de $45.000. Se tiene la informacin de cada uno de los salarios.

Distribucin de frecuencias del Salario mensual en el ltimo ao de los 120


empleados de una empresa, sabiendo que el salario menor es de $3500 y el
salario mayor de $45.000. No se tiene la informacin de cada uno de los
salarios sino el nmero de empleados por intervalos de clase de salarios, de
amplitud $5000.

Distribucin de frecuencias del Nivel educativo de los ocupados en la rama


Comercio y afines del departamento de Canelones en 2007.

2. Reconstruye laa Tablas de distribuciones de frecuencias simples absolutas,


relativas y porcentuales y, cuando sea pertinente tambin las acumuladas
correspondientes a partir de la informacin proporcionada por las siguientes
grficas, provenientes de un estudio a una poblacin compuesta por 200
personas:

Fuente: datos ficticios

28

Fuente: datos ficticios

3. Completa la siguiente Tabla de frecuencias con la distribucin relativa y la


relativa acumulada. Representa en 3 grficas distribuciones de frecuencias que
presenta la tabla construida (absoluta simple, relativa y relativa acumulada)
Edad (en aos)
18
19
20
21
22
23
24
25
26
27
28
29
30
N=

fi
5
15
25
20
20
40
15
10
15
20
5
5
5
200

Fuente: datos ficticios

29

Вам также может понравиться