Академический Документы
Профессиональный Документы
Культура Документы
ESTADISTICA LABORAL
Profesores: Mariela Quiones y Mariana Cabrera
2.1 INTRODUCCION
La matriz de datos que vimos en el mdulo I no es habitualmente la manera en que
presentamos la informacin que caracteriza a una poblacin.
Imagina una encuesta, por ejemplo, en la cual obtenemos informacin para 100
personas, a las cuales caracterizamos en base a 15 preguntas. Es una encuesta
pequea tanto en tamao como en el nmero de variables. Sin embargo seguramente
ser de poca utilidad para nosotros y para quienes quieran conocer las caractersticas
de esa poblacin el presentar la matriz como resultado final.
En este mdulo veremos dos tipos de herramientas que permiten presentar la
informacin de forma que pueda ser fcilmente leda y analizada: las tablas y las
grficas. Estas herramientas nos permiten comenzar a describir una poblacin en base
a cada una de sus caractersticas, por separado.
Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que
precisaremos una tabla en la que resumamos estos datos obtenindose la siguiente
tabla de frecuencias.
Integrantes
del hogar
Nmero
hogares
16
20
Total
50
de
Sexo
Nmero
jefes
Masculino
30
Femenino
20
Total
50
de
450
115
250
300
17
18
200
675
50
37
78
159
230
500
120
100
18
125
31
42
56
110
25
268
60
15
20
985
Evidentemente, la variable tiene un recorrido muy grande, 980 pesos, por lo que si
queremos hacer una tabla con estos datos tendremos que tomar clases que agrupen
los valores. A estas clases le debemos definir un recorrido. Para decidir el recorrido
de las clases, necesitaremos decidir cuntas clases queremos?. Normalmente se
suele trabajar con no ms de 10 o 12 clases. Tomemos entonces 10.
recorrido =985 0 = 985
Dividimos el recorrido entre 10 (985/10)= 98,5. Por lo que podramos pensar que una
buena decisin es tomar clases de recorrido 99 (ms cmodo que 98,5)
Construccin de la clases:
Hay diferentes modalidades para construir clases
a) Se toman los limites superior e inferior reales de la distribucin de datos. Es decir, el
primer intervalo es 0 99; el segundo 100 a 199; el tercero 200 a 299, y as
sucesivamente.. (ver tabla)
b) Se toman los denominados lmites tericos sumando al lmite superior y restando al
lmite inferior 0,5 unidades. ( Li 0,5) (Ls + 0,5). Esto significa que el primer intervalo
tiene un recorrido de -0,5 a 99,5; el segundo de 99,5 a 199,5. Sin embargo, se podr
observar a travs de la recoleccin de ejemplos que no es usual usar decimales en la
presentacin de las clases, por lo que cuando se construye una tabla en base a los
lmites tericos, encontraremos estas cifras redondeadas de tal forma que veremos: el
primer intervalo va de 0 a 100; el segundo de 100 a 200, el tercero, de 200 a 300 y, as
sucesivamente. Habr que tener en cuenta, sin embargo, que si bien la primer clase
se define como (0 a 100) no incluye el 100; esta cifra esta incluida en la segunda
clase. Lo mismo con el 200, 300, etc..De esta forma respetaremos el criterio antes
mencionado de definicin exhaustiva y mutuamente excluyente de cada clase.
Elementos a considerar en la
frecuencias de clases
Frecuencia
simple
absoluta (fi)
- 99
15
100 - 199
200 - 299
300 - 399
400 - 499
500 - 599
600 - 699
700 - 799
[ Li-1 , Li )
fi
800 - 899
[ 0 100 )
15
900 - 999
[ 100 - 200)
[ 200 - 300)
[ 300 400)
[ 400 - 500)
[ 500 - 600)
[ 600 - 700)
Clases
cuenta.
[ 900 - 1000) 1
Tomaremos como ejemplo la tabla anterior para poder representar el calculo de todos
estos valores. Seleccionamos esta tabla porque la misma esta construida en base a los
limites TEORICOS que son los adecuados para calcular la AMPLITUD y la MARCA DE
CLASE de cada clase.
Tabla de frecuencias de la variable dinero disponible en el momento
CLASES
MARCA DE
CLASE
[ Li-1 , Li )
FRECUENCIA
ABSOLUTA
AMPLITUD
Ai
Xc
fi
100
[ 0 100 )
50
15
100
[ 100 - 200)
150
[ 200 - 300)
250
100
100
[ 300 400)
350
1
100
[ 400 - 500)
450
100
[ 500 - 600)
550
[ 600 - 700)
650
100
100
[ 700 - 800)
750
[ 800 - 900)
850
100
100
[ 900 - 1000)
950
30
Observa que la suma de las frecuencias absolutas debe coincidir con el total
poblacional (N);
10
11
[ 400 - 500)
[ 500 - 600)
[ 600 - 700)
[ 700 - 800)
[ 800 - 900)
[ 900 - 1000)
1
1
1
0
0
1
30
0,03
0,03
0,03
0,00
0,00
0,03
1,00
3
3
3
0
0
3
100
27
28
29
29
29
30
0,90
0,93
0,97
0,97
0,97
1,00
90
93
97
97
97
100
En esta tabla tenemos cada una de las frecuencias representada por la notacin
correspondiente.
Ejemplos:
Considere el ejemplo de la variable Escolaridad con valores 0, 1, 2 3 en una base de
datos que contiene 200 datos
0 = bachillerato,
1 = licenciatura sin ttulo;
2 = licenciatura con ttulo y
3 = postgrado.
En esta variable la informacin que es relevante es la que se refiere a:
1. Los valores distintos que se presentan en la matriz de datos originales (columna 1)
2. El orden de estos valores
3. La frecuencia con que cada uno de esos valores se presenta en la matriz de datos
originales .
4. Los distintos valores acumulados a medida que crece el valor de la variable. En esta
variable tiene sentido la idea de acumular pues los valores guardan un orden que da
un criterio de acumulacin.
As, el resumen eficiente para este tipo de variables es una tabla de frecuencias simple que
brinde informacin tanto a partir de las frecuencias absolutas, relativas y porcentuales,
simples como acumuladas. Seleccionamos una tabla de frecuencias simple porque la
poblacin es grande (200) y su recorrido pequeo (no es necesario agrupar los valores en
clases)
Xi
0 = bachillerato,
1 = licenciatura sin
ttulo;
2 = licenciatura con
ttulo
3 = postgrado
30
120
fi
fr
0,15
0,6
15
30
f%
Fi
30
150
Fr
0,15
0,75
F%
15
75
40
0,2
120
190
0,95
95
10
200
0,05
1
40
100
200
1,00
100
12
fi
fr
f%
0 = viudo,
1 = casado
2 =soltero
30
120
40
0,15
0,6
0,2
15
30
120
3 = divorciado
10
200
0,05
1
40
100
Una tabla de distribucin de frecuencias es una forma de presentar los datos sobre una
caracterstica de la poblacin en estudio; por tanto debe contener la informacin necesaria
para que el lector pueda analizarla.
13
2.4 GRFICOS
Los grficos son considerados el mtodo de presentacin de la informacin ms simple
para el lector porque puede captar el panorama general o la tendencia de los datos de
una sola mirada. Es mucho ms fcil de comprender que una tabla o un texto. La
sencillez de lneas, una atractiva manera de presentacin, la posibilidad de usar las tres
dimensiones (3D), junto con colores, hacen de los grficos una de las herramientas
ms poderosas para transmitir ideas en forma rpida y simple al lector. Su desventaja
ms notoria es la prdida de precisin y exactitud, si se lo compara con una tabla.
Recomendaciones:
-
para las comparaciones conviene emplear una sola dimensin, antes que dos o tres;
en los grficos de porcentaje acumulativo adems del nivel cero se debe colocar el
100%;
la lnea ms gruesa de todas debe ser la del grfico o curva que se muestre, para
subordinar las dems a la principal
la escala de un grfico debe adaptarse para que entre toda la informacin en el mismo;
si un grfico no resulta claro para el autor, mucho menos lo ser para el lector.
Basado en Bioestadstica aplicada , Azzimonti Renzo, JC.
14
como las mostradas en la figura 2. Cuando los tamaos de las dos poblaciones son
diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podran
resultar engaosas, como veremos en el siguiente mdulo.
Poblacin A
Poblacin B
15
muestra un grfico tridimensional apilando las barras una encima de otra. Todo esto se
puede hacer pues slo se representan tres categoras; cuando stas son muchas ms, no
conviene apilar ni recargar tanto de informacin al eje de abcisas. Las grandes ventajas
del grfico de barras son: sencillez de construccin y facilidad de captacin por parte del
lector. Esto ltimo se debe a que visualmente se compara una sola dimensin: la altura,
pues como las bases son todas iguales no se les presta atencin.
16
Por ejemplo, si se deben presentar tres tipos diferentes cuyos porcentajes del total
sean respectivamente: 50%, 30% y 20%, entonces se divide el crculo en tres sectores
de superficie proporcional. El sector circular de la primera deber tener un ngulo que
sea el 50% de los 360 del ngulo total, o sea, abarcar la mitad del crculo con un
ngulo de 180. El segundo ocupar el 30% del total con un sector de ngulo de 108.
Y el tercero tendr un ngulo de 72. En el ejemplo anterior se presentan seis formas
de ilustrar la misma informacin. En la primera se ha trazado un grfico en 3D al modo
tradicional. El semicrculo ms grande corresponde a la categora estatal referidos a la
variable cobertura de salud en el ltimo ao. El restante sector, de un 30%,
corresponde a los que se atienden en la salud privada y el resto a los que carecen de
cobertura.
Todos estos elementos se captan ms rpido dando una ojeada al grfico que leyendo
todo el prrafo anterior, e ilustra sobre las ventajas de este mtodo con respecto al
textual. Se presentan tambin otros tres crculos usando el modo tridimensional, pero
con tcnicas diferentes, para ilustrar al alumno sobre algunas de las posibilidades
disponibles para poder elegir entre ellas.
Pictogramas
Expresan con dibujos alusivos al tema de estudio las frecuencias de las categoras de
la variable. Estos grficos se hacen representando a diferentes escalas un mismo
dibujo, como vemos en la figura 4.
17
Tomado de www.comenius.usach.cl
El escalamiento de los dibujos debe ser tal que el rea de cada uno de ellos sea
proporcional a la frecuencia de la modalidad que representa. Este tipo de grficos suele
usarse en los medios de comunicacin, para que sean comprendidos por el pblico no
especializado, sin que sea necesaria una explicacin compleja.
18
19
xi
fi
fr Fi
Fr
1/8
1/8
3/8
4/8
3/8
7/8
1/8
8/8
n=8
Ejemplo
Clasificadas 12 familias por su nmero de hijos se obtuvo:
Nmero de hijos
(xi)
Frecuencias (fi
20
F. Absolutas
F. Relativas
F. Absolutas
Acumuladas
F. Relativas
Acumuladas
xi
ni
fi
Fi
Fr
0,08
0,08
0,25
0,33
0,42
0,75
0,25
12
Total
12
21
Xc
fi
Fi
0 -- 2
2 -- 4
4 -- 6
6 -- 8
10
8 - 10
12
..
12
22
Ejemplos:
La siguiente distribucin se refiere a las horas trabajadas anualmente por 500
trabajadores zafrales:
Horas
trabajadores
300 -- 500
50
500 -- 700
150
700 -- 1.100
275
ms de 1.100
25
Total
500
23
Intervalos
ai
fi
fr
fr
Fr
300 -- 500
200
50
0,10
0,10
0,10
500 -- 700
200
150
0,30
0,30
0,40
700 -- 1.100
400
275
0,55
0,275
0,95
1.100 -- 1.300
200
25
0,05
0,05
1,00
N=500
24
Por otro lado, mirando la figura se ve que sumando frecuencias relativas, se puede
calcular la cantidad de trabajadores (o porcentaje) con, por ejemplo, no ms de las 900
horas de trabajo anual
0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los trabajadores zafrales.
Esta cantidad se obtiene de modo ms directo viendo a qu altura corresponde al valor
900 en el diagrama de frecuencias acumuladas (figura 9).
Como en total son 500 trabajadores zafrales, el nmero de stos con una duracin
igual o menor que 900 horas es 0,675 * 500 =337,5, redondeando, 338 trabajadores.
25
26
27
EJERCICIOS
1. Propone representaciones tabulares (lo ms completas posibles) y grficas (puede
ser de ms de un tipo) para los siguientes casos:
28
fi
5
15
25
20
20
40
15
10
15
20
5
5
5
200
29