Вы находитесь на странице: 1из 10

ESTADISTICA DESCRIPTIVA

CLASE: TABLAS DE FRECUENCIAS


VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA

Introducción
Una vez recolectado los datos, es necesario clasificarlos y ordenarlos con el fin de facilitar el
análisis estadístico. Existen diferentes modos de presentar y evaluar las características de
los datos, ya sea por tablas, gráficos e indicadores.

En esta parte del curso presentaremos como resumir los datos a través de tablas, la
construcción de ellas según la naturaleza de estos, y así poder identificar características
importantes de ellos,

Organización de los datos


La organización de los datos trata de acomodar estos, para que puedan revelar sus
características informativas fundamentales y así simplificar los análisis para obtener
conclusiones. Estos los podemos organizar a través de tablas o gráficos. Se hablará de “datos
no agrupados”, a los que son no organizados y los ya organizados son llamados “datos
agrupados”.

Una vez recolectados los datos, es necesario clasificarlos y ordenarlos con el fin de facilitar el
análisis estadístico. Para tal efecto, primero se deben definir “categorías” o “clases”,
identificando cada dato en alguna de estas categorías. Este procedimiento da origen a una
agrupación de los datos llamada “distribución de frecuencias”.

Clase o categoría: es una partición o subdivisión de todos los valores posibles que tome la
variable.

Distribución de frecuencias: es una agrupación de datos en categorías o clases.

Por ejemplo,
De la variable, nivel educacional, las clases serían los niveles de educación: básica completa,
media completa, universitaria, etc.

Si el número de datos es grande. el arreglo puede ser difícil de manejar y poco útil en cuanto
a la información que pueda entregar, por eso se utilizan tablas de frecuencias como una
primera organización de los datos. Para los datos cualitativos o discretos se habla de tablas
de frecuencia no agrupadas y para datos cuantitativos en escala continua se habla de tablas
de frecuencia agrupadas.

Tablas de Frecuencias
Una tabla de frecuencias resume la información acerca de la cantidad de veces que una
variable toma un valor determinado. Además, permite organizar e interpretar de manera más
rápida y eficiente los datos.

En las tablas de frecuencias cada categoría tiene una frecuencia observada. Las respuestas
observadas en la muestra se denominan clases, las cuales se simbolizan por: c1, c2 ,..., ck donde
𝑘 es la cantidad de categorías distintas.

AREA ESTADISTICA 1
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA

Elementos de una tabla de frecuencia


En la construcción de tablas se utilizan las clases junto con las siguientes frecuencias:
frecuencia absoluta, frecuencia relativa y frecuencia relativa porcentual.

Frecuencia Absoluta: corresponde al número de elementos en la muestra que pertenecen a


la clase ci , denotada por f i y se cumple:
k

f
i 1
i n

Frecuencia Relativa: corresponde a la cantidad de elementos en la muestra que pertenecen


a la clase ci , relativo al total de elementos en la muestra, denotada por hi y se cumple
k

h  1
fi
hi   i
n
i 1

Frecuencia Relativa Porcentual: es el producto entre la frecuencia relativa de la clase ci y


el número 100, se cumple
k

 h % 100%
i 1
i

Estas frecuencias son independientes de la escala de medición, y es lo mínimo que una tabla
de frecuencia puede tener.

Observación: en la mayoría de estudios se obtienen recuentos de frecuencias, los cuales


proporcionan una valiosa idea del comportamiento de la variable del estudio, pero los
recuentos por si solo pueden causar confusión, por lo que es necesario considerar un
recuento relativo al total (frecuencia relativa). Por ejemplo, hablar de 10 casos de 20, es un
panorama totalmente distinto de 10 casos de 1000.

Tabla de Frecuencia Variable Cualitativa


Para una variable cualitativa, primero se definen las clases o categorías, luego se identifican
los datos correspondientes a cada clase (las frecuencias asociadas a las clases).

La tabla de frecuencias para datos cualitativos sería.

Tabla de frecuencia para datos cualitativos


Clase Frecuencia Frecuencia Frec. Relativa
ci  absoluta  f i  Relativa hi  Porcentual hi %
c1 f1 h1 h1 %
c2 f2 h2 h2 %

ck fk hk hk %
Total n 1 100%

AREA ESTADISTICA 2
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA

Del Ejemplo
La variable cualitativa, “nivel de educación”, se considerará una muestra de 40 personas
mayores de 18 años que habitan la comuna.

MEDIA COMPLETA BASICA INCOMPLETA BASICA INCOMPLETA


MEDIA COMPLETA MEDIA COMPLETA MEDIA COMPLETA
TECNICA UNIVERSITARIO MEDIA COMPLETA MEDIA COMPLETA
MEDIA INCOMPLETA TECNICA UNIVERSITARIO MEDIA COMPLETA
MEDIA INCOMPLETA MEDIA INCOMPLETA MEDIA COMPLETA
MEDIA COMPLETA TECNICA UNIVERSITARIO BASICA COMPLETA
MEDIA COMPLETA UNIVERSITARIA COMPLETA BASICA COMPLETA
UNIVERSITARIA COMPLETA BASICA INCOMPLETA MEDIA INCOMPLETA
MEDIA INCOMPLETA TECNICA UNIVERSITARIO MEDIA INCOMPLETA
UNIVERSITARIA COMPLETA MEDIA INCOMPLETA BASICA COMPLETA
BASICA COMPLETA UNIVERSITARIA INCOMPLETA MEDIA INCOMPLETA
TECNICO UNIVERSITARIO MEDIA INCOMPLETA TECNICO UNIVERSITARIO
TECNICO UNIVERSITARIO BASICA INCOMPLETA MEDIA INCOMPLETA
TECNICO UNIVERSITARIO

Construir una tabla de frecuencias para la variable “nivel de educación”.

Desarrollo
Se identifican las clases de la variable, en este caso las clases son: BASICA INCOMPLETA, BASICA
COMPLETA, MEDIA INCOMPLETA, MEDIA COMPLETA, TECNICA UNIVERSITARIO, UNIVERSITARIA
INCOMPLETA y UNIVERSITARIA COMPLETA.

Luego
Tabla de frecuencia para la variable “Nivel Educacional”
Nivel Educacional Frecuencia Frecuencia Frec. Relativa
absoluta  f i  relativa hi  porcentual hi %
BASICA INCOMPLETA 4 0,1 10%
BASICA COMPLETA 4 0,1 10%
MEDIA INCOMPLETA 10 0,25 25%
MEDIA COMPLETA 10 0,25 25%
TECNICA UNIVERSITARIO 8 0,2 20%
UNIVERSITARIA INCOMPLETA 1 0,025 2,5%
UNIVERSITARIA COMPLETA 3 0,075 7,5%
Total 40 1 100%

De la tabla podemos observar y concluir, por ejemplo:


- Si consideramos f5  8 , tenemos que hay 8 de las 40 personas seleccionadas que
tienen nivel de educación Técnica Universitaria, lo que equivale a un 20% del total de
los datos, según lo que muestra h5 %  20% .

AREA ESTADISTICA 3
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA

Se pueden agregar otras frecuencias a la tabla, sobretodo cuando se trabaja con variables
aleatorias discretas.

Frecuencia Absoluta Acumulada: corresponde al número total de elementos en la muestra


que pertenecen a las clases c1, c2 ,..., ci . Se denota por Fi y cumple
i
Fi  f1  f 2  ....  fi  f
j 1
j , j  1,2,..., i, i  1,2,..., k

f1  f 2  ...  fi  ...  f k  n

Frecuencia Relativa Acumulada: corresponde a la cantidad de elementos en la muestra que


pertenecen a las clases c1, c2 ,..., ci , con respecto al total de elementos en la muestra, se denota
por H i y cumple
i
H i  h1  h2  ....  hi  h ,
j 1
j j  1,2,..., i, i  1,2,..., k

H k  h1  h2  ...  hi  ....  hk  1.0

Una Tabla de frecuencias completa para datos no agrupados, queda:

Tabla de frecuencia para datos no agrupados


Clase F. Absoluta F. Relativa F. Relativa F. absoluta F. Relativa
ci fi hi Porcentual h i % Acumulada F i Acumulada H i
c1 f1 h1 h1 % F1  f1 H1  h1
c2 f2 h2 h2 % F2  f1  f 2 H 2  h1  h2
     
ck fk hk hk % Fk  n Hk  1
Total 𝑛 1 100%

Del Ejemplo
Luego la tabla del ejemplo anterior quedaría:

Tabla de frecuencia para la variable “Nivel Educacional”


Frecuencia Frecuencia F. Relativa F. absoluta F. Relativa
Nivel Educacional absoluta Relativa porcentual Acumulada Acumulada
 fi  hi  hi % Fi Hi
BASICA INCOMPLETA 4 0,1 10% 4 0.1
BASICA COMPLETA 4 0,1 10% 8 0.2
MEDIA INCOMPLETA 10 0,25 25% 18 0.45
MEDIA COMPLETA 10 0,25 25% 28 0.70
TECNICA UNIVERSITARIO 8 0,2 20% 36 0.90
UNIVERSITARIA INCOMPLETA 1 0,025 2,5% 37 0.925
UNIVERSITARIA COMPLETA 3 0,075 7,5% 40 1
Total 40 1 100%

AREA ESTADISTICA 4
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA

Ejemplo 1: Variable aleatoria discreta


Del ejemplo, consideremos la información de 40 personas sobre el “número de cargas
familiares”. Construir una tabla de distribución de frecuencias.
3 1 1 3 2 3 3 2 3 4 1 0 2 3
1 1 4 1 1 4 3 2 4 3 2 2 4 2
1 0 2 2 2 1 3 2 2 4 2 4

Desarrollo
Se define las clases para la variable, en este caso son: 0, 1, 2, 3, 4

Luego la tabla de frecuencias completa quedaría,

Tabla de frecuencia para la variable “numero de cargas familiares”


clase F. Absoluta F. Relativa F. Relativa F. absoluta F. Relativa
ci fi hi Porcentual h i % Acumulada F i Acumulada H i
0 2 0,050 5% 2 0,050
1 9 0,225 22,5% 11 0,275
2 13 0,325 32,5% 24 0,600
3 9 0,225 22,5% 33 0,825
4 7 0,175 17,5% 40 1
Total 40 1 100%

De esta tabla podemos observar que:


Por ejemplo, si f3  13 , significa que 13 de las 40 personas seleccionadas tienen 2 cargas
familiares, lo que equivale a un 32,5% del total de los datos, según lo muestra h3 %  32,5% .
Además podemos observar que F3  24 , lo que significa que hay 24 personas que tienen a lo
más 2 cargas familiares, lo que equivale al 60% de la muestra, por H3 %  60% .

Ejercicios propuestos
Los siguientes datos representan a la variable “estado civil” de 40 trabajadores de una clínica
de Concepción
Casado Divorciado Casado Casado Separado
Divorciado Casado Soltero Separado Viudo
Casado Soltero Separado Soltero Soltero
Casado Casado Soltero Casado Separado
Soltero Casado Casado Viudo Soltero
Soltero Soltero Separado Casado Casado
Casado Casado Casado Separado Casado
Divorciado Soltero Separado Divorciado Casado

a) Clasifique la variable
b) Construya una tabla de distribución de frecuencia
c) Interprete la siguiente información: f 3 , h4 % .

AREA ESTADISTICA 5
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA

Tabla de distribución de frecuencias de una Variable Continua (datos agrupados)

Construcción de la tabla
En variables continuas, la organización de datos es un poco mas compleja, se dividen los datos
en k grupos, llamados “intervalos”, estos intervalos representan las clases y se determina la
frecuencia de datos asociado a cada intervalo, conformando una tabla de frecuencia
agrupada.

Lo primero que tenemos que tener claro es la cantidad de intervalos a considerar, y


determinar el tamaño de los intervalos, se utiliza la regla de Sturges.

Regla de Sturges, método para determinar el número de intervalos, 𝑘 , donde “𝑛” es la


cantidad de datos que se desea organizar, se tiene:
𝒌 = 𝟑, 𝟑 ∙ 𝒍𝒐𝒈(𝒏) + 𝟏

Luego, determinamos el tamaño de cada intervalo. Se define:

Rango: diferencia entre el máximo y el mínimo valor de una variable. Se calcula como:
rango  max xi  min xi 

Amplitud, “𝑎”: corresponde al cuociente entre el rango y el número de intervalos, 𝑘. Se


calcula como:
rango
a
k

Determinada la amplitud del intervalo, se calcula el limite inferior y superior de cada


intervalo.

Para la determinación de los limites del intervalo, se comienza con el límite inferior del
primer intervalo, generalmente es LI1  minxi . Posteriormente se suma a LI1 la amplitud, 𝑎,
y se obtiene el límite superior del primer intervalo LS1  LI1  a , el que también será el límite
inferior de la segunda clase, LS1  LI2 , el límite superior del segundo intervalo será
LS2  LI2  a. . Los siguientes limites se obtienen sumando la amplitud hasta completar los 𝑘
intervalos a utilizar.

Observación: Los limites superiores se consideran abierto para su primera clase y cerrado
para la segunda.

Se considera otro elemento en la tabla de frecuencia para variables continuas, marca de clase,
que nos ayudara para graficar y determinar estadísticos.

AREA ESTADISTICA 6
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA

Marca de clase: corresponde al punto medio del i-ésimo intervalos, un representante del
intervalo. Se calcula como:
Ls  Li
mi 
2

Luego la tabla de frecuencia para datos continuos, queda:

Tabla de frecuencia para datos agrupados


Clase o Marca Frecuencia Frecuencia F. Relativa F. absoluta F. Relativa
Intervalo de clase absoluta Relativa Porcentual Acumulada Acumulada
ci  mi   fi  hi  hi % Fi  H i 
LI1  LS1 m1 f1 h1 h1 % F1  f1 H1  h1
LI2  LS2  m2 f2 h2 h2 % F2  f1  f 2 H 2  h1  h2
      
LIi  LSi  mi fi hi hi % Fi Hi
      
LIk  LSk  mk fk hk hk % Fk  n Hk  1
n n 1 100%

Ejemplo 2: variable cuantitativa continua


Consideremos el “ingreso mensual” de 40 trabajadores de una empresa.
331.630 159.826 150.300 334.248 400.039 315.711
407.104 322.300 316.321 244.269 465.077 384.814
252.506 261.223 330.957 335.282 461.700 233.960
386.389 615.777 175.074 608.127 71.497 247.899
250.622 420.819 305.919 596.255 241.924 161.001
230.511 494.537 310.666 414.191 236.368 415.552
463.494 151.422 235.137 464.362

Desarrollo
Determinar el número de intervalos, con 𝑛 = 40, → 𝑘 = 3,3 ∙ 𝑙𝑜𝑔(40) + 1 = 6,28 = 7
El rango de los datos es, rango  615.777  71.497  544.280

Y la amplitud: a  544.280  77.754,28  77.755


7
Por lo tanto, los límites de los intervalos de clases serian
LI1  xmin  71.497
LS1  LI1  a  71.497  77.755  149.252
LI2  LS1  a  149.252  77.755  227.007
LI3  LS2  a  227.007  77.755  304.762 ….
Y así hasta obtener el ultimo límite del ultimo intervalo de clase: L7  umax  615.782

AREA ESTADISTICA 7
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA

Luego la tabla de frecuencia será


Tabla de frecuencia para la variable “ingreso mensual”
Frec. Frec. F. Relativa F. Absoluta F. Relativa
Intervalo Marca de
Absoluta, Relativa, Porcentual, Acumulada, Acumulada,
Ingresos, $ clase mi
fi hi hi % Fi Hi
71.497 149.252 110.371,5 1 0,025 2,5% 1 0,025
149.252  227.007 188.126,5 5 0,125 12,5% 6 0,15
227.007  304.762 265.881,5 10 0,25 25% 16 0,40
304.762  382.517 343.636,5 9 0,225 22,5% 25 0,625
382.517  460.272 421.391,5 7 0,175 17,5% 32 0,80
460.269  538.027 499.146,5 5 0,125 12,5% 37 0,925
538.027  615.782 576.901,5 3 0,075 7,5% 40 1
40 1 100%

De la tabla, podemos observar que:


Por ejemplo, m5  421.391,5, f5  7, h5  0,175, h5 %  17,5%, F5  32, H5  0,80.
Esto significa que, de las 40 personas de la muestra, el valor $421.391,5 representa a la quinta
clase, 7 de las 40 personas tienen un ingreso superior a $382.514 y menor a $460.269, lo que
representa a un 17,5% del total de los datos y que hay 32 personas cuyo ingreso es a los mas
de $460.269, lo que representa un 80% del total de la muestra.

Ejemplo 3
Supongamos que se está interesado en estudiar el comportamiento de la variable “Número
de años efectivos cursados en instituciones de educación”, se encuesta a 40 personas y se tiene.
3 3 4 4 4 6 6 6 6 7 7 7 8 8
8 8 8 8 8 8 8 9 9 9 10 10 10 10
10 10 11 11 11 11 11 12 12 12 14 14

Construir una tabla de frecuencia adecuada para los datos.

Desarrollo
Determinar el número de intervalos, con 𝑛 = 40, → 𝑘 = 3,3 ∙ 𝑙𝑜𝑔(40) + 1 = 6,29 = 6
El rango de los datos es, rango 14  3 11
Y la amplitud: a  11  1,833  2
6

Por lo tanto, los límites de los intervalos de clases serian


LI1  3 y LS1  3  2  5
LI2  LS1  5 y LS2  5  2  7
LI3  LS2  7 y LS3  7  2  9
LI 4  LS3  9 y LS4  9  2  11
LI5  LS4  11 y LS5  11  2  13

AREA ESTADISTICA 8
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA

LI6  LS5  13 y LS6  13  2  15


luego la tabla de frecuencia será

Tabla de frecuencia para “numero de años efectivos cursados”


Intervalo Marca F. F. F. Relativa F. Absoluta F. Relativa
Número de de clase Absoluta Relativa Porcentual Acumulada Acumulada
años cursados mi fi hi hi % Fi Hi
3  5 4 5 0,125 12,5% 5 0,125
5 7 6 4 0,1 10% 9 0,225
7  9 8 12 0,3 30% 21 0,525
9  11 10 9 0,225 22,5% 30 0,75
1113 12 8 0,2 20% 38 0,95
13  15 14 2 0,05 5% 40 1
40 1 100%

De la tabla, podemos observar que, por ejemplo, m5  12, f5  8, h5  0,2, h5%  20%, F5  38,
H5  0,95. Esto significa que de las 40 personas de la muestra, el valor 12 representa a la quinta
clase, donde 8 de las 40 personas tienen más de 11 años de estudios y menos de 13, lo que
representa a un 20% del total de los datos y que además hay 38 personas que tienen menos
de 13 años de estudio, lo que representa a un 95% del total de la muestra.

Ejercicios Propuestos
1. Los siguientes datos representan el tiempo de duración, en años, de 30 catre clínicos.

2.0 3.0 0.3 3.3 1.3 0.4 4.5 0.3 1.5 0.5
4.5 0.3 1.5 0.5 2.5 5.0 2.5 5.0 1.0 6.0
1.0 6.0 5.6 6.0 1.2 0.2 5.6 6.0 1.2 0.2

a. Identifique la variable y clasifíquela.


b. Construya una tabla de distribución de frecuencia completa.
c. Interprete la siguiente información: f 3 , h4 % , F5 .

2. Los siguientes datos representan los tipos de grupo sanguíneo de 50 pacientes que
fueron atendidos de urgencia en el mes.

A 0 AB AB B A AB AB A A
AB AB A AB A B 0 AB A AB
B AB A AB A A B AB A AB
B A AB AB A A B AB AB AB
A AB A A AB B B AB AB AB

a. Identifique la variable y clasifíquela.


b. Construya una tabla de distribución de frecuencia completa.
c. Interprete la siguiente información: f 3 , h4 % .

AREA ESTADISTICA 9

Вам также может понравиться