Академический Документы
Профессиональный Документы
Культура Документы
Análisis de datos: La
ordenación de datos
Realizado por : Jorge Rentería 2018-10
Ordenamiento de datos
Recolección de datos
Los datos pueden provenir de observaciones reales o de
registros que se mantienen para otros propósitos.
La distribución de frecuencias o tabla de frecuencias es
una ordenación en forma de tabla de los datos
estadísticos, asignando a cada dato su frecuencia
correspondiente.
Tipos de frecuencias
Frecuencia absoluta
Σfab= N
Veamos un ejemplo
En una Tabla de Distribución de Frecuencias, de 5 clases,
se tienen los siguientes valores de frecuencias absolutas:
CLASES Fab
Clase 1--------------10
Clase 2--------------20
Clase 3--------------25
Clase 4--------------08
Clase 5--------------02
el calculo de N (suma de frecuencias absolutas) es:
N=10+20+25+08+02
N=65
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia
absoluta de un determinado valor y el número total de
datos.
Ejemplo
Ejemplo
Ejemplo
o más bien
Unidad de Variación
Un concepto muy importante en este punto es el de la Unidad
de Variación. El cual se debe entender como la mínima diferencia
que puede presentarse entre dos datos del conjunto que se analiza.
1.-Recopilación de los Datos a analizar
2.-Ordenamiento de los datos de menor a mayor
o de mayor a menor.
3.-Se establece el número de clases
4.-Se calcula el ancho de clase exacto de cada
intervalo.
5.-Se ajusta el valor del ancho de clase.
6.-Identificación de los limites de clase o de los
intervalos de clase nominales.
7.-Se realiza el conteo de los datos.
Desarrolle la tabla de Distribución de Frecuencia para la
siguiente lista de datos.
Paso 1
Recopilación de los datos
782, 1333, 515, 1475, 696, 832, 1052, 700, 958, 542, 1296,
704, 814, 1482, 1023, 739, 643, 956, 1023, 784.
Paso 2
Se ordenan los datos de menor a mayor
515 700 784 987 1296
542 704 814 1023 1333
643 739 832 1023 1475
696 782 956 1052 1482
Paso 3
Se determina el número de clases
Para esto se emplea la fórmula:
Número de clases= 5.
Antes de entrar al paso 4, veamos
Cabe mencionar que en este caso particular se aplica
el método de la raíz cuadrada para determinar el número de
clases, pues el número de datos que se desea analizar es
pequeño. Sin embargo, para los casos en que la base de
datos es grande, se sugiere aplicar
el método de Sturges, quien presenta la siguiente formula
para para calcular el número de clases:
Número de Clases= 1 +3.32*log(N)
= 903
Limite Nominal Inferior de la Cuarta Clase
= 903+194
= 1097
Limite Nominal Inferior de la Quinta Clase
= 1097+194
= 1291
Aunque sabemos que solo son 5 clases las que
compondrá la Tabla de Distribución de Frecuencias,
calcularemos un Limite Nominal Inferior hipotético para
apoyarnos en el y poder calcular el ultimo Limite
Nominal Superior.
2 709
3 903
4 1097
5 1291
H 1485
En donde
n= número de clase
Según esto, la formula, traducida a lenguaje común, se expresaría:
De forma que
Recuerde que la unidad de variación (UV) es igual a 1,
según lo expuesto anteriormente.
Los limites Nominales, ya completos se verían en la TDF
así.
y ya habiendo calculado el último Limite Nominal
Superior(el de la quinta clase), se puede eliminar la
clase hipotética que se introdujo solo como apoyo para
poder calcular mencionado limite La TDF quedaría
PASO 7
En este paso iniciamos el conteo de los datos. Para ello
procedemos de la manera que se explica; a partir de la
base de datos que se ordeno de menor a mayor, se van
contando los números que están comprendidos en cada
intervalo de clase, de preferencia, estos se van tachando
en la misma base de datos.