Академический Документы
Профессиональный Документы
Культура Документы
Los datos se clasifican de acuerdo con el tipo de la característica a que pertenecen y con este
propósito se han definido las series estadísticas que se clasifican en:
a) Series cualitativas
b) Series cuantitativas
Se obtienen de un número finito de posibles valores, generalmente enteros, que pueden contarse,
esto es: 0,1, 2, 3,4, ... Por ejemplo: número de hijos, número de trabajadores, número de mujeres,
número de libros, número de asegurados, número de préstamo, número de pacientes atendidos,
número de medicamentos, número de días de incapacidad, días de estancia.
Son las mediciones que se obtienen de un número infinito de posibles valores dentro de un
intervalo. Por ejemplo: peso, edad, estatura, salario, área de terreno, tiempo de recuperación,
nivel de colesterol en la sangre.
c) Series cronológicas
Los datos están referidos a un período de tiempo, que puede ser: años, meses, días, semanas,
horas, minutos, segundos, etc.
d) Series geográficas
Los datos se clasifican de acuerdo con su distribución espacial, como por ejemplo: países,
provincias, cantones, distritos, regiones.
2. DISTRIBUCIÓN DE FRECUENCIAS
Antes de generar las distribuciones de frecuencias del conjunto de datos, que generalmente se
encuentran almacenados en una base de datos, es necesario revisar y tabular los datos.
Finalizado el trabajo de campo, se realiza el procesamiento de los datos, que consiste en convertir
la información en datos que sean susceptibles de ser analizados estadísticamente. Este trabajo
comprende las siguientes tareas que se le harán al cuestionario:
a) Revisión y crítica
El entrevistador al concluir su labor diaria debe revisar los cuestionarios, lo mismo hace el
supervisor del grupo, más tarde cuando los cuestionarios se llevan a la oficina se realiza una
nueva revisión de inconsistencias, omisión de respuestas, anotaciones ilegibles, etc.
b) Codificación
Se listan las respuestas a las preguntas abiertas, se clasifican en varias categorías, según
corresponda, y luego se les asigna códigos numéricos.
c) Digitación
En una base de datos que se tiene preparada para este propósito se digitan los datos de los
cuestionarios.
d) Tabulación
Gráfico N°1
ESTUDIANTES DE UN CURSO DE ESTADÍSTICA
SEXO Total Proporción DE LA UNIVERSIDAD DE COSTA RICA
Sexo II semestre 2007
Hombres 17 0,45
Mujeres 21 0,55
Total 38 1,00 Mujeres
Hombres
0 5 10 15 20 25
Número de estudiantes
Fuente: Escuela de Estadística de la Universidad de Costa Rica, 2007.
Distribución de frecuencias según carrera: con valores absolutos y con relativos respecto al total
de columna de doble entrada proporciones con respecto al total por columnas
Gráfico N°2
ESTUDIANTES DE UN CURSO DE ESTADÍSTICA DE LA UNIVERSIDAD DE COSTA RICA,
SEGÚN CARRERA
II semestre 2007
Número de estudiantes
Carrera 0 2 4 6 8
Microbiología
Farmacia
Medicina
Mujeres
Zootecnia
Hombres
Nutrición
Biología
Odontología
Gráfico N°3
ESTUDIANTES DE UN CURSO DE ESTADÍSTICA DE LA UNIVERSIDAD DE COSTA RICA,
SEGÚN CARRERA
II semestre 2007
Número de estudiantes
Carrera 0 2 4 6 8 10 12
Microbiología
Farmacia
Medicina
Mujeres
Zootecnia
Hombres
Nutrición
Biología
Odontología
Distribución de frecuencias por según carrera: con valores absolutos y con relativos respecto al
total de filas de doble entrada proporciones con respecto al total por
Simbología:
A continuación se describen los pasos para elaborar una distribución de frecuencias para una
variable cuantitativa discreta, con el número de créditos de 45 estudiantes de un curso de
estadística:
13 15 18 13 19 23 20 20 24 21 18 19 19 17 17
14 16 18 19 22 20 20 23 19 19 18 14 16 18 17
22 23 22 21 20 19 20 22 18 20 21 22 19 17 16
Pasos para construir una distribución de frecuencias:
13 13 14 14 15 16 16 16 17 17 17 17 18 18 18
18 18 18 19 19 19 19 19 19 19 19 20 20 20 20
20 20 20 21 21 21 22 22 22 22 22 23 23 23 24
Créditos Frecuencia
13 2
14 2
15 1
16 3
17 4
18 6
19 8
20 7
21 3
22 5
23 3
24 1
Total 45
Corresponde a los grupos o intervalos en los cuales se ubican, una única vez, las observaciones o
datos.
Clases exhaustivas
Todas las observaciones del conjunto de datos quedan incluidas en alguna de las clases definidas.
El número de clases se puede aproximar por medio de la fórmula de Sturges, que dice:
Este resultado debe ser adaptado de acuerdo con los intereses del investigador y el tipo de datos.
R: es el rango o recorrido de los datos. El valor del rango es la diferencia entre el mayor y el
menor valor del conjunto.
K: número de clases
La amplitud que se obtenga con esta fórmula podría ser un número un poco incómodo de
manejar, por tanto se recomienda que se utilice un número fácil de explicar y de comprender la
información que se desea comunicar. Se prefieren intervalos de tamaño 5 o 10 o múltiplos de
10.
Para determinar el tamaño de los intervalos del ejemplo se procede de la siguiente manera:
Se utilizará un tamaño de intervalo de tamaño 2, porque es más cómodo, que la fracción de 1,83.
También se podría trabajar con seis clases o con ocho clases.
Si uno de los dos términos está definido, ya sea el número de clases o el tamaño del intervalo,
con solo utilizar la fórmula anterior (2) queda determinado el término que falta.
4. Con el número de clases y el tamaño de los intervalos determinados (6 clases de tamaño 2), se
procede a elaborar las clases de la distribución de frecuencias con los límites dados, como la
variable es discreta estos serán los límites definitivos.
13 - 14
15 - 16
17 - 18
19 - 20
21 - 22
23 - 24
Para el ejemplo tenemos que, después de calcular los límites se asignan a cada intervalo las
observaciones que el corresponden, que llamamos frecuencia absoluta y que se indican a la par
del arreglo ordenado de la página 5. Luego se acumulan las frecuencias absolutas para obtener las
frecuencias acumuladas que aparecen en la tercera columna ( 2; 2+3; 5+10; 15+8; 23+6; 29+1).
Con la fórmula que aparece en la tabla de la página 4 se calculan las frecuencias relativas
simples y por último se multiplican por 100 las frecuencias relativas para tener los porcentajes.
Se ha incluido también, en esta distribución de frecuencias, las frecuencias acumuladas “más de”,
que acumulan las frecuencias absolutas en orden inverso, es decir del último límite al primero (4;
4+8; 12+15; 27+10; 37+4; 41+4). Así ser logra completar la tabla siguiente:
Frecuencia
Frecuencia Frecuencia
Número de Frecuencia relativa acumulada
absoluta acumulada Porcentaje
créditos (fr) o proporción menos de
(f) menos de (F)
(F↑)
13 - 14 4 4 0,089 8,9 45
15 - 16 4 8 0,089 8,9 41
17 - 18 10 18 0,222 22,2 37
19 - 20 15 33 0,333 33,3 27
21 - 22 8 41 0,178 17,8 12
23 - 24 4 45 0,089 8,9 4
Los siguientes datos corresponden a las estaturas (en cm, redondeados a la unidad más próxima)
de los 54 estudiantes de un curso de estadística impartido en el I semestre del año 2007:
153 153 156 156 157 157 158 158 158 160 160 160 160
161 161 161 161 162 162 162 162 164 164 164 164 165
167 167 167 167 168 168 168 168 169 169 172 172 173
173 173 174 175 175 175 177 177 177 179 179 183 183
185 187
Para construir una distribución de frecuencias se seguirá los mismos pasos indicados para la
distribución de frecuencias de una variable discreta.
Pasos para construir una distribución de frecuencias:
Estatura Frecuencia
153 2
156 2
157 2
158 3
160 4
161 4
162 4
164 4
165 1
167 4
168 4
169 2
172 2
173 3
174 1
175 3
177 3
179 2
183 2
185 1
187 1
Total 54
Para determinar el tamaño de los intervalos del ejemplo se procede de la siguiente manera:
R = 187 – 153 = 34
Amplitud = 34 / 7 = 4,85≈5
4. Límites dados
Con el número de clases y el tamaño de los intervalos se procede a elaborar las clases de la
distribución de frecuencias con los límites dados, es decir como si la variable fuera discreta, hasta
que se llenan todos los componentes de la tabla. Se construyen los límites para 7 clases de
tamaño 5
5. Límites reales
Si la variable es continua, sucede que para este nivel de medición hay muchos valores
intermedios entre el límite superior de una clase y el límite inferior de la siguiente, y se deben
construir los límites reales de acuerdo con el tipo de redondeo de los datos cuando se recogieron.
Los datos pueden haberse redondeado, de acuerdo con los siguientes criterios:
Así sucesivamente.
En el ejemplo, la estatura que es una variable continua, por tanto, es necesario calcular los límites
reales y como los datos se redondearon a la unidad más próxima, se resta 0,5 al límite inferior y
se suma 0,5 al límite superior, de la siguiente forma:
152,5 - 157,5
157,5 - 162,5
162,5 - 167,5
167,5 - 172,5
172,5 - 177,5
177,5 - 182,5
182,5 - 187,5
Frecuencia Frecuencia
Límites reales Frecuencia relativa (fr)
absoluta acumulada menos Porcentaje
de clase o proporción
(f) de (F)
152,5 - 157,5 6 6 0,111 11,1
Ejemplo:
A continuación se describen los pasos para elaborar una distribución de frecuencias, con los datos
del peso de 30 niños atendidos en la consulta externa de una clínica, en marzo del 2008. (Los
pesos se redondearon al décimo más próximo)
24,1 25,0 24,8 24,3 25,3 24,2 23,6 24,5 24,4 24,2 24,5 23,0 24,0 23,8 23,8
25,3 24,5 24,0 25,2 24,6 25,2 24,4 24,7 24,1 24,6 24,9 24,1 25,8 25,2 23,3
Pesos Frecuencia
23 1
23,3 1
23,6 1
23,8 2
24 2
24,1 3
24,2 2
24,3 1
24,4 2
24,5 3
24,6 2
24,7 1
24,8 1
24,9 1
25,0 1
25,2 3
25,3 2
25,8 1
Total 30
Para determinar el tamaño de los intervalos del ejemplo se procede de la siguiente manera.
R = 25,8 - 23 = 2,8
4. Con el número de clases y el tamaño de los intervalos se procede a elaborar las clases de la
distribución de frecuencias con los límites dados, es decir como si la variable fuera discreta.
23,0 - 23,4
23,5 - 23,9
24,0 - 24,4
24,5 - 24,9
25,0 - 25,4
25,5 - 25,9
5. Como la variable es continua hay muchos valores intermedios entre el límite superior de una
clase y el límite inferior de la siguiente, y se deben construir los límites reales de acuerdo con el
redondeo de los datos cuando se recogieron, como se explicó en el ejemplo anterior.
Como en nuestro ejemplo la variable, el peso de los niños, es continua se calculan los límites
reales:
22,95 - 23,45
23,45 - 23,95
23,95 - 24,45
24,45 - 24,95
24,95 - 25,45
25,45 - 25,95
Para el ejemplo tenemos que, después de calcular los límites reales se asignan a cada intervalo de
peso el número de niños y se completa la siguiente tabla:
Frecuencia Frecuencia
Frecuencia acumulada
Límites reales absoluta relativa (fr) o Porcentaje
menos de (F)
(f) proporción
22,95 - 23,45 2 2 0,067 6,7
Estas tabulaciones de los datos permiten elaborar los cuadros y los gráficos, para presentar y
analizar los datos. También con la base de datos revisada y sin errores se calculan las medidas de
interés y se aplican las técnicas indicadas en los objetivos de la investigación.