Академический Документы
Профессиональный Документы
Культура Документы
Introducción
Una vez recolectado los datos, es necesario clasificarlos y ordenarlos con el fin de facilitar el
análisis estadístico. Existen diferentes modos de presentar y evaluar las características de
los datos, ya sea por tablas, gráficos e indicadores.
En esta parte del curso presentaremos como resumir los datos a través de tablas, la
construcción de ellas según la naturaleza de estos, y así poder identificar características
importantes de ellos,
Una vez recolectados los datos, es necesario clasificarlos y ordenarlos con el fin de facilitar el
análisis estadístico. Para tal efecto, primero se deben definir “categorías” o “clases”,
identificando cada dato en alguna de estas categorías. Este procedimiento da origen a una
agrupación de los datos llamada “distribución de frecuencias”.
Clase o categoría: es una partición o subdivisión de todos los valores posibles que tome la
variable.
Por ejemplo,
De la variable, nivel educacional, las clases serían los niveles de educación: básica completa,
media completa, universitaria, etc.
Si el número de datos es grande. el arreglo puede ser difícil de manejar y poco útil en cuanto
a la información que pueda entregar, por eso se utilizan tablas de frecuencias como una
primera organización de los datos. Para los datos cualitativos o discretos se habla de tablas
de frecuencia no agrupadas y para datos cuantitativos en escala continua se habla de tablas
de frecuencia agrupadas.
Tablas de Frecuencias
Una tabla de frecuencias resume la información acerca de la cantidad de veces que una
variable toma un valor determinado. Además, permite organizar e interpretar de manera más
rápida y eficiente los datos.
En las tablas de frecuencias cada categoría tiene una frecuencia observada. Las respuestas
observadas en la muestra se denominan clases, las cuales se simbolizan por: c1, c2 ,..., ck donde
𝑘 es la cantidad de categorías distintas.
AREA ESTADISTICA 1
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA
f
i 1
i n
h 1
fi
hi i
n
i 1
h % 100%
i 1
i
Estas frecuencias son independientes de la escala de medición, y es lo mínimo que una tabla
de frecuencia puede tener.
ck fk hk hk %
Total n 1 100%
AREA ESTADISTICA 2
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA
Del Ejemplo
La variable cualitativa, “nivel de educación”, se considerará una muestra de 40 personas
mayores de 18 años que habitan la comuna.
Desarrollo
Se identifican las clases de la variable, en este caso las clases son: BASICA INCOMPLETA, BASICA
COMPLETA, MEDIA INCOMPLETA, MEDIA COMPLETA, TECNICA UNIVERSITARIO, UNIVERSITARIA
INCOMPLETA y UNIVERSITARIA COMPLETA.
Luego
Tabla de frecuencia para la variable “Nivel Educacional”
Nivel Educacional Frecuencia Frecuencia Frec. Relativa
absoluta f i relativa hi porcentual hi %
BASICA INCOMPLETA 4 0,1 10%
BASICA COMPLETA 4 0,1 10%
MEDIA INCOMPLETA 10 0,25 25%
MEDIA COMPLETA 10 0,25 25%
TECNICA UNIVERSITARIO 8 0,2 20%
UNIVERSITARIA INCOMPLETA 1 0,025 2,5%
UNIVERSITARIA COMPLETA 3 0,075 7,5%
Total 40 1 100%
AREA ESTADISTICA 3
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA
Se pueden agregar otras frecuencias a la tabla, sobretodo cuando se trabaja con variables
aleatorias discretas.
f1 f 2 ... fi ... f k n
Del Ejemplo
Luego la tabla del ejemplo anterior quedaría:
AREA ESTADISTICA 4
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA
Desarrollo
Se define las clases para la variable, en este caso son: 0, 1, 2, 3, 4
Ejercicios propuestos
Los siguientes datos representan a la variable “estado civil” de 40 trabajadores de una clínica
de Concepción
Casado Divorciado Casado Casado Separado
Divorciado Casado Soltero Separado Viudo
Casado Soltero Separado Soltero Soltero
Casado Casado Soltero Casado Separado
Soltero Casado Casado Viudo Soltero
Soltero Soltero Separado Casado Casado
Casado Casado Casado Separado Casado
Divorciado Soltero Separado Divorciado Casado
a) Clasifique la variable
b) Construya una tabla de distribución de frecuencia
c) Interprete la siguiente información: f 3 , h4 % .
AREA ESTADISTICA 5
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA
Construcción de la tabla
En variables continuas, la organización de datos es un poco mas compleja, se dividen los datos
en k grupos, llamados “intervalos”, estos intervalos representan las clases y se determina la
frecuencia de datos asociado a cada intervalo, conformando una tabla de frecuencia
agrupada.
Rango: diferencia entre el máximo y el mínimo valor de una variable. Se calcula como:
rango max xi min xi
Para la determinación de los limites del intervalo, se comienza con el límite inferior del
primer intervalo, generalmente es LI1 minxi . Posteriormente se suma a LI1 la amplitud, 𝑎,
y se obtiene el límite superior del primer intervalo LS1 LI1 a , el que también será el límite
inferior de la segunda clase, LS1 LI2 , el límite superior del segundo intervalo será
LS2 LI2 a. . Los siguientes limites se obtienen sumando la amplitud hasta completar los 𝑘
intervalos a utilizar.
Observación: Los limites superiores se consideran abierto para su primera clase y cerrado
para la segunda.
Se considera otro elemento en la tabla de frecuencia para variables continuas, marca de clase,
que nos ayudara para graficar y determinar estadísticos.
AREA ESTADISTICA 6
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA
Marca de clase: corresponde al punto medio del i-ésimo intervalos, un representante del
intervalo. Se calcula como:
Ls Li
mi
2
Desarrollo
Determinar el número de intervalos, con 𝑛 = 40, → 𝑘 = 3,3 ∙ 𝑙𝑜𝑔(40) + 1 = 6,28 = 7
El rango de los datos es, rango 615.777 71.497 544.280
AREA ESTADISTICA 7
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA
Ejemplo 3
Supongamos que se está interesado en estudiar el comportamiento de la variable “Número
de años efectivos cursados en instituciones de educación”, se encuesta a 40 personas y se tiene.
3 3 4 4 4 6 6 6 6 7 7 7 8 8
8 8 8 8 8 8 8 9 9 9 10 10 10 10
10 10 11 11 11 11 11 12 12 12 14 14
Desarrollo
Determinar el número de intervalos, con 𝑛 = 40, → 𝑘 = 3,3 ∙ 𝑙𝑜𝑔(40) + 1 = 6,29 = 6
El rango de los datos es, rango 14 3 11
Y la amplitud: a 11 1,833 2
6
AREA ESTADISTICA 8
VICERRECTORÍA ACADÉMICA
INSTITUTO DE MATEMÁTICA, FÍSICA Y ESTADÍSTICA
ÁREA ESTADÍSTICA
De la tabla, podemos observar que, por ejemplo, m5 12, f5 8, h5 0,2, h5% 20%, F5 38,
H5 0,95. Esto significa que de las 40 personas de la muestra, el valor 12 representa a la quinta
clase, donde 8 de las 40 personas tienen más de 11 años de estudios y menos de 13, lo que
representa a un 20% del total de los datos y que además hay 38 personas que tienen menos
de 13 años de estudio, lo que representa a un 95% del total de la muestra.
Ejercicios Propuestos
1. Los siguientes datos representan el tiempo de duración, en años, de 30 catre clínicos.
2.0 3.0 0.3 3.3 1.3 0.4 4.5 0.3 1.5 0.5
4.5 0.3 1.5 0.5 2.5 5.0 2.5 5.0 1.0 6.0
1.0 6.0 5.6 6.0 1.2 0.2 5.6 6.0 1.2 0.2
2. Los siguientes datos representan los tipos de grupo sanguíneo de 50 pacientes que
fueron atendidos de urgencia en el mes.
A 0 AB AB B A AB AB A A
AB AB A AB A B 0 AB A AB
B AB A AB A A B AB A AB
B A AB AB A A B AB AB AB
A AB A A AB B B AB AB AB
AREA ESTADISTICA 9