Академический Документы
Профессиональный Документы
Культура Документы
DISTRITO DE MEDELLÍN
INSTITUTO LA SALLE
LA EXIGENCIA DA EXCELENCIA
Código Fecha
Material de Estudio No. 1
07 04 11
Caracterización de Variables Cuantitativas
Para caracterizar variables cuantitativas se consideran dos casos teniendo en cuenta
la forma en que están presentados los datos: datos agrupados y datos no agrupados.
Datos agrupados: Se caracterizan a partir de la construcción de un diagrama de
tallo y hojas, una tabla de frecuencias, los histogramas y polígonos
correspondientes.
Caracterización de datos agrupados
Tabla de frecuencias
Una tabla de frecuencias es un arreglo tabular de las frecuencias con que ocurre cada
característica en que se han dividido los datos. La construcción de una tabla de
frecuencias para datos cuantitativos presenta como su punto de mayor importancia la
determinación del número de intervalos (clases) que la conformaran. Este número
depende de la cantidad y de la naturaleza de los datos a resumir y del propósito que se
busca con el resumen. A continuación se presentan ciertas pautas para la construcción
de una tabla de frecuencias.
1. El número de intervalos debe escogerse de acuerdo con el número de datos.
Para ello se emplea la siguiente aproximación:
Donde n corresponde al número de datos que se van a agrupar.
2. Una vez escogido el número de intervalos, se determina la longitud o tamaño
que deben tener los intervalos, de tal manera que todos los intervalos tengan el
mismo tamaño. Para ello se utiliza el siguiente criterio:
3. Construcción de la tabla: Se construye el primer intervalo a partir del dato
menor, así:
Al elaborar la tabla de frecuencias se debe incluir:
f la cual es la frecuencia del intervalo y corresponde al número de datos que están
en ese rango.
fr es la frecuencia relativa o proporción y corresponde a la frecuencia comparada
con el total.
F es la frecuencia acumulada y corresponde a la sumatoria de las frecuencias de los
intervalos anteriores incluyendo su frecuencia.
Fr es la frecuencia acumulada relativa y corresponde a la frecuencia acumulada
comparada con el total.
Mi es la marca de clase y corresponde al punto medio de cada uno de los intervalos.
Se calcula mediante la siguiente expresión:
Ejemplo: Elaboraremos la tabla de frecuencias para los datos que se encuentran en
siguiente tabla.
Tabla 1
Desarrollo:
1. El número de intervalos a utilizar es 8. Puesto que:
2. Tamaño del intervalo:
3. Construcción de la tabla:
Intervalo f fr F Fr Mi
32.1 – 32.8 5 0,08 5 0,08 32.45
32.9 – 33.6 11 0,17 16 0,25 33.25
33.7 – 34.4 9 0,14 25 0,39 34.05
34.5 – 35.2 20 0,31 45 0,70 34.85
35.3 – 36.0 8 0,13 53 0,83 35.65
36.1 – 36.8 6 0,09 59 0,92 36.45
36.9 – 37.6 3 0,05 62 0,97 37.25
37.7 – 38.4 2 0,03 64 1,00 38.05
Total 64 1,00
Algunas conclusiones a partir de la tabla son:
El 8% de las camisas fue fabricado con un material que contenía entre el 32.1% y el
32.8% de algodón y un porcentaje igual fue fabricado con un material que contenía
entre el 36.9% y el 38.4% de algodón.
El 84% de las camisas fue fabricado con un material que contenía entre el 32.9% y el
36.8% de algodón.
Diagramas para datos cuantitativos agrupados
Diagrama de tallo y hojas
Un diagrama de tallo y hojas es una representación gráfica en la cual, los datos se
clasifican de acuerdo con la expresión decimal de cada uno de ellos. Este diagrama es
usado cuando hay una cantidad no muy pequeña de datos y dan una idea de la
localización de los datos y de la forma de la distribución.
Para construir un diagrama de este estilo se debe dividir cada dato en tallo y hoja. El
tallo corresponde a la primera, o primeras cifras del dato, y en la mayoría de los casos
la hoja corresponde a la última cifra del dato.
Ejemplo:
La siguiente tabla representa el porcentaje de algodón en un material utilizado para la
fabricación de camisas para caballeros.
Tabla 1. Datos del porcentaje de algodón
El diagrama de tallos y hojas para los anteriores datos aparece a continuación.
Diagrama de tallo y hojas para porcentaje de algodón. n = 64. Unidad de la hoja = 0.10
(el número 1 después del punto significa que se usa una sola cifra decimal).
Tallo Hojas
32 156789
33 114566666688
34 011122355666667777779
35 00111234456789
36 234888
37 13689
Del diagrama se puede concluir que:
En 6 camisas se usó un porcentaje de algodón entre el 32.0 y 33.0; 12 camisas fueron
elaboradas con un porcentaje de algodón entre el 33.0 y 33.9; 21 camisas fueron
elaboradas con un porcentaje de algodón entre el 33.9 y el 35.0; 14 camisas fueron
elaboradas con un porcentaje de algodón entre el 34.9 y el 36.0; 6 camisas fueron
elaboradas con un porcentaje de algodón entre el 36.0 y el 37.0 y 5 camisas fueron
elaboradas con un porcentaje de algodón entre el 37.0 y el 38.0. Luego la mayoría de
las camisas tienen un porcentaje de algodón entre el 33.9 y el 35.0.
Histogramas
Un histograma es una representación gráfica de una variable en forma de barras. Se
utilizan para variables continuas o para variables discretas, con un gran número de
datos, y que se han agrupado en clases.
En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del
intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada
barra es proporcional a la frecuencia de los valores representados.
Así el histograma correspondiente a los datos de la tabla 1 seria:
Polígono de Frecuencias
A partir del diagrama de clases (M i) es posible construir el diagrama de líneas o
polígono de frecuencias; en el eje horizontal se ubican las marcas de clase y en el eje
vertical las frecuencias.
Las marcas de clase coinciden con el punto medio de cada rectángulo de un histograma
y se unen mediante segmentos para formar el polígono de frecuencias.
El polígono de frecuencias acumuladas se llama ojiva. Para el caso de la tabla 1 la
ojiva se muestra a continuación.