Вы находитесь на странице: 1из 10

ESTADISTICA

GUIA N2

Tablas y Representaciones Grficas Estadsticas

INTRODUCCION

Normalmente, al efectuar un estudio estadstico de una V.A, los datos que nos encontramos son
muy numerosos y estn desordenados. En consecuencia, el primer paso que debemos efectuar
ante cualquier estudio estadstico es sintetizar el conjunto de datos mediante tablas o grficos
resumen, con el fin de poder identificar el comportamiento caracterstico de un fenmeno y facilitar
su anlisis exhaustivo.

Generalmente, la presentacin de un conjunto de datos se puede hacer indicando los valores que
toma la variable estudiada y la frecuencia de aparicin de estos valores frente al total de datos del
estudio. A partir de este resultado se pueden construir una serie de tablas y grficas sencillas que
se describen a continuacin: tablas de frecuencias unidimensionales, diagrama de barra, diagrama
de sectores e histograma.

Tablas de frecuencia unidimensional

La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los


datos estadsticos, asignando a cada dato el nmero de veces que aparece dicho valor, o lo que es
lo mismo, su frecuencia correspondiente. Las tablas de frecuencias ms sencillas son las que se
construyen a partir de los distintos valores de variables cualitativas, o en su caso, de variables
cuantitativas discretas con pocos posibles valores. La construccin de tablas de frecuencias
unidimensionales para variables de naturaleza cuantitativa continua con multitud de valores
diferentes, es muy similar. La nica diferencia es que previamente se deben agrupar los datos por
intervalos, ya que si no las tablas presentan muchas filas y resultan poco prcticas. El nmero de
intervalo aconsejable suele estar entre 5 y 15, considerndose generalmente, N.

Definiciones
Para la construccin de las tablas de frecuencia, es necesario estimar los siguientes estadsticos:
Frecuencia absoluta
Se representa por ni y es el nmero de veces que aparece un determinado valor de una variable
aleatoria.
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el
nmero total de datos, N. Se representa por fi = ni/N .
Suele expresarse en porcentaje.

Frecuencia absoluta Acumulada


Es la suma de las frecuencias absolutas, ordenados los valores de menor a mayor. La frecuencia
absoluta del mximo valor es igual al nmero total de datos, que se representa por N.

Frecuencia relativa Acumulada


Es la suma de las frecuencias relativas de todos los valores inferiores o iguales al valor
considerado. Se representa por Fi.
La suma de las frecuencias relativas totales debe ser igual a 1 (o 100%).

Pasos a seguir para la construccin de la tabla de frecuencias


1. Ordenar los valores de la V.A. de menor a mayor.
2. Colocar en la primera columna los posibles valores de la V.A., ordenados.
3. Se cuenta el nmero de veces que aparece cada valor o la frecuencia absoluta (ni).
4. Se calcula la Frecuencia relativa (f= ni/N).
5. Se calculan la frecuencias absolutas acumuladas: n1+.nn=N
6. Se calculan la frecuencia relativas acumuladas f1+.fn

La tabla o distribucin de frecuencias debe quedar como se indica en la siguiente tabla:

Tabla 1. Tabla de frecuencias

Valor de V.A Frec Absoluta Frec. Relativa Frec Absoluta Frec. Relativa
(ni) (fi) Acumulada Acumulada

. . . . .
. . . . .
. . . . .

Fuente: Elaboracin Propia


Por ejemplo: Las notas de un examen de matemticas de 30 alumnos de una clase son las
siguientes:
5, 3, 4, 1, 2, 8, 9, 8, 7, 6, 6, 7, 9, 8, 7, 7, 1, 0, 1, 5, 9, 9, 8, 0, 8, 8, 8, 9, 5, 7.
Calcular la tabla de frecuencias.
1. Ordenamos los datos contando los alumnos que han sacado un 0 han sido 2, un 1 han sido
3 y as sucesivamente. Construimos la tabla correspondiente:
2. N: nmero total de datos N = 30.
3. ni: frecuencia absoluta, nmero de veces que se repite una nota. El sumatorio nos da los
datos totales N = 30.
4. fi: frecuencia relativa. Cociente ni / N
5. Frecuencia absoluta acumulada. F 2 = f 1 + f2= 2 + 3 = 5 F 3 = F 2 + f 3 = 5 + 1 = 6.
6. Frecuencia Relativa Acumulada, F=1.

Frec Frec. FrecFrec.

Valores Absoluta Relativa Absoluta Relativa


(ni) (fi) Acumulada Acumulada

0 2 2 /30 2 2/30

1 3 3/30 5 5/30

2 1 1/30 6 6/30

3 1 1/30 7 7/30

4 1 1/30 8 8/30

5 3 3/30 11 11/30

6 2 2/30 13 13/30

7 5 5/30 18 18/30

8 7 7/30 25 25/30

9 5 5/30 30 30/30

30

Diagrama de Barras y diagrama de sectores

Son adecuados en el caso de variables cualitativas o cuantitativas discretas con pocas categoras.
En el caso del diagrama de barras, se asigna una barra en el eje X a cada clase o categora de la
variable cualitativa. En el eje Y se representan las frecuencias absolutas o relativas (ni o fi) y
simplemente se levanta una barra de altura proporcional a la frecuencia absoluta o relativa. Los
grficos de tarta o diagramas de sectores son muy similares: se dibuja un crculo dividido en tantas
secciones como categoras diferentes tenga la variable objeto del estudio. Cada seccin es
proporcional a su frecuencia. El inconveniente de estos grficos es que si la variable tiene un
exceso de categoras o clases no permiten visualizar con claridad.

7,00%
24,00%
Fila 1 16,00%

Fila 2

Fila 3 1
2
Fila 4 3
4
53,00%
0 0,1 0,2 0,3 0,4 0,5 0,6
frecuencia

Imagen 1. Grfico de Barras y Grfico de Sectores


Fuente: Elaboracin Propia

Por ejemplo: Las notas de un examen de matemticas de 30 alumnos de una clase son las siguientes:
5, 3, 4, 1, 2, 8, 9, 8, 7, 6, 6, 7, 9, 8, 7, 7, 1, 0, 1, 5, 9, 9, 8, 0, 8, 8, 8, 9, 5, 7.
Calcular el diagrama de barras y de sectores
A partir de la tabla de frecuencias estimada en el apartado 4.2., se obtienen los siguientes grficos:

Diagrama de Barras
1
2
3
5
6
7
8
9
10

0 0,04 0,08 0,12 0,16 0,2 0,24


frecuencia

Imagen 2. Grfico de Barras


Fuente: Elaboracin Propia

Diagrama de Sectores
7,00%
17,00%
10,00%

3,00%
3,00%
3,00%
23,00%
10,00%

7,00%
17,00%
Imagen 3. Grfico de Sectores
Fuente: Elaboracin Propia

Histograma

Los histogramas son el equivalente al diagrama de barras cuando lo que se quiere representar es
la frecuencia de una variable cuantitativa que toma un gran nmero de valores, tales como la edad.
Peso temperatura, etc. Para representar un grfico de este tipo es necesario dividir el rango de
valores de la variable en un nmero de intervalos (que deben estar como en la tabla de
frecuencias, entre 5 y 15), siendo recomendable que sean de la misma amplitud.

La construccin de un histograma comienza con la divisin del eje de abscisas (eje X) en los
intervalos estimados y, a continuacin, sobre cada uno de ellos se levanta un rectngulo de base
igual a la amplitud del intervalo y de altura proporcional a la frecuencia (relativa o absoluta).

Imagen 4. Histograma
Fuente: http://maralboran.org/wikipedia/index.php/Gr%C3%A1ficos_estad%C3%ADsticos

Los histogramas constituyen una poderosa herramienta para el anlisis descriptivo de los datos.
Entre otras cosas, permiten detectar, en funcin de su forma, el tipo de distribucin que sigue la
variable. En el caso de que la variable siga una distribucin normal, obtendremos un histograma
con una curva de frecuencias simtricas o en forma de campana, caracterizada porque las
observaciones equidistantes del mximo central tienen la misma frecuencia:

Imagen 5. Histograma de una distribucin normal


Fuente: http://paginespersonals.upcnet.es/~jsr/proyecto/histogra.htm

As mismo, permiten detectar problemas como:


1. Frecuencia anmala de un valor
2. Medidas inconsistentes

Imagen 6. Histograma de medidas inconsistentes debido a anomalas o errores


Fuente: http://paginespersonals.upcnet.es/~jsr/proyecto/histogra.htm
3. Mezclas de poblaciones distintas

Imagen 7. Histograma de mezcla de dos poblaciones


Fuente: http://paginespersonals.upcnet.es/~jsr/proyecto/histogra.htm

4. Datos artificialmente modificados

Imagen 8 Histograma datos censurados o sesgados


Fuente: http://paginespersonals.upcnet.es/~jsr/proyecto/histogra.htm

5. Datos anmalos
6. Asimetra (No normalidad de los datos)

Imagen 9. Histogramas de asimetra positiva y negativa


Fuente: http://paginespersonals.upcnet.es/~jsr/proyecto/histogra.htm

Por ejemplo: En una gran empresa de logstica, se mide el tiempo medio en minutos que cada
operario tarda en realizar la operacin de carga de los camiones. Los resultados se muestran en la
tabla adjunta, ordenados de menor a mayor. Representar el histograma correspondiente.

199,9 200,6 201,3


200,0 200,7 201,3
200,1 200,8 201,4
200,2 200,8 201,5
200,3 200,8 201,5
200,4 201,0 201,6
200,4 201,0 201,6
200,5 201,0 201,8
200,6 201,1 202,0
200,6 201,2 202,0
202,6

Agrupando los valores de la variable aleatoria en cinco intervalos, obtendramos el siguiente


histograma:

Histogram
15

12

0
199 200 201 202 203

Imagen 10. Histograma


Fuente: Problemas de Introduccin a la Estadstica. Editorial UPV.2006

Otros grficos

Otro grfico muy interesante es el diagrama de frecuencias acumuladas. La nica diferencia con el
histograma es que cada intervalo se levanta no por su frecuencia (relativa o absoluta), sino por la
frecuencia acumulada. Normalmente se utiliza la frecuencia relativa acumulada.

Permite responder a preguntas como qu % de los datos tiene una valor inferior a uno dado, qu
valor es superado por un 5% de los datos de la muestra, etc ., entrando por el valor deseado del
eje X, cortando con la curva y leyendo el valor correspondiente en el eje Y.

Imagen 11. Diagrama de frecuencias acumuladas


Fuente: Elaboracin Propia

Diagrama de tallos y hojas

Dado un conjunto de datos formado por observaciones, las cuales pueden ser representadas
mediante y donde cada tiene por lo
menos dos dgitos. Una forma rpida de obtener una representacin visual del conjunto
de datos es construir un diagrama de tallos y hojas. Este diagrama es usado cuando hay
un nmero no muy pequeo de datos. Los siguientes son los pasos para construir un
diagrama de tallos y hojas:
Seleccionar uno o ms dgitos iniciales para los valores de tallo. El dgito(s) final(es) se
convierte (n) en hojas. Para facilitar la determinacin de la forma de la distribucin de los
datos se necesitan al menos 5 tallos.
Hacer una lista de valores de tallo en una columna vertical.
Registrar las hojas por cada observacin junto al valor correspondiente del tallo.
Indicar las unidades para tallos y hojas en algn lugar del diagrama.
Muchos de los procedimientos estadsticos que se desarrollarn en la siguientes unidades
suponen que la variable aleatoria estudiada tiene al menos una distribucin
aproximadamente normal, para la cual el diagrama de tallos y hojas tiene forma de
campana.
Los diagramas de tallos y hojas nos dan una idea de la localizacin de los datos y de la forma de la
distribucin. Esta tcnica funciona bien para los conjuntos de datos que no tienen una dispersin
muy grande.

Ejemplo
La siguiente tabla representa el porcentaje de algodn en un material utilizado para la fabricacin
de camisas para caballeros.

Tabla 1. Datos del porcentaje de algodn

33. 35. 34. 33. 33. 33. 37. 33.


1 3 2 6 6 1 6 6

34. 34. 33. 32. 35. 34. 37. 34.


5 7 4 5 4 6 3 1

35. 35. 34. 34. 34. 35. 34. 34.


6 0 7 1 6 9 6 7

36. 35. 34. 35. 33. 34. 35. 35.


3 4 6 1 8 7 5 7

35. 36. 35. 36. 37. 33. 32. 36.


1 2 2 8 1 6 8 8

34. 36. 35. 37. 34. 32. 32. 34.


7 8 0 9 0 9 1 3

33. 35. 34. 36. 34. 33. 34. 32.


6 1 9 4 1 5 5 7

32. 33. 33. 34. 34. 34. 35. 37.


6 6 8 2 6 7 8 8

El diagrama de tallos y hojas para los anteriores datos aparece a continuacin.

Tallo Hojas

6 32 156789

18 33 114566666688

(21) 34 011122355666667777779
Tallo Hojas

25 35 00111234456789

11 36 234888

5 37 13689

Algunas veces, la utilizacin del primero o de los dos primeros dgitos de los datos puntuales como
tallos no proporcionan suficientes tallos como para permitirnos detectar la forma de su distribucin.
Una manera de solucionar esto es utilizar tallos dobles. Es decir, utilizar cada tallos dos veces: una
vez para trazar las hojas inferiores 0, 1, 2, 3, 4, y a continuacin nuevamente para trazar las hojas
superiores 5, 6, 7, 8, 9.

Вам также может понравиться