Вы находитесь на странице: 1из 26

Estadstica Descriptiva

Diplomatura de Estadstica
Facultad de Matematicas y Estadstica
Universidad de Sevilla
Tema 2
Res umenes numericos y gracos
Version 2005-2006-
Jose A. Mayor Gallego
Departamento de Estadstica e Investigacion Operativa
Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 1
1. Introducci on
Usualmente, la investigacion de un colectivo, ya se trate de una poblacion completa
o de una muestra o parte extrada de la misma, proporciona como resultado inmediato
un conjunto mas o menos extenso, de datos numericos o de otro tipo, que pretendemos
estudiar con la nalidad de abarcar la naturaleza de dicho colectivo, en relacion a las
caractersticas que nos interesan.
De esta forma, nos enfrentamos a una masa de informacion, usualmente exten-
sa, grande, lo que obliga a realizar sobre la misma diversas transformaciones, de
tipo reductivo, que permitan captar estructuras y patrones latentes, que de otra
forma permanecen ocultos a nuestra percepcion. Dichas transformaciones producen
como resultados nal una serie de objetos, de interpretacion mas inmediata, y que
clasicaremos de la siguiente forma,
Res umenes numericos.
Res umenes gracos.
2. Res umenes numericos
El primer paso en el estudio estadstico descriptivo de un conjunto de datos sera la
construcci on de tablas u otros tipos de esquemas que permitan resumir y ordenar
la estructura de dichos datos, facilitando as la posterior extraccion de conclusiones.
2.1. Tablas de frecuencias
Se dispone de una variable estadstica, X, constituida por n valores, X
1
, X
2
, . . . , X
n
,
procedentes de la observacion de un determinado caracter sobre n individuos. Esta
variable puede ser tanto cualitativa como cuantitativa, y supondremos que presenta
k modalidades que denotamos x
1
, x
2
, . . . , x
k
. Notese que los valores originales de cada
elemento se denota por X
i
, y las modalidades por x
i
.
El n umero de individuos que presentan la modalidad x
i
de denomina frecuen-
cia absoluta de dicha modalidad, y se denota n
i
. Obviamente

i
n
i
= n. Dichas
frecuencias se disponen en forma de tabla, con la siguiente estructura,
Modalidades Frecuencias absolutas
x
1
n
1
x
2
n
2
.
.
.
.
.
.
x
k
n
k
Usualmente, si las modalidades estan medidas en alguna escala de tipo ordinal
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 2
o superior, dichas modalidades se disponen ordenadas. En caso contrario, es decir,
cuando la escala es nominal, se disponen arbitrariamente.
Tambien podemos asociar a cada modalidad su frecuencia relativa, f
i
= n
i
/n,
su porcentaje, p
i
= 100 f
i
, su frecuencia absoluta acumulada, N
i
= n
1
+n
2
+
+ n
i
, y su frecuencia relativa acumulada, F
i
= N
i
/n. Veamos un ejemplo con
una variable cuantitativa discreta.
EJEMPLO 1 Supongamos que se han estudiado 150 familias con hijos observando para
cada una el n umero de los mismos, habiendose obtenido los siguientes datos,
0 0 0 1 1 6 5 1 0 0 5
0 0 0 0 0 1 1 1 1 1 1
5 4 4 4 3 3 4 4 0 0 0
3 0 1 2 2 2 2 2 2 2 3
2 2 2 2 2 3 2 3 3 2 1
2 2 2 2 2 3 3 2 3 2 3
0 0 0 0 1 1 1 2 1 1 1
0 0 2 2 2 2 3 2 1 1 2
2 2 2 2 2 3 2 2 2 2 2
1 1 1 1 2 2 2 2 2 2 1
3 3 3 3 3 3 3 3 3 3 3
2 2 2 2 2 2 2 2 2 2 2
1 1 1 1 1 1 1 1 1 1 1
2 2 2 2 2 2 2
que, una vez clasicados, originan la siguiente tabla,
x
i
n
i
f
i
N
i
F
i
0 20 20/150 20 20/150
1 35 35/150 55 55/150
2 62 62/150 117 117/150
3 24 24/150 141 141/150
4 5 5/150 146 146/150
5 3 3/150 149 149/150
6 1 1/150 150 1
150 1

Cuando la variable es de tipo cuantitativo continuo y/o presenta una gran cantidad
valores distintos, dichos valores se agrupan en intervalos, usualmente de la forma (a, b],
que son entonces considerados como las modalidades. Notaremos (e
i1
, e
i
] al intervalo
que representa la modalidad i-esima. En este caso, se asocia a cada modalidad un valor
representativo de la misma, denominado marca de clase, que se denota x
i
, y que
usualmente es el punto medio del intervalo, es decir,
x
i
=
e
i1
+ e
i
2
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 3
Veamos a continuaci on un ejemplo de ello.
EJEMPLO 2 Vamos a considerar los siguientes valores, procedentes de una prueba de
evaluacion realizada sobre 175 estudiantes, y cuyo rango teorico de valores es el intervalo
[0, 100],
76 66 77 50 81 69 75 73 84 62 65
71 93 54 70 55 86 63 84 76 80 88
78 69 77 75 52 60 68 71 84 70 89
78 87 98 80 76 55 65 77 64 82 70
75 73 82 72 84 75 85 78 83 74 81
68 76 77 61 66 85 58 92 96 51 87
78 77 90 75 62 81 63 72 68 76 72
86 80 92 79 84 70 50 70 71 77 69
75 91 80 87 83 64 85 61 77 65 67
74 90 78 82 73 88 85 89 65 75 76
84 55 81 75 77 69 83 70 86 69 96
79 98 51 97 63 90 54 74 71 89 76
82 71 83 77 84 78 90 53 98 75 69
64 70 81 77 67 83 79 85 76 72 57
76 65 71 74 94 75 66 95 80 91 80
56 83 82 60 74 81 79 80 61 79
Como puede verse, estos datos presentan una gran cantidad de valores distintos. Por
ello, debido a su elevada diversidad, la tabla de frecuencias se realizara agrupando los
datos en intervalos, obteniendose por ejemplo,
(e
i1
, e
i
] x
i
n
i
N
i
f
i
F
i
(46

5, 55

5] 51 11 11 11/175 11/175
(55

5, 64

5] 60 16 27 16/175 27/175
(64

5, 73

5] 69 39 66 39/175 66/175
(73

5, 82

5] 78 63 129 63/175 129/175


(82

5, 91

5] 87 35 164 35/175 164/175


(91

5, 100

5] 96 11 175 11/175 175/175


175 1

2.1.1. Construccion de intervalos. Regla del logaritmo


Realmente, no existe ninguna regla ja para decidir el n umero de intervalos y su
amplitud. Hay varias ideadas por distintos autores. A continuacion vamos exponer
una de ellas con objeto de jar las ideas sobre esta cuestion. La denominaremos Regla
del Logaritmo.
La idea general de esta regla es que los intervalos tengan la misma
amplitud, y que dichas amplitudes sean, o bien potencias de 10, es decir,
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 4
10 o 100 o 0,1 o 0,01 etc., o bien mitades de potencias de 10, es decir, 5
o 50 o 0,5 o 0,05, etc., o bien quintos de potencias de 10, es decir, 2 o 20
o 200 o 0,2 o 0,02, etc.
En primer lugar decidiremos el n umero maximo de intervalos, L, mediante la
formula,
L = [10 log
10
n]
donde [] indica en este caso redondeo al entero mas proximo. Recuerdese que log
10
n
es el exponente al que hay que elevar 10 para obtener n. Por ejemplo, 10
2
= 100 por lo
que log
10
100 = 2. De la misma forma, log
10
10.000 = 4, etc. Cuando n no es potencia
de 10, se buscara su logaritmo empleando una calculadora.
Seguidamente, denotando por X
MAX
y X
MIN
son los valores maximo y mnimo
de X respectivamente, calcularemos la cantidad,
A =
X
MAX
X
MIN
L
Finalmente buscaremos, o bien la potencia de diez, o bien la mitad de potencia
de diez, o bien la quinta parte de potencia de 10, mas proxima a A por exceso, es
decir, por arriba. Dicha cantidad sera la amplitud com un de los intervalos. Veamos
una aplicacion de esta regla, empleando un nuevo conjunto de datos.
EJEMPLO 3 Vamos a considerar los siguientes valores, procedentes de la prueba de
evaluacion mencionada en el Ejemplo 2, pero realizada sobre otro grupo de 120estudiantes.
El rango teorico de valores es el intervalo [0, 100],
41 46 54 60 54 61 50 50 53 55
51 58 61 48 51 60 43 53 62 55
56 62 45 49 55 59 56 53 59 53
58 55 50 48 61 62 57 58 58 53
61 50 62 49 53 60 54 34 49 58
60 53 56 53 59 52 61 53 56 60
39 54 50 60 57 52 55 59 53 55
54 59 54 60 57 50 45 57 60 55
55 59 55 54 49 58 52 53 60 54
51 56 58 53 54 49 61 50 60 53
58 55 51 56 62 54 58 50 53 55
61 60 54 51 53 54 55 48 58 62
Apliquemos la regla del logaritmo para construir intervalos. Tenemos n = 120, siendo
pues L = [10 log
10
120] = 21. Se tiene X
MIN
= 34 y X
MAX
= 62, por consiguiente,
A =
62 34
21
= 1

3333..
La potencia de 10, mitad de potencia de 10 o quinta parte de potencia de 10 mas proxi-
ma por exceso a 1333.. es 2, luego esa sera la amplitud de los intervalos. Si empezamos
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 5
en 33, lo que es bastante logico, los intervalos seran,
(33, 35] (35, 37] (37, 39] (39, 41] (41, 43] (43, 45] (45, 47]....(61, 63]
es decir, 15 intervalos.

Esta quizas no sea la mejor regla para todos los casos que se nos puedan presentar,
pero es una posibilidad que emplearemos con cierta frecuencia. Cuando no se indique
nada en contra, se usara en problemas y ejercicios.
2.2. Diagramas de tronco y hojas o tallo y hojas o Stem
and Leaf [Trabajo personal del alumno]
Son una variacion de las tablas de frecuencia, conservando los datos originales y
a nadiendo alguna informacion adicional.
Realmente, este diagrama tiene una gran similitud con los histogramas pero repre-
senta directamente los dgitos de los valores observados en vez de barras o rectangulos.
De esta forma, su construccion es mucho mas sencilla y se conserva mucha mas in-
formacion. La observacion de un diagrama de tronco y hoja revela propiedades y
caractersticas tales como,
Rango de valores de los datos, as como concentracion y simetra de los mismos.
Valores que se separan marcadamente del resto, y valores poco observados o
lagunas.
Para construirlo seguiremos los siguientes pasos,
1. Examinar los datos para decidir cuantos dgitos se van a conservar, truncando
a partir del ultimo dgito retenido. Todos los dgitos, salvo el ultimo, forman el
tronco de la observacion, el ultimo dgito es la hoja. El lugar de truncamiento,
que podemos hacer con o sin redondeo, dependera del tipo de datos.
2. Escribir la lista de posibles troncos desde el menor al mayor y cada hoja a
la derecha del tronco al que pertenece. Adicionalmente, se pueden ordenar las
hojas sobre cada tronco en orden ascendente.
3. A nadir una serie de anotaciones indicando de que forma se pueden leer los da-
tos a partir del diagrama y el n umero de datos. Ademas, si hay valores que se
separan en exceso del resto, se anotan aparte indicando el sentido de distancia-
miento. De esta forma, se obtiene un diagrama mas compacto.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 6
A veces, cuando los dgitos correspondientes a las hojas son unidades, se originan
diagramas con pocos troncos pero si se toman decimas, aparecen demasiados. En estos
casos, se puede dividir un tronco en dos partes, diferenciando cada parte con un *
para las hojas de 0 a 4, y con un . para las de 5 a 9. Tambien es posible diferenciar
cinco partes distintas empleando *, T, F, S y . para hojas de 0 a 1, 2 a
3, 4 a 5, 6 a 7, y 8 a 9 respectivamente. Observese la similitud de estas clases con
las diferentes amplitudes de intervalos empleadas en la regla de construccion de los
mismos que hemos utilizado en la seccion anterior.
Con objeto de constatar las diferencias que se pueden detectar entre dos grupos de
datos empleando los diagramas de tronco y hoja, vamos a considerar dicho diagrama
para los conjuntos de datos de los Ejemplos 2. y 3. Dichos diagramas se muestran a
continuacion.
unidad = 1 1|2 representa 12
5*|00112344
5.|555678
6*|0011122333444
6.|5555566677888999999
7*|0000000111111222233344444
7.|5555555555666666666777777777788888899999
8*|0000000111111222223333334444444
8.|5555566677788999
9*|0000112234
9.|5667888
Figura 1. Diagrama de tronco y hoja. Datos del Ejemplo 2.
unidad = 1 1|2 representa 12
INF|34,39,41
4T|3
4F|55
4S|6
4.|88899999
5*|0000000011111
5T|222333333333333333
5F|444444444444555555555555
5S|6666667777
5.|8888888888999999
6*|000000000001111111
6T|222222
Figura 2. Diagrama de tronco y hoja. Datos del Ejemplo 3.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 7
En la primera la, se da informacion sobre la unidad utilizada y como estan
representados los valores sobre el diagrama. Si hay valores extremos, se representan
en la la siguiente, indicando si son superiores o inferiores. Por ejemplo, en la Figura
2., hay tres valores extremos inferiores. La deteccion de estos valores se ha hecho
empleando el metodo basado en los cuartiles. Este metodo se expone y estudia en el
Tema 4.
Para los datos del Ejemplo 2., se observa, como ya sabamos, una gran simetra, el
intervalo intercuartlico, que contiene el 50 % de las observaciones, y la inexistencia de
valores extra nos. Para los del Ejemplo 3., el diagrama muestra asimetra y presencia
de valores extra nos, raros o anomalos.
Los conceptos mencionados anteriormente, es decir, cuartiles, intervalo intercuartli-
co, vallas interiores y exteriores y mediana, se veran en el Tema 3. El concepto de
valores extremos o extra nos se estudiara en el Tema 4.
3. Res umenes gracos
Las representaciones gracas permiten captar rapidamente y sin gran esfuerzo las
principales caractersticas de un conjunto o distribucion de frecuencias. Son un medio
complementario aunque muy importante pare realizar un analisis estadstico de los
datos.
Las representaciones gracas basicas estan asociadas a los res umenes numericos o
tablas de frecuencias y son,
Diagramas de barras e histogramas: Representan fundamentalmente fre-
cuencias, ya sean absolutas o relativas. Los diagramas de barras se emplean
basicamente para variables discretas, mientras que los histogramas se asocian a
variables de tipo continuo, agrupadas en intervalos.
Polgonos de frecuencia acumulada: Representan frecuencias acumuladas.
Otras representaciones son los diagramas de rectangulos, los diagramas de
sectores, los pictogramas y los perles ortogonales
A continuacion vamos a exponer los diferentes tipos de representaciones gracas,
clasicandolas seg un el tipo de datos a los que se aplican.
3.1. Res umenes gracos para variables cualitativas
3.1.1. Diagramas de rectangulos
Para variables cualitativas, podemos emplear los diagramas de rectangulos. Seg un
que estos se representen en horizontal o vertical, se denominan diagramas de barras
o diagramas de columnas.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 8
Veamos los primeros. Basicamente consisten en representar las frecuencias median-
te barras o rectangulos horizontales de longitudes proporcionales a las mismas. Por
ejemplo, si una modalidad presenta una frecuencia doble que otra, su correspondiente
barra tendra tambien una longitud doble a la de la otra. Vease la Figura 3.
f
i
x
i
Figura 3. Diagrama de barras. En vertical aparecen las modalidades, x
i
. Las longitudes
de las barras de cada modalidad son proporcionales a sus frecuencias.
En principio, es indiferente emplear frecuencias absolutas o relativas, pues unas
y otras son proporcionales entre si, pero si se compara una variable para diferentes
conjuntos de elementos, hay que tener precaucion pues el n umero total de elementos de
cada conjunto puede inuir indirectamente en las longitudes de las barras, falseando
en cierta medida la interpretacion. Por este motivo, en tales caso hay que emplear
frecuencias relativas.
El siguiente ejemplo se empleara, al igual que los datos de los ejemplos 1., 2. y 3.,
a lo largo de todo el tema, y se reere a las preferencias de un conjunto de personas
por diferentes tipos de espectaculos, diferenciadas por sexo.
EJEMPLO 4 Se ha preguntado a un grupo de 100 varones, y a un grupo de 143
mujeres, sobre sus preferencias de ocio, siendo las modalidades los siguientes espectaculos:
CINE, TEATRO, M

USICA y F

UTBOL.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 9
Una vez recogidos los datos se han contado, clasicado y tabulado, obteniendose los
siguientes res umenes, diferenciados por sexo,
PREFERENCIAS DE OCIO. VARONES
ESPECT

ACULOS n
i
f
i
CINE 48 048
TEATRO 12 012
M

USICA 10 010
F

UTBOL 30 030
100
PREFERENCIAS DE OCIO. MUJERES
ESPECT

ACULOS n
i
f
i
CINE 60 0419580420
TEATRO 17 0118881119
M

USICA 23 0160839161
F

UTBOL 43 0300699301
143

A continuacion vamos a construir un diagrama de barras para los datos corres-


pondientes a las preferencias sobre diversos espectaculos que ha mostrado un grupo
de 100 varones, y que aparecen en el Ejemplo 4. Lo haremos con el programa EXCEL,
para lo cual pulsaremos el icono correspondiente a gracos, y una vez que aparezca
la galera de posibilidades, optaremos por el diagrama de barras horizontales mas
simple.
En la lista es el primero, y como no vamos a realizar comparaciones, podemos
emplear frecuencias absolutas. En el asistente para gracos que se nos muestra en la
pantalla escogeremos la pesta na serie, e introduciremos en el lugar adecuado el rango
de celdas que contenga las frecuencias absolutas.
Tambien introduciremos los ttulos y rotulos adecuados para una presentacion
nal lo mas informativa posible. En la Figura 4. exponemos el resultado obtenido.
Con peque nas variaciones se pueden obtener diagramas de columnas, as como
realizar representaciones de este tipo para varias series de datos, lo que permite inte-
resantes comparaciones.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 10
Figura 4. Diagrama de barras para los datos del Ejemplo 4. Preferencias del grupo de
varones. Realizado con EXCEL.
Volvemos a insistir en el cuidado que se debe tener al realizar estas comparaciones
cuando las series que se comparan se reeren a grupos o conjuntos de elementos de
diferentes tama nos. Por ejemplo, si queremos comparar, en terminos generales, las
preferencias entre varones y mujeres, mediante diagramas de este tipo, por ejemplo
con barras apiladas, tendramos que emplear las frecuencias relativas, pues hay 143
mujeres y 100 hombres, y esta diferencia podra producir una falsa impresion si usamos
frecuencias absolutas, pero queremos realizar un estudio en terminos relativos.
En la Figura 5. exponemos un diagrama de barras apiladas para preferencias de
varones y mujeres, realizado con EXCEL, la forma de proceder es similar a la del
diagrama anterior, pero introduciendo las dos series de datos, para varones y para
mujeres, que aparecen en el Ejemplo 4., y a nadiendo los rotulos adecuados. Como se
aprecia en el graco, se han empleado las frecuencias relativas para poder apreciar
las diferencias genericas entre las preferencias de varones y mujeres.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 11
Figura 5. Diagrama de barras apiladas para los datos del Ejemplo 3. Preferencias de
varones y mujeres. Realizado con EXCEL.
3.1.2. Diagramas de sectores
Sobre un crculo, se dibujan, para cada modalidad, sectores circulares de amplitud
proporcional a las frecuencias. Ahora es indiferente emplear frecuencias absolutas o
relativas.
Supongamos que a la modalidad x
i
le corresponde una amplitud de
i
grados. Se
tiene
i
= cf
i
, siendo c la constante de proporcionalidad, por lo que,
360
o
=

i
= c

i
f
i
= 1
por consiguiente
i
= f
i
360
o
. Y de esta forma se calculan las correspondientes
amplitudes de cada modalidad, en grados sexagesimales.
Por ejemplo, para los datos correspondientes a los varones del Ejemplo 4, las
amplitudes correspondientes aparecen en la tabla que se expone a continuacion.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 12
PREFERENCIAS DE OCIO. VARONES
ESPECT

ACULOS n
i
f
i

i
= f
i
360
o
CINE 48 048 17280
TEATRO 12 012 4320
M

USICA 10 010 3600


F

UTBOL 30 030 10800


100
As, para construir el diagrama de sectores, habra que tomar un crculo y dividirlo
en sectores con las respectivas amplitudes angulares anteriores. Para ello se necesita
alg un instrumento para poder medir angulos.
El programa EXCEL nos evita este proceso. En efecto, siguiendo un metodo analo-
go al empleado para los diagramas de barras, hemos obtenido los siguientes diagramas
con preferencias de varones y mujeres.
Figura 6. Diagramas de sectores para los datos del Ejemplo 4. Preferencias de varones y
mujeres. Realizado con EXCEL.
Finalmente, para terminar este apartado, diremos que aunque los diagramas de
rect angulos y sectores son especcos para variables de tipo cualitativo, es posible
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 13
por supuesto aplicarlos a variables cuantitativas, incluso continuas. Por ejemplo, re-
cordemos que los datos del Ejemplo 2., relativos a los 175 estudiantes se resumen
numericamente en la siguiente tabla,
(e
i1
, e
i
] x
i
n
i
N
i
f
i
F
i
(46

5, 55

5] 51 11 11 11/175 11/175
(55

5, 64

5] 60 16 27 16/175 27/175
(64

5, 73

5] 69 39 66 39/175 66/175
(73

5, 82

5] 78 63 129 63/175 129/175


(82

5, 91

5] 87 35 164 35/175 164/175


(91

5, 100

5] 96 11 175 11/175 175/175


175 1
Aunque para este tipo de datos no sea lo mas apropiado, pues ya existen res umenes
gracos especcos para ellos como el histograma, no hay ning un inconveniente en
construir un diagrama de barras como el que aparece en la Figura 6., realizado con
el programa EXCEL.
Figura 7. Diagrama de barras para los datos del Ejemplo 2., agrupados en intervalos.
Realizado con EXCEL.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 14
3.2. Res umenes gracos para variables cuantitativas
Las variables de tipo intrnsecamente cuantitativo, como n umero de hijos, puntua-
ciones en un examen o tallas y pesos tienen tipos de gracos especcos, adaptados a
sus particularidades. Recordemos que las variables de este tipo pueden ser discretas
o continuas, pero esta distincion es mas bien teorica, y en la practica distinguiremos
fundamentalmente si la variable esta agrupada en intervalos o no. As, en los ejemplos
basicos que estamos manejando continuamente en el Tema 2., la variable N

UMERO
DE HIJOS no se agrupa en intervalos, pues sus valores presentan poca variedad, pero
las PUNTUACIONES de los 175 estudiantes s se agrupan ya que presentan numero-
sos valores distintos, aunque desde un punto de vista practico tenga un caracter discre-
to pues ning un profesor calica por ejemplo con 74

3337664553443656664. As pues,
distinguiremos basicamente que esten o no agrupadas, y consideraremos como ejem-
plos paradigmaticos los ya mencionados, es decir, el N

UMERO DE HIJOS de las 150


familias [Ejemplo 1.] y las PUNTUACIONES de los 175 estudiantes [Ejemplo 2.].
Vease inicio del Tema 2.
3.2.1. Diagramas de barras
Son especcos para las variables no agrupadas. En el eje de abscisas, es decir,
el horizontal, se colocan los distintos valores de la variable, en su sitio seg un su valor y
la escala que se considere. Sobre cada uno de ellos, se levanta una lnea perpendicular
al eje. Las longitudes pueden ser las frecuencias absolutas, las relativas o magnitudes
proporcionales a las mismas. Realmente lo que importa es la relacion entre las barras,
y el tomar una u otra opcion solo hace variar la escala del graco. Vease Figura 8.
x
1
x
2
x
k
Figura 8. Diagrama de barras para una variable cuantitativa. En la horizontal aparecen
las modalidades, x
i
. Las longitudes de las barras de cada modalidad son las
correspondientes frecuencias o cantidades proporcionales.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 15
Sobre este esquema b asico existen numerosas variaciones. Por ejemplo, se pueden
considerar lneas o barras nas de diferentes colores. Tambien se pueden comparar
diferentes conjuntos de datos, de forma similar a como se haca con variables cuali-
tativas, mediante diagramas de columnas adheridas o apiladas. Recuerdese que para
este tipo de comparaciones, y seg un el objetivo que se quiera conseguir, las frecuen-
cias absolutas pueden no resultar apropiadas. Vease lo dicho para los diagramas de
rect angulos.
En la Figura 9. se expone un diagrama de barras realizado con EXCEL para los
datos del n umero de hijos de 150 familias [Ejemplo 1.]. Observese que en este graco,
las alturas de las barras coinciden con las frecuencias n
i
Figura 9. Diagrama de barras para el n umero de hijos de 150 familias. Realizado con
EXCEL.
3.2.2. Histogramas
Son especcos de variables agrupadas en intervalos. En el eje de abscisas se
colocan los intervalos, y sobre cada uno de ellos se levanta un rectangulo de area igual,
o proporcional, a la frecuencia del mismo, que en principio puede ser tanto absoluta
como relativa. Vease Figura 10.
Si por ejemplo queremos que las areas de los rectangulos coincidan con las frecuen-
cias absolutas, la altura, h
i
, del rectangulo sobre el intervalo (e
i1
, e
i
] de amplitud a
i
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 16
sera tal que n
i
= a
i
h
i
y por consiguiente,
h
i
= n
i
/a
i
i = 1, 2, . . . , k
que nos permite calcular las alturas de los rectangulos.
Observemos que para una misma frecuencia, cuanto mayor es la amplitud del
intervalo menor es la altura del rectangulo, pues el elemento representativo del histo-
grama es la supercie. Observemos tambien que si todos los intervalos son de igual
amplitud, se pueden tomar las alturas directamente iguales a las frecuencias.
e
0
e
1
e
2
e
k
Figura 10. Histograma para una variable cuantitativa agrupada.
A veces, la aplicacion rigurosa de la regla anterior, bajo una determinada escala,
da lugar a gracos poco esteticos, por ejemplo muy aplastados o muy estirados en
vertical, pudiendose entonces introducir un factor de proporcionalidad que produzca
una graca mas proporcionada. Esto equivale simplemente a un cambio de escala, y
no distorsiona en absoluto la nalidad del histograma.
En la Figura 11. se expone un histograma realizado con EXCEL para los datos del
Ejemplo 2., es decir, las puntuaciones de 175 estudiantes, agrupadas en intervalos. En
este caso, todos los intervalos tienen la misma amplitud, y en la graca, la altura de
los rectangulos construidos sobre cada intervalo se ha hecho coincidir con la frecuencia
absoluta, n
i
. De esta forma se consigue que las supercies de los diferentes rectangulo
guarden una relacion de proporcionalidad con las frecuencias de cada uno, que como
ya hemos mencionado, es la idea fundamental de este tipo de graco.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 17
Figura 11. Histograma para los datos del Ejemplo 2, puntuaciones de 175 estudiantes,
agrupados en intervalos. Realizado con EXCEL.
3.2.3. Polgono de frecuencias
Este graco se puede construir tanto para variables no agrupadas como agrupadas
en intervalos, y tanto con frecuencias absolutas como relativas. Nosotros lo veremos
con frecuencias absolutas.
3.2.3.1. Variables no agrupadas en intervalos
Consiste en construir, a partir de un diagrama de barras, existente o hipotetico,
segmentos rectilneos que unan los extremos de las barras, formando as una lnea
poligonal que une los puntos (x
1
, n
1
), (x
2
, n
2
),...,(x
k
, n
k
). Usualmente, este graco
se proporciona en combinacion con el diagrama de barras, pero no es estrictamente
necesario. En la Figura 12. aparece esquematicamente un diagrama de este tipo,
construido a partir del diagrama de barras.
En la Figura 13. podemos ver un polgono de frecuencias, obtenido con el programa
EXCEL, para los datos del n umero de hijos de 150 familias, ya conocidos. Como puede
verse, la evolucion del polgono permite captar rapidamente el fenomeno es estudio.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 18
x
1
x
2
x
k
x
i
!
!
!
!

H
H
H
H
H
H
H
Figura 12. Polgono de frecuencias para una variable cuantitativa no agrupada en
intervalos.
Figura 13. Polgono de frecuencias para el n umero de hijos de 150 familias. Realizado
con EXCEL.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 19
3.2.3.2. Variables agrupadas en intervalos
Consiste en construir, a partir de un histograma, existente o hipotetico, segmentos
rectilneos que unan los puntos medios de las bases superiores de cada rectangulo,
formando as una lnea poligonal.
Si x
i
son las marcas de clases de los intervalos, y h
i
son las alturas de los rectangulos
construidos sobre los intervalos, dicha lnea poligonal es la que une los puntos (x
1
, h
1
),
(x
2
, h
2
),...,(x
k
, h
k
).
Usualmente, este graco se proporciona en combinacion con el histograma, pero no
es estrictamente necesario. En la Figura 14. aparece esquematicamente un diagrama
de este tipo, construido a partir del histograma.
En la Figura 15. podemos ver un polgono de frecuencias, obtenido con el programa
EXCEL, para los datos de las puntuaciones de 175 estudiantes, ya conocidos. Como
puede verse, la evolucion del polgono permite captar rapidamente el fenomeno es
estudio.
e
0
e
1
e
2
e
k

c
c
c
c
c
Z
Z
Z
Z
Z
Figura 14. Polgono de frecuencias para una variable cuantitativa agrupada en intervalos.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 20
Figura 15. Polgono de frecuencias para las puntuaciones de 175 estudiantes. Realizado
con EXCEL.
3.2.4. Curva acumulativa
Este graco pretende plasmar visualmente la acumulacion de la frecuencia, al
aumentar los valores de la variable. Usualmente emplea frecuencias relativas acu-
muladas y se puede realizar tanto para variables no agrupadas como agrupadas en
intervalos. Para este tipo de graco es indispensable que los valores de la variable se
coloquen ordenados de menor a mayor.
3.2.4.1. Variables no agrupadas en intervalos
Para este tipo de datos, la curva acumulativa es la representacion graca de la
siguiente funcion,
F(x) =

0 si x < x
1
F
1
si x
1
x < x
2
F
2
si x
2
x < x
3

F
k1
si x
k1
x < x
k
1 si x
k
x
La graca es una lnea constante a trozos, nunca decreciente, y con saltos en
los puntos x
1
, x
2
,...,x
k
, correspondientes a las discontinuidades de la funcion F(x).
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 21
Observemos que el crecimiento de esta lnea indica la forma en que se distribuyen las
observaciones en los diferentes valores de la variable. Realmente, para un valor x IR,
F(x) es la frecuencia relativa o proporcion de individuos cuyo valor de la variable en
estudio es menor o igual que x.
Por ejemplo, para el conocido ejemplo del n umero de hijos de 150 familias, F(3)
es la frecuencia relativa o proporcion de familias que tienen 3 hijos o menos, es decir
0 o 1 o 2 o 3 hijos, y as se comprende el hecho de que la graca presente saltos en
los valores x
i
.
La funcion F(x) se denomina funcion de distribucion de la variable estadstica
que se estudia. No hay que confundir esta funcion con la funcion de distribucion
asociada a una variable aleatoria, que se estudia en Calculo de Probabilidades. Son
cosas distintas.
x
1
x
2
x
3
x
k
F
1
F
2
1
)
[ )
[ )
[ )
F(x)
[
Figura 16. Curva acumulativa para una variable cuantitativa no agrupada en intervalos.
Es la graca de la funcion F(x).
En la Figura 16. aparece esquematicamente un graco de este tipo. Observese que
la notacion ) y [ indica que extremo de los segmento es abierto o cerrado respectiva-
mente.
3.2.4.2. Variables agrupadas en intervalos
La idea es la misma que para datos no agrupados, pero ahora, se aplica la hipotesis
teorica de que las observaciones se distribuyen uniformemente en los intervalos, con
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 22
lo cual la acumulacion se supone exenta de discontinuidades. Concretamente, esta
graca se obtiene uniendo por segmentos rectilneos los puntos,
(, 0), (e
0
, 0), (e
1
, F
1
), (e
2
, F
2
), , (e
k1
, F
k1
), (e
k
, 1), (+, 1)
formando as una lnea poligonal continua y creciente que indica la forma en que se
distribuyen las observaciones en los diferentes valores de la variable. Esta lnea es la
representacion de una funcion que denotamos, con en el caso anterior, F(x).
Realmente, para un valor x IR, F(x) es la frecuencia relativa o proporcion de
individuos cuyo valor de la variable en estudio es menor o igual que x. Por ejemplo,
para el conocido ejemplo de las puntuaciones de 175 estudiantes, F(67

5) es la fre-
cuencia relativa o proporcion de estudiantes que han obtenido 67

5 o menos, es decir
una nota en el intervalo [0, 67

5].
Tambien como en el caso anterior, la funcion F(x) se denomina funcion de distri-
bucion de la variable estadstica que se estudia. No hay que confundir esta funcion
con la funcion de distribucion asociada a una variable aleatoria, que se estudia en
Calculo de Probabilidades. Son cosas distintas.
En la Figura 17. aparece esquematicamente un graco de este tipo. Observese la
continuidad y su caracter creciente.
e
0
e
1
e
2
e
k

!
!
!!

!
!
!
!
!
!
! 1
F
1
F
2
F
3
F(x)
Figura 17. Curva acumulativa para una variable cuantitativa agrupada en intervalos.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 23
3.3. Otros tipos de gracos
3.3.1. Pictogramas
Estos gracos utilizan guras relacionadas con el fenomeno que se estudia de forma
que su tama no o cantidad indique la frecuencia de cada modalidad.
Supongamos que se ha estudiado la produccion lactea media diaria de tres granjas
de ganado vacuno, denominadas GRANJA A, GRANJA B y GRANJA C, siendo las
producciones en litros,
GRANJA PRODUCCI

ON L

ACTEA
GRANJA A 495
GRANJA B 2456
GRANJA C 1567
En la Figura 18. se expone un pictograma que pretende representar las diferencias
de produccion mediante el tama no de la gura.
Figura 18. Pictograma para la produccion lactea de las granjas A, B y C
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 24
3.3.2. Cartogramas
Sobre un mapa se indica, para cada region geograca, la frecuencia o intensidad
de la caracterstica en estudio. Para hacerlo se pueden emplear diferentes colores o
tramas, o tambien cantidades numericas.
A modo de ejemplo, se expone en la Figura 19. un cartograma en el que se quiere
representar las diferencias de porcentaje de aulas de ense nanza concertada sobre el
total de la ense nanza privada, en diferentes comunidades. Este cartograma se ha
extrado de un Boletn Informativo elaborado por el Instituto Nacional de Estadstica
en Junio de 2002, sobre la ense nanza privada en Espa na.
Figura 19. Cartograma representativo de los porcentajes de aulas de ense nanza privada
concertada sobre el total de la ense nanza privada. Fuente: I.N.E., Junio de 2002.
Como es facil de comprender, ni los pictogramas ni los cartogramas pueden con-
siderarse gracas muy representativa ni exactas. Este problema puede eliminarse en
parte acompa nando el graco de las cantidades numericas, como en el caso del anterior
cartograma.
Jose A. Mayor Gallego. Universidad de Sevilla
F.M.E. Estadstica Descriptiva. Tema 2: Res umenes numericos y gracos 25
3.3.3. Perl ortogonal
Se emplea para representar diferentes caractersticas de un mismo individuo. Esta
representacion tiene gran interes en estudios psicologicos o pedagogicos. Consiste
en representar, para cada individuo, representar en un eje horizontal las distintas
caractersticas en estudio, y en el eje vertical los valores de cada una.
Por ejemplo, supongamos que un alumno de Primero de Estadstica presenta las
siguientes calicaciones,
Asignatura Calicacion
Estadstica Descriptiva 8
Analisis Matematico 5

Algebra 6
Calculo de Probabilidades 4
Informatica 5
Teora de la Probabilidad 2
Investigacion Operativa 6
que representadas gracamente dan lugar al siguiente perl ortogonal que aparece en
la Figura 20.,
Figura 20. Perl ortogonal para las calicaciones obtenidas por un alumno de Primero de
Estadstica. Realizado con EXCEL.
Jose A. Mayor Gallego. Universidad de Sevilla

Вам также может понравиться

  • Caso Clínico
    Caso Clínico
    Документ5 страниц
    Caso Clínico
    Gerad Cookie Ortega
    Оценок пока нет
  • Pedriatria
    Pedriatria
    Документ6 страниц
    Pedriatria
    Gerad Cookie Ortega
    Оценок пока нет
  • Caso Clinico Ivonne Quiroz Arreola
    Caso Clinico Ivonne Quiroz Arreola
    Документ15 страниц
    Caso Clinico Ivonne Quiroz Arreola
    Gerad Cookie Ortega
    Оценок пока нет
  • Edema Corneal Y Estromal
    Edema Corneal Y Estromal
    Документ32 страницы
    Edema Corneal Y Estromal
    Gerad Cookie Ortega
    100% (2)
  • Caso Clinico de Pediatria Visual
    Caso Clinico de Pediatria Visual
    Документ16 страниц
    Caso Clinico de Pediatria Visual
    Gerad Cookie Ortega
    Оценок пока нет
  • Temesd02 PDF
    Temesd02 PDF
    Документ26 страниц
    Temesd02 PDF
    Gerad Cookie Ortega
    Оценок пока нет
  • Caso Clínico Pediátrico
    Caso Clínico Pediátrico
    Документ7 страниц
    Caso Clínico Pediátrico
    Gerad Cookie Ortega
    0% (1)
  • Caso Clinico Infantes
    Caso Clinico Infantes
    Документ7 страниц
    Caso Clinico Infantes
    Gerad Cookie Ortega
    Оценок пока нет
  • Como Influye La Cooperación Del Paciente Pediátrico en
    Como Influye La Cooperación Del Paciente Pediátrico en
    Документ13 страниц
    Como Influye La Cooperación Del Paciente Pediátrico en
    Gerad Cookie Ortega
    Оценок пока нет
  • Reporte Del Caso Clinico
    Reporte Del Caso Clinico
    Документ27 страниц
    Reporte Del Caso Clinico
    Gerad Cookie Ortega
    Оценок пока нет
  • Oclusion Arterial Retiniana
    Oclusion Arterial Retiniana
    Документ78 страниц
    Oclusion Arterial Retiniana
    Gerad Cookie Ortega
    Оценок пока нет
  • Resumen Clase 1
    Resumen Clase 1
    Документ79 страниц
    Resumen Clase 1
    Gerad Cookie Ortega
    Оценок пока нет
  • Síndrome en Y
    Síndrome en Y
    Документ14 страниц
    Síndrome en Y
    Gerad Cookie Ortega
    Оценок пока нет
  • Fluroquinolonas 2
    Fluroquinolonas 2
    Документ49 страниц
    Fluroquinolonas 2
    Gerad Cookie Ortega
    Оценок пока нет
  • Queratitis Por Farmacos
    Queratitis Por Farmacos
    Документ44 страницы
    Queratitis Por Farmacos
    Gerad Cookie Ortega
    Оценок пока нет
  • Paralisis Oculosimpatica
    Paralisis Oculosimpatica
    Документ35 страниц
    Paralisis Oculosimpatica
    Gerad Cookie Ortega
    Оценок пока нет
  • Gam y Gram
    Gam y Gram
    Документ30 страниц
    Gam y Gram
    Gerad Cookie Ortega
    Оценок пока нет
  • Expo Cornea
    Expo Cornea
    Документ38 страниц
    Expo Cornea
    Gerad Cookie Ortega
    Оценок пока нет
  • Neovascularizacion
    Neovascularizacion
    Документ18 страниц
    Neovascularizacion
    Gerad Cookie Ortega
    Оценок пока нет
  • Anatomofisiologia de
    Anatomofisiologia de
    Документ34 страницы
    Anatomofisiologia de
    Gerad Cookie Ortega
    Оценок пока нет
  • Gam y Gram
    Gam y Gram
    Документ30 страниц
    Gam y Gram
    Gerad Cookie Ortega
    Оценок пока нет
  • Retina
    Retina
    Документ1 страница
    Retina
    Gerad Cookie Ortega
    Оценок пока нет