Вы находитесь на странице: 1из 27

1

UCV/FACES/EAC
Estadsticas I
Distribuciones de Frecuencia y Grficas
Prof. Leonardo Simmons
Prof. Leonardo Simmons Estadsticas I -02
2
DISTIBUCIONES DE FRECUENCIA
Uno de los primeros pasos que se realizan en cualquier estudio estadstico es
la tabulacin de los resultados, es decir, recoger la informacin de la muestra
o poblacin resumida en una tabla, que denominaremos distribucin de
frecuencias. en la que cada valor de la variable se le asocian sus
frecuencias absolutas, relativas y acumuladas.

Las distribuciones de frecuencias varan en sus columnas dependiendo del
nivel de agrupacin de las observaciones de la variable estudiada y si sta
corresponde a una variable cualitativa, a una variable discreta o a una
variable continua.
Prof. Leonardo Simmons Estadsticas I -02
3
DISTIBUCION DE FRECUENCIA DATOS NO
AGRUPADOS (DFDNA)
Caso: Variable Cualitativa (Atributo)
La estructura de una DFDNA para una variable cualitativa es como sigue:





Donde:
X
i
= es el i-simo valor de la variable de estudio
f
i
= es la frecuencia del i-simo valor de la variable
H
i
y %h
i
= son la respectivas frecuencias relativas
X f h %h
x
1
f
1
h
1
%h
1
x
2
f
2
h
2
%h
2
: : : :
x
k
f
k
h
k
%h
k
n = N 1.00 100
Prof. Leonardo Simmons Estadsticas I -02
4
DISTIBUCION DE FRECUENCIA DATOS NO
AGRUPADOS (DFDNA)
P.ej: Se pregunt a un grupo de alumnos de Ingeniera Industrial su materia
preferida y estas fueron sus respuestas:
mat eco adm inv ind
mat inv ind prob eco
prob mat mat adm inv
eco mat prob ind prob
mat prob ind ind inv
eco prob mat adm ind
mat ind mat inv ind
adm prob mat ind prob
mat eco adm ind prob
prob mat ind adm inv
P.ej: Organicemos estas repuestas en una DFDNA:
Materia Preferida (x)
#Estudiantes (f) h %h
Administracion 6 0,12 12,00
Ing. Econmica 5 0,10 10,00
Ing. Industrial 11 0,22 22,00
Inv. de operaciones 6 0,12 12,00
Matematicas 12 0,24 24,00
Prob. y estadsticas
10
0,20 20,00
50
1,00 100,00
Prof. Leonardo Simmons Estadsticas I -02
5
DISTIBUCION DE FRECUENCIA DATOS NO
AGRUPADOS (DFDNA)
De la tabla se pueden extraer conclusiones como:
1. La materia ms preferida por los estudientes en la muestra es
matemticas con 24% y en segundo lugar Ing. Industrial con 22%
2. La materia menos preferida es Ing. Econmica con 10%
3. La proporcin de alumnos que prefieren Prob. Y estadsticas es 0,20
Se puede representar grficamente la informacin contenida en la DFDNA:

Distibucin de las Materias Preferidas
12%
10%
22%
12%
24%
20%
Administracion
Ing. Econmica
Ing. Industrial
Inv. de operaciones
Matematicas
Prob. y estadsticas
Distibucin de las Materias Preferidas
0
2
4
6
8
10
12
14
A
d
m
i
n
i
s
t
r
a
c
i
o
n
I
n
g
.

E
c
o
n

m
i
c
a
I
n
g
.

I
n
d
u
s
t
r
i
a
l
I
n
v
.

d
e

o
p
e
r
a
c
io
n
e
s
M
a
t
e
m
a
t
i
c
a
s
P
r
o
b
.

y

e
s
t
a
d

s
t
ic
a
s
Materias
N
o
.

E
s
t
u
d
i
a
n
t
e
s
Fuente: Encuesta Fuente: Encuesta
Prof. Leonardo Simmons Estadsticas I -02
6
DISTIBUCION DE FRECUENCIA DATOS NO
AGRUPADOS (DFDNA)
Caso: Variable Cuantitativa (Discreta)
La estructura de una DFDNA para una variable cuantitativa (Discreta)
es como sigue:
X f h %h F H %H
x
1
f
1
h
1
%h
1
F
1
H
1
%H
1
x
2
f
2
h
2
%h
2
F
2
H
2
%H
2
: : : : : : :
x
k
f
k
h
k
%h
k
F
k
H
k
%H
k
n = N 1.00 100
Prof. Leonardo Simmons Estadsticas I -02
7
DISTIBUCION DE FRECUENCIA DATOS NO
AGRUPADOS (DFDNA)
P.ej: Una encuesta entre un grupo de madres-solteras, para analizar los
problemas econmicos que enfrentan, en determinada comunidad; arroj los
siguientes resultados acerca del nmero de nios (menores de 12 aos) en el
hogar:
1 4 2 3 5 3 5 3 3 5
1 1 2 1 4 1 2 1 4 1
2 1 1 2 1 2 3 2 3 3
3 1 3 4 1 1 3 5 4 2
2 5 1 4 2 3 1 2 5 1
No. Nios (X )
No.Hogares (f) h %h F H %H
1 16 0,32 32 16 0,32 32
2 11 0,22 22 27 0,54 54
3 11 0,22 22 38 0,76 76
4 6 0,12 12 44 0,88 88
5 6 0,12 12 50 1 100
50 1,00 100
Prof. Leonardo Simmons Estadsticas I -02
8
DISTIBUCION DE FRECUENCIA DATOS NO
AGRUPADOS (DFDNA)
Grficas asociadas..
Histogramas
Distribucin del Porcentaje de Nios por Hogares
0
20
40
60
80
100
120
1 2 3 4 5
No. de Nios
%
H
o
g
a
r
e
s
1 2 3 4 5
%

H
o
g
a
r
e
s

5
15
20
25
30
10
35
No. de Nios
Distribucin del Porcentaje de Nios por Hogares
Fuente: Encuesta de Hogares Fuente: Encuesta de Hogares
Prof. Leonardo Simmons Estadsticas I -02
9
DISTIBUCION DE FRECUENCIA DATOS NO
AGRUPADOS (DFDNA)
Grficas asociadas..
Ojiva Ascendente Circular
Distribucin del Porcentaje de Nios por
Hogares
2
22%
3
22%
4
12%
5
12%
1
32%
Fuente: Encuesta de Hogares
1 2 3 4 5
%

H
o
g
a
r
e
s

20
60
80
100
30
40
35
No. de Nios
Distribucin Acumulada del Porcentaje de
Nios por Hogares
Fuente: Encuesta de Hogares
Prof. Leonardo Simmons Estadsticas I -02
10
DISTIBUCION DE FRECUENCIA DATOS
AGRUPADOS (DFDA)
La distribucin de frecuencia de datos agrupados (DFDA) por lo general se usa
para organizar los valores poblacionales o muestrales de una variable
cuantitativa continua.
Las observaciones de la variable se agrupan en clases o intervalos de tal
manera que las frecuencias hacen referencia a la clase o intervalo de
valores de la variable y no a un valor en particular como en el caso de la
DFDNA.
A continuacin se detalla el procedimiento para construir una DFDA:
1. Ordenar los datos
2. Determinar el Rango (R) de la variable: R = X
max
- M
min
3. Determinar el nmero de clases o intervalos (K) de la distribucin:
Empricamente
Mtodo de 2
K
: K es el exponente de 2 tal que 2
K
n
Formula de Sturges: K = parte entera (1+ 3,32 Log (n))
Prof. Leonardo Simmons Estadsticas I -02
11
DISTIBUCION DE FRECUENCIA DATOS
AGRUPADOS (DFDA)
4. Calcular el rango de las clases o intervalos (C) de la distribucin:
C = R/K
5. Asiganar los limites de las clases o intervalos con la siguiente regla:
l
1
= X
min
, donde l
1
= Limite inferior de la clase 1
L
1
= l
1
+ C, donde L
1
= Limite superior de la clase 1
l
2
= L
1
, donde l
2
= Limite inferior de la clase 2
L
2
= l
2
+ C ..y as sucesivamente hasta llegar a que L
k
= X
max
6. Clasificar cada observacin de la variable en una y solo una de las clases,
usando la siguiente regla:
Las primeras K-1 clases son [) cerradas en el limite inferior y
abiertas en el limite superior
La ltima clase (K) es [] cerrada en ambos limites
7. Determinar las frecuencias relativas y acumuladas; adems de la marca de
clases:
X
i
=(L
i
+ l
i
)/2
Prof. Leonardo Simmons Estadsticas I -02
12
DISTIBUCION DE FRECUENCIA DATOS
AGRUPADOS (DDNA)
P.ej: La tienda CABRERAS Y ASOCIADOS esta interesada en efectuar un
anlisis de sus cuentas por cobrar. Uno de los factores que ms interesaba a la
administracin de la tienda era el de los saldos de las cuentas de crdito. Se
escogi al azar una muestra aleatoria de 30 cuentas y se anot el saldo de
cada cuenta (en Miles de Bs.F) como sigue:

7,42 8,15 11,1 12,18 12,98 13,02 17,64 17,97 20,64 21,1
25,68 29,75 32,67 34,40 38,74 43,13 43,66 43,66 43,97 51,69
53,4 60,94 68,13 70,15 77,97 79,61 81,59 89,19 90,99 93,91
1. Determinar el Rango (R) de la variable: R = X
ma
- M
min
= 93,917,42= 86,49

2. Determinar el nmero de clases o intervalos (K) de la distribucin:
Mtodo de 2
K
: K= 5 ya que 2
5
= 32 30
Formula de Sturges: K = parte entera (1+ 3,32 Log (30)) =parte entera (5,9069=5
Prof. Leonardo Simmons Estadsticas I -02
13
DISTIBUCION DE FRECUENCIA DATOS
AGRUPADOS (DFDA)
4. Calcular el rango de las clases o intervalos (C) de la distribucin:
C = R/K = 86,49/5 = 17,298 *
Nota (*): como la variable se mido con 2 decimales redondeamos el valor
calculado de C con la misma cantidad de decimales, es decir:
C = 17,30
5. Asiganar los limites de las clases o intervalos con la siguiente regla:
l
1
= X
min
= 7,42 ; L
1
= l
1
+ C = 7,42 + 17,30 = 24,72; ..y as sucesivamente
6. Clasificar cada observacin de la variable en una y solo una de las clases,
usando la siguiente regla:
Las primeras K-1 clases son [) cerradas en el limite inferior y abiertas
en el limite superior
La ltima clase (K) es [] cerrada en ambos limites
7. Determinar las frecuencias relativas y acumuladas; adems de la marca de
clases:
X
i
=(L
i
+ l
i
)/2
Prof. Leonardo Simmons Estadsticas I -02
14
DISTIBUCION DE FRECUENCIA DATOS
AGRUPADOS (DFDA)
Resultando la siguiente DFDA:
No.
Cuentas (f)
Marca
de
Clase
(X) h %h F H %H
7,42 - 24,72 10 16,07 0,3333 33,3333 10 0,3333 33,3333
24,72 - 42,02 5 33,37 0,1667 16,6667 15 0,5000 50,0000
42,02 - 59,32 6 50,67 0,2000 20,0000 21 0,7000 70,0000
59,32 - 76,62 3 67,97 0,1000 10,0000 24 0,8000 80,0000
76,62 - 93,92 6 85,27 0,2000 20,0000 30 1,0000 100,0000
30 1,000 100,000
Saldo (Miles BsF)
Prof. Leonardo Simmons Estadsticas I -02
15
DISTIBUCION DE FRECUENCIA DATOS
AGRUPADOS (DFDA)
7,42 24,72 42,02 59,39 76,62 93,92
Saldo de la Cuentas por Cobrar (Miles Bs.F)
5
10
15
20
25
30
35
%

C
u
e
n
t
a
s

p
o
r

C
o
b
r
a
r

Distribucin de los Saldo de la Cuentas por
Cobrar (Miles Bs.F)
Cabrera & Asociados
Fuente: Archivos de Cabrera & Asociados
Grafica asociada a
la DFDA:
Histograma
Prof. Leonardo Simmons Estadsticas I -02
16
DISTIBUCION DE FRECUENCIA DATOS
AGRUPADOS (DFDA)
Grafica asociada a la
DFDA:
Polgono de Frecuencia
7,42 24,72 42,02 59,39 76,62 93,92
Saldo de la Cuentas por Cobrar (Miles Bs.F)
5
10
15
20
25
30
35
%

C
u
e
n
t
a
s

p
o
r

C
o
b
r
a
r

Distribucin de los Saldo de la Cuentas por
Cobrar (Miles Bs.F)
Cabrera & Asociados
Fuente: Archivos de Cabrera & Asociados
16,07 33,37 50,57 67,97 85,27
Prof. Leonardo Simmons Estadsticas I -02
17
DISTIBUCION DE FRECUENCIA DATOS
AGRUPADOS (DFDA)
Grafica asociada a la
DFDA:
Histograma
+
Polgono de Frecuencia
(Integrados)
7,42 24,72 42,02 59,39 76,62 93,92
Saldo de la Cuentas por Cobrar (Miles Bs.F)
5
10
15
20
25
30
35
%

C
u
e
n
t
a
s

p
o
r

C
o
b
r
a
r

Distribucin de los Saldo de la Cuentas por
Cobrar (Miles Bs.F)
Cabrera & Asociados
Fuente: Archivos de Cabrera & Asociados
Prof. Leonardo Simmons Estadsticas I -02
18
DISTIBUCION DE FRECUENCIA DATOS
AGRUPADOS (DFDA)
Grafica asociada a
la DFDA:
Ojiva Ascendente
7,42 24,72 42,02 59,39 76,62 93,92
Saldo de la Cuentas por Cobrar (Miles Bs.F)
20
40
60
80
100
%

C
u
e
n
t
a
s

p
o
r

C
o
b
r
a
r

Distribucin Acumulada de los Saldo de las
Cuentas por Cobrar (Miles Bs.F)
Cabrera & Asociados
Fuente: Archivos de Cabrera & Asociados
Prof. Leonardo Simmons Estadsticas I -02
19
DISTIBUCION DE FRECUENCIA DATOS
AGRUPADOS (DDNA)
Ejemplo de interpretacin de los resultados contenidos en la tabla:
1. f
1
: Diez (10) de las cuentas investigadas tienen saldo entre 7,42 y 24,72
miles BsF, lo cual representa el 10% h
1
de la muestra.
2. H
3
: 0,70 es la proporcin de cuentas por pagar de la muestra con un
saldo menor que 59,32 BsF.
3. %H
3
: El 70% de las cuentas investigadas presentan saldo de a lo sumo
59,32 BsF.
4. X
3
: La cantidad 50,67 BsF es el saldo que representa a todas las cuentas
con saldo entre 42,02 y 59,32 BsF.




Prof. Leonardo Simmons Estadsticas I -02
7,42 24,72 42,02 59,39 76,62 93,92
Saldo de la Cuentas por Cobrar (Miles Bs.F)
20
40
60
80
100
%

C
u
e
n
t
a
s

p
o
r

C
o
b
r
a
r

Distribucin Acumulada de los Saldo de las
Cuentas por Cobrar (Miles Bs.F)
Cabrera & Asociados
Fuente: Archivos de Cabrera & Asociados
20
DISTIBUCION DE FRECUENCIA DATOS
AGRUPADOS (DDNA)
Con ayuda de las grficas podemos
responder a preguntas como:
Que porcentaje aproximadamente de
cuentas tienen saldos entre 30 y 65
BsF?
Como se aprecia 30 y 65 BsF no son
limites de clases por eso no
podemos responder directamente
con la tabla esta pregunta y nos
tenemos que valer de la grfica de
frecuencias acumuladas (ojiva) para
ello:
-Aprox. el 40% de las cuentas tienen
saldo a 30 Mil BsF
-Aprox. el 73% de las cuentas tienen
saldo a 65 Mil BsF
Luego: 73%-40% = 33% entonces:
aprox. El 33% de las cuentas tienen
saldo entre 30 y 65 miles BsF

30
65
40
73
Prof. Leonardo Simmons Estadsticas I -02
21
ANALISIS EXPLORATORIO DE DATOS
Diagrama de Tallo y Hoja
Las tcnicas del anlisis exploratorio de datos consiste en operaciones
aritmticas sencillas y grficas fciles de trazar, que pueden emplearse para
resumir con rapidez los datos de una muestra.

La tcnica conocida como diagrama tallo y hoja se usa para mostrar en
forma simultanea el orden del rango y la forma de un conjunto de datos.
Persigue los siguientes objetivos:
Representacin visual de la informacin
Descubrir un patrn de comportamiento de los datos, es decir, qu
distribucin pueden seguir los datos
Identificar si hay valores extremos o datos anormales en la muestra
Es aplicables a variables cuantitativas de valores formados por al menos dos
cifras.
Principio: Cada nmero se divide en dos partes, una que llamaremos "Tallo"
y la otra denominada " ramas u Hojas".
Prof. Leonardo Simmons Estadsticas I -02
22
ANALISIS EXPLORATORIO DE DATOS
Diagrama de Tallo y Hoja
Ejemplo: Considere los siguientes nmeros: 65, 57, 79, 69, 53, 63, 71. Los
tallos sern las decenas, y las hojas sern las unidades, de la siguiente
manera, luego:
Tallo
Formado por uno o ms dgitos principales (cifras mas significativas), ubicados a la
izquierda del nmero.
Hoja Resto de los nmeros (cifras secundarias) ubicadas a la derecha
Tallo Ramas
5 37
6 359
7 19
Procedimiento:
1. Se define cmo se van a dividir los nmeros en tallos y hojas, es decir, se
identifican cuales van a ser los tallos, y cuales va a ser las hojas.
2. En una columna se listan los tallos en orden ascendente.
3. Se recorren los datos y se colocan, en la columna siguiente, las hojas de
acuerdo al tallo que tengan y se ordenan en forma creciente
Prof. Leonardo Simmons Estadsticas I -02
23
ANALISIS EXPLORATORIO DE DATOS
Diagrama de Tallo y Hoja
Ejemplo: Considere la siguiente informacin sobre duracin de bateras de
carro, en aos. Se pide:
Construir el diagrama de tallos y hojas usando como tallos la parte entera.
Construir el diagrama de tallos y hojas partiendo cada tallo en dos.
Duracin de bateras (en aos)
2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6
3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5
Prof. Leonardo Simmons Estadsticas I -02
24
ANALISIS EXPLORATORIO DE DATOS
Diagrama de Tallo y Hoja
Usando como tallos la parte entera
Tallos: Dgitos principales (Parte entera);
Hojas: Dgitos secundarios (Parte decimal)
Tallo Hojas Frecuencia
1 9 1
2 2 5 6 6 9 5
3 0 0 1 1 1 1 2 2 2 3 3 3 4 4 4 5 5 6 7 7 7 8 8 9 9 25
4 1 1 2 3 4 5 6 7 7 9
Total 40
Partiendo cada tallo en dos
En este caso el tallo 1 nicamente tendra la parte superior, y el tallo 4
tendra tanto la parte inferior como la superior
Prof. Leonardo Simmons Estadsticas I -02
25
ANALISIS EXPLORATORIO DE DATOS
Diagrama de Tallo y Hoja
Tallo Ramas Frecuencia
1 S 9 1
2 I 2 1
2 S 5 6 6 9 4
3 I 0 0 1 1 1 1 2 2 2 3 3 3 4 4 4 15
3 S 5 5 6 7 7 7 8 8 9 9 10
4 I 1 1 2 3 4 5
4 S 5 6 7 7 4
Total 40
Prof. Leonardo Simmons Estadsticas I -02
26
ANALISIS EXPLORATORIO DE DATOS
Diagrama de Tallo y Hoja
Observaciones:
Se recomienda que el nmero de tallos est entre 5 y 20.
A veces, de acuerdo con la informacin que se tenga, pueden resultar muy
pocos tallos, con lo cual las ramas quedan muy concentradas, y realmente no
se obtiene mucha informacin. En estos casos, puede ser conveniente partir
los tallos en dos: Un tallo inferior (que tenga, por ejemplo, las hojas menores
que 5), y un tallo superior (que tenga las hojas mayores o iguales a cinco).

As, por ejemplo, el tallo 6 puede dividirse en 6I, para los valores entre 60 y
64, y el tallo 6S, para los valores entre 65 y 69.

Cuando se parten los tallos en dos, todos los tallos deben partirse en dos.
Solamente el primero y el ltimo tallo podran dejarse sin partir, en caso de
que en el primer tallo slo haya informacin para el tallo superior, y cuando
para el ltimo tallo slo haya informacin para el tallo inferior.
Prof. Leonardo Simmons Estadsticas I -02
27
TAREA No. 2





1. Resolver del libro Estadstica para Administracin y Economa Anderson 8va.
Edicin , capitulo 2, los ejercicios del 1 al 10 (pag. 28 al 30)
2. Resolver del libro Estadstica para Administracin y Economa Anderson 8va.
Edicin , capitulo 2, los ejercicios del 11 al 21 (pag. 36 al 39)
3. Resolver del libro Estadstica para Administracin y Economa Anderson 8va.
Edicin , capitulo 2, los ejercicios del 22 al 28 (pag. 42 al 43)
4. Si usted trabaja identifique al una variable cuantitativa importante que
corresponda con algn proceso administrativo en el que usted interviene, p.ej:
ventas, inventario, personal, etc. Recolecte una muestra de al menos 50
observaciones de dicha variable y construya una DFDA y sus respectivas grficas.
Saque algunas conclusiones