Вы находитесь на странице: 1из 41

1

2. Distribucin de frecuencias
Ordenamiento de datos cuando en un estudio
estadstico se recopila una gran cantidad de ellos .
Existen dos tipos de distribucin de frecuencias, con
datos no agrupados y con datos agrupados.
2.1 Distribucin en datos NO agrupados
Se utiliza preferentemente cuando las opciones de la
variable son pocas .
Ejemplo:
Al lanzar un dado 10 veces, se obtuvo la siguiente informacin:
1 6 4 3 1 2 6 5 1 3
Frecuencia: Corresponde a la cantidad de veces
que se encuentra un dato en una muestra.
Rango: 6 1 =5
Rango: Es la diferencia entre el dato mayor y el menor.
1 6 4 3 1 2 6 5 1 3
Al construir la tabla de frecuencias, se obtiene:
Nmero Frecuencia
1 3
2 1
3 2
4 1
5 1
6 2
Al sumar la columna
frecuencia, se obtiene el total
de datos (n).
Total datos: 10.
2.2 Distribucin en datos agrupados
Se utiliza cuando la variable ofrece una gran gama de
posibilidades, si es cuantitativa continua, debemos agrupar los
datos en intervalos semiabiertos, excepto el ltimo, que es
cerrado.
Al agrupar los datos en intervalos, se debe calcular la
marca de clase.

Peso (Kg.) Frecuencia Marca de
clase
[55,59[ 2 57
[59,63[ 5 61
[63,67[ 3 65
[67,71[ 7 69
[71,75] 4 73
Ejemplo:
Corresponde al promedio entre los
extremos del intervalo.
R
NC
A=
A: Amplitud=Longitud del Intervalo
R: Rango
NC: Nmero de Clases
EJEMPLO 1:
En un estudio en particular estaban
interesados en evaluar el nmero de
frutos por planta de zapallo. Se consider
solo las plantas de una parcela; para cada
planta se cont la cantidad de frutos que
tenan. Los datos se presentan en forma
aleatoria a continuacin :

1 5 7 4 1 2 5 4
6 2 7 5 7 6 3 2
5 4 3 6 6 3 4 4
1 4 3 5 4 4

La variable en estudio es:
La muestra:
La unidad experimental:
N=30

3

7

4

6

5

5

8

4

4

3

3

2

3

1

f
i

x
i

frecuencia
variable
Hay 3
zapallos
con 2
frutos
Hay 4
zapallos
con 6
frutos


100

1

N=30

100

10

1

1/10
30
3

7

90

13.33
97/10
2/15
27
4

6

76.67

16.67
23/30
1/6

23
5

5

60

26.67
3/5
4/15
18
8

4

33.3

13.33
1/3
2/15

10
4

3

20

10
1/5
1/10
6

3

2

10

10

1/10
3

1/10

3

1

Fr%

fr%
Fr

fr
F

fi

xi

FRECUENCIA
RELATIVA
FRECUENCIA
ACUMULADA
FRECUENCIA
ACUMULADA
RELATIVA
FRECUENCI
A REALTIVA
PORCENTUA
L
FRECUENCIA ACUMULADA
RELATIVA PORCENTUAL
Cantidad de zapallos por planta
0
1
2
3
4
5
6
7
8
9
1 2 3 4 5 6 7
cantidad de zapallos
c
a
n
t
i
d
a
d

d
e

p
l
a
n
t
a
s
Fuente: Datos brindados por la ctedra

Elemplo 2:
Siguiendo con el estudio del zapallo japons
ahora estamos interesados en evaluar el peso de
los zapallos para eso registramos su peso en
kilogramos. Tom una muestra de 30 zapallos



Variable: peso tipo cuantitativa continua
Muestra 30 zapallos

1.20 1.20 1.20 1.30 1.30 1.30
1.60 1.60 1.60 1.60 1.60 1.60
1.40 1.50 1.50 1.50 1.50 1.50
1.70 1.70 1.70 1.70 1.80 1.80
1.60 1.90 1.80 1.80 2.00 1.90
R= x
M -
x
m
=

R= X
M
- x
m
= 2.00-1.20=0.80

DATOS:
1 PASO: CALCULAR EL RANGO DE LOS DATOS. QUE ES LA DIFERENCIA
ENTRE EL MAXIMO VALOR Y EL MINIMO
Frmula para calcular la cantidad de intervalos


5 log N= N de intervalos

1+3.3*logN= N de intervalos

5 *log 30=7.38 ~ 7

1+3.3*log 30=5.67 ~ 6

2PASO: CALCULAR LA CANTIDAD DE INTERVALOS
0.80/6=0.1333~ 0.15

La amplitud del intervalo es 0.15
3 PASO: CALCULAR LA AMPLITUD DEL INTERVALO

AMPLITUD= RANGO/N DE INTERVALOS

1.93 (1.85-2.00]
1.78 (1.70-1.85]
1.63 (1.55-1.70]
1.48 (1.40-1.55]
1.33 (1.25-1.40]
1.18 (1.10-1.25]
x
i

Clase

MARCA DE
CLASE
SI COMENZAMOS CON 1.10
Clase

xi fi fr Fi Fr fr% Fr%
1
(1.10-1.25]
1.18
2
(1.25-1.40]
1.33
3
(1.40-1.55]
1.48
4
(1.55-1.70]
1.63
5
(1.70-1.85]
1.78
6
(1.85-2.00]
1.93



1.20 1.20 1.20 1.30 1.30 1.30 1.40
1.50 1.50 1.50 1.50 1.50 1.60 1.60
1.60 1.60 1.60 1.60 1.60 1.70 1.70
1.70 1.70 1.80 1.80 1.80 1.80 1.90
1.90 2.00
Clase

xi fi Fr Fi Fr fr% Fr%
1
(1.10-1.25]
1.18 3 0.10 3 0.10 10 10
2
(1.25-1.40]
1.33 4 0.13 7 0.23 13 23
3
(1.40-1.55]
1.48 5 0.17 12 0.40 17 40
4
(1.55-1.70]
1.63 11 0.37 23 0.77 37 77
5
(1.70-1.85]
1.78 4 0.13 27 0.90 13 90
6
(1.85-2.00]
1.93 3 0.10 30 1.00 10 100
Cantidad de zapallos segn peso
0
2
4
6
8
10
12
0.03 1.18 1.33 1.48 1.63 1.78 1.93 2.08
peso
c
a
n
t
i
d
a
d

d
e

z
a
p
a
l
l
o
s

3
HISTOGRAMA
Fuente: Datos brindados por la ctedra
Cantidad de zapallos segn peso
0
2
4
6
8
10
12
0.03 1.18 1.33 1.48 1.63 1.78 1.93 2.08
peso
c
a
n
t
i
d
a
d

d
e

z
a
p
a
l
l
o
s
POLIGONO DE FRECUENCIAS
Fuente: Datos brindados por la ctedra
Ojiva o poligono de frecuencias acumuladas
0
3
6
9
12
15
18
21
24
27
30
33
1.1 1.25 1.4 1.55 1.7 1.85 2
cantidad de zapallos
p
e
s
o
Fuente: Datos brindados por la ctedra
22
Estadstica
Tema: Tablas de Frecuencias
Problema: En un curso de 32 alumnos, se le asignar a cada uno
de ellos el tema de examen final en una determinada asignatura.
Para esto cada alumno saca una bolita de una urna que contiene
cuatro bolitas numeradas del 1 al 4. Conforme el valor de la bolita
se asigna el tema de acuerdo a la siguiente codificacin: bolita 1
tema respiratorio; bolita 2 tema neurologa; bolita 3 tema
salud ocupacional; bolita 4 tema traumatologa.
Una vez realizada cada extraccin se contabilizan los datos en una
planilla Excel, y se tiene inters en calcular la frecuencia para
cada uno de los cuatro temas de examen.
Caso: Datos nominales (o atributos)
23
Nmina de alumnos Bolita Examen
IGOR ALEXANDER ALBORNOZ SALGADO 3 Salud Ocupacional
JULIO ANDRS CABALLERO MUNIZAGA 3 Salud Ocupacional
MARCELO LEONARDO TAPIA SANTANDER 2 Neurologa
MARCELO ALEJANDRO FLORES LUCERO 1 Respiratorio
FELIPE EDMUNDO ELLIES UGARTE 3 Salud Ocupacional
ANDRS ALEXIS NGEL GMEZ 1 Respiratorio
SANDRA LORETO MIRANDA CANDIA 2 Neurologa
CAROLINA SOLEDAD MIRANDA SILVA 1 Respiratorio
KAREM VICTORIA GALLARDO MORALES 2 Neurologa
CAROLINA ANGLICA ORTIZ URRUTIA 3 Salud Ocupacional
CAROLINA ANDREA ARAYA TORO 4 Traumatologa
ANDREA ALEJANDRA PASTN ZAMORANO 1 Respiratorio
MORN LANG TAPIA 3 Salud Ocupacional
ELENA LUCILA PLAZA LVAREZ 2 Neurologa
MARA PAZ ELGUETA MUOZ 2 Neurologa
SONIA CAROLINA SEGOVIA RAMREZ 1 Respiratorio
CLAUDIO ANDRS SILVA ORELLANA 2 Neurologa
VICTOR NGEL OLIVARES CERDA 3 Salud Ocupacional
PATRICIO IVN CUSO BORDONES 4 Traumatologa
ALFREDO JAVIER GARY BUFADEL 3 Salud Ocupacional
LUIS ALBERTO FLORES SOTO 1 Respiratorio
MARA JOS OSSES LVAREZ 1 Respiratorio
VELIN SILVIA CCERES PREZ 4 Traumatologa
CAROLINA ANDREA ROJAS MARTNEZ 3 Salud Ocupacional
DIEGO ALONSO HERREROS JERALDO 1 Respiratorio
FELIPE VEGA OATE 3 Salud Ocupacional
MAURICIO LUIS LOYOLA BARRAZA 3 Salud Ocupacional
RAUL FERNANDO BENTEZ ALFARO 4 Traumatologa
FABIOLA ANDREA BERMDEZ YNEZ 4 Traumatologa
JUAN TIRADO TIRADO 1 Respiratorio
CARLOS CARRASCO 3 Salud Ocupacional
CRISTIAN MORGADO ZUMARAN 4 Traumatologa
Tema: Tablas de Frecuencias Estadstica
24
Estadstica
Tema: Tablas de Frecuencias
Ahora vamos a contar. Qu queremos contar?
Queremos saber cuntas personas tienen que dar el
examen de Respiracin, cuntas deben dar el examen
de Neurologa, y de Salud Ocupacional y
Traumatologa. De otra forma queremos saber la
frecuencia de los alumnos ubicados en los diferentes
exmenes.
En rigor, vamos a calcular cuntas veces han
aparecido las bolitas numeradas con 1, 2, 3 y 4 de las
32 extracciones realizadas en la urna.

25
Estadstica
Tema: Tablas de Frecuencias
Debe aparecer el siguiente resultado:
frecuencia
26
Estadstica
Tema: Tablas de Frecuencias
Problema: Se realizara una sencilla comprobacin de calidad en
la fabricacin de un determinado tipo de focos. Para esto se
seleccionan 20 cajas, donde cada caja contiene 15 focos. Para cada
una de las cajas se prueban los focos y se cuenta el nmero de
focos que estn quemados (fallados).
Caso: Datos cuantitativos discretos
Las cajas se numeran del 1 al 20, de modo que X(i) representar el
nmero de focos quemados de la i-sima caja. Una vez realizado el
control de calidad se obtuvieron los siguientes datos:
X(1)=3; X(2)=2, X(3)=1; X(4)=0; X(5)=3;
X(6)=2; X(7)=1; X(8)=1; X(9)=3; X(10)=3;
X(11)=2; X(12)=4; X(13)=2; X(14)=2; X(15)=0;
X(16)=3; X(17)=1; X(18)=3; X(19)=4, X(20)=2
27
Estadstica
Tema: Tablas de Frecuencias
Lo que interesa en este control de calidad es el nmero de
bombillas quemadas por caja, y estos valores se puede ver por
simple inspeccin son {0, 1, 2, 3, 4}
Caso: Datos cuantitativos discretos
Ahora bien, contaremos el nmero de veces (frecuencia) en que se
repite cada uno de los datos anteriores, de otra forma, y a manera de
ejemplo, la frecuencia del nmero 2 denotar el nmero de cajas que
contienen 2 focos quemados.
Para este conteo vamos a realizar una particular tabla que
llamaremos tabla de frecuencia. Esta tabla se genera mediante
dos columnas esenciales. La primera, donde se ubican los valores
{0, 1, 2, 3, 4}; y en la segunda columna ubicamos las frecuencias
respectivas (lo hacemos en una planilla Excel)
28
Estadstica
Tema: Tablas de Frecuencias
Caso: Datos cuantitativos discretos
Las tres columnas restantes las explicamos a continuacin
29
Estadstica
Tema: Tablas de Frecuencias
Caso: Datos cuantitativos discretos
A veces llamada frecuencia
absoluta
Suma de las
frecuencias
Frecuencia / Total
Suma parcial de las
frecuencias
Suma parcial
de las
frecuencias
relativas
Este valor
siempre es 1
La suma debe
ser 1
1
+
+
30
Estadstica
Tema: Tablas de Frecuencias
Caso: Datos cuantitativos discretos
Podemos concluir, entre otras cosas, lo siguiente:
18 cajas tienen a lo ms 3
focos quemados
El 10% de las cajas tiene
exactamente 4 focos malos
El 30% de las cajas tiene a lo
ms 1 foco quemado
31
Estadstica
Tema: Tablas de Frecuencias
Caso: Datos cuantitativos continuos
Supongamos que tenemos las siguientes observaciones:
1 2
, , , ,...,
i n
x x x x
Definimos
{ }
{ }
min 1 2
max 1 2
, , , ,...,
, , , ,...,
i n
i n
x x x x x
x x x x x
=
=
Hacemos
max min
R x x =
Que llamaremos rango o recorrido de las observaciones
32
Estadstica
Tema: Tablas de Frecuencias
Caso: Datos cuantitativos continuos
Esquemticamente tenemos la situacin siguiente
Y queremos formar k intervalos no traslapados de la forma:
min
x
max
x
4
x
n
x
i
x
1
x
min
x
max
x
4
x
n
x
i
x
1
x
1
C
2
C
k
C
Rango
33
Estadstica
Tema: Tablas de Frecuencias
Caso: Datos cuantitativos continuos
Por operatividad en el manejo de los datos se acostumbra que el
nmero de intervalos de clase flucte entre 5 y 20 intervalos.
Con esta convencin se deduce que la mxima amplitud de cada intervalo
es de R/5, y la mnima amplitud de R/20
Los intervalos de clase estarn definidos si definimos la amplitud
(longitud) para cada intervalo, que supondremos constante para cada
intervalo, de manera que recubra todo el rango. Luego la amplitud A
de cada intervalo de clase ser una fraccin adecuada de R
min
x
max
x
4
x
n
x
i
x
1
x
1
C
2
C
j
C
k
C
34
Probabilidad y Estadstica
Tema: Tablas de Frecuencias
Luego iterativamente
los intervalos se
forman como:
Por lo general, vamos a trabajar con 8 intervalos de clases, de modo que
definimos la longitud para cada intervalo como
8
R
A =
| |
1 min min
2 min min
min min
min min
,
( , 2 ]
( ( 1) , ]
( ( 1), ]
j
k
C x x A
C x A x A
C x j A x jA
C x k x kA
= +
= + +
= + +
= + +

35
Estadstica
Tema: Tablas de Frecuencias
La tabla de frecuencia para datos continuos es de la siguiente forma
Clases
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia absoluta
acumulada
Frecuencia relativa
acumulada
1
C
1
n
n
n
f
1
1
=
1 1
n N
=
1 1
f F
=
2
C
2
n
n
n
f
2
2
=
2 1 2
n n N
+ =
2 1 2
f f F
+ =
M M M M M
j
C
j
n
n
n
f
j
j
=
=
=
j
i
i j
n N
1

=
=
j
i
i j
f F
1
M M M M M
k
C
k
n
n
n
f
k
k
= n N
k
=
1
=
k
F
n 1
36
Estadstica
Tema: Tablas de Frecuencias
Definicin de los valores
Clases
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia absoluta
acumulada
Frecuencia relativa
acumulada
1
C
1
n
n
n
f
1
1
=
1 1
n N
=
1 1
f F
=
2
C
2
n
n
n
f
2
2
=
2 1 2
n n N
+ =
2 1 2
f f F
+ =
M M M M M
j
C
j
n
n
n
f
j
j
=
=
=
j
i
i j
n N
1

=
=
j
i
i j
f F
1
M M M M M
k
C
k
n
n
n
f
k
k
= n N
k
=
1
=
k
F
n
1
N de observaciones
en el intervalo
Total de observaciones
Frecuencia de la
clase/total
Suma de las frecuencias hasta el j-simo
intervalo de clase
Suma de las frecuencias
relativas hasta el j-simo
intervalo de clase
Intervalo de
clase
37
Probabilidad y Estadstica
Tema: Tablas de Frecuencias
Ejemplo de construccin de tabla de frecuencia para el caso continuo
Se tienen los siguientes valores en una planilla Excel (estaturas y pesos de
hombres, 220 datos; y mujeres, 91 datos)
E7
E226
campo
peso
hombres
38
Probabilidad y Estadstica
Tema: Tablas de Frecuencias
Construiremos una tabla de frecuencia para el peso de los hombres. El
primer paso es definir el rango y la amplitud de clase.
Columna M
Fila 7
39
Probabilidad y Estadstica
Tema: Tablas de Frecuencias
Construimos las clases definiendo los lmites inferior y superior de cada
intervalo.
R= max-min
A = R/8

Desde este
punto se
arrastra el
mouse
hasta
completar
8 casillas
mnimo
mnimo + amplitud
luego ...
40
Probabilidad y Estadstica
Tema: Tablas de Frecuencias
Las frecuencias absolutas se construyen de la siguiente manera:
41
Probabilidad y Estadstica
Tema: Tablas de Frecuencias
El resto de las columnas se obtiene de manera sencilla
16
15
14
13
12
11
10
9
8
T S R Q P O

Вам также может понравиться