Вы находитесь на странице: 1из 39

DISTRIBUCION

DE FRECUENCIAS

ING. CAROL FABIAN CORONEL


DESPUES DE LA RECOPILACION DE LOS DATOS,
ES NECESARIO,CLASIFICARLOS, RESUMIRLOS Y
PRESENTARLOS EN FORMA TAL, QUE FACILITEN
SU COMPRENSION Y SU POSTERIOR ANALISIS Y
UTILIZACION. PARA ELLO SE ORDENAN EN UNA
TABLA DE DISTRIBUCION DE FRECUENCIAS Y
LUEGO SE PRESENTARAN EN GRAFICOS.
TABLA DE DISTRIBUCION
DE FRECUENCIAS

*PRESENTAN LA DISTRIBUCION DE UN CONJUNTO DE DATOS


DE ACUERDO AL TIPO DE VARIABLE QUE SE TENGA. EN ELLA
SE OBSERVA LA FRECUENCIA (NUMERO DE DATOS
OBSERVADOS EN CADA CLASE O INTERVALO)DESPUES DE
REALIZAR EL PROCESO DE CONTEO O TABULACION.

UNO DE LOS USOS DE LAS TABLAS DE FRECUENCIAS ES PARA


CALCULAR ALGUNOS INDICADORES DE RESUMEN, COMO LOS
ESTADISTICOS.

EN EL PROCEDIMIENTO PARA CONSTRUIR TABLAS


DE FRECUENCIAS NOS REFERIREMOS SIEMPRE A
MUESTRAS.
TABLA DE FRECUENCIAS
PARA VARIABLES CUALITATIVAS
Ejemplo: DE UN ESTUDIO DE INVESTIGACION
REALIZADA EN FORMA ALEATORIA A 80 PERSONAS
DE 12 A 20 AÑOS SE REGISTRARON LOS PROGRAMAS
MAS VISTOS EN LA TV.LOS RESULTADOS FUERON:

PROGRAMAS Nº DE TELEVIDENTES
variable
NOTICIEROS 17

SERIES 15

18
NOVELAS frecuencias
DIBUJOS 16

CULTURALES 14

TOTAL 80
TABLA DE FRECUENCIAS PARA LA PREFERENCIA DE PROGRAMAS DE TV.
PROGRAMAS Frecuencia Absoluta (fi) Frecuencia Relativa (hi)
(número de televidentes)
NOTICIEROS 17 0.2125
SERIES 15 0.1875

NOVELAS 18 0.2250
DIBUJOS 16 0.2000
CULTURALES 14 0.1750
TOTAL n=80 1.0000
(1)La frecuencia absoluta fi, es el número de datos observados en
cada categoria o modalidad. La suma de todas las frecuencias
absolutas es igual al total de datos observados (n=80).
(2)La frecuencia relativa hi se define por hi = fi /n
La suma de todas las frecuencias relativas es igual a uno.
(3)La frecuencia relativa se convierte en % multiplicandola por 100
(4)Las frecuencias relativas son conocidas como proporciones.
CON LA INFORMACION DE LA TABLA PODEMOS
REALIZAR ALGUNAS PREGUNTAS:

1.-¿CUANTAS PERSONAS PREFIEREN VER LOS


• NOTICIEROS? RPTA. 17

2.-¿CUÁNTAS PERSONAS NO PREFIEREN VER EL


• LOS NOTICIEROS? RPTA. 63

3.-¿QUÉ PORCENTAJE DE PERSONAS PREFIEREN VER


• LAS SERIES? RPTA. 18.75%

4.-¿CUÁL ES EL PORCENTAJE DE PERSONAS QUE NO


• PREFIEREN VER LAS SERIES? RPTA. 81.25%
GRAFICOS PARA VARIABLES CUALITATIVAS

LA INFORMACION OBTENIDA EN LA TABLA DE


FRECUENCIAS PUEDE SER MOSTRADA EN
GRAFICOS ADECUADOS.

DIAGRAMAS DE BARRAS

20
FRECUENCIA ABSOLUTA

15

10

0
NOTICIEROS SERIES NOVELAS DIBUJOS CULTURALES

PROGRAMAS
DIAGRAMA CIRCULAR O TIPO PASTEL

CULTURAL
NOTICIEROS
18% 21%

DIBUJOS
SERIES
20%
19%
NOVELAS
22%

LOS SECTORES CIRCULARES


QUE COMPRENDEN LA GRAFICA
CIRCULAR TIENEN ANGULO
CENTRAL DADO POR:

hi x 360º
TABLA DE FRECUENCIAS SIMPLES

PARA VARIABLES CUANTITATIVAS


DISCRETAS

•SE EMPLEAN PARA DATOS CUANTITATIVOS


DISCRETOS(VALORES ENTEROS).

• CUANDO SOLAMENTE SE PRESENTAN POCOS


DATOS DISTINTOS.
Ejemplo: SE HA REALIZADO UNA ENCUESTA A 20
FAMILIAS PARA SABER EL NUMERO DE HIJOS QUE
TIENEN , Y SE HA OBTENIDO EL SIGUIENTE
RESULTADO:

3 7 7 6 7 4 5 1 4 5
5 9 4 2 4 6 7 4 7 6

CONSTRUYA UNA TABLA DE DISTRIBUCION


DE FRECUENCIAS.
TABLA DE FRECUENCIAS PARA EL NUMERO DE HIJOS POR FAMILIA
NºDE TARJAS O CONTEO fi hi
HIJOS (NUMERO DE FAMILIAS)
1 / 1 0.05
2 / 1 0.05
3 / 1 0.05
4 //// 5 0.25
5 /// 3 0.15
6 /// 3 0.15
7 //// 5 0.25
8 0 0.00
9 / 1 0.05
TOTAL n = 20 1.00
GRAFICO DE LINEAS O BASTONES PARA
VARIABLES CUANTITATIVAS DISCRETAS
Frecuencia absoluta

6
5
No de familias

4
3
2
1
0
1 2 3 4 5 6 7 8 9
No de hijos
Frecuencias relativas

30
25
% de familias

20
15
10
5
0
1 2 3 4 5 6 7 8 9
No de hijos
TABLA DE FRECUENCIAS POR
INTERVALOS
VARIABLES CUANTITATIVAS CONTINUAS
Y TAMBIEN DISCRETAS

LA DISTRIBUCION DE FRECUENCIAS POR CLASE O


INTERVALOS SE USA CUANDO LA VARIABLE
ESTADISTICA ES CUANTITATIVA CONTINUA O
CUANDO EL NUMERO DE VALORES DISTINTOS DE
UNA VARIABLE DISCRETA ES MUY GRANDE
(GENERALMENTE MAS DE 20).
ESTRUCTURA DE UNA TABLA DE FRECUENCIAS
POR INTERVALOS
“VARIABLE”

[Li , Ls > Xi fi hi Fi Hi

k
Total n  f i
i 1

Donde: [Li , Ls> : Intervalos o Clases Li : Limite Inferior


Xi : Marca de clase Ls : Limite Supeior
fi : frecuencia absoluta
hi : frecuencia relativa
Fi : Frecuencia absoluta acumulada
Hi : Frecuencia relativa acumulada
CARACTERISTICAS

1.- LA FRECUENCIA ABSOLUTA (fi) INDICA LA


CANTIDAD DE OBSERVACIONES QUE HAY
EN EL i-ESIMO INTERVALO.

2.- LA FRECUENCIA RELATIVA (hi) INDICA LA


FRACCION DE LAS OBSERVACIONES QUE
ESTAN EN EL i-ESIMO INTERVALO: hi= fi /n

3.- F1= f1 H1= h1


F2= f1+ f2 H2= h1+ h2
Fk= f1+ f2+...+ fk Hk= h1+ h2+...+ hk
4.- EN TODA TABLA DE DISTRIBUCION DE
FRECUENCIAS POR INTERVALOS:
k

h Fk  n
k

i 1
fi  n
i 1
i 1

5.- LA MARCA DE CLASE ES LA SEMISUMA DE


LOS LIMITES DE CLASE
L L
X  i
i s

2
6.- EL ANCHO DE CLASE “C” REPRESENTA LA
LONGITUD DEL INTERVALO: C = Ls – Li
GENERALMENTE ES CONSTANTE.

7.- CUANDO EL ANCHO DE CLASE ES CONSTANTE


ENTONCES LA DISTANCIA ENTRE LAS MARCAS
DE CLASE ES CONSTANTE E IGUAL A “C”.
PROCEDIMIENTO PARA LA CONSTRUCION DE
TABLAS DE FRECUENCIAS POR INTERVALOS

1) CALCULAR EL RANGO: R = Xmáx – Xmin

2) HALLAR EL NUMERO DE INTERVALOS “K”,MEDIANTE


LA FORMULA DE “STURGES”: K = 1+3.3 Log(n)
DONDE “n” ES EL NUMERO DE DATOS, Y “K” SE
REDONDEA A UN VALOR ENTERO (REDONDEO SIMPLE)
EJMS: si K=6.28 SE REDONDEA A 6
si K=6.5 SE REDONDEA A 7

3) DETERMINAR EL ANCHO DE CLASE:


C = R /K
DONDE C SE REDONDEA POR EXCESO, DE ACUERDO
AL NUMERO DE DECIMALES QUE TIENEN LOS DATOS.
El valor de C dependerá de la cantidad de lugares decimales de los datos
originales, que serán agrupados en la tabla de frecuencias:

Ejemplo de dato Ejemplo de Se


original valor de C redondea
calculado a:
15 (dato entero) 5.75 6
3.2 (dato con 1 decimal) 2.33782129 2.4
11.13 (dato con 2 decimales) 3.24920976 3.25
5.391 (dato con 3 decimales) 1.42135709 1.422
99.3489 (con 4 decimales) 9.2876405 9.2877
EJEMPLO 1. SI LA VARIABLE CUANTITATIVA ES DISCRETA
Se ha aplicado una encuesta a 40 centros educativos con el fin de
observar el número de niños que estudian en ellos, obteniendose:

42 58 79 86 98 120 134 120 59 62

85 89 76 110 104 78 84 96 90 75

120 130 122 95 82 94 108 79 105 115

102 80 56 78 84 66 69 78 84 98

construya una tabla de frecuencias adecuada.


PROCEDIMIENTO:

Rango: R= 134 - 42 = 92

Número de intervalos: K = 1 + 3.3 log 40 = 6,29


(fórmula de Sturges) redondeo simple a 6

Ancho de clase: C =92 / 6 = 15,33


redondeamos por exceso de decimales
a 16
Número de niños (variable) Centros educativos

Intervalos Tarjas Xi fi hi Fi Hi
o conteo
[42-58> 50 2 0.050 2 0.050

[58-74> 66 5 0.125 7 0.175

[74-90> 82 15 0.375 22 0.550

[90-106> 98 9 0.225 31 0.775

[106-122> 114 6 0.150 37 0.925

[122-138> 130 3 0.075 40 1.000

TOTAL n=40 1.000


EJEMPLO 2: SI LA VARIABLE CUANTITATIVA
ES CONTINUA.

En un comercio, se dispone de los datos de la venta semanal


(en miles de soles) para las últimas 30 semanas.
Construya una tabla de distribución de frecuencias.

14,6 12,8 13,9 15,3 14,2 15,6 14,2 13,4 13,8 14,5

15,2 14,4 12,9 12,4 13 15,5 15,6 15,8 15,7 15,8

13,9 14,2 14,9 13,1 12,2 14,1 15,1 15,7 13,4 13,2
PROCEDIMIENTO:

1. R= Xmax – X min = 15,8 – 12,2 = 3,6

2. Hallar K mediante Sturges:

K= 1 + 3,3 log (30) = 5,8745 aprox. 6 (redondeo simple)

3. Determinar el ancho de clase C:

C= 3,6 / 6 =0,6 (no se redondea, porque ya tiene un decimal


como los datos)
Venta miles de soles (variable) Número de semanas

Intervalos Tarjas Xi fi hi
Fi Hi
o conteo
[12,2-12,8> // 12,5 2 0,0667 2 0,0667

[12,8-13,4> ///// 13,1 5 0,1667 7 0,2334

[13,4-14,0> ///// 13,7 5 0,1667 12 0,4000

[14,0-14,6> ////// 14,3 6 0,2000 18 0,6000

[14,6-15,2> /// 14,9 3 0,1000 21 0,7000

[15,2-15,8> ////// /// 15,5 9 0,3000 30 1,0000

TOTAL n=30 1.0000


INTERPRETACIONES UTILIZANDO LA TABLA
DE FRECUENCIAS
1.- ¿Cuántas semanas tienen ventas entre 14,0 y 14,6 miles de soles?
Rpta. f4 = 6 semanas.

2.- ¿Cuál es la proporción o el porcentaje del número de semanas


cuyas ventas se encuentran entre 12,8 y 13,4 miles de soles?
Rpta. h2 = 0,1667 ó h2 = 16,67%

3.- ¿Cuántas semanas tienen ventas menores a 14,6 miles de soles?


Rpta. F4 = 18 semanas

4.- ¿Cuál es la proporción o el porcentaje del número de semanas


cuyas ventas son menores a 15,2 miles de soles?
Rpta. H5 = 0,70 ó H5 = 70%
LAS GRAFICAS EN UNA TABLA
DE FRECUENCIAS
Histograma de Frecuencias Absolutas
9
8
7
Frequencia Absoluta

6
5
4
3
2
1
0
12.2 12.8 13.4 14.0 14.6 15.2 15.8
Ventas
Histograma de Frecuencias Relativas (%)
30

25
Frequencia Relativa %

20

15

10

0
12.2 12.8 13.4 14.0 14.6 15.2 15.8
Ventas
Poligono de Frecuencias Absolutas
9
8
7
numero de semanas

6
5
4
3
2
1
0
12.5 13.1 13.7 14.3 14.9 15.5
Ventas
Polígono de frecuencias absolutas

10
Num. de semanas

8
6
4
2
0
12.5 13.1 13.7 14.3 14.9 15.5
ventas
Observación
•Los polígonos de frecuencia son especialmente
útiles para comparar las distribuciones de dos
grupos de datos diferentes, para ello es
conveniente trabajar en un mismo gráfico y
empleando los mismos intervalos.
•Importante: Si la cantidad de datos es muy
diferente en ambos grupos es preferible trabajar
con polígonos de frecuencia relativa.
OJIVA
UNA OJIVA ES LA REPRESENTACION GRAFICA DE
UNA DISTRIBUCION DE FRECUENCIAS ABSOLUTAS
ACUMULADAS O LAS FRECUENCIAS RELATIVAS
ACUMULADAS.

OJIVA “MENOR QUE” O ASCENDENTE

ES LA REPRESENTACION GRAFICA DE UNA


DISTRIBUCION DE FRECUENCIAS ABSOLUTAS
ACUMULADAS “MENOR QUE” O LAS FRECUENCIAS
RELATIVAS ACUMULADAS “MENOR QUE”.
DEL EJEMPLO1:
Fi

40 *

MENOR Fi Hi OJIVA MENOR QUE


QUE 37 *

42 0 0
58 2 0.05 31 *

74 7 0.174 22 *

90 22 0.550
7 *
106 31 0.775
122 37 0.925 2 *

138 40 1.000 *

0 42 58 74 90 106 122 138


DIAGRAMAS DE TALLOS Y HOJAS
ES UNA TECNICA QUE SE USA PARA ORGANIZAR
LOS DATOS COMO PRIMER PASO EN UN ANALISIS
EXPLORATORIO DE DATOS.

OBJETIVOS:

REPRESENTACION VISUAL DE LA INFORMACION.

DESCRIBIR UN PATRON DE COMPORTAMIENTO


DE LOS DATOS, ES DECIR QUE DISTRIBUCION
PUEDEN SEGUIR LOS DATOS.

IDENTIFICAR SI HAY VALORES EXTREMOS O


DATOS ANORMALES O VALORES ATIPICOS.
PROCEDIMIENTO:

ORDENAR LOS DATOS DE LA VARIABLE EN


FORMA CRECIENTE.

TOMAR COMO TALLO LA PRIMERA O LAS DOS


PRIMERAS CIFRAS DEL DATO Y COMO HOJA
LA ULTIMA CIFRA. A CONTINUACION SEPARADOS
POR UNA LINEA VERTICAL SE COLOCAN LOS
TALLOS A LA IZQUIERDA Y LAS HOJAS A LA
DERECHA DEL TALLO CORRESPONDIENTE.
DE ESTA FORMA CADA TALLO SE REPRESENTA
UNA SOLA VEZ Y DEFINE UNA CLASE Y EL
NUMERO DE HOJAS REPRESENTA LA FRECUENCIA
DE LA CADA CLASE.
EJEMPLOS:
. PARA DATOS CON DOS CIFRAS, ESCRIBIR A LA
IZQUIERDA DE LA LINEA LA CIFRA DE LAS
DECENAS, QUE FORMAN EL TALLO, Y A LA
DERECHA LAS UNIDADES QUE SERAN LAS HOJAS.
POR EJEMPLO ESCRIBIR 85:
TALLO HOJA

8 5

ESCRIBIR 329 COMO TALLO Y HOJA


TALLO HOJA

32 9
Para los siguientes datos, construya un diagrama tallos y hojas:
12, 15,18, 22,24, 26, 27, 31, 33, 33,35, 36, 42, 42, 45, 46, 50, 51, 53
LEAF UNIT = 1.0 ES LA UNIDAD DE HOJA,DICE DONDE
PONER EL PUNTO DECIMAL, EN EL
TALLO HOJAS EJEMPLO LEAF UNIT=1.0 ASI LA
PRIMERA OBSERVACION ES 12 ,SI LEAF
3 1 258 UNIT FUERA 0.10 SERIA 1.2, SI LEAF UNIT
FUERA 10 ENTONCES EL VALOR SERIA
120.
7 2 2467

(5) 3 13356 CENTRO DE LA DISTRIBUCION

7 4 2256 ¡OBSERVE QUE SE PARECE A UN


HISTOGRAMA VOLTEADO!
3 5 013

Вам также может понравиться