Вы находитесь на странице: 1из 60

Probabilidad y Estadística

1
Presentación de datos
1. Descripción en Tablas

Distribución de Frecuencias

Frecuencias Relativas

2. Descripción en gráficos

Histogramas

Gráficos de Barra 2
Presentación de datos
• ¿Para qué se construyen las tablas de
frecuencias ?
1. Ordenar
2. Agrupar Datos
3. Resumir

3
Presentación de datos
Ordenando la Información:
• Datos muy numerosos generalmente se
agrupan en clases o categorías.
• Se establece la frecuencia determinando
cuántos datos pertenecen a cada clase o
valor de la variable.
• Se construye la tabla de datos llamada
tabla de frecuencias.
4
Presentación de datos
• El formato general de una tabla
estadística , llamada también Tabla de
Frecuencias o Tabla de Distribución de
Frecuencias es la siguiente:
Nombre de la
Frecuencia
Variable
Recorrido de la Frecuencia
variable observada
Total N

5
Presentación de datos

Absolutas, ni
xi ni Ni fi Fi
Absolutas
x1 n1 N1 f1 F1 acumuladas, Ni
... ... ... ... ...
xi ni Ni fi Fi Relativas
... ... ... ... ... fi = ni / n
xk nk Nk fk Fk
n 1 Relativas
acumuladas
Fi = Ni / n
6
Presentación de datos
TIPOS DE FRECUENCIAS

a) Frecuencia o Frecuencia Absoluta: Es el número


de veces que se presenta un valor o categoría de
una variable. Se representa por fi.

b) Frecuencia Relativa: La frecuencia relativa se


puede expresar en términos de porcentaje o de
proporción y se representa por fr. (Es la razón entre
la frecuencia absoluta y el total de datos)
7
Presentación de datos
Veamos un ejemplo de la tabla de distribución de
frecuencias para una variable discreta:

En 13 cajones de huevos se contó la cantidad de


huevos desechables por cajón:
xi fi Fi fr = f i fri% Fr= F Fr %
n
n
1 2 2 0,1538 15,38 0,1538 15,38
2 4 6 0,3077 30,77 0,4615 46,15
3 1 7 0,0769 7,69 0,5385 53,85
4 3 10 0,2308 23,08 0,7692 76,92
5 2 12 0,1538 15,38 0,9231 92,30
6 1 13 0,0769 7,69 1,0000 100,00
Totales 13 1,000 100,00

8
Presentación de datos
Otro ejemplo:
• Se quiere conocer el número de hijos por
matrimonio de una ciudad. Para este
propósito, se elige una muestra
representativa de 50 matrimonios de ella.
Se obtienen los siguientes datos:
2, 2, 4, 1, 3, 5, 3, 2, 1, 6, 3, 4, 1, 2, 0, 2, 3 , 1, 7,
4, 2, 3, 0, 5, 1, 4, 3, 2, 4, 1, 5, 2, 1, 2, 4, 0, 3, 3,
2, 6, 1, 5, 4, 2, 0, 3, 2, 4, 3, 1
• El número total de datos se representa con la
letra n. En nuestro ejemplo n = 50.
9
1-9

Presentación de datos
TABLA
xi fi
• La frecuencia absoluta es el 0 4
número de veces que 1 9
aparece un valor (xi) en 2 12
los datos obtenidos.
3 10
• En nuestro ejemplo, la 4 8
frecuencia absoluta indica 5 4
el número de familias que
6 2
tienen esa cantidad de
7 1
hijos:
n 50
10
1-9

Presentación de datos
Gráficos
xi fi
0 4
1 9
2 12
3 10
4 8
5 4
6 2
7 1
n 50
11
1-9

Presentación de datos
Gráficos
xi fi
0 4
1 9
2 12
3 10
4 8
5 4
6 2
7 1
n 50
12
1-9

Presentación de datos
Gráficos
xi fi
0 4
1 9
2 12
3 10
4 8
5 4
6 2
7 1
n 50
13
1-9

Presentación de datos
FRECUENCIA ABSOLUTA
ACUMULADA ( fi ) xi fi Fi
0 4 4
• La frecuencia absoluta
acumulada indica cuántos 1 9 13
elementos de la lista de datos 2 12 25
son menores o iguales a un 3 10 35
valor dado.
4 8 43
5 4 47
• Es la suma de las frecuencias
absolutas desde la primera fila 6 2 49
hasta la fila elegida. 7 1 50

14
1-9

Presentación de datos
Frecuencia acumulada
Representación gráfica
xi fi Fi
0 4 4
1 9 13
2 12 25
3 10 35
4 8 43
5 4 47
6 2 49
7 1 50
15
1-9

Presentación de datos
Frecuencia acumulada
Representación gráfica
xi fi Fi
0 4 4
1 9 13
2 12 25
3 10 35
4 8 43
5 4 47
6 2 49
7 1 50
16
1-9

Presentación de datos
• La frecuencia relativa es el cociente entre la
frecuencia absoluta (f i) y el número total de
datos (n). En nuestro ejemplo n = 50:
xi fi Fi hi Hi
0 4 4 0,08 0,08
1 9 13 0,18 0,26
2 12 25 0,24 0,50
3 10 35 0,20 0,70
4 8 43 0,16 0,86
5 4 47 0,08 0,94
6 2 49 0,04 0,98
7 1 50 0,02 1,00
17
1-9

Frecuencia relativa ( hi )
Gráfico lineal

xi hi Hi
0 0,08 0,08
1 0,18 0,26
2 0,24 0,50
3 0,20 0,70
4 0,16 0,86
5 0,08 0,94
6 0,04 0,98
7 0,02 1,00

18
1-9

Frecuencia relativa ( hi )
Diagrama de barras
xi hi Hi
0 0,08 0,08
1 0,18 0,26
2 0,24 0,50
3 0,20 0,70
4 0,16 0,86
5 0,08 0,94
6 0,04 0,98
7 0,02 1,00

19
1-9

Frecuencia relativa acumulada (Hi)

• La frecuencia relativa acumulada es el cociente entre la


frecuencia absoluta acumulada (F i)y el número total de
datos (n). En nuestro ejemplo, n = 50:
xi fi Fi hi Hi
0 4 4 0,08 0,08
1 9 13 0,18 0,26
2 12 25 0,24 0,50
3 10 35 0,20 0,70
4 8 43 0,16 0,86
5 4 47 0,08 0,94
6 2 49 0,04 0,98
7 1 50 0,02 1,00
20
1-9

Frecuencia relativa acumulada (Hi)

Ojiva
xi hi Hi
0 0,08 0,08
1 0,18 0,26
2 0,24 0,50
3 0,20 0,70
4 0,16 0,86
5 0,08 0,94
6 0,04 0,98
7 0,02 1,00

21
1-9

Frecuencia relativa acumulada (Hi)

Diagrama de Barras
xi hi Hi
0 0,08 0,08
1 0,18 0,26
2 0,24 0,50
3 0,20 0,70
4 0,16 0,86
5 0,08 0,94
6 0,04 0,98
7 0,02 1,00

22
Presentación de datos
• Si se estudia una gran cantidad de
datos o una variable cuantitativa
continua, los valores individuales
carecen de interés.
• Por lo tanto, se los agrupa en los
llamados “intervalos de clase”.

23
Presentación de datos
Definiciones:
• Rango: Diferencia entre el máximo y el
mínimo valor de una variable.
• Marca de clase: Representante de un
intervalo, y corresponde al promedio entre los
extremos de éste.
• Tamaño de un intervalo: Es el cociente entre
el valor del rango y la cantidad de intervalos
que se desea obtener.
Se recomienda tomar como longitud de
los intervalos un valor entero que sea
mayor o igual al cociente obtenido. 24
Presentación de datos
Determinación del número de Clases
• Tomar el número de clases (m) igual al
entero más próximo a siendo n el
número de datos
• m
• Regla de Sturges: m = 1 + 3.3log(n)
En general: 5 ≤ m ≤ 20
• En lo posible, la amplitud o longitud de los
intervalos de clase deben ser de igual
amplitud: c= l/m

25
Presentación de datos
El límite inferior del primer intervalo debe ser algo
menor que el valor más pequeño de la variable, y el
límite superior del último intervalo algo mayor al dato
más grande. Esto es:
xmáx= valor extremo superior de la variable
xmín= valor extremo inferior de la variable
La diferencia entre estos dos valores nos da la “amplitud
total”
A= xmáx- xmín
Si creemos que la cantidad de intervalos conveniente es
h entonces la amplitud de los intervalos será
aproximadamente a=A/h

26
Presentación de datos
Veamos un ejemplo:
• Los resultados de un test de inteligencia hecho a 25
personas fueron : 100, 80, 92, 101, 65, 72, 121, 68, 75,
93, 101, 100, 102, 97, 89, 73, 121, 114, 113, 106, 84,
94, 83, 74 y 90.
a) Construir la tabla de frecuencias absolutas, relativas
y relativas porcentuales.
b) Obtener la tabla de frecuencias y porcentajes que
tenga intervalos de amplitud 10.
c) Obtener la tabla de frecuencias y porcentajes que
tenga intervalos de amplitud 20.
d) ¿Qué ocurre al aumentar el número de intervalos?
Justificar.
27
Presentación de datos
Valor Máximo: 121 Valor Mínimo: 65
Intervalo Marca de Frecuencia Frecuencia Frecuencia
Puntajes Clase Absoluta Relativa Relativa
Porcentual
64 – 73 68,5 4 0,16 16
74 – 83 78,5 4 0,16 16
84 – 93 88,5 5 0,20 20
94 – 103 98,5 7 0,28 28
104 – 113 108,5 2 0,08 8
114 – 123 118,5 3 0,12 12
Total 25 1.00 100
Cantidad de Intervalos Amplitud: 10
6 a=
28
Presentación de datos
Qué sucede si reducimos la cantidad de intervalos?
Frecuencia
Intervalo Marca de Frecuencia Frecuencia
Relativa
Puntajes Clase Absoluta Relativa
Porcentual
64 – 83 73,5 8 0,32 32
84 – 103 93,5 12 0,48 48
104 - 123 113,5 5 0,20 20
Total 25 1.00 100

Aumentar el número de intervalos no


permite hacer un análisis muy
detallado.
29
Presentación de datos
Ejemplo: Los datos de la tabla muestran las
estaturas de 40 alumnos. Obtener la tabla de
frecuencias relativas a estos datos:
Estatura Marca de Frecuencia Frecuencia Frecuencia
Clase Absoluta Relativa relativa
porcentual
1,50 – 1,54 3
1,55 – 1,59 6
1,60 – 1,64 9
1,65 – 1,69 10
1,70 – 1,74 7
1,75 – 1,79 5
Total 40
30
Presentación de datos
Veamos por ejemplo de variables continuas:
• X= valor de índice de Productividad de 20
establecimientos.
45,0 55,0 48,9 40,5 42,8
52,0 49,0 52,5 51,7 50,0
50,0 56,5 57,0 52,0 45,0
49,0 44,3 41,0 59,2 46,3

Vemos cuál es el valor extremo inferior:


xmín=40,5
y el extremo superior:
xmáx=59,2 31
Presentación de datos
Para obtener la amplitud del intervalo:
60  40 20
Intervalos 5 a  4
5 5
Los intervalos se construyen de tal forma que
contienen al extremo inferior pero no al
superior.
Intervalo de clase fi Fi fri Fri
40,0 - 44,0 3 3 3/20=0,15 3/20=0,15
44,0 - 48,0 4 7 4/20=0,20 7/20=0,35
48,0 - 52,0 6 13 6/20=0,30 13/20=0,65
52,0 - 56,0 4 17 4/20=0,20 17/20=0,85
56,0 - 60,0 3 20 3/20=0,15 20/20=1,00
20 1,00
32
Presentación de datos
La representación gráfica correspondiente a la
distribución de frecuencias simples o relativas de una
variable cuantitativa continua es el HISTOGRAMA
HISTOGRAMA
7
6
FRECUENCIAS

5
4
3
2
1
0
40,0 - 44,0 44,0 - 48,0 48,0 - 52,0 52,0 - 56,0 56,0 - 60,0
X 33
Presentación gráfica de datos
El gráfico tiene la ventaja sobre el cuadro de
permitir apreciar más rápidamente los datos y
abarcar todo su conjunto.
90
80
70
60
50 Este
40 Oeste

30 Norte

20
10
0
1er trim. 2do trim. 3er trim. 4to trim.
34
Presentación gráfica de datos
En estadística denominamos gráficos a aquellas
imágenes que permiten presentar información
cuantitativa.
La utilidad De los gráficos es doble:
• Sirven como sustituto a las tablas
• Constituyen por sí mismos una poderosa
herramienta para el análisis de los datos

A veces son el medio más efectivo no sólo para


describir y resumir la información, sino también
para analizarla.
35
Gráficos
S  Organizar los datos
i  Observar patrones
r
v  Observar agrupamientos
e  Observar relaciones
n
 Comparar distribuciones
p  Visualizar rápidamente la distribución
a de los datos
r
a  Visualizar, obtener y comparar medidas
estadísticas

36
Presentación gráfica de datos
La información contenida en las tablas de frecuencias
resulta más accesible y fácil de interpretar si se
representan por medio de gráficos estadísticos.
Diagrama de barras Histograma

En él se asocia a cada valor de la Está formado por rectángulos,


variable una barra, cuya longitud cuyas bases corresponden con
es igual o proporcional a su los intervalos de clase y sus
frecuencia. Áreas son iguales o
proporcionales a sus
frecuencias.

37
Presentación gráfica de datos
Polígono de frecuencias Diagrama de sectores

Es una línea poligonal que Es un gráfico formado por


une los vértices superiores un círculo dividido en
de las barras de un sectores circulares cuyas
diagrama de barras, o los amplitudes son
puntos medios de las proporcionales a las
bases superiores de los frecuencias de los datos
rectángulos de un representados.
histograma.

38
Gráficos
Pictogramas Gráfico de líneas

Los pictogramas son similares a En este tipo de gráfico se


los gráficos de barras. Emplean representan los valores de los
dibujo en una determinada datos en dos ejes cartesianos
escala. Generalmente este dibujo ortogonales entre sí.
debe cortarse para representar Se pueden usar para
los datos. Se usan para lograr el representar: una serie o más
interés masivo del público. series

39
Presentación gráfica de datos

Los puntos del gráfico


indican la cantidad de
cajas de cierto fármaco
vendidas durante los seis
primeros meses de un
año.

Cuál es la cantidad promedio de cajas vendidas


durante este periodo?
Construir la tabla de frecuencias correspondiente
40
Gráficos
Cajas
Meses
Vendidas

Enero 25 000

Febrero 15 000

Marzo 15 000

Abril 30 000

Mayo 35 000

Junio 15 000

La cantidad promedio de cajas vendidas


durante los 6 meses es de 22 500.
41
Diagrama de hoja y tallo

42
Diagrama de hoja y tallo
• Un diagrama donde cada valor
de datos es dividido en una
“hoja” (normalmente es el
último dígito) y un “tallo” (los
otros dígitos).
• Por ejemplo “32” será dividido
en “3” (tallo) y “2” (hoja).
• Los valores del “tallo” se registran en columna y los
valores “hoja” van a la derecha (o izquierda) de los
valores del tallo.
• El “tallo” es usado para agrupar los puntajes y cada “hoja”
indica los puntajes individuales dentro de cada grupo. 43
Diagrama de hoja y tallo

13 30 47 62
14 34 47 64 1* 34456
14 39 47 64
2* 001235
15 39 47 66
16 39 48 66 3* 04999
20 43 49 67
20 44 52 67 4* 344457777789
21 44 53 67
22 44 53 67 5* 23434
23 45 54
6* 244667777
25 47 54

44
Diagrama de hoja y tallo
• Tallo Hoja Frecuencia
• 7 6 1
• 8 7 1
• 9 7 1
• 10 5 1 2
• 11 5 8 0 3
• 12 1 0 3 3
• 13 4 1 3 5 3 5 6
• 14 2 9 5 8 3 1 6 9 8
• 15 4 7 1 3 4 0 8 8 6 8 0 8 12
• 16 3 0 7 3 0 5 0 8 7 9 10
• 17 8 5 4 4 1 6 2 1 0 6 10
• 18 0 3 6 1 4 1 0 7
• 19 9 6 0 9 3 4 6
• 20 7 1 0 8 4
• 21 8 1
• 22 1 8 9 3
• 23 7 1
• 24 5 1
45
Diagrama de puntos

• • •
• • • • • • •
• • • • • • • • •
1 2 3 4 5 6 7 8 9 10

46
Diagrama de Cajas y Bigotes

Min Max

Q1 mediana Q3

Escala

47
Resumen de gráficos
Objetivo Naturaleza Tipo de diagrama

Distribución de Cualitativa Circular, Barras Simples


frecuencia de
Histogramas, Polígonos de
una variable Continua
frecuencia

Distribución de Cualitativa Barras agrupadas


frecuencia de
dos variables Histogramas, Polígonos de
Continua
frecuencia
Barras agrupadas y Barras
Cualitativa
proporcionales
Relación entre
dos variables Gráficos lineales y diagramas de
Continua
dispersión
48
Ejercicios:
Gráficos
1) Construya una tabla de frecuencia de los siguientes
gráficos.

49
Gráficos

Frecuencia
Frecuencia
Días N° Artículos relativa
Relativa
porcentual
Lunes 3 0,129 12,9
Martes 5,2 0,224 22,4
Miércoles 4,8 0,206 20,6
Jueves 6 0,258 25,8
Viernes 4,2 0,181 18,1
Total 23,2 0,998 99,8

50
Gráficos
Edad Frecuencia Frecuencia Frecuencia
Absoluta Acumulada Relativa %

20-24 6 6 37.50
24-28 5 11 31.25
28-32 3 14 18.75
32-36 2 16 12.50
Total 16 100.00

51
Gráficos
2) Construya un gráfico de barras y circular
i) En una caja hay 10 bolitas marcadas con los
números del 1 al 4. En la siguiente tabla se
muestra la distribución de frecuencias de cada
uno de los números:
f
r 6
e
c4
u
e
2
n
c
0
i
a
1 2 3 4
Gráfico de Barras
52
Gráficos

53
Gráficos
El gráfico circular de la figura muestra las preferencias de 30 alumnos
en actividades deportivas. ¿Cuál(es) de las siguientes afirmaciones
es(son) correcta(s) ?

I. La frecuencia relativa del grupo de fútbol es de 40%.


II. La frecuencia relativa del grupo de básquetbol es de 30%.
III. La mitad del grupo no prefirió fútbol ni tenis.

Observación: Construye la tabla frecuencias


correspondiente
54
Gráficos
Deporte Frecuencia Frecuencia Frecuencia
Absoluta Relativa Relativa %
Fútbol 12 0,40 40
Tenis 3 0,10 10
Atletismo 6 0,20 20
Básquetbol 9 0,30 30
Total 30 1 100

i. La frecuencia relativa del grupo de fútbol es de 40%.


(Correcta)
ii. La frecuencia relativa del grupo de básquetbol es de
30%. (Correcta)
iii. La mitad del grupo no prefirió fútbol ni tenis.
(Correcta)
55
Gráficos
4) Los resultados de un test de inteligencia
hecho a 25 personas se han registrado en la
siguiente tabla de frecuencias por intervalos.
Construye un histograma de los datos
propuestos.
Frecuencia
Intervalo Marca de Frecuencia Frecuencia
Relativa
Puntajes Clase Absoluta Relativa
Porcentual
64 – 73 68,5 4 0,16 16
74 – 83 78,5 4 0,16 16
84 – 93 88,5 5 0,20 20
94 – 103 98,5 7 0,28 28
104 – 113 108,5 2 0,08 8
114 – 123 118,5 3 0,12 12
Total 25 1.00 100
56
Gráficos
Diagrama de
7
6
barras 68.5
5
78.5
4 88.5
3 98.5
2 108.5
1 118.5
0
68.5 78.5 88.5 98.5 108.5 118.5

Histograma

57
Gráficos
5) La figura muestra el consumo de gas de una familia en
todos los meses del año pasado. De acuerdo al gráfico
responde lo siguiente:
i. la mayor variación mensual en el consumo, se produjo
entre que meses?
ii. en mayo no hubo consumo?
iii. el mayor consumo se produjo en?

58
Gráficos
i. la mayor variación mensual en el consumo, se produjo entre
que meses?
La mayor variación se produjo durante los meses de febrero
y marzo
ii. en mayo no hubo consumo?
Si hubo consumo, pues fue el mismo de los meses de abril y
junio
iii. el mayor consumo se produjo en?
Se produjo en el mes de agosto

59
Estoy listo para la
prueba

Muchas gracias
60

Вам также может понравиться