Вы находитесь на странице: 1из 44

ESTADÍSTICA

DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA

Esta es una etapa de la metodología estadística, en la que


no se involucra la teoría de la probabilidad como
herramienta para realizar inferencias a toda la población,
sin embargo se construyen indicadores, se hacen gráficos,
se realizan comparaciones, siempre con el interés de
conocer la población de donde fue tomada la muestra.
ESTADÍSTICA DESCRIPTIVA

Histograma de Frecuencias Absolutas


9

Frecuencia Absoluta
5

0
43.15 44.15 45.15 46.15 47.15 48.15 49.15 50.15 51.15 52.15 53.15 54.15 55.15

Logintud del Hueso

ESTADÍSTICA DESCRIPTIVA
Diagrama de Sectores - Nivel Educativo
C ategory
DOCTORA DO
9,5% ESPEC IA LIZA C ION
12,9%
MA ESTRIA
PREGRA DO
PRIMA RIA
14,0% SECUNDA RIA

12,9%

“organización, presentación y 18,2%

32,4%

análisis de datos”.
DISTRIBUCIÓN DE FRECUENCIAS

Es una tabla en la cual se consignan los valores que asume


una variable frente a su frecuencia de ocurrencia.

Caso 1: Datos sin Agrupar

Caso 2: Datos Agrupados


Caso 1: Datos sin Agrupar
Supongamos que se tiene una población constituida por 200
cajas y se desea examinarlas, determinándose el número de
piezas defectuosas que contiene cada caja. Por razones de
tiempo y costo se desea que la investigación no sea exhaustiva,
es decir, no se examinara la totalidad de las 200 cajas, sino que
se seleccionara una muestra de tamaño 30.

Los resultados se muestran a continuación:

3, 2, 0, 2, 3, 3, 1, 1, 0, 1, 3, 3, 4, 4, 3,
2, 4, 2, 4, 2, 0, 2, 4, 3, 1, 2, 4, 3, 0, 2.

*En la primera caja examinada se encontraron 3 piezas


defectuosas.
Distribución de frecuencias
“Datos sin Agrupar”
TABLA DE FRECUENCIA DEL NUMERO DE PIEZAS DEFECTUOSAS QUE
CONTIENEN LAS CAJAS.

xi ni fi Ni Fi
Valor observado Frecuencia Frecuencia Frecuencia Absoluta Frecuencia Relativa
Absoluta Relativa Acumulada Acumulada

0 4 0.133 4 0.133
1 4 0.133 8 0.267
2 8 0.267 16 0.533
3 8 0.267 24 0.800
4 6 0.200 30 1.0
Total 30 1.0
Frecuencia Absoluta (ni)
Se comienza organizando la información escribiendo los datos
distintos de que consta la muestra y haciendo un conteo para
determinar el número de veces que aparece cada dato

xi Conteo ni
(Valor observado) (Frecuencia absoluta)
0
1 3, 2, 0, 2, 3, 3, 1, 1, 0, 1,
2 3, 3, 4, 4, 3, 2, 4, 2, 4, 2,
3
0, 2, 4, 3, 1, 2, 4, 3, 0, 2.
4
Total
Frecuencia Absoluta (ni)
Se comienza organizando la información escribiendo los datos
distintos de que consta la muestra y haciendo un conteo para
determinar el número de veces que aparece cada dato

xi Conteo ni
(Valor observado) (Frecuencia absoluta)
0 |||| 4
1 |||| 3, 2, 0, 2, 3, 3, 1, 1, 0, 1,
2 ||||| ||| 3, 3, 4, 4, 3, 2, 4, 2, 4, 2,
3 ||||| |||
0, 2, 4, 3, 1, 2, 4, 3, 0, 2.
4 ||||| |
Total
FrecuenciaAbsoluta
Frecuencia Absoluta(n(ni)i)
Se comienza organizando la información escribiendo los datos
distintos de que consta la muestra y haciendo un conteo para
determinar el número de veces que aparece cada dato

xi Conteo ni
(Valor observado) (Frecuencia absoluta)
0 |||| 4
La frecuencia absoluta del
1 |||| 4 dato xi se representa por
2 ||||| ||| 8 medio de ni.
3 ||||| ||| 8
Ej: el dato x3=2 aparece 8
4 ||||| | 6 veces en la muestra, por tanto
Total 30 n3=8.
Frecuencia Relativa (fi)
La frecuencia absoluta también puede expresarse como una
fracción o porcentaje, surgiendo lo que se denomina frecuencia
relativa (fi).
ni
fi  xi ni fi
n
0 4
Ejemplo:
1 4
n3 8
f3    0.267 2 8
n 30 3 8
4 6
30
Frecuencia Relativa (fi)
La frecuencia absoluta también puede expresarse como una
fracción o porcentaje, surgiendo lo que se denomina frecuencia
relativa (fi).
ni
fi  xi ni fi
n
0 4 0.133
Ejemplo:
1 4 0.133
n3 8
f3    0.267 2 8 0.267
n 30 3 8 0.267

Lo que indica que el dato x3=2 representa 4 6 0.200


el 26.7% de toda la muestra, es decir, que 30 1.0
de acuerdo a la muestra, el 26.7% de las
cajas tienen 2 piezas defectuosas.
FRECUENCIA ABSOLUTA ACUMULADA (Ni)
Número de datos que son inferiores o iguales a xi

Ni  n1  n2  ...  ni

FRECUENCIA RELATIVA ACUMULADA (Fi)


Fracción o porcentaje de la frecuencia absoluta
acumulada hasta xi

Ni
Fi   f1  f 2      f i
n
Frecuencias Acumuladas
xi ni fi Ni Fi
En el ejemplo: 0 4 0.133 4 0.133

N3  n1  n2  n3 1 4 0.133 8 0.267
2 8 0.267 16 0.533
N3  4  4  8  16
3 8 0.267 24 0.800
4 6 0.200 30 1.0
N3 16
F3    0.533 60 1.0
n 30
Frecuencias Acumuladas
xi ni fi Ni Fi
En el ejemplo: 0 4 0.133 4 0.133

N3  n1  n2  n3 1 4 0.133 8 0.267
2 8 0.267 16 0.533
N3  4  4  8  16
3 8 0.267 24 0.800
4 6 0.200 30 1.0
N3 16
F3    0.533 60 1.0
n 30

Indica que 16 datos son iguales o inferiores al dato x3=2, es decir que de acuerdo con
la muestra, 16 cajas presentan 2 o menos piezas defectuosas.

Indica que el 53.3% de los datos son iguales o inferiores al dato x3=2, es decir que de
acuerdo con la muestra, el 53.3% de las cajas presentan 2 o menos piezas defectuosas.
Distribución de frecuencias
“Datos sin Agrupar”
TABLA DE FRECUENCIA DEL NUMERO DE PIEZAS DEFECTUOSAS QUE
CONTIENEN LAS CAJAS.

xi ni fi Ni Fi
Valor observado Frecuencia Frecuencia Frecuencia Absoluta Frecuencia Relativa
Absoluta Relativa Acumulada Acumulada

0 4 0.133 4 0.133
1 4 0.133 8 0.267
2 8 0.267 16 0.533
3 8 0.267 24 0.800
4 6 0.200 30 1.0
Total 30 1.0
Propiedades y Relaciones
Si se toma una muestra de n datos, de los cuales hay m distintos, que
ordenados en forma creciente son x1, x2, …, xm, entonces:

1. 0  ni  n 6. Nm  n
n1  N1  N 2  ...  N m  n
m
2.  ni  n
i 1
7.
j

3. 0  fi  1 8. Fj   fi
i 1

f1  F1  F2  ...  Fm  1
m
4.  fi  1
i 1
9.

j
5. N j   ni
i 1
Función de Distribución N(x)
Las frecuencias acumuladas pueden definirse como funciones sobre
todos los números reales.
N(x)= “número de datos que son menores o iguales a x”
Para el ejemplo, la distribución de N(x) es:

xi ni fi Ni Fi Ej: N ( x  2)  16
0 4 0.133 4 0.133
0 si x  0
1 4 0.133 8 0.267 4 si x  1

2 8 0.267 16 0.533
8 si x  2
3 8 0.267 24 0.800 N ( x)  
16 si x  3
4 6 0.200 30 1.0 24 si x  4
Total 30 1.0 
30 si x  4
Función Empírica de Distribución
Acumulada, F(x)
F(x)= “fracción (o porcentaje) de los datos que son menores o
iguales que x”

Para el ejemplo, la distribución de F(x) es:

xi ni fi Ni Fi Ej: F( x  2)  0.533
0 4 0.133 4 0.133
0 si x  0
1 4 0.133 8 0.267 0.133 si x  1
2 8 0.267 16 0.533 
0.267 si x  2
3 8 0.267 24 0.800 F ( x)  
0.533 si x  3
4 6 0.200 30 1.0
0.800 si x  4
Total 30 1.0 
1 si x  4
Funciones de Distribución
En general la función N(x) se define como:

0 si x  x1

N ( x)   N j si x j  x  x j 1 j 1,2,..., k

n si x  xk

En general la función F(x) se define como:

0 si x  x1

F ( x)   Fj si x j  x  x j 1 j 1,2,..., k

n si x  xk
Representación gráfica
Cuando se trate de frecuencias absolutas o de frecuencias
relativas, se realizará la representación por medio del llamado
diagrama de frecuencias (absolutas o relativas)

xi ni fi
0 4 0.133
1 4 0.133
2 8 0.267
3 8 0.267
4 6 0.200
30 1.0
Representación gráfica
Cuando se trate de frecuencias absolutas o de frecuencias
relativas, se realizará la representación por medio del llamado
diagrama de frecuencias (absolutas o relativas)

xi ni fi
0 4 0.133
1 4 0.133
2 8 0.267
3 8 0.267
4 6 0.200
30 1.0
Representación gráfica
Cuando se considere las frecuencias acumuladas, la representación
gráfica consiste en llevar a un plano cartesiano las funciones N(x) y F(x).

0 si x  0
4 si x  1

8 si x  2
N ( x)  
16 si x  3
24 si x  4

30 si x  4

Función de distribución N(x)


Representación gráfica
Cuando se considere las frecuencias acumuladas, la representación
gráfica consiste en llevar a un plano cartesiano las funciones N(x) y F(x).

0 si x  0
0.133 si x  1

0.267 si x  2
F ( x)  
0.533 si x  3
0.800 si x  4

1 si x  4

Función empírica de distribución


acumulada
EJERCICIO 1
Una fabrica de gaseosas proyecta lanzar al mercado un nuevo sabor. Se
realiza un test de aceptación de dicho sabor en una muestra de 30 niños,
utilizando una escala de 10 puntos para medir el grado de aceptación. Los
puntos obtenidos en los 30 niños fueron los siguientes:

2 ,6 ,8 ,7 ,4 ,5 ,10 ,6 ,6 ,7 ,6 ,7 ,3 ,8 ,7
6, 8, 6, 5, 4, 7, 8, 5, 7, 6, 7, 2, 7, 2, 7

La muestra estuvo compuesta por igual numero de niños de ambos sexos, de


5 a 12 años de edad residentes del barrio X de la ciudad de Cali.

a) Cual es la población? b) Cual es la muestra?


c) Cual es la variable? d) De que tipo es la variable?
e) Que clase de escala se ha utilizado en la medición de la variable?
f) Construya la distribución de frecuencias absoluta y relativa.
g) Construya la distribución de frecuencias acumuladas.
h) Realice el grafico para la frecuencia absoluta ó relativa.
Caso 2: Datos Agrupados
Suponga que se tiene la siguiente información de la
duración en horas de cierto dispositivo electrónico.

“Seguramente todos los datos sean distintos y la tabla


de frecuencia no resumiría en nada la información”
¿Qué se puede hacer?

Solución Agrupar la información


Caso 2: Datos Agrupados

Una entidad encargada del control de contaminación de cierto río,


lleva registros sobre el oxígeno disuelto (x), expresado en mg/l;
éstos se presentan a continuación:

2.6 3.6 3.1 2.6 2.7 3.9 2.4 2.7 2.5 2.3 4.0 3.2
2.5 1.7 0.3 3.1 2.6 1.3 4.3 1.5 2.8 1.8 4.2 3.5
2.4 2.2 3.4 3.7 0.8 2.3 1.9 4.5 1.2 2.2 2.2 3.0
2.1 1.8 2.9 3.8 3.5 1.6 3.2 4.4 1.4 0.7 2.8 3.3
0.5 2.3
Distribución de Frecuencias
“Datos Agrupados”
TABLA DE FRECUENCIA DEL REGISTRO DE OXIGENO DISUELTO
DE CIERTO RÍO (mg/l)

Intervalos de x´i
ni fi Ni Fi
Clase Marca de clase

(0.29, 0.99] 0.64 4 0.08 4 0.08

(0.99, 1.69] 1.34 5 0.10 9 0.18

(1.69, 2.39] 2.04 11 0.22 20 0.40

(2.39, 3.09] 2.74 13 0.26 33 0.66

(3.09, 3.79] 3.44 10 0.20 43 0.86

(3.79, 4.50] 4.15 7 0.14 50 1.0

Total 50 1.0
Pasos para datos Agrupados
1. Determinar el numero de intervalos (k) que deseamos
construir: [5 < m < 20]

2k  n 26  64  50 k=6

2. Determinar el rango de variación (R):

Rango  Max( xi )  Min( xi ) R = 4.5 – 0.3


R = 4.2

3. Fijar el ancho de clases (C):


R
C C = 4.2 / 6 C = 0.7
k
Pasos para datos Agrupados
4. Construir cada una de las k clases:
Clase Intervalos xi
L0  Min L0  0.29
No i de Clase Marca de

L1  0.29  0.7  0.99 Calase

L1  L0  C 1 (0.29, 0.99]
L2  0.99  0.7  1.69
L2  L1  C L3  1.69  0.7  2.39
2 (0.99, 1.69]

 L4  2.39  0.7  3.09 3 (1.69, 2.39]

L5  3.09  0.7  3.79 4 (2.39, 3.09]


Lk  Lk 1  C
L6  3.79  0.7  4.50 5 (3.09, 3.79]

6 (3.79, 4.50]
Pasos para datos Agrupados
4. Construir cada una de las k clases:
Clase Intervalos xi
L0  Min L0  0.29
No i de Clase Marca de

L1  0.29  0.7  0.99 Calase

L1  L0  C 1 (0.29, 0.99]
L2  0.99  0.7  1.69
L2  L1  C L3  1.69  0.7  2.39
2 (0.99, 1.69]

 L4  2.39  0.7  3.09 3 (1.69, 2.39]

L5  3.09  0.7  3.79 4 (2.39, 3.09]


Lk  Lk 1  C
L6  3.79  0.7  4.50 5 (3.09, 3.79]

6 (3.79, 4.50]
5. Calcular la marca de clase (x’i):
Li 1  Li
x 'i 
2
Pasos para datos Agrupados
4. Construir cada una de las k clases:
Clase Intervalos xi
L0  Min L0  0.29
No i de Clase Marca de

L1  0.29  0.7  0.99 Clase

L1  L0  C 1 (0.29, 0.99] 0.64


L2  0.99  0.7  1.69
L2  L1  C L3  1.69  0.7  2.39
2 (0.99, 1.69] 1.34

 L4  2.39  0.7  3.09 3 (1.69, 2.39] 2.04

L5  3.09  0.7  3.79 4 (2.39, 3.09] 2.74


Lk  Lk 1  C
L6  3.79  0.7  4.50 5 (3.09, 3.79] 3.44

6 (3.79, 4.50] 4.15


5. Calcular la marca de clase (x’i):
Li 1  Li
x 'i  Determina el punto medio de cada clase
2
Pasos para datos Agrupados
6. Determinar la frecuencia asociada con cada intervalo, deben
contarse los datos que pertenecen a cada uno.

Intervalos x´i ni fi Ni Fi
de Clase 2.6 3.6 3.1 2.6 2.7
(0.29, 0.99] 0.64 3.9 2.4 2.7 2.5 2.3
4.0 3.2 2.5 1.7 0.3
(0.99, 1.69] 1.34
3.1 2.6 1.3 4.3 1.5
(1.69, 2.39] 2.04 2.8 1.8 4.2 3.5 2.4
(2.39, 3.09] 2.74
2.2 3.4 3.7 0.8 2.3
1.9 4.5 1.2 2.2 2.2
(3.09, 3.79] 3.44
3.0 2.1 1.8 2.9 3.8
(3.79, 4.50] 4.15 3.5 1.6 3.2 4.4 1.4
Total
0.7 2.8 3.3 0.5 2.3
Pasos para datos Agrupados
6. Determinar la frecuencia asociada con cada intervalo, deben
contarse los datos que pertenecen a cada uno.

Intervalos x´i ni fi Ni Fi
de Clase 2.6 3.6 3.1 2.6 2.7
(0.29, 0.99] 0.64 4 3.9 2.4 2.7 2.5 2.3
4.0 3.2 2.5 1.7 0.3
(0.99, 1.69] 1.34
3.1 2.6 1.3 4.3 1.5
(1.69, 2.39] 2.04 2.8 1.8 4.2 3.5 2.4
(2.39, 3.09] 2.74
2.2 3.4 3.7 0.8 2.3
1.9 4.5 1.2 2.2 2.2
(3.09, 3.79] 3.44
3.0 2.1 1.8 2.9 3.8
(3.79, 4.50] 4.15 3.5 1.6 3.2 4.4 1.4
Total
0.7 2.8 3.3 0.5 2.3
Distribución de Frecuencias
“Agrupados”
TABLA DE FRECUENCIA DEL REGISTRO DE OXIGENO DISUELTO
DE CIERTO RÍO (mg/l)

Intervalos de
x´i ni fi Ni Fi
Clase
(0.29, 0.99] 0.64 4 0.08 4 0.08

(0.99, 1.69] 1.34 5 0.10 9 0.18

(1.69, 2.39] 2.04 11 0.22 20 0.40

(2.39, 3.09] 2.74 13 0.26 33 0.66

(3.09, 3.79] 3.44 10 0.20 43 0.86

(3.79, 4.50] 4.15 7 0.14 50 1.0

Total 50 1.0
Distribución de Frecuencias
“Datos Agrupados”
TABLA DE FRECUENCIA DEL REGISTRO DE OXIGENO DISUELTO
DE CIERTO RÍO (mg/l)

Intervalos de
x´i ni fi Ni Fi
Clase
33 mediciones presentaron un
(0.29, 0.99] 0.64 4 0.08 4 0.08
registro de oxigeno disuelto
(0.99, 1.69] 1.34 5 inferior o9igual a0.18
0.10 3.09mg/l

(1.69, 2.39] 2.04 11 0.22 20 0.40

(2.39, 3.09] 2.74 13 0.26 33 0.66

(3.09, 3.79] 3.44 10 0.20 43 0.86

(3.79, 4.50] 4.15 7 0.14 50 1.0


El 20% de las mediciones presentaron un
registro de oxigenoTotal 50
disuelto entre 1.0
3.09mg/l y 3.79mg/l
¿Cuál es el porcentaje de datos que son iguales o
inferiores a x ?

fi
F  x   F  Li 1    x  Li 1 
C

¿Qué porcentaje de datos se encuentran entre a y b?

f  a, b   F  b   F  a 
¿Qué porcentaje de datos se encuentran entre 0.5 y 1.5?

Intervalos x´i ni fi Ni Fi

(0.29, 0.99] 0.64 4 0.08 4 0.08


(0.99, 1.69] 1.34 5 0.10 9 0.18
(1.69, 2.39] 2.04 11 0.22 20 0.40
(2.39, 3.09] 2.74 13 0.26 33 0.66
(3.09, 3.79] 3.44 10 0.20 43 0.86
(3.79, 4.50] 4.15 7 0.14 50 1.0
Total 50 1.0
¿Qué porcentaje de datos se encuentran entre 0.5 y 1.5?

Intervalos x´i ni fi Ni Fi

0.5 (0.29, 0.99] 0.64 4 0.08 4 0.08

1.5 (0.99, 1.69] 1.34 5 0.10 9 0.18


(1.69, 2.39] 2.04 11 0.22 20 0.40
(2.39, 3.09] 2.74 13 0.26 33 0.66
(3.09, 3.79] 3.44 10 0.20 43 0.86
(3.79, 4.50] 4.15 7 0.14 50 1.0
Total 50 1.0
¿Qué porcentaje de datos se encuentran entre 0.5 y 1.5?

Intervalos x´i ni fi Ni Fi

0.5 (0.29, 0.99] 0.64 4 0.08 4 0.08

1.5 (0.99, 1.69] 1.34 5 0.10 9 0.18


(1.69, 2.39] 2.04 11 0.22 20 0.40
(2.39, 3.09] 2.74 13 0.26 33 0.66
(3.09, 3.79] 3.44 10 0.20 43 0.86
(3.79, 4.50] 4.15 7 0.14 50 1.0
Total 50 1.0

f  0.5,1.5   F 1.5   F  0.5 


 0.152857  0.024
 0.1288  12.88%
Representación gráfica
Cuando se trate de frecuencias absolutas, se realizará la representación
por medio del llamado Histograma de frecuencias.

i Intervalos x´i ni fi

1 (0.29, 0.99] 0.64 4 0.08

2 (0.99, 1.69] 1.34 5 0.10

3 (1.69, 2.39] 2.04 11 0.22

4 (2.39, 3.09] 2.74 13 0.26

5 (3.09, 3.79] 3.44 10 0.20

6 (3.79, 4.50] 4.15 7 0.14

Total 50 1.0
Representación gráfica
Cuando se trate de frecuencias absolutas o relativas acumuladas, se debe
calcular su función de distribución (F(x)) y representarla por medio del
grafico llamado Ojiva.

0 para x  0.29
 0.08
0   x  0.29  para 0.29  x  0.99
 0.7
 0.10
0.08   x  0.99  para 0.99  x  1.69
 0.7
 0.22
0.18   x  1.69  para 1.69  x  2.39
0.7
F ( x)  
0.40  0.26  x  2.39  para 2.39  x  3.09
 0.7
 0.20
0.66   x  3.09  para 3.09  x  3.79
 0.7
 0.14
0.86   x  3.79  para 3.79  x  4.50
 0.7
1 para x  4.50
Representación gráfica
Ojiva
EJERCICIO 2
Tiempos de atención (en minutos) de pacientes en el
servicio de filtro urgencias de un hospital local:

13.1, 7.1, 14.8, 19.0, 10.2, 18.0, 19.8, 15.0, 17.3, 10.8,
22.3, 14.5, 17.1, 14.9, 12.0, 14.0, 18.4, 10.2, 15.8, 16.5,
15.0, 17.6, 4.2, 13.4, 21.2, 14.7, 13.8, 21.0, 14.3, 11.1,
18.9, 8.3, 16.6, 11.2, 20.2, 14.4, 13.5, 18.2, 12.4, 17.0,
26.7, 15.5, 22.0, 12.9, 17.9, 7.4, 18.0, 19.8, 16.0, 21.2.
a) Cual es la variable? b) De que tipo es la variable?
c) Que clase de escala se ha utilizado en la medición de la variable?
d) Construya la distribución de frecuencias absoluta y relativa.
e) Construya la distribución de frecuencias acumuladas.
e) Construya una Ojiva.
EJERCICIO 3
Los siguientes datos señalan el tiempo de funcionamiento (en días) hasta que
se presenta la primera falla de n=88 radiotransmisores-receptores:

16, 224, 16, 80, 96, 536, 400, 80, 392, 576, 128, 56, 656, 224, 40, 32, 358, 384,
256, 246,328, 464, 448, 716, 304, 16, 72, 8, 80, 72, 56, 608, 108, 194, 136,
224, 80, 16, 424, 264, 156, 216, 168, 184, 552, 72, 184, 240, 438, 120, 308,
32, 272, 152, 328, 480, 60, 208, 340, 104, 72, 168, 40, 152, 360, 323, 40, 112,
112, 288, 168, 352, 56, 72, 64, 40, 184, 264, 96, 224, 56, 72, 64, 40, 184, 264,
96, 224, 56, 72, 64, 40, 184, 264, 96, 224, 56, 72, 64, 40, 184, 264, 96, 224,
168, 168, 114, 280, 152, 208, 160, 176.

Para resumir los datos construya:


1. Distribución de frecuencias absoluta y relativa.
2. Distribución de frecuencias acumuladas.
3. Una Ojiva.

Вам также может понравиться