Вы находитесь на странице: 1из 26

ESTADSTICA DESCRIPTIVA

Ing. Miguel Maldonado Amaya. Mgs.

ESTADSTICA DESCRIPTIVA
Es el estudio de las tcnicas para recopila, organizar y representar datos obtenidos en un estudio estadstico para
facilitar su anlisis y aplicacin.
RECOPILACIN DE DATOS
Fuentes de datos

1. Investigacin en registros administrativos: INEC, Banco Central, Cmaras de Produccin, Universidades, etc.(Para
obtener ndices de empleos, ndices de precios, datos de salud, datos de eficiencia, etc.)

2. Obtencin de datos mediante encuestas de investigacin. Por ejemplo. Estudios de Mercado, Estudios de
preferencia Electoral.

3. Realizacin de experimentos estadsticos.

ESTADSTICA DESCRIPTIVA
Criterios para disear una encuesta de investigacin
1. Definir el objetivo del estudio
2. Definir la poblacin de inters

3. Determinar el tamao de la muestra


4. Seleccionar el tipo de muestreo

5. Elegir temas generales


6. Elaborar el formulario para la encuesta. Preguntas cortas, claras y de opciones.

7. Realizar pruebas
8. Realizar la encuesta

ESTADSTICA DESCRIPTIVA
Tipos de Datos
Los resultados que se obtienen pueden ser
1. Datos cualitativos: corresponden a respuestas categricas
Ejemplo. Estado civil de una persona
2.

Datos cuantitativos: corresponden a respuestas numricas


Ejemplo. La edad en aos

Los datos cuantitativos pueden ser.


Discretos: Se obtiene mediante conteo
Continuos: Se obtiene mediante mediciones
DESCRIPCIN DE CONJUNTOS DE DATOS

Los datos obtenidos se los puede representar de diferentes formas:


1. Tabularmente
2. Grficamente
3. Mediante nmeros que caracterizan al grupo de datos

ESTADSTICA DESCRIPTIVA
TABLA DE FRECUENCIAS
Es un dispositivo para agrupacin de datos y facilitar su interpretacin.

Recomendaciones para construir tablas de frecuencias


Sea X una muestra de tamao n
1. Identificar la unidad de medida de los datos
2. Obtener el rango de los datos: Distancia entre el mayor y el menor valor de los datos( = 1 )

3. Seleccionar el nmero de clases(o intervalos) k, para agrupar los datos.


4. Obtener la longitud de las clases. =

5. Realizar el conteo de datos para obtener la frecuencia en cada clase

ESTADSTICA DESCRIPTIVA
Notacin - Tabla de frecuencia
n: nmero de datos
k: nmero de clases
: frecuencia de la clase i, i=1,2,3,..,k

frecuencia relativa de la clase i

: frecuencia acumulada de la clase i: FI = f1 + f2 + f3 + + fi

frecuencia acumulada relativa de la clase i

: marca de clase i(es el valor central del intervalo de la clase i)

ESTADSTICA DESCRIPTIVA
Ejemplo
Obtenga la tabla de frecuencias para los siguientes 40 datos de una muestra, correspondientes al tiempo que se utiliz para
atender a las personas en una estacin de servicio:
Desarrollo
1. Precisin: un decimal
2. Rango: R = 6.2 1.8 = 4.4
3. Nmero de clases : k=6
4. Longitud: R/k=0.733(Por simplicidad se redefine la longitud como 1 y se usan nmeros
enteros para los extremos de las clases
5. Conteo de los datos( puede hacerse en un recorrido), n=40
Nmero
1
2
3
4
5
6

Clase(Intervalo)
12
2
4
4
6
6

Frecuencia absoluta
1
9
11
12
5
2

Clase
Marca Frecuencia Frecuencia
Nmero
(Intervalo) de clase Absoluta
relativa
i
[a,b)
m
f
f/n
1
2
3
4
5
6

[1,2)
[2,3)
[3,4)
[4,5)
[5,6)
[6,7)

1.5
2.5
3.5
4.5
5.5
6.5

1
9
11
12
5
2
40

0.03
0.23
0.28
0.30
0.13
0.05

Frecuencia
absoluta
acumulada
F
1
10
21
33
38
40

Frecuencia
relativa
acumulada
F/n
0.03
0.25
0.53
0.83
0.95
1.00

ESTADSTICA DESCRIPTIVA
PRESENTACIN GRFICA DE CONJUNTOS DE DATOS
HISTOGRAMA DE FRECUENCIAS

Es la manera ms comn de representar


grficamente la distribucin de frecuencia de los

datos.
Se construye dibujando rectngulos cuya base

corresponde a cada intervalo de clase, y su


altura segn el valor de la frecuencia.

ESTADSTICA DESCRIPTIVA
PRESENTACIN GRFICA DE CONJUNTOS DE DATOS
POLGONO DE FRECUENCIAS

Es una manera de representar el perfil de la


distribucin de los datos. Se obtiene uniendo

mediante

segmentos

de

recta

los

puntos(marca de clase, frecuencia).

Para cerrar el polgono se puede agregar un


punto a cada lado con frecuencia 0).

ESTADSTICA DESCRIPTIVA
PRESENTACIN GRFICA DE CONJUNTOS DE DATOS
OJIVA

Este grfico

se usa para representar

la

frecuencia acumulada absoluta o relativa. Se lo

obtiene uniendo segmentos de recta que se


extienden entre los extremos de las clases y

usando los valores de la frecuencia acumulada.


La ojiva permite responder preguntas cuantos

datos son menores que

ESTADSTICA DESCRIPTIVA
GRFICOS DE FRECUENCIAS CON FORMAS ESPECIALES
Los grficos pueden tomar otros aspectos, usando barras, colores, efectos tridimensionales, sombreado, etc. O
usando una representacin tipo pastel. Como ilustracin se muestran algunos:

ESTADSTICA DESCRIPTIVA
MEDIDAS DE TENDENCIA CENTRAL
Son nmeros que definen cual es el valor alrededor del que se concentran los datos. Se indican a continuacin los
ms utilizados.

Media Muestral()
Definicin
Si X: X1 X2 . Xn es una muestra de n datos, entonces la media muestral es el promedio aritmtico simple
de los datos:

1 + 2 + 1
=
=

=1
Ejemplo.
Si los datos son 2,6,11,8,11,4,7,5
Entonces =

2+6+11+8+11+4+7+5
8

= 6.

NOTA: La media es de uso comn, sin embargo algunos


datos puede hacer cambios significativos.

ESTADSTICA DESCRIPTIVA
Moda Muestral(Mo)
Es el dato que ocurre con mayor frecuencia en una muestra. Puede ser que no exista la moda y tambin es posible que
exista mas de una moda.

Ejemplo
Si los datos son 2,6,11,8,11,4,7,5

Entonces Mo=11

ESTADSTICA DESCRIPTIVA
Mediana Muestral()
Es el valor ubicado en el centro de los datos ordenados
Sean X: X1 X2 Xn
una muestra de tamao n
X(1 X(2 X(n
los elementos de la muestra ordenados en forma creciente

+1
2

+1
2

Ejemplo.
Si los datos son 2,6,11,8,11,4,7,5
Los datos ordenados 2,4,5,6,7,8,11,11, entonces
1
= 6 + = 6.
2

NOTA: Las medidas de tendencia central no son


suficientes para describir de manera completa el
comportamiento de los datos de una muestra. Se
necesitan otras medidas.

ESTADSTICA DESCRIPTIVA
MEDIDAS DE DISPERSIN
Son nmeros que proveen informacin adicional acerca del comportamiento de lso datos, describiendo
numricamente su dispersin.
RANGO
Es la diferencia entre el mayor valor y menor valor de los datos de la muestra.
= ( (
Ejemplo: Si los datos son 2,6,11,8,11,4,7,5
Entonces el rango es: = =

VARIANZA MUESTRAL
Esta medida cuantifica las distancias de los datos con respecto al valor de la media muestral.

=(

ESTADSTICA DESCRIPTIVA
Ejemplo: Si los datos son 2,6,11,8,11,4,7,5 y se ha calculado que = 6.
Entonces la varianza es
2

(2 6.

2 +(6

6.

2+ + (

6.

= 10.214

DESVIACIN ESTNDAR MUESTRAL


La raz cuadrada positiva de la varianza. La desviacin estndar muestral o desviacin tpica est expresada en las
mismas unidades de medida que los datos de la muestra.
= +

ESTADSTICA DESCRIPTIVA
MEDIDAS DE POSICIN
Son nmeros que distribuyen los datos ordenados de la muestra en grupos con el propsito de resaltar su ubicacin
relativa. Estos nmeros se denominan cuantiles en forma genrica.
CUARTILES
Son nmeros que dividen a los datos de la muestra en grupos de tamao aproximado de 25%.
Primer Cuartil(
A la izquierda de 1 estn incluidos 25% de los datos( aproximadamente)
A la derecha de 1 estn incluidos 75% de los datos(aproximadamente)

Segundo Cuartil(
Igual que la mediana divide al grupo de datos en dos partes, cada una con el 50% de los datos(aproximadamente)
Tercer Cuartil(
A la izquierda de 3 estn incluidos 75% de los datos( aproximadamente)
A la derecha de 3 estn incluidos 25% de los datos(aproximadamente)

ESTADSTICA DESCRIPTIVA
Ejemplo: Suponer que una muestra contiene 40 datos ordenados:
. . ( . Calcular
Desarrollo
1: 2 % 40 = 10
Por lo tanto: 1 = (10 + 11 /2
2:

0% 40 = 20
2 = (20 + 21 /2

es igual a la mediana

3:

% 40 = 0
3 = (30 + 31 /2

es igual a la mediana

ESTADSTICA DESCRIPTIVA
DECILES
Son nmeros que dividen los datos de la muestran en grupos de tamao aproximado de 10%
Primer Decil (
A la izquierda de D1 estn incluidos 10% de los datos(aproximadamente)
A la derecha de D1 estn incluidos 90% de los datos(aproximadamente)
Segundo Decil (
A la izquierda de D2 estn incluidos 20% de los datos(aproximadamente)
A la derecha de D2 estn incluidos 80% de los datos(aproximadamente)

Ejemplo: Suponer que una muestra contiene 40 datos ordenados:


(1 (2 . . (40 . Calcular D1

D1 :

10% 40 = 4

Por lo tanto: D1 = (

/2

ESTADSTICA DESCRIPTIVA
PERCENTILES (O PORCENTILES)
Son nmeros que dividen a los datos de la muestra en grupos de tamao aproximado de 1%
Primer Percentil (
A la izquierda de P1 estn incluidos 1% de los datos(aproximadamente)
A la derecha de P1 estn el 99% de los datos(aproximadamente)
Segundo Percentiles (
A la izquierda de P2 estn incluidos 2% de los datos(aproximadamente)
A la derecha de P2 estn incluidos 98% de los datos(aproximadamente)

Ejemplo: Suponer que una muestra contiene 400 datos ordenados:


(1 (2 . . (400 . Calcular P1 P82

P1 :

1% 400 = 4

Por lo tanto: P1 = (

P82:
+

/2

82% de 400 = 28
82 =

328

329

/2

ESTADSTICA DESCRIPTIVA
COEFICIENTE DE VARIACIN
Es un nmero que se usa para comparar la variabilidad de los datos de diferentes grupos. Es una medida adimensional.

Ejemplo
4
Para un grupo de datos = 20 = 4, entonces = 20 = 0.2 = 20%
6

Para un grupo de datos = 48 = 6, entonces = 48 = 0.12 = 12. %

En conclusin podemos decir que el primer grupo tiene mayor variabilidad relativa con respecto a su media

ESTADSTICA DESCRIPTIVA
FRMULAS PARA DATOS AGRUPADOS

Si los datos de una muestra estn disponibles nicamente en una tabla de frecuencias, se
pueden usar formulas para calcular las medidas estadsticas, en forma aproximada
Nmero

Clase

Marca

f/n

F/n

1 1

1 /

1 /

2 2

2 /

2 /

..

..

..

..

..

..

..

Medias de datos agrupados


1
=


=1

Varianza de datos agrupados

1
2
=
1


=1

ESTADSTICA DESCRIPTIVA
FRMULAS PARA DATOS AGRUPADOS

Ejemplo: La Tabla de frecuencias siguiente contiene los datos agrupados en 6 clases del nmero de
artculos vendidos por un almacn en 50 das. Calcule la media y la varianza.
Nmero

Clase

10 20

Marca

f/n

F/n

0.04

0.04

20 0

25

10

12

0.2

0.24

0 40

35

12

24

0.24

0.48

40 0

45

14

38

0.28

0.76

0 60

55

47

0.18

0.94

60 0

65

50

0.06

ESTADSTICA DESCRIPTIVA
INSTRUMENTOS GRFICOS ADICIONALES
DIAGRAMA DE CAJA
Es un dispositivo grfico que se usa para expresar en forma resumida, algunas medidas estadsticas de posicin:

El diagrama de caja describe grficamente el rango, el rango intercuartlico (Q 3 Q1 , valores extremos y la ubicacin
de los cuartiles. Es una representacin til para comparar grupos de datos.
DIAGRAMA DE PUNTOS
Si la cantidad de datos es pequea,(alrededor de 20 o menos), se los puede representar mediante puntos
directamente sin agruparlos en intervalos.

ESTADSTICA DESCRIPTIVA
INSTRUMENTOS GRFICOS ADICIONALES

DIAGRAMA DE PARETO
Es un grfico til para identificar las causas principales que producen cierto tipo de resultados.
Procedimiento para construir el diagrama de Pareto
1. Categorice los datos por tipo de problema
2. Determine la frecuencia y ordene en forma decreciente
3. Represente la frecuencia relativa con barras
4. Superponga la ojiva de la frecuencia relativa acumulada
5. Analice cuales son las causas mas importantes que inciden en el suceso de inters.

ESTADSTICA DESCRIPTIVA
Ejemplo

Un fabricante ha realizado un conteo de los tipos de defectos de sus productos y ha registrado su frecuencia. Se desea
analizar su incidencia en la poblacin con un Diagrama de Pareto.
Los resultados, tabulados segn el procedimiento anterior son:

Вам также может понравиться