Вы находитесь на странице: 1из 66

ESTADISTICA DESCRIPTIVA

PROF. LUZ ADRIANA PEREIRA


Organizar informacin: tablas de frecuencia y
grficas.
Medidas que permitan indicar rasgos importantes de la muestra,
Como su magnitud, homogeneidad y simetra, entre otras. Como su magnitud, homogeneidad y simetra, entre otras.
Al proceso de resumir datos por medio de estadgrafos
que indiquen sus rasgos, se le conoce como
Reduccin de datos
La Media Aritmtica: La media aritmtica de una
muestra de datos: x1, x2,..., xn, se define como:

=
n
i
x X
1
Caso 1. Muestra no Agrupada

=
=
i
i
x
n
X
1
Caso 2. Muestra Agrupada (Tabla de Frecuencias)
i
m
i
i
m
i
i i
f x n x
n
X

= =

=

=
1 1
1
Donde:
i
x

Es la marca de clase del
Intervalo i, para variables
de tipo continuo.
Ejemplo: calcule la media aritmtica para el
conjunto de datos:
1,2,2,5,2,6,4,2,5
Caso 1. Muestra no Agrupada
1,2,2,5,2,6,4,2,5

=
=
n
i
i
x
n
X
1
1
Los datos
Nmero de pedidos diarios en un mes
en el Local M1 de Motopizza
10 13 21
Variable a
estudiar:
Nmero de
pedidos diarios
en un mes
Caso 2. Muestra Agrupada. Variable discreta (Tabla de Frecuencias)
10 13 21
10 24 25
21 15 14
15 10 15
22 21 23
24 20 14
10 13 14
15 20 23
25 13 15
23 14 27
Nmero de
pedidos diarios
en un mes en el
Local M1 de
n
i
f
i
N
i
F
i
PASO 4. Calcular las frecuencias acumuladas, tiene como papel informar
sobre el nmero o porcentaje de datos menores o iguales a un valor Xi.
De la tabla es posible
decir que el nmero de
datos menores o iguales Local M1 de
Motopizza
10 4 0,13 4 0,13
13 3 0,10 7 0,23
14 4 0,13 11 0,37
15 5 0,17 16 0,53
20 2 0,07 18 0,60
21 3 0,10 21 0,70
22 1 0,03 22 0,73
23 3 0,10 25 0,83
24 2 0,07 27 0,90
25 2 0,07 29 0,97
27 1 0,03 30 1,00
datos menores o iguales
a x4=15 es 16, lo que
corresponde a N4 = 16
Lo que significa:
que 16 de los das del mes se
realizaron 15 o menos de 15
pedidos diarios de pizzas.
1 11 1 2 22 2 3 33 3 4 44 4 5 55 5 Total Total Total Total
1 11 1
2 0 0 0 0 2
2 22 2
4 1 0 0 0 5
X
Y
Caso 2. Muestra Agrupada. Variable discreta (Tabla de Frecuencias)
X: Nmero de
personas que
componen la
familia
Y: Nmero de
3 33 3
2 4 1 0 0 7
4 44 4
0 5 3 5 0 13
5 55 5
3 2 0 4 1 10
6 66 6
3 5 2 2 1 13
Total Total Total Total
14 17 6 11 2
50
Y: Nmero de
personas
que generan
ingresos
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
i
m
i
i
m
i
i i
f x n x
n
X

= =
= =
1 1
1
X: Nmero de pedidos diarios en un mes

1
12

+ + + +
+ + + + + +
=
=

=
) 1 27 ( ) 2 25 ( ) 2 24 ( ) 3 23 ( ) 1 22 (
) 3 21 ( ) 2 20 ( ) 5 15 ( ) 4 14 ( ) 3 13 ( ) 4 10 (
30
1
30
1
12
1 i
i i
n x X
El Local M1 de Motopizza
entrega en promedio 17.6
pedidos diarios, es decir,
proximadamente 18 pedidos.
j
s
j
j
s
j
j j
f y n y
n
Y

= =
= =
1 1
1
Y: Nmero de personas que generan ingresos
Ejercicio: calcule e interprete:
Y: Nmero de personas que generan ingresos
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
(0-25] (25-60] (60-180] (180-250] (250-350]
Total
(0-10]
34 30 14 2 0 80
(10-40]
23 12 20 4 1 60
(40-90]
13 8 24 4 1 50
X
Y
Caso 2. Muestra Agrupada. Variable continua (Tabla de Frecuencias)
13 8 24 4 1 50
(90-150]
0 0 2 5 3 10
Total
70 50 60 15 5 200
X: rea cultivada (hectreas)
Y: Produccin anual de maiz (Toneladas)
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
Intervalo de clase (a,b]
Temperatura de la Pizza
Frecuencia
Absoluta del
intervalo i
Frecuencia
Relativa del
intervalo i
Frecuencia
Absoluta
Acumulada del
intervalo i
Frecuencia
Relativa
Acumulada del
intervalo i
69.51 - 73.51
73.51 - 77.51
77.51 - 81.51
81.51 - 85.51
85.51 - 89.51
89.51 - 93.51
2
8
9
15
4
2
0,05
0,20
0,23
0,38
0,10
0,05
2
10
19
34
38
40
0,05
0,25
0,48
0,86
0,96
1
i
m
i
i
m
i
i i
f x n x
n
X

= =

=

=
1 1
1
X: Temperatura (Pizzas)
Donde:
i
x

Es la marca de clase del
Intervalo i, para variables
de tipo continuo.
Intervalo Intervalo Intervalo Intervalo i para la variable X i para la variable X i para la variable X i para la variable X Marca de Marca de Marca de Marca de
clase clase clase clase ( ( ( ( x x x xi ii i ) )) )
ni ni ni ni
2
1 i i
i
l l
x
+
=


21 . 81
40
1
6
1
=

=

= i
i i
n x X
69.51 - 73.51 71.51 2
73.51 - 77.51 75.51 8
77.51 - 81.51 79.51 9
81.51 - 85.51 83.51 15
85.51 - 89.51 87.51 4
89.51 - 93.51 91.51 2
Las 40 pizass en estudio, son entregadas con una
temperatura en promedio de 81.21C
Propiedades de la Media Aritmtica
1. La suma de las desviaciones de los datos con respecto a la media es cero.
Si definimos la desviacin del dato x
i
con respecto al valor a como: d
i
= x
i
-a,
la propiedad puede escribirse como:
( ) 0
1
=

=
n
i
i
x x
La media es el centro de gravedad del conjunto de datos
Demuestre la propiedad 1.
Propiedades de la Media Aritmtica
Propiedad 2.
La suma de los cuadrados de las desviaciones de los datos con respecto a un
Valor a es mnima cuando a =
x
n
( )

=
=
n
i
i
a x a f
1
2
) ( x Tiene su mnimo en a =
Demuestre la propiedad 2.
Propiedad 3.
Si x
i
= k para todo i, es decir, todos los datos son iguales a una constante,
entonces,
k x =
Demuestre la propiedad 3.
Propiedad 4.
Si todos los datos de una muestra se multiplican por una constante, el nuevo
Promedio ser la constante por el promedio inicial.
x a y ax y si
i i
= =
Demuestre la propiedad 4.
Propiedad 5.
Si z
i
= axi + byi para todo i, donde a y b son constantes, entonces:
y b x a z + =
Demuestre la propiedad 5.
Propiedad 6.
Si una muestra de n individuos se divide en k-submuestras excluyentes y
exhaustivas de tamao n1, n2,..., nk, y con promedios
k
x x x , , ,
2 1
K
El promedio global est dado por:
k
k k
G
n n n
n x n x
x
+ + +
+ +
=
K
K
2 1
1 1
Demuestre la propiedad 6.
La media aritmtica de distribuciones condicionales
Se calcula sobre los elementos que cumplen la condicin
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
( )
.
2 2 1 1
i
s is i i
i
n
y n y n y n
x y M
+ + +
=
K
( )
s
i
is
i
i
i
i
i
y
n
n
y
n
n
y
n
n
x y M
.
2
.
2
1
.
1
+ + + = K
( )
s
i
is
i
i
i
i
i
y
n
n
y
n
n
y
n
n
x y M
.
2
.
2
1
.
1
+ + + = K
Media aritmtica de Y para los que satisfacen la condicin X=xi
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
i i i
n n n
. . .
( )
.
1
i
ij
i
n
n
x y f =
( ) ( ) ( ) ( )
s i s i i i
y x y f y x y f y x y f x y M + + + = K
2 2 1 1
( ) ( ) ( ) ( )
s i s i i i
y x y f y x y f y x y f x y M + + + = K
2 2 1 1
( ) ( )

=
=
s
j
j i j i
y x y f x y M
1
Se puede calcular tantas medias condicionales, como valores de x.
( ) ( ) ( )
m
x y M x y M x y M , , ,
2 1
K
(0-25] (25-60] (60-180] (180-250] (250-350]
Total
(0-10]
34 30 14 2 0 80
(10-40]
23 12 20 4 1 60
(40-90]
13 8 24 4 1 50
X
Y
Ejemplo: Calcule el promedio de Tonelada anuales que se produce en
Las fincas que tienen un rea cultivada entre 10 y 40 hectreas.
13 8 24 4 1 50
(90-150]
0 0 2 5 3 10
Total
70 50 60 15 5 200
X: rea cultivada (hectreas)
Y: Produccin anual de maiz (Toneladas)
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
( ) ( ) ( ) ( )
s i s i i i
y x y f y x y f y x y f x y M + + + = K
2 2 1 1
Produccin ( Produccin ( Produccin ( Produccin (Yj Yj Yj Yj) )) ) f( f( f( f(Yj Yj Yj Yj/X2) /X2) /X2) /X2) Y Y Y Yi ii i
(0-25] 23/60 = 0.383 12.5
(25-60] 12/60 = 0.200 42.5
(60-180] 20/60 = 0.333 120 (60-180] 20/60 = 0.333 120
(180-250] 4/60 = 0.066 215
(250-350] 1/60 = 0.016 300
( ) ( ) ( ) ( ) ( ) ( ) 300 016 . 0 215 066 . 0 120 333 . 0 5 . 42 2 . 0 5 . 12 383 . 0
2
+ + + + = x y M
( ) 24 . 72
2
= x y M
El promedio de Toneladas anuales que producen las
Fincas que tienen entre 10 y 40 Hectreas cultivadas,
es 72.24 Ton. De Maiz
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
Importante propiedad!
La media de las medias condicionales coincide con la media de
todos los datos.
Si se hace una particin de los elementos de la muestra de
acuerdo con los valores de la caracterstica X, colocando en un
conjunto los que tienen X = x , en otra los que tienen X = x y as conjunto los que tienen X = x1, en otra los que tienen X = x2 y as
sucesivamente, y a cada grupo calculamos la media aritmtica, de
la caracterstica Y, entonces por la propiedad de la media
aritmtica Roberto Behar y Mario Yepes
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
( ) ( ) ( )
n
n x y M n x y M n x y M
y
m m
+ + +
=
K
2 2 1 1
La Mediana (Me): la mediana corresponde al
segundo cuartil.
La Mediana es el valor que supera no ms de la mitad de
los datos y es superado por no ms de la mitad de ellos
Caso 1. La muestra no agrupada

+
=
|

\
|
+
+
par es n si
X X
impar es n si X
Me
n
n
n
,
2
,
1
2
2
2
1
Para calcular la mediana
se requiere que los datos
sean organizados de forma
creciente o decreciente

+
=
|

\
|
+
|

\
|
|

\
| +
par es n si
X X
impar es n si X
Me
n n
n
,
2
,
1
2 2
2
1

par es n si ,
2
Calcule la mediana de los siguientes datos: 1, 3, 5, 8, 9, 11, 20
n=7
) 7 ( ) 6 ( ) 5 ( ) 4 ( ) 3 ( ) 2 ( ) 1 (
, , , , , , X X X X X X X
( )
8
4
2
1 7
= = =
|

\
| +
X X Me

+
=
|

\
|
+
|

\
|
|

\
| +
par es n si
X X
impar es n si X
Me
n n
n
,
2
,
1
2 2
2
1

par es n si ,
2
Calcule la mediana de los siguientes datos: 1.2, 3.1, 5, 7.1, 8, 9, 11, 20
Caso 2. Muestra Agrupada. Variable continua (Tabla de Frecuencias)
(0-25] (25-60] (60-180] (180-250] (250-350]
Total
(0-10]
34 30 14 2 0 80
(10-40]
23 12 20 4 1 60
(40-90]
13 8 24 4 1 50
X
Y
13 8 24 4 1 50
(90-150]
0 0 2 5 3 10
Total
70 50 60 15 5 200
( )
i
i
L
i
c
f
F
L Me
i
*
5 . 0
1
1

+ =

Estadstica Descriptiva . UNIVALLE. feb-jun 2009
Intervalo de clase (a,b]
Temperatura de la Pizza
Frecuencia
Absoluta del
intervalo i
Frecuencia
Relativa del
intervalo i
Frecuencia
Absoluta
Acumulada del
intervalo i
Frecuencia
Relativa
Acumulada del
intervalo i
69.51 - 73.51
73.51 - 77.51
77.51 - 81.51
81.51 - 85.51
85.51 - 89.51
89.51 - 93.51
2
8
9
15
4
2
0,05
0,20
0,23
0,38
0,10
0,05
2
10
19
34
38
40
0,05
0,25
0,48
0,86
0,96
1
Es el dato por debajo del cual se encuentra el 50% de las observaciones de
X. cul es ese valor?
( ) ( ) ( )

>
+

=

m
i i i
i
i
i
L x para
L x L para L x
c
f
L F
L x para
x F
1
0
1 1 1
0
( ) ( )
i i i
i
i
i
L x L para L x
c
f
L F x F + =
1 1 1
) (
Calculemos al Mediana para X: Temperatura de entrega pizza
Si despejamos X de esta expresin Si despejamos X de esta expresin
encontraremos el valor de la mediana
( ) ( ) 40 10 10
30
30 . 0
10 5 . 0 + = x para Me F
( )
30
30 . 0
) 10 ( 5 . 0
10

+ =
F
Me
Me X =
30 . 0
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
( )
20 30
30 . 0
4 . 0 5 . 0
10 =

+ = Me
20 = Me
El 50% de las fincas tienen 20 menos de 20 hectreas de cultivo
de Maz.
Propiedades de la Mediana
La suma de las distancias de los datos a un punto "a" es
mnima cuando ese punto es la mediana, es decir:
( )

=
n
a x a f
Entonces f(a) tiene mnimo en
( )

=
=
i
i
a x a f
1
Entonces f(a) tiene mnimo en
a=Me
Propiedades de la Mediana
La mediana es robusta o no es sensible a valores extremos.
Ejemplo:
Si los salarios de los empleados de una empresa tienen la siguiente
distribucin:
5
= =

Salario Xi Salario Xi Salario Xi Salario Xi fi fi fi fi


$100.000 0.20
$120.000 0.10
$130.000 0.25
$150.000 0.40
$1.200.000 0.05
( ) ( ) ( ) ( ) ( ) 05 . 0 1200000 4 . 0 150000 25 . 0 130000 10 . 0 120000 20 . 0 100000
500 . 184 *
1
+ + + + =
= =

=
x
f x x
i
i i
500 . 184 = X
No resulta ser un buen
Indicador.
Salario Xi Salario Xi Salario Xi Salario Xi fi fi fi fi Fi Fi Fi Fi
$100.000 0.20 0.20
$120.000 0.10 0.30
$130.000 0.25 0.55
$150.000 0.40 0.95
$1.200.000 0.05 1.00
Ahora calculemos la mediana.
000 . 130 = Me
$1.200.000 0.05 1.00
Este si resulta ser un
Indicador que describe mejor
el comportamiento de los
Salarios en esta empresa
La Moda:es el valor de la observacin que
aparece con ms frecuencia en la muestra.
Caso 1. La muestra no agrupada.
2, 3, 1, 1, 1, 4, 3, 1, 5, 1, 5, 2
Mo=1
Calcule la Moda para el siguiente conjunto de datos:
2, 4, 5,6, 9, 6, 9, 5, 5, 5, 8, 8, 8, 4, 7, 7, 7, 7
Intervalo de clase (a,b]
Temperatura de la Pizza
Frecuencia
Absoluta del
intervalo i
Frecuencia
Relativa del
intervalo i
Frecuencia
Absoluta
Acumulada del
intervalo i
Frecuencia
Relativa
Acumulada del
intervalo i
Caso 2. Muestra Agrupada. Variable continua (Tabla de Frecuencias)
Cuando se trata de una variable de naturaleza continua, la moda corresponde al(os)
valor(es) alrededor del(os) cual(es) se produce una mayor concentracin de datos, es
decir a los puntos de mayor densidad de frecuencia.
69.51 - 73.51
73.51 - 77.51
77.51 - 81.51
81.51 - 85.51
85.51 - 89.51
89.51 - 93.51
2
8
9
15
4
2
0,05
0,20
0,23
0,38
0,10
0,05
2
10
19
34
38
40
0,05
0,25
0,48
0,86
0,96
1
Caso 2. Muestra Agrupada. Variable continua (Tabla de Frecuencias)
(0-25] (25-60] (60-180] (180-250] (250-350]
Total
(0-10]
34 30 14 2 0 80
(10-40]
23 12 20 4 1 60
(40-90]
13 8 24 4 1 50
X
Y
13 8 24 4 1 50
(90-150]
0 0 2 5 3 10
Total
70 50 60 15 5 200
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
Cuando se trata de una variable de naturaleza continua, la moda corresponde al(os)
valor(es) alrededor del(os) cual(es) se produce una mayor concentracin de datos, es
decir a los puntos de mayor densidad de frecuencia.
Si se conociera la funcin de densidad en forma analtica, podramos
encontrar la(s) moda(s), por derivacin de la funcin f(x); pero como
slo se dispone de la funcin de densidad emprica que se construy a
partir de la muestra, se debe definir un procedimiento que permita
acercarse a la determinacin de los mencionados mximos relativos
Intervalo Modal.
Entre Li-1 y Li se
encuentra la
Moda
Observe que si las dos clases adyacentes: la anterior
y la siguiente, tienen igual densidad de frecuencias,
se puede suponer que la Moda se encuentra en el
punto medio de la clase que contiene la Moda. En
caso contrario la Moda estar desplazada un poco caso contrario la Moda estar desplazada un poco
hacia la clase adyacente de mayor densidad de
frecuencia.
Tringulos
semejantes
dos tringulos son
semejantes si sus
ngulos son
iguales dos a dos.
Mo= L(i-1)+r
Proyeccin
del punto O
r C
r
OF
OG
i

= =

2
1
Del grfico podemos decir que:
i
C r *
2 1
1
+

=
De ah que:
i i
C L Mo *
2 1
1
1
+

+ =

1
1
1

=
i
i
i
i
C
f
C
f
1
1
2
+
+
=
i
i
i
i
C
f
C
f
Reemplazando en la expresin anterior y por:
1

f f
i
i
i
i
i
i
i
i
i
i
i
i
C
C
f
C
f
C
f
C
f
C
f
L Mo *
2
1
1
1
1
1
1
1
+
+

+ =
Intervalo de clase (a,b]
Temperatura de la Pizza
Frecuencia
Absoluta del
intervalo i
Frecuencia
Relativa del
intervalo i
Frecuencia
Absoluta
Acumulada del
intervalo i
Frecuencia
Relativa
Acumulada del
intervalo i
Caso 2. Muestra Agrupada. Variable continua (Tabla de Frecuencias)
Calcule la Moda para la variable Temperatura de entrega de la Pizza
69.51 - 73.51
73.51 - 77.51
77.51 - 81.51
81.51 - 85.51
85.51 - 89.51
89.51 - 93.51
2
8
9
15
4
2
0,05
0,20
0,23
0,38
0,10
0,05
2
10
19
34
38
40
0,05
0,25
0,48
0,86
0,96
1
Calcule la Mo para la variable X.
(0-25] (25-60] (60-180] (180-250] (250-350]
Total
(0-10]
34 30 14 2 0 80
(10-40]
23 12 20 4 1 60
(40-90]
13 8 24 4 1 50
X
Y
13 8 24 4 1 50
(90-150]
0 0 2 5 3 10
Total
70 50 60 15 5 200
71 . 5 10 *
30
3 . 0 0
10
4 . 0
2
0
10
4 . 0
0
1
1
=

+ =

i
i
C
C
Mo
Las 200 Fincas en
estudio se caracterizan
por tener alrededor de
5.71 Hectreas
cultivadas.
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
(0-25] (25-60] (60-180] (180-250] (250-350]
Total
(0-10]
34 30 14 2 0 80
(10-40]
23 12 20 4 1 60
(40-90]
13 8 24 4 1 50
X
Y
Calcule e interprete la Mo para la variable Y.
13 8 24 4 1 50
(90-150]
0 0 2 5 3 10
Total
70 50 60 15 5 200
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
La Media Geomtrica de una muestra de los
datos: x1, x2,..., xn, se define como:
n
n
x x x G M = K
2 1
.
Caso 1. Muestra no Agrupada
Esta es una medida
que puede aplicarse
al crecimiento
exponencial o inters
compuesto, pues
obtiene la raz
n
n
x x x G M = K
2 1
.
Caso 2. Muestra Agrupada (Tabla de Frecuencias)
n
n
m
n n
m
x x x G M = K
2 1
2 1
.
Donde:
i i
x x

=
Es la marca de clase del
Intervalo i, para variables
de tipo continuo.
obtiene la raz
ensima de un grupo
de n datos
multiplicados entre s
Una poblacin que tena 10.000 habitantes en el ao cero, creci el primer
ao a una tasa del 2%, el segundo ao creci a una tasa del 4% y el tercer
ao al 10%. Cul es el factor de expansin promedio de la poblacin en
los 3 aos?
P3 = P0 . f1 . f2 . f3 = 11.669
3
0 3 2 1 0
f P f f f P =
Como f es el factor
de expansin
MG f f f f = =
3
MG f f f f = =
3
3 2 1
Con el ejemplo:
0527 . 1 ) 10 . 1 ( ) 04 . 1 ( ) 02 . 1 (
3
= = f
Lo que implica que la tasa promedio de creciemiento
de la poblacin fue de 5.27%
Evalan el nivel de representatividad de los indicadores de tendencia
Central.
Depende de la dispersin o grado de homogeneidad de los datos Depende de la dispersin o grado de homogeneidad de los datos
de la muestra.
A: 2,98,3,97
B: 49,51,48,52
50 = X
La media no es representativa
del conjunto A
El rango (r): es La distancia entre el valor mximo y
el valor mnimo de un conjunto de datos.
r = max-min
Ejemplo: calcule el rango del siguiente conjunto de datos:
50, 47, 32, 51, 38, 45, 46, 34.
r = max-min= 51-32 =19
Observe: 2, 3, 4, 7, 1, 11, 2, 3, 94
r = 94-1= 93
El rango es sensible a
Valores extremos
La desviacin Mediana (DM): es un indicador
de dispersin que corresponde a la distancia
promedio de los datos a la mediana.
Caso 1. Datos no agrupados
Me x
n


n
Me x
M D
i
i
=

=
1
.
Caso 2. Datos agrupados
n
Me x n
M D
m
i
i i
=

=
1
.
Donde:
i i
x x

=
Es la marca de clase del
Intervalo i, para variables
de tipo continuo.
Calcule la DM para la variable X.
(0-25] (25-60] (60-180] (180-250] (250-350]
Total
(0-10]
34 30 14 2 0 80
(10-40]
23 12 20 4 1 60
(40-90]
13 8 24 4 1 50
X
Y
13 8 24 4 1 50
(90-150]
0 0 2 5 3 10
Total
70 50 60 15 5 200
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
X: rea cultivada (hectreas)
Y: Produccin anual de maiz (Toneladas)
Intervalos Intervalos Intervalos Intervalos
de clase X de clase X de clase X de clase X
Marca Marca Marca Marca
de clase de clase de clase de clase
ni ni ni ni fi fi fi fi Ni Ni Ni Ni Fi Fi Fi Fi
(0-10]
5 80
0.4 80 0.4
(10-40]
25 60
0.30 140 0.7
(40-90]
65 50
0.25 190 0.95
(90-150]
120 10
0.05 200 1
20 = Me
( ) 20 120 05 . 0 20 65 25 . 0 20 25 30 . 0 20 5 4 . 0 20 .
1
+ + + =

=
m
i
i i
x f M D
75 . 23 20 .
1
=

=
m
i
i i
x f M D
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
Indica que los datos de
Hectreas cultivadas estn
alejados de la Mediana en
promedio 23.75 hectreas
Calcule e interprete la DM para la variable Y.
(0-25] (25-60] (60-180] (180-250] (250-350]
Total
(0-10]
34 30 14 2 0 80
(10-40]
23 12 20 4 1 60
(40-90]
13 8 24 4 1 50
X
Y
13 8 24 4 1 50
(90-150]
0 0 2 5 3 10
Total
70 50 60 15 5 200
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
La Varianza (s
2
): es la medida de dispersin ms
utilizada en estadstica.
Caso 1. Muestra no Agrupada
( )

=
n
x x S
2
2
1
Caso 2. Muestra Agrupada (Tabla de Frecuencias)
( )

=
=
i
i
x x
n
S
1
2
( )

=
=
m
i
i i
x x n
n
S
1
2
2
1
Donde: i i
x x

=
Es la marca de clase del
Intervalo i, para variables
de tipo continuo.
Cmo interpretar la varianza?
No es posible realizar una interpretacin
directa, pues la unidades de este indicador
se encuentra en unidades cuadradas de la
variable de estudio. Aunque resulta amplia
de ventajas para manipulacin matemtica
Desviacin estndar
( )

=
m
i
i i
x x n
n
S
1
2
1
1
Calcule e interprete la desviacin estndar para los datos Temperatura de entrega
De las pizzas.
Intervalos Intervalos Intervalos Intervalos
de clase X de clase X de clase X de clase X
Marca Marca Marca Marca
de clase de clase de clase de clase
ni ni ni ni fi fi fi fi Ni Ni Ni Ni Fi Fi Fi Fi
(0-10]
5 80
0.4 80 0.4
(10-40]
25 60
0.30 140 0.7
(40-90]
65 50
0.25 190 0.95
75 . 31 = X
(40-90]
65 50
0.25 190 0.95
(90-150]
120 10
0.05 200 1
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) | |
2 2 2 2
1
2 2
75 . 31 120 10 75 . 31 65 50 75 . 31 25 60 75 . 31 5 80
200
1 1
+ + + = =

=
m
i
i i
x x n
n
S
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
( ) | | 7 , 965 7 , 193137
200
1 1
1
2
2
= = =

=
m
i
i i
x x n
n
S
1 . 31 7 , 965 = = S
Los datos de las hectreas se alejan en promedio 31.1
hectreas de la media.
Principio de Tchebychev:
Una interpretacin de la desviacin estndar puede hacerse a travs del principio
de Tchebychev) que expresa que para cualquier muestra x1, x2, ...,xn se cumple
que si se construye un intervalo con centro en la media y con extremos ubicados a
una distancia de k veces la desviacin estndar S, en dicho intervalo est por lo
menos
100
1
1
2

|

\
|

k
2
1
1 ) ; (
k
ks x ks x f +
100 1
2

|

\

k
A dos desviaciones estndar est por lo menos el 75% de los datos. Para 3 desviaciones
Por lo menos el 88.8%
Para la temperatura de la pizza aplique el teorema de Tchebychev
Propiedad 1.
( )
2
1
2
2
x
n
x
s
n
i
i
=

=
Forma alternativa para calcular la varianza
Demuestra la propiedad 1.
Propiedad 2.
0
2
s
Si xi = k, entonces
Propiedad 3.
0
2
= s
Demuestra la propiedad 3.
Propiedad 4.
Si yi=kxi, entonces
2 2 2
x y
s k s =
Demuestra la propiedad 4.
Propiedad 5.
2 2
s s =
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
Si yi=k+xi, entonces
Demuestra la propiedad 5.
2 2
x y
s s =
Coeficiente de variacin (cv): indicador que involucra la magnitud
de los datos que se estudian. Expresa la desviacin como un
porcentaje de la media aritmtica.
una desviacin estndar de 200 metros es grande o es pequea ? o de otra
manera: una desviacin estndar de 200 metros me indica que hay poca o
mucha dispersin ? mucha dispersin ?
R// Depende
Por ejemplo: la distancia recorrida diariamente por un cartero, registrada durante 30
das. En este caso, una desviacin estndar de 200 metros puede ser pequea, as
como una desviacin estndar de 10 micras podra ser grande si se est estudiando el
dimetro de ciertas clulas.
% 100 . =
x
s
V C
% 100 . =
x
s
V C
Coeficiente de variacin (cv):
El coeficiente de variacin se utiliza para comparar variabilidad relativa
Expresa la desviacin estndar como un porcentaje de
la media aritmtica.
El coeficiente de variacin se utiliza para comparar variabilidad relativa
de una caracterstica en poblaciones de diferentes medias.
Varianza de Y para los que satisfacen la condicin X=xi y cuya media
Aritmtica es :
( )
i
x y M
( ) | |

=
=
s
j
ij i j
i
x y
n x y M y
n
S
i
1
2
.
2
1
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
= j
i
n
1
.
( ) | | ( ) | | ( )

= =
= =
s
j
i i j
s
j
i
ij
i j
x y
x y f x y M y
n
n
x y M y S
i
1
2
1
.
2
2
(0-25] (25-60] (60-180] (180-250] (250-350]
Total
(0-10]
34 30 14 2 0 80
(10-40]
23 12 20 4 1 60
X
Y
Ejemplo: Calcule la desviacin estandar de Tonelada anuales que s
e produce en las fincas que tienen un rea cultivada entre 10 y 40
hectreas.
(40-90]
13 8 24 4 1 50
(90-150]
0 0 2 5 3 10
Total
70 50 60 15 5 200
X: rea cultivada (hectreas)
Y: Produccin anual de maiz (Toneladas)
Estadstica Descriptiva . UNIVALLE. feb-jun 2009
Produccin ( Produccin ( Produccin ( Produccin (Yj Yj Yj Yj) )) ) f( f( f( f(Yj Yj Yj Yj/X2) /X2) /X2) /X2) Y Y Y Yi ii i
(0-25] 23/60 = 0.383 12.5
(25-60] 12/60 = 0.200 42.5
(60-180] 20/60 = 0.333 120
(180-250] 4/60 = 0.066 215
( ) | | ( ) | | ( )

= =

=
6
1
2
2
2
6
1
. 2
2
2
2
2
2
j
j
j
j
j
x y
x y f x y M y
n
n
x y M y S
( ) 24 . 72
2
= x y M
(180-250] 4/60 = 0.066 215
(250-350] 1/60 = 0.016 300
Estadstica Descriptiva . UNIVALLE. feb-jun 2009