Вы находитесь на странице: 1из 13

Estadstica Descriptiva

Juan Carlos Arango Parra

1.

Conceptos Bsicos

Un experimento estadstico es una secuencia de observaciones que caracteriza a un


fenmeno donde se pueden obtener datos de interes. El lanzamiento de una moneda es un
experimento, as como lanzar uno, dos o ms dados, la preferencia en una votacin, el salario
de una determinado grupo de personas, etctera. La Poblacin en el experimento estadstico
es el conjunto de todas las observaciones posibles, mientras que la Muestra es un subconjunto de las observaciones, es decir, de la poblacin; el tamao de la muestra se denota con la letra n.
En el experimento de las preferencias en una eleccin presidencial en un pas, la poblacin
es el conjunto de todas las personas que tienen el derecho a votar, mientras que la muestra
es la cantidad de personas que se eligen de esta poblacin con miras a estimar cuales son las
preferencias por los candidatos y hacer entonces un estimativo alusivo a la poblacin.
La estadstica descriptiva se utiliza cuando se encuentra disponible la poblacin completa y
no existe incertidumbre o cuando se tienen grandes conjuntos de datos. En las definiciones que se
presentan a continuacin se supondr que la muestra P tiene tamao n y datos x1 , x2 , x3 , . . . , xn .
Definicin 1 Frecuencia Absoluta El nmero de veces que aparece un dato xi en una muestra
se llama frecuencia absoluta, se denota fi .

La frecuencia relativa es el cociente entre la frecuencia absoluta del dato y el tamao de


la muestra, fi = fni . Mientras que la frecuencia acumulada del dato xj consiste en la suma de
las frecuencias absolutas de los datos menores o iguales que l, Fj = f1 + f2 + . . . + fj1 + fj .
Al dividir la frecuencia acumulada entre el tamao de la muestra se obtiene la frecuencia
F
relativa acumulada, Fj = nj .
Sea P una muestra de tamao n con k datos distintos (k n) x1 , x2 , . . . , xk1 , xk Se
desprenden dos propiedades, la primera es que la frecuencia relativa es un nmero comprendido
entre 0 y 1, 0 fi 1 y la suma de las frecuencias relativas de los k datos distintos, el resultado
k
P
es 1, se escribe
fi = 1.
i=1

Definicin 2 Media Aritmtica La media aritmtica de la muestra P = {x1 , x2 , . . . , xn } es


el nmero
n
X
xi
x=
n
i=1

La media aritmtica tambin recibe el nombre de promedio entre los datos de la muestra.
Si los datos de la muestra P = {x1 , x2 , . . . , xk } se puede agrupar en k clases con frecuencias
absolutas f1 , f2 , . . . , fk entonces la media aritmtica se puede calcular como
x=

k
X
fi xi
i=1

La media aritmtica tambin se conoce como centro de gravedad, ya que en fsica permite
calcular el centro de masa de una conjunto de n partculas de igual masa distribuidas sobre una
varilla. La media aritmtica tiene las mismas unidades que el conjunto de datos.

Definicin 3 Mediana Supngase que la muestra P = {x1 , x2 , . . . , xn } se ordena en forma


creciente, la mediana de la muestra P, representada Me , es el valor medio (si n es impar) y el
valor promedio entre los valores medios (si n es par).

Ntese que para la muestra P1 = {4, 0, 2, 3, 4, 5, 6, 6, 7} que ya est ordena de menor a mayor,
el tamao es 9 que es impar, el dato de la mitad, es decir, aquel que divide la muestra en 2 partes
iguales es Me = x5 = 4, ntese que la posicin del dato se halla a travs de la expresin n+1
2 .
Por otro lado para la muestra P2 = {2, 1, 0, 1, 1, 3, 4, 5, 5, 6, 6, 7} que tiene tamao n = 12,
par, los datos de la mitad son x6 = 3 y x7 = 4, en este caso la mediana corresponde al promedio
n
n+1
entre ambos datos, Me = 3+4
2 = 3,5. La posicin de los datos del medio son 2 y 2 . Con base
en estos ejemplos, la mediana se puede escribir como

Me =

(
xk

xk +xk+1
2

Si n es impar y k =
Si n es par y k = n2

n+1
2

Ejemplo 1 Para las tres muestras P1 = {1, 2, 3, 4, 5, 6}, P2 = {1, 1, 1, 6, 6, 6} y


P3 = {13, 2, 3, 4, 5, 20} la media aritmtica son iguales ya que la suma de los datos
equivale a 21, as x1 = x2 = x3 = 21
6 = 3,5. Como cada muestra tiene tamao par, n = 6,
entonces la mediana es el promedio de los valores medios ubicados en las posiciones 3 y 4,
1+6
3+4
por lo que Me1 = 3+4
2 = 3,5, Me2 = 2 = 3,5 y Me3 = 2 = 3,5. Las tres muestras tienen
igual media aritmtica e igual mediana, parece entonces que las tres muestras brindan igual
informacin, sin embargo en trminos de homogeneidad, la primera est mejor distribuida ya
que la distancia entre los datos se hace mnima, esta homogeneidad est determinada por la
varianza o desviacin estndar.

Definicin 4 Moda La moda de un conjunto de datos, denotada M0 , es la observacin de


mayor frecuencia.

En el caso que la muestra tenga dos valores con mayor frecuencia, a la muestra se le llama
bimodal. Respecto del ejemplo 1 se sigue que las muestras P1 y P3 carecen de moda, ya que
cada dato tiene igual frecuencia, mientras que la muestra P2 es bimodal ya que 1 y 6 tienen una
frecuencia de 3, as M02 = 1 = 6.

Teorema 1 Teorema de Kring Sea P = {x1 , x2 , . . . , xn } una muestra de tamao n. Considere la funcin
n
X
f (x) = (x x1 ) + (x x2 ) + . . . + (x xn ) =
(x xi )2
2

i=1

El valor mnimo de f ocurre para x.

Demostracin
n
P
Al derivar la funcin f resulta f (x) =
2(x xi ) que por las propiedades de la sumatoria
i=1


n
P
P xi
se escribe f (x) = 2 nx
igualando a cero resulta x =
n = x, este es el nmero crtico,
i=1

como la segunda derivada es f (x) = 2n > 0 entonces x = x es el valor mnimo de f .

La funcin f del teorema 1 representa el cuadrado de la distancia entre los datos xi , ubicados
en una recta numrica, respecto de un x, por lo tanto dicho cuadrado de la distancia se
n
P
minimiza con la media aritmtica, donde f (x) =
(xi x)2 , al trmino x x se le conoce como
i=1

desviacin; queda por demostrar que la media aritmtica de las desviaciones es cero, es decir,
n
P
xi x
n = 0. La imagen f (x) permite definir la varianza como sigue, la cual se conoce tambin
i=1

como la varianza corregida.

Definicin 5 Varianza La varianza, S 2 , de una muestra P se define como


n

S2 =

1 X
(xi x)2
n1
i=1

Con base en la definicin de varianza, se sigue que es un nmero no-negativo, adems tiene
el cuadrado de las unidades en que estn expresados los datos xi de la muestra P, es por ello
que recurre a la desviacin estndar o desviacin tpica, denotada S y que corresponde con
3


la raz cuadrada positiva de la de la varianza S = S 2 . La desviacin estndar hace alusin a
la distancia mnima entre los datos y las unidades de medida son las mismas que los datos de la
muestra. Si la muestra P se agrupa en k clases diferentes entonces la varianza se escribe como
k
1 P
S 2 = n1
fi (xi x)2 . A menor desviacin estndar hay mayor homogeneidad o agrupamiento
i=1

de los datos.

Teorema 2 La varianza de una muestra Px = {x1 , x2 , . . . , xn } se escribe como


#
" n
X
1
x2i nx2
S2 =
n1
i=1

Demostracin
Al expandir la expresin (xi x)2 en la definicin de varianza resulta
n

1 X 2
S =
(xi 2xi x + x2 )
n1
2

i=1

Como la sumatoria es lineal y tanto 2 como x son constantes entonces la suma anterior se escribe
como
" n
#
n
n
X
X
X
1
2
2
2
S =
xi 2x
xi + x
1
n1
i=1

i=1

Por la definicin de media aritmtica se sigue que nx =

i=1

n
P

xi y al ser

i=1

n
P

1 = n entonces la

i=1

igualdad anterior se escribe como


" n
#
" n
#
X
X
1
1
2
2
2
2
2
2
S =
xi 2nx + nx =
xi nx
n1
n1
i=1

Que era el objetivo de la demostracin.

i=1

Esta propiedad de la varianza resulta ms cmoda de utilizar ya que la media aritmtica es


conocida y resta calcular los cuadrados de los datos. Por un procedimiento
anlogo
demuestre
 k

P
1
que si la muestra n est dividida en k clases entonces S 2 = n1
fi x2i nx2 .
i=1

Teorema 3 Sea Px = {x1 , x2 , . . . , xn } una muestra de tamao n. El cuadrado de la media


n
P
x2i
aritmtica de Px no excede la media de los cuadrados de los datos, es decir, x2
n.
i=1

Demostracin

Una expresin alternativa a demostrar es que x

n
P

i=1

x2i
n.

Para la demostracin de esta

propiedad existen dos alternativas, la primera es utilizando el hecho que S 2 0 y hacer uso del
teorema 2 o utilizando la desigualdad de Cauchy-Schwarz que se expresa como
v
v
u n
u n
n
X
uX
uX
2
t
ai bi
ai t
b2i ()
i=1

Si hacemos que ai = xi y bi =
la desigualdad se tiene

1
n

i=1

para i = 1, 2, . . . , n entonces ai bi =

i=1

n
P

i=1

1
n2

1
n

yx=

n
P

i=1

xi
n

xi
n,

por tanto al sustituir en

v
v
u n
u n
uX
uX 1
t
x2i t
n
n2

n
X
xi

Como

i=1

i=1

i=1

entonces por las propiedades de radicacin se tiene


v
v
r
u n
u n 2
uX
uX xi
1
xt
x2i
=t
n
n
i=1

i=1

Y as la demostracin concluye. Se sugiere hacer uso de la otra alternativa.

.

Ejemplo 2 Considere la muestra Px = {7, 3, 2, 1, 5, 8} si a cada dato se desplaza tres


unidades a la derecha resulta la muestra Py = {4, 0, 1, 4, 8, 11}. La media aritmtica de la
muestra Px es x = 13 , mientras que para Py su media aritmtica es y = 10
3 , ntese que y = x + 3,
es decir, la media aritmtica de la muestra original tambin se desplaza tantas unidades como
los datos, mientras que las varianzas se conservan, ya que el desplazamiento no afecta las
distancias entre los datos, en este caso Sx2 = Sy2 = 454
15 30,26. Por otro lado, la mediana de
2+1
1
la muestra Px es Mex = 2 = 2 (n es par) mientras que la mediana de la otra muestra es
5
Mey = 1+4
2 = 2 , de igual forma, Mey = Mex + 3.
Teorema 4 Sea Px una muestra de tamao n. Si yi = xi + c entonces se obtiene la muestra
Py = {y1 , y2 , . . . , yn } donde y = x + c, Sx2 = Sy2 y Mey = Mex + c.
Demostracin
Por definicin, la media aritmtica de la muestra Py es y =

yi = xi + c entonces

y=

n
X
xi + c
i=1

n
X
xi
i=1

n
X
c
+
n
n
i=1

n
P

i=1

yi
n,

()

como los yi son de la forma

Debido a que

n
P

i=1

xi
n

n
P

es la media aritmtica de la muestra Px y

i=1

c
n

c
n

n
P

1 = c entonces

i=1

al sustituir en () se sigue que y = x + c. Para el clculo de la varianza se tiene que yi y =


(xi + c) (x + c) = xi x, es decir, las desviaciones respecto de y son las mismas que respecto
n
n
1 P
1 P
(yi y)2 = n1
(xi x)2 , as Sy2 = Sx2 . Para demostrar la igual
de x por lo que Sy2 = n1
i=1

i=1

relativa a las medianas, se consideran dos casos, si n es impar, Me coincide con Mex = xk donde
k = n+1
2 , como Mey = yk entonces por la definicin de los yi = xi + c se sigue que Mey = xk + c
x +x
y as Mey = xk + c = Mex + c; en el caso de que n sea par, Mex = k 2 k+1 siendo k = n2 , por lo
que
yk + yk+1
(xk + c) + (xk+1 + c)
xk + xk+1
Mey =
=
=
+c
2
2
2
Se concluye entonces que Mey = Mex + c en cualquiera de los casos para n. 

Ejemplo 3 Considere la muestra Px = {4, 2, 1, 3, 3, 5, 5} a partir de sta e obtiene la


muestra Py = {8, 4, 2, 6, 6, 10, 10}, multiplicando cada dato por 2. Las medianas son
Mex = 3 y Mey = 6 (n impar) en este caso se presenta la igualdad Mey = 2Mex . Para la
media aritmtica de cada muestra resulta x = 97 y y = 18
7 resultando en la igualdad y = 2x,
2 = 1084 , por lo que S 2 = 22 S 2 . Es decir, la media
las desviaciones equivalen a Sx2 = 271
y
S
y
y
x
21
21
y la mediana se multiplican por 2, es decir, en el mismo factor que los datos, mientras que la
varianza se multiplica por el cuadrado de dicho factor.

Teorema 5 Si la muestra Py = {y1 , y2 , . . . , yn } se obtiene de la muestra Px = {x1 , x2 , . . . , xn }


al multiplicar cada dato por la constante c, yi = cxi entonces y = cx, Mey = cMex y Sy2 = c2 Sx2 .

Demostracin
Con base en la definicin de media aritmtica y por el hecho que yi = c xi se tiene
y=

n
X
yi
i=1

n
X
c xi
i=1

=c

n
X
xi
i=1

Se logra concluir con esto que y = cx. Para las desviaciones resulta yi y = cxi cx = c(xi x),
por la definicin de varianza se tiene
Sy2 =

i=1

i=1

1 X
1 X 2
(yi y)2 =
c (xi x)2
n1
n1

Esta ltima expresin se puede escribir como

Sy2

c2

1
n1

n
P

(xi

i=1

x)2

= c2 Sx2 . Para la

demostracin de la mediana nuevamente se consideran los dos casos, para n impar, Mex = xk
con k = n+1
2 , mientras que la mediana de la muestra Py es Mey = yk = c xk , que por sustitucin
6

y +y

cx +cx

resulta Mey = cMex ; en el caso en que n sea par Mey = k 2 k+1 = k 2 k+1 = c
donde k = n2 y as se concluye que Mey = cMex para cualquiera de los casos. 

xk +xk+1
2

Ejemplo 4 Se desea construir una muestra de tamao 2 que tenga media aritmtica cero y
varianza 1. Consideremos la muestra Px = {a, b}, como x = 0 entonces a+b
2 = 0 de donde
2 + b2 = 1 que al reemplazar
a = b (1). La varianza debe dar 1, por el teorema
2
se
sigue
que
a

a = b se tiene que 2b2 = 1 y as b = 12 = 22 , por lo que a = 22 y por tanto la muestra que


n o
se pide es Px = 22 , 22 . Ntese que en el proceso de solucin resultaron dos ecuaciones con
dos incgnitas, con este mismo algoritmo habr forma de hallar una muestra de tamao 3 con
las mismas caractersticas.

Teorema 6 Sea Px = {x1 , x2 , . . . , xn } una muestra de tamao n con media aritmtica x y


desviacin estndar Sx . Si Py = {y1 , y2 , . . . , yn } es una muestra de tamao n tal que yi = xSi x
x
entonces y = 0 y Sy2 = 1.

Demostracin
Por una propiedad propuesta

n
P

i=1

xi x
n

= 0, entonces por la definicin de la media aritmtica

para la muestra Py y por el hecho que yi =


y=

n
X
yi
i=1

xi x
Sx

entonces

n
X
xi x
i=1

nSx

n
1 X xi x
=
Sx
n
i=1

De all que y = 0. Con base en este resultado se tiene que yi y = yi =


la definicin de varianza se tiene
Sy2

i=1

i=1

1 2
S
Sx2 x

x), con base en

1 X
1 X (xi x)2
=
(yi y)2 =
n1
n1
Sx2

Esta ltima expresin se puede escribir como


Sy2 =

1
Sx (xi

= 1 que es la conclusin pedida.

Sy2

1
Sx2

1
n1

n
P

(xi

i=1

x)2

por tanto

Definicin 6 Desviacin Media La desviacin media del conjunto de datos P


{x1 , x2 , . . . , xn } se define como
n
X
|xi x|
DM =
n
i=1

La desviacin media tiene las mismas unidades que los datos de la muestra, en las k clases en
k
P
fi |xi x|
que se divide la muestra se escribe esta desviacin como DM =
. De igual forma que
n
i=1

la desviacin media, la desviacin mediana se define como DMe =

n
P

i=1

|xi Me |
n

k
P

i=1

fi |xi Me |
.
n

Las medidas de tendencia central miden la disposicin de los datos para agruparse
alrededor de su centro, el cual puede ser: La media aritmtica, la mediana o la moda. Mientras
que las medidas de dispersin miden la variabilidad del conjunto de datos respecto del centro,
estas medidas sern la varianza, la desviacin estndar, la desviacin media y la desviacin
mediana.

Ejemplo 5 Se seleccionan aleatoriamente de un proceso de fabricacin, 50 bateras y se lleva a


cabo una prueba para determinar la duracin de stas, obteniendo los siguientes datos
52.5
62.3
57.2
52.7
54.9

62.7
64.4
56.4
58.9
53.1

58.9
52.7
65.7
62.3
54.9

65.7
54.9
48.8
49.3
57.3

49.3
48.8
48.8
49.3
60.4

58.9
56.8
57.3
48.8
58.7

57.3
53.1
60.4
60.4
62.3

60.4
58.7
58.1
61.6
48.8

59.6
61.6
63.3
61.6
54.9

58.1
63.3
62.3
64.4
63.3

A continuacin se determinan las medidas de tendencia central y de dispersin. Para ello se


ordenan los datos de menor a mayor con miras a ubicar la mediana. En este caso el dato mnimo
es xmin = 48,8 y el dato mximo es xmax = 65,7, los datos organizados quedan como
48.8
52.7
57.3
59.6
62.3

48.8
53.1
57.3
60.4
62.3

48.8
53.1
57.3
60.4
62.7

48.8
54.9
58.1
60.4
63.3

48.8
54.9
58.1
60.4
63.3

49.3
54.9
58.7
61.6
63.3

49.3
54.9
58.7
61.6
64.4

49.3
56.4
58.9
61.6
64.4

52.5
56.8
58.9
62.3
65.7

52.7
57.2
58.9
62.3
65.7

La suma de todos los 50 datos da como resultado 2876,2 de donde x = 2876,2


50 = 57,524, como
el nmero de datos es par entonces la mediana se halla como el promedio entre los datos 25
y 26, as Me = 58,1+58,7
= 58,4, mientras que el dato que ms se repite es el valor mnimo
2
M0 = 48,8. Con esto se tienen las medidas de tendencia central.
1
Para la obtencin de la varianza se hace uso del teorema 2 para lograr que S 2 = 49
[166718,11

2
50 (57,524) ] = 25,869, la desviacin estndar es S = 25,869 = 5,086. Por otro lado, la
desviacin media equivale a DM = 105,152+105,152
= 4,206 y la desviacin mediana equivale a
50
125,9+82,1
DMe =
= 4,16, en este caso la mediana es la medida de tendencia central que genera
50
menor dispersin.

2.

Datos Agrupados

La agrupacin de datos consiste en organizar por clases los datos con una longitud igual y de
tal manera que la informacin no se disperse mucho.
Sea n el tamao de la muestra que se desea agrupar. El nmero de clases o de intervalos
en las cuales se agruparn los datos se denota como k y se halla a travs de la igualdad
k = 1 + log2 n = 1 + 3,3 log n que se conoce como la Regla de Sturges, valor que se debe
aproximar al natural superior, para n = 100, k = 8. Ntese que en la igualdad k = 1 + log2 n
se tiene la expresin equivalente 2k1 = n que representa el nmero de particiones de un cierto
conjunto, en analoga con el conjunto de partes de un conjunto.
El rango de la muestra es la diferencia entre el dato mximo y mnimo R = xmax xmin .
La amplitud de cada intervalo es el cociente entre el rango y el nmero de clases A = Rk , valor
que se aproxima al decimal superior de acuerdo con la naturaleza de los datos.
Ya que se hace un nmero importante de aproximaciones en el anterior proceso, se halla otros
valores que minimizan la prdida de informacin. El rango ampliado se halla como Ra = k A
valor que es mayor que el rango por la aproximacin, se determina el nmero c = Ra R, este valor
de c permite definir los extremos de los intervalos.. El primer intervalo inicia con L1 = xmin 2c
y termina en L2 = L1 + A de la forma [L1 , L2 ), en el siguiente intervalo se considera [L2 , L3 )
para los siguientes extremos se tiene que Li = L1 + (i 1)A, donde Lk+1 = xmax + 2c , veamos
c
c
Lk+1 = L1 + k A = xmin + Ra = xmax R + Ra
2
2
c
c
= xmax + c = xmax +
2
2
Otro concepto fundamental a tener en cuenta en la agrupacin de datos tiene que ver con la
marca de clase se denota xi y equivale al punto medio del intervalo que har las veces del valor
i+1
promedio entre los datos que se encuentren en dicho intervalo, as xi = Li +L
; otra alternativa
2
para hallar la marca de clase es xi = xi1 + A, es decir, a la marca de clase anterior se le suma
la amplitud A (demuestre esta equivalencia). La frecuencia absoluta del i-simo intervalo se
denota como fi y la acumulada como Fi .
k
P
fi x i
Para las medidas de tendencia central de los datos agrupados se hallan como x =
n
i=1

A n
donde xi es la marca de clase, la mediana se halla como Me = Li + fi 2 Fi1 , para obtener
el valor de i se halla el valor n2 y en el intervalo donde se hallen acumulados estos n2 datos
corresponde la i, as Li es el lmite inferior del intervalo, fi es la frecuencia absoluta de ese
intervalo y Fi1 es la frecuencia acumulada hasta el intervalo anterior a l. Para la moda en los
datos agrupados se determina cual es el intervalo modal (aquel con mayor frecuencia absoluta),
de all se hace el clculo M0 = Li + A fi1fi+1
+fi+1 .

Las medidas de dispersin se hayan igual que en los datos agrupados a travs de las frecuencias
9

absolutas y la marca de clase, para la desviacin media se utiliza la expresin DM =

k
P

i=1

siendo xi la marca de clase, mientras que la desviacin mediana como DMe =

k
P

i=1

fi |xi x|
n

fi |xi Me |
.
n

Ejemplo 6 Consideremos los datos del ejemplo 5 relativo a la duracin de las bateras, los datos
organizados de forma creciente son
48.8
52.7
57.3
59.6
62.3

48.8
53.1
57.3
60.4
62.3

48.8
53.1
57.3
60.4
62.7

48.8
54.9
58.1
60.4
63.3

48.8 49.3
54.9 54.9
58.1 58.7
60.4 61.6
63.3 63.3

49.3 49.3
54.9 56.4
58.7 58.9
61.6 61.6
64.4 64.4

52.5
56.8
58.9
62.3
65.7

52.7
57.2
58.9
62.3
65.7

Ya que el dato mnimo y mximo son 48,8 y 65,7 entonces el rango del conjunto de datos es
R = xmax xmin = 65,7 48,8 = 16,9, como n = 50 entonces al hacer uso de la regla de Sturges
el nmero de intervalos es k = 1 + 3,3 log 50 = 6,606 que se aproxima al entero superior para
tener k = 7. Con el rango y el nmero de intervalos se logra la amplitud como A = Rk = 2,41 que
haciendo la aproximacin al decimal superior se logra A = 2,5 y con esto el rango ampliado es
Ra = A k = 17,5 y as el valor de c es c = Ra R = 0,6. Con base en estos resultados el lmite
inferior del primer intervalo es L0 = 48,8 0,3 = 48,5, L1 = L0 + A = 51,0, procediendo con
cada intervalo se obtiene que L7 = L0 + 7A = 66,0 que es lo mismo que xmax + 2c . En la siguiente
tabla se anexa los intervalos as como las frecuencias absolutas, acumuladas y las marcas de clase
k
1
2
3
4
5
6
7

Intervalos
[48,5, 51,0)
[51,0, 53,5)
[53,5, 56,0)
[56,0, 58,5)
[58,5, 61,0)
[61,0, 63,5)
[63,5, 66,0)

fi
8
5
4
8
10
11
4

Fi
8
13
17
25
35
46
50

xi
49.75
52.25
54.75
57.25
59.75
62.25
64.75

fi xi
398.00
261.25
219.00
458.00
597.50
684.75
259.00
2877.50

x2i
2475.0625
2730.0625
2997.5625
3277.5625
3570.0625
3875.0625
4192.5625

fi x2i
19800.5000
13650.3125
11990.2500
26220.5000
35700.6250
42625.6875
16770.2500
166758.125

Por medio de la columna 6 se puede decir que la media aritmtica es de x = 2877,5


= 57,55;
 k 50

P
1
2
2
2
mientras que la varianza que se encuentra a travs de la expresin S = n1
fi xi nn

entonces S 2 = 23,63 y as la desviacin estndar es S = 4,86.

i=1

Hallemos ahora la mediana, como n2 = 25 y hay 25 datos acumulados en el intervalo 4


entonces i = 4, Li = L4 = 56,0, fi = f4 = 8, Fi1 = F3 = 17, por tanto la mediana del conjunto
de datos agrupados es Me = 56,0 + 2,5
8 (25 17) = 58,5. Para la moda, se halla el intervalo
modal, aquel de mayo frecuencia absoluta, en este caso el intervalo 6, de all que Li = L6 = 61,0,
10

4
fi+1 = f7 = 4, fi1 = f5 = 10, as M0 = 61,0 + 10+4
= 61,28. Las desviaciones media y mediana
102,5+102,5
tienen un valor de DM =
= 4,1 y DMe = 123,75+81,25
= 4,1. En la siguiente tabla se
50
50
recopilan cada una de las medidas de dispersin y de tendencia central para los datos sin y con
agrupacin, adems se presenta una fila con el error porcentual que se halla como el cociente
|SACA|
100 donde SA representa la medida sin agrupacin y CA la medida con agrupacin y
SA
se divide sobre SA ya que este es el dato exacto mientras que en las agrupaciones es un valor
aproximado.

Medidas
Sin agrupacin
Con agrupacin
Error porcentual

3.

x
57.524
57.55
0,04 %

Me
58.4
58.5
0,17 %

M0
48.8
61.28
25,57 %

S2
25.869
23.63
8,7 %

S
5.086
4.86
4,44 %

DM
4.206
4.1
2,52 %

DMe
4.16
4.1
1,44 %

Datos Bivariados

Una muestra de tamao n de la forma Pxy = {(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn )} que representa
la relacin entre dos variables recibe el nombre de muestra bivariada y cada dato (xi , yi ) que
es una pareja ordenada, es una dato bivariado; la grfica en un plano cartesiano de estos datos
recibe el nombre de dispersin de puntos, si los datos xi aumentan y de igual forma los datos
yi entonces se dice que existe una correlacin positiva o directa entre los datos, pero si xi
aumenta mientras que yi disminuye se dice que la correlacin es negativa o inversa; esto en
el mismo sentido de las funciones crecientes y decrecientes.

Definicin 7 Coeficiente de Correlacin De Pearson Para la muestra Pxy


{(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn )} se define el nmero r, coeficiente de correlacin, como

n
P

(x1 x)(yi y)
s
r=s
n
n
P
P
(xi x)2
(yi y)2
i=1

i=1

i=1

El coeficiente de correlacin mide la relacin que existe entre las variables, ntese que dicho
coeficiente es adimensional y adems es un nmero comprendido entre 1 y 1, en efecto, con
base en la desigualdad de Cauchy-Schwartz se escribe
v

v
u n
n
n
X
u
X
u
uX

t
2
(xi x) t (yi y)2
(xi x)(yi y)


i=1

i=1

i=1

As el numerador no excede el denominador y es por ello que 1 r 1. En el caso en que el


coeficiente de correlacin se acerque a 1 o 1, se dice que existe una fuerte correlacin lineal
entre las variables, si r tiende a cero, la correlacin lineal es dbil, si r > 0 la correlacin es
directa y si r < 0 la correlacin es inversa y si r = 0 se dice que las variables son independientes.
11

Se habla de correlacin lineal, ya que pueden existir otras correlaciones como exponenciales,
logartmicas o polinmicas con grados mayores que 1, pero este coeficiente se utiliza para las
correlaciones lineales.

Definicin 8 Covarianza La covarianza de la muestra Pxy = {(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn )}


se define como
n
1 X
Sxy =
(xi x)(yi y)
n1
i=1

Donde x y y son las medias aritmticas de las muestras Px y Py .

n
P
(xi x)(yi y),
Con base en la definicin de covarianza se tiene que (n 1)Sxy =
i=1
s
s
n
n
p
p
P
P
como (n 1)Sx =
(xi x)2 y (n 1)Sy =
(yi y)2 entonces el coeficiente de
i=1

i=1

correlacin se escribe como r =

(n1)Sxy

n1Sx n1Sy

Sxy
Sx Sy .

Teorema 7 La covarianza de una muestra Pxy = {(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn )} se puede hallar
como
" n
#
X
1
Sxy =
xi yi nx y
n1
i=1

La demostracin se propone
Ntese que si los datos xi y yi son iguales para
 n como ejercicio.

P
1
cada i entonces Sxx = n1
x2i nx2 = Sx2 , es decir, la covarianza coincide con la varianza
i=1

del conjunto de datos. Si las variables son independientes entonces r = 0 y as Sxy = 0, es decir,
n
P
x i yi
la covarianza es cero y adems se cumple que
n = x y.
i=1

La covarianza tambin se puede denotar como Cov[X, Y ] y la varianza como V ar(X), donde
X, Y son las muestras de los datos de forma individual, es decir, X equivale a la muestra
Px = {x1 , x2 , . . . , xn }, igual con Y . La covarianza cumple las siguientes propiedades:
1) Cov[X, Y ] = Cov[Y, X]
3) Cov[X, X] = Sx2
5) Cov[X + a, Y + b] = Cov[X, Y ]

2) Cov[X, a] = 0
4) Cov[aX, bY ] = abCov[X, Y ]
6) V ar(aX + bY ) = a2 V ar(X) + b2 V ar(Y ) + 2abCov[X, Y ]

En la segunda propiedad est haciendo alusin a que la muestra Y es de trminos constantes,


yi = a para todo i = 1, 2, . . . , n; mientras que la ltima la covarianza no se afecta si los datos se
desplazan a unidades respecto de X y b unidades respecto de Y . Para la demostracin de estas
proposiciones se hace uso de las propiedades de la media aritmtica y varianza demostradas
12

Cov[X,Y ]

.
V ar(X) V ar(Y )

anteriormente. El coeficiente de correlacin se escribe como r =

Si X e Y son

independientes entonces V ar(X + Y ) = V ar(X) + V ar(Y ).


Si existe una correlacin lineal entre las variables X e Y es posible encontrar una lnea recta
que se ajuste a los datos y tal que las distancias verticales entre los puntos (xi , yi ) a la recta sean mnimas, dicha recta se llama lnea de mnimos cuadrados o lnea de menor ajuste.
Si la recta de mnimos cuadrados es de la forma y = mx + b entonces las constantes m y b se
pueden hallar al resolver el sistema de ecuaciones
n
X

yi = m

i=1

n
X

xi yi = m

i=1

n
X

xi + nb (1)

i=1

n
X

x2i + b

i=1

n
X

xi

(2)

i=1

Si se divide por n la segunda ecuacin se tiene y = mx + b (), es decir, el punto (x, y) hace
parte de la recta de menor ajuste. Despejando b en la ecuacin () y reemplazando en (2) se
tiene
" n
#
n
X
X
2
2
xi yi nx y = m
xi nx
i=1

i=1

Dividiendo por n 1 y haciendo uso de las propiedades de la varianza y covarianza se tiene


S
]
Cov[X, Y ] = mSx2 , as m = Cov[X,Y
que al ser Cov[X, Y ] = rSx Sy entonces m = r Syx . El
S2
conjunto solucin es m =

Cov[X,Y ]
Sx2

y b = y mx.

Ejemplo 7 Considere la muestra P = {(4, 8), (2, 12), (10, 4), (5, 10), (8, 2)}, determine la recta
de mnimos cuadrados para el conjunto dado. Primero se debe hallar las medias aritmticas de
los conjuntos en forma individual donde x = 5,8, mientras que en y, y = 7,2.
S

Ya que el coeficiente de correlacin es r = Sxxy


Sy entonces se requiere hallar las desviaciones
estndares de las muestras, donde Sx = 3,194 y Sy = 4,147, mientras que la covarianza es
Cov[X, Y ] = 11,7, as el coeficiente de correlacin es r = 0,8859, es decir, la correlacin
tiende a ser lineal y la relacin es inversa. La pendiente de la recta de mejor ajuste es m =
1,147, mientras que el intercepto es b = 13,85, la ecuacin de la recta de mnimos cuadrados
es y = 1,147x + 13,85.
Bibliografa
1. Canavos, George. Probabilidad y estadstica, aplicaciones y mtodos. Mc-Graw Hill, Mxico, 1988.
2. Lipschutz, Seymour and Lipson, Marc. Probabilidad. Segunda edicin. Mc-Graw Hill, Bogot, 2001.
13

Вам также может понравиться