Академический Документы
Профессиональный Документы
Культура Документы
1.
Conceptos Bsicos
La media aritmtica tambin recibe el nombre de promedio entre los datos de la muestra.
Si los datos de la muestra P = {x1 , x2 , . . . , xk } se puede agrupar en k clases con frecuencias
absolutas f1 , f2 , . . . , fk entonces la media aritmtica se puede calcular como
x=
k
X
fi xi
i=1
La media aritmtica tambin se conoce como centro de gravedad, ya que en fsica permite
calcular el centro de masa de una conjunto de n partculas de igual masa distribuidas sobre una
varilla. La media aritmtica tiene las mismas unidades que el conjunto de datos.
Ntese que para la muestra P1 = {4, 0, 2, 3, 4, 5, 6, 6, 7} que ya est ordena de menor a mayor,
el tamao es 9 que es impar, el dato de la mitad, es decir, aquel que divide la muestra en 2 partes
iguales es Me = x5 = 4, ntese que la posicin del dato se halla a travs de la expresin n+1
2 .
Por otro lado para la muestra P2 = {2, 1, 0, 1, 1, 3, 4, 5, 5, 6, 6, 7} que tiene tamao n = 12,
par, los datos de la mitad son x6 = 3 y x7 = 4, en este caso la mediana corresponde al promedio
n
n+1
entre ambos datos, Me = 3+4
2 = 3,5. La posicin de los datos del medio son 2 y 2 . Con base
en estos ejemplos, la mediana se puede escribir como
Me =
(
xk
xk +xk+1
2
Si n es impar y k =
Si n es par y k = n2
n+1
2
En el caso que la muestra tenga dos valores con mayor frecuencia, a la muestra se le llama
bimodal. Respecto del ejemplo 1 se sigue que las muestras P1 y P3 carecen de moda, ya que
cada dato tiene igual frecuencia, mientras que la muestra P2 es bimodal ya que 1 y 6 tienen una
frecuencia de 3, as M02 = 1 = 6.
Teorema 1 Teorema de Kring Sea P = {x1 , x2 , . . . , xn } una muestra de tamao n. Considere la funcin
n
X
f (x) = (x x1 ) + (x x2 ) + . . . + (x xn ) =
(x xi )2
2
i=1
Demostracin
n
P
Al derivar la funcin f resulta f (x) =
2(x xi ) que por las propiedades de la sumatoria
i=1
n
P
P xi
se escribe f (x) = 2 nx
igualando a cero resulta x =
n = x, este es el nmero crtico,
i=1
La funcin f del teorema 1 representa el cuadrado de la distancia entre los datos xi , ubicados
en una recta numrica, respecto de un x, por lo tanto dicho cuadrado de la distancia se
n
P
minimiza con la media aritmtica, donde f (x) =
(xi x)2 , al trmino x x se le conoce como
i=1
desviacin; queda por demostrar que la media aritmtica de las desviaciones es cero, es decir,
n
P
xi x
n = 0. La imagen f (x) permite definir la varianza como sigue, la cual se conoce tambin
i=1
S2 =
1 X
(xi x)2
n1
i=1
Con base en la definicin de varianza, se sigue que es un nmero no-negativo, adems tiene
el cuadrado de las unidades en que estn expresados los datos xi de la muestra P, es por ello
que recurre a la desviacin estndar o desviacin tpica, denotada S y que corresponde con
3
la raz cuadrada positiva de la de la varianza S = S 2 . La desviacin estndar hace alusin a
la distancia mnima entre los datos y las unidades de medida son las mismas que los datos de la
muestra. Si la muestra P se agrupa en k clases diferentes entonces la varianza se escribe como
k
1 P
S 2 = n1
fi (xi x)2 . A menor desviacin estndar hay mayor homogeneidad o agrupamiento
i=1
de los datos.
Demostracin
Al expandir la expresin (xi x)2 en la definicin de varianza resulta
n
1 X 2
S =
(xi 2xi x + x2 )
n1
2
i=1
Como la sumatoria es lineal y tanto 2 como x son constantes entonces la suma anterior se escribe
como
" n
#
n
n
X
X
X
1
2
2
2
S =
xi 2x
xi + x
1
n1
i=1
i=1
i=1
n
P
xi y al ser
i=1
n
P
1 = n entonces la
i=1
i=1
Demostracin
n
P
i=1
x2i
n.
propiedad existen dos alternativas, la primera es utilizando el hecho que S 2 0 y hacer uso del
teorema 2 o utilizando la desigualdad de Cauchy-Schwarz que se expresa como
v
v
u n
u n
n
X
uX
uX
2
t
ai bi
ai t
b2i ()
i=1
Si hacemos que ai = xi y bi =
la desigualdad se tiene
1
n
i=1
para i = 1, 2, . . . , n entonces ai bi =
i=1
n
P
i=1
1
n2
1
n
yx=
n
P
i=1
xi
n
xi
n,
v
v
u n
u n
uX
uX 1
t
x2i t
n
n2
n
X
xi
Como
i=1
i=1
i=1
i=1
.
yi = xi + c entonces
y=
n
X
xi + c
i=1
n
X
xi
i=1
n
X
c
+
n
n
i=1
n
P
i=1
yi
n,
()
Debido a que
n
P
i=1
xi
n
n
P
i=1
c
n
c
n
n
P
1 = c entonces
i=1
i=1
relativa a las medianas, se consideran dos casos, si n es impar, Me coincide con Mex = xk donde
k = n+1
2 , como Mey = yk entonces por la definicin de los yi = xi + c se sigue que Mey = xk + c
x +x
y as Mey = xk + c = Mex + c; en el caso de que n sea par, Mex = k 2 k+1 siendo k = n2 , por lo
que
yk + yk+1
(xk + c) + (xk+1 + c)
xk + xk+1
Mey =
=
=
+c
2
2
2
Se concluye entonces que Mey = Mex + c en cualquiera de los casos para n.
Demostracin
Con base en la definicin de media aritmtica y por el hecho que yi = c xi se tiene
y=
n
X
yi
i=1
n
X
c xi
i=1
=c
n
X
xi
i=1
Se logra concluir con esto que y = cx. Para las desviaciones resulta yi y = cxi cx = c(xi x),
por la definicin de varianza se tiene
Sy2 =
i=1
i=1
1 X
1 X 2
(yi y)2 =
c (xi x)2
n1
n1
Sy2
c2
1
n1
n
P
(xi
i=1
x)2
= c2 Sx2 . Para la
demostracin de la mediana nuevamente se consideran los dos casos, para n impar, Mex = xk
con k = n+1
2 , mientras que la mediana de la muestra Py es Mey = yk = c xk , que por sustitucin
6
y +y
cx +cx
resulta Mey = cMex ; en el caso en que n sea par Mey = k 2 k+1 = k 2 k+1 = c
donde k = n2 y as se concluye que Mey = cMex para cualquiera de los casos.
xk +xk+1
2
Ejemplo 4 Se desea construir una muestra de tamao 2 que tenga media aritmtica cero y
varianza 1. Consideremos la muestra Px = {a, b}, como x = 0 entonces a+b
2 = 0 de donde
2 + b2 = 1 que al reemplazar
a = b (1). La varianza debe dar 1, por el teorema
2
se
sigue
que
a
Demostracin
Por una propiedad propuesta
n
P
i=1
xi x
n
n
X
yi
i=1
xi x
Sx
entonces
n
X
xi x
i=1
nSx
n
1 X xi x
=
Sx
n
i=1
i=1
i=1
1 2
S
Sx2 x
1 X
1 X (xi x)2
=
(yi y)2 =
n1
n1
Sx2
1
Sx (xi
Sy2
1
Sx2
1
n1
n
P
(xi
i=1
x)2
por tanto
La desviacin media tiene las mismas unidades que los datos de la muestra, en las k clases en
k
P
fi |xi x|
que se divide la muestra se escribe esta desviacin como DM =
. De igual forma que
n
i=1
n
P
i=1
|xi Me |
n
k
P
i=1
fi |xi Me |
.
n
Las medidas de tendencia central miden la disposicin de los datos para agruparse
alrededor de su centro, el cual puede ser: La media aritmtica, la mediana o la moda. Mientras
que las medidas de dispersin miden la variabilidad del conjunto de datos respecto del centro,
estas medidas sern la varianza, la desviacin estndar, la desviacin media y la desviacin
mediana.
62.7
64.4
56.4
58.9
53.1
58.9
52.7
65.7
62.3
54.9
65.7
54.9
48.8
49.3
57.3
49.3
48.8
48.8
49.3
60.4
58.9
56.8
57.3
48.8
58.7
57.3
53.1
60.4
60.4
62.3
60.4
58.7
58.1
61.6
48.8
59.6
61.6
63.3
61.6
54.9
58.1
63.3
62.3
64.4
63.3
48.8
53.1
57.3
60.4
62.3
48.8
53.1
57.3
60.4
62.7
48.8
54.9
58.1
60.4
63.3
48.8
54.9
58.1
60.4
63.3
49.3
54.9
58.7
61.6
63.3
49.3
54.9
58.7
61.6
64.4
49.3
56.4
58.9
61.6
64.4
52.5
56.8
58.9
62.3
65.7
52.7
57.2
58.9
62.3
65.7
2
50 (57,524) ] = 25,869, la desviacin estndar es S = 25,869 = 5,086. Por otro lado, la
desviacin media equivale a DM = 105,152+105,152
= 4,206 y la desviacin mediana equivale a
50
125,9+82,1
DMe =
= 4,16, en este caso la mediana es la medida de tendencia central que genera
50
menor dispersin.
2.
Datos Agrupados
La agrupacin de datos consiste en organizar por clases los datos con una longitud igual y de
tal manera que la informacin no se disperse mucho.
Sea n el tamao de la muestra que se desea agrupar. El nmero de clases o de intervalos
en las cuales se agruparn los datos se denota como k y se halla a travs de la igualdad
k = 1 + log2 n = 1 + 3,3 log n que se conoce como la Regla de Sturges, valor que se debe
aproximar al natural superior, para n = 100, k = 8. Ntese que en la igualdad k = 1 + log2 n
se tiene la expresin equivalente 2k1 = n que representa el nmero de particiones de un cierto
conjunto, en analoga con el conjunto de partes de un conjunto.
El rango de la muestra es la diferencia entre el dato mximo y mnimo R = xmax xmin .
La amplitud de cada intervalo es el cociente entre el rango y el nmero de clases A = Rk , valor
que se aproxima al decimal superior de acuerdo con la naturaleza de los datos.
Ya que se hace un nmero importante de aproximaciones en el anterior proceso, se halla otros
valores que minimizan la prdida de informacin. El rango ampliado se halla como Ra = k A
valor que es mayor que el rango por la aproximacin, se determina el nmero c = Ra R, este valor
de c permite definir los extremos de los intervalos.. El primer intervalo inicia con L1 = xmin 2c
y termina en L2 = L1 + A de la forma [L1 , L2 ), en el siguiente intervalo se considera [L2 , L3 )
para los siguientes extremos se tiene que Li = L1 + (i 1)A, donde Lk+1 = xmax + 2c , veamos
c
c
Lk+1 = L1 + k A = xmin + Ra = xmax R + Ra
2
2
c
c
= xmax + c = xmax +
2
2
Otro concepto fundamental a tener en cuenta en la agrupacin de datos tiene que ver con la
marca de clase se denota xi y equivale al punto medio del intervalo que har las veces del valor
i+1
promedio entre los datos que se encuentren en dicho intervalo, as xi = Li +L
; otra alternativa
2
para hallar la marca de clase es xi = xi1 + A, es decir, a la marca de clase anterior se le suma
la amplitud A (demuestre esta equivalencia). La frecuencia absoluta del i-simo intervalo se
denota como fi y la acumulada como Fi .
k
P
fi x i
Para las medidas de tendencia central de los datos agrupados se hallan como x =
n
i=1
A n
donde xi es la marca de clase, la mediana se halla como Me = Li + fi 2 Fi1 , para obtener
el valor de i se halla el valor n2 y en el intervalo donde se hallen acumulados estos n2 datos
corresponde la i, as Li es el lmite inferior del intervalo, fi es la frecuencia absoluta de ese
intervalo y Fi1 es la frecuencia acumulada hasta el intervalo anterior a l. Para la moda en los
datos agrupados se determina cual es el intervalo modal (aquel con mayor frecuencia absoluta),
de all se hace el clculo M0 = Li + A fi1fi+1
+fi+1 .
Las medidas de dispersin se hayan igual que en los datos agrupados a travs de las frecuencias
9
k
P
i=1
k
P
i=1
fi |xi x|
n
fi |xi Me |
.
n
Ejemplo 6 Consideremos los datos del ejemplo 5 relativo a la duracin de las bateras, los datos
organizados de forma creciente son
48.8
52.7
57.3
59.6
62.3
48.8
53.1
57.3
60.4
62.3
48.8
53.1
57.3
60.4
62.7
48.8
54.9
58.1
60.4
63.3
48.8 49.3
54.9 54.9
58.1 58.7
60.4 61.6
63.3 63.3
49.3 49.3
54.9 56.4
58.7 58.9
61.6 61.6
64.4 64.4
52.5
56.8
58.9
62.3
65.7
52.7
57.2
58.9
62.3
65.7
Ya que el dato mnimo y mximo son 48,8 y 65,7 entonces el rango del conjunto de datos es
R = xmax xmin = 65,7 48,8 = 16,9, como n = 50 entonces al hacer uso de la regla de Sturges
el nmero de intervalos es k = 1 + 3,3 log 50 = 6,606 que se aproxima al entero superior para
tener k = 7. Con el rango y el nmero de intervalos se logra la amplitud como A = Rk = 2,41 que
haciendo la aproximacin al decimal superior se logra A = 2,5 y con esto el rango ampliado es
Ra = A k = 17,5 y as el valor de c es c = Ra R = 0,6. Con base en estos resultados el lmite
inferior del primer intervalo es L0 = 48,8 0,3 = 48,5, L1 = L0 + A = 51,0, procediendo con
cada intervalo se obtiene que L7 = L0 + 7A = 66,0 que es lo mismo que xmax + 2c . En la siguiente
tabla se anexa los intervalos as como las frecuencias absolutas, acumuladas y las marcas de clase
k
1
2
3
4
5
6
7
Intervalos
[48,5, 51,0)
[51,0, 53,5)
[53,5, 56,0)
[56,0, 58,5)
[58,5, 61,0)
[61,0, 63,5)
[63,5, 66,0)
fi
8
5
4
8
10
11
4
Fi
8
13
17
25
35
46
50
xi
49.75
52.25
54.75
57.25
59.75
62.25
64.75
fi xi
398.00
261.25
219.00
458.00
597.50
684.75
259.00
2877.50
x2i
2475.0625
2730.0625
2997.5625
3277.5625
3570.0625
3875.0625
4192.5625
fi x2i
19800.5000
13650.3125
11990.2500
26220.5000
35700.6250
42625.6875
16770.2500
166758.125
i=1
4
fi+1 = f7 = 4, fi1 = f5 = 10, as M0 = 61,0 + 10+4
= 61,28. Las desviaciones media y mediana
102,5+102,5
tienen un valor de DM =
= 4,1 y DMe = 123,75+81,25
= 4,1. En la siguiente tabla se
50
50
recopilan cada una de las medidas de dispersin y de tendencia central para los datos sin y con
agrupacin, adems se presenta una fila con el error porcentual que se halla como el cociente
|SACA|
100 donde SA representa la medida sin agrupacin y CA la medida con agrupacin y
SA
se divide sobre SA ya que este es el dato exacto mientras que en las agrupaciones es un valor
aproximado.
Medidas
Sin agrupacin
Con agrupacin
Error porcentual
3.
x
57.524
57.55
0,04 %
Me
58.4
58.5
0,17 %
M0
48.8
61.28
25,57 %
S2
25.869
23.63
8,7 %
S
5.086
4.86
4,44 %
DM
4.206
4.1
2,52 %
DMe
4.16
4.1
1,44 %
Datos Bivariados
Una muestra de tamao n de la forma Pxy = {(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn )} que representa
la relacin entre dos variables recibe el nombre de muestra bivariada y cada dato (xi , yi ) que
es una pareja ordenada, es una dato bivariado; la grfica en un plano cartesiano de estos datos
recibe el nombre de dispersin de puntos, si los datos xi aumentan y de igual forma los datos
yi entonces se dice que existe una correlacin positiva o directa entre los datos, pero si xi
aumenta mientras que yi disminuye se dice que la correlacin es negativa o inversa; esto en
el mismo sentido de las funciones crecientes y decrecientes.
n
P
(x1 x)(yi y)
s
r=s
n
n
P
P
(xi x)2
(yi y)2
i=1
i=1
i=1
El coeficiente de correlacin mide la relacin que existe entre las variables, ntese que dicho
coeficiente es adimensional y adems es un nmero comprendido entre 1 y 1, en efecto, con
base en la desigualdad de Cauchy-Schwartz se escribe
v
v
u n
n
n
X
u
X
u
uX
t
2
(xi x) t (yi y)2
(xi x)(yi y)
i=1
i=1
i=1
Se habla de correlacin lineal, ya que pueden existir otras correlaciones como exponenciales,
logartmicas o polinmicas con grados mayores que 1, pero este coeficiente se utiliza para las
correlaciones lineales.
n
P
(xi x)(yi y),
Con base en la definicin de covarianza se tiene que (n 1)Sxy =
i=1
s
s
n
n
p
p
P
P
como (n 1)Sx =
(xi x)2 y (n 1)Sy =
(yi y)2 entonces el coeficiente de
i=1
i=1
(n1)Sxy
n1Sx n1Sy
Sxy
Sx Sy .
Teorema 7 La covarianza de una muestra Pxy = {(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn )} se puede hallar
como
" n
#
X
1
Sxy =
xi yi nx y
n1
i=1
La demostracin se propone
Ntese que si los datos xi y yi son iguales para
n como ejercicio.
P
1
cada i entonces Sxx = n1
x2i nx2 = Sx2 , es decir, la covarianza coincide con la varianza
i=1
del conjunto de datos. Si las variables son independientes entonces r = 0 y as Sxy = 0, es decir,
n
P
x i yi
la covarianza es cero y adems se cumple que
n = x y.
i=1
La covarianza tambin se puede denotar como Cov[X, Y ] y la varianza como V ar(X), donde
X, Y son las muestras de los datos de forma individual, es decir, X equivale a la muestra
Px = {x1 , x2 , . . . , xn }, igual con Y . La covarianza cumple las siguientes propiedades:
1) Cov[X, Y ] = Cov[Y, X]
3) Cov[X, X] = Sx2
5) Cov[X + a, Y + b] = Cov[X, Y ]
2) Cov[X, a] = 0
4) Cov[aX, bY ] = abCov[X, Y ]
6) V ar(aX + bY ) = a2 V ar(X) + b2 V ar(Y ) + 2abCov[X, Y ]
Cov[X,Y ]
.
V ar(X) V ar(Y )
Si X e Y son
yi = m
i=1
n
X
xi yi = m
i=1
n
X
xi + nb (1)
i=1
n
X
x2i + b
i=1
n
X
xi
(2)
i=1
Si se divide por n la segunda ecuacin se tiene y = mx + b (), es decir, el punto (x, y) hace
parte de la recta de menor ajuste. Despejando b en la ecuacin () y reemplazando en (2) se
tiene
" n
#
n
X
X
2
2
xi yi nx y = m
xi nx
i=1
i=1
Cov[X,Y ]
Sx2
y b = y mx.
Ejemplo 7 Considere la muestra P = {(4, 8), (2, 12), (10, 4), (5, 10), (8, 2)}, determine la recta
de mnimos cuadrados para el conjunto dado. Primero se debe hallar las medias aritmticas de
los conjuntos en forma individual donde x = 5,8, mientras que en y, y = 7,2.
S