Вы находитесь на странице: 1из 23

1

TEMA 02

DISTRIBUCIN DE FRECUENCIAS
EN VARIABLES BIDIMENSIONALES
Y SUS CARACTERSTICAS NUMRICAS

Olga Sanz Espinosa
Carmen Prez Pintos
Curso-Master en Bioestadstica y sus aplicaciones en
Ciencias de la Salud. Especialistas en Bioestadstica aplicada
a la investigacin. Diplomadas en Estadstica (UCM)



CONTENIDO


Introduccin
1. Tipos de relaciones de las variables
2. Distribucin de frecuencias conjuntas
3. Distribucin de frecuencias
marginales y condicionadas
4. Dependencia e independencia
5. Momentos
6. Covarianza y sus caractersticas
Resumen
Ejercicios




Introduccin

La finalidad del estudio de las variables bidimensionales es poder ver la
relacin que existe entre varias variables, poder estudiar el grado de depen-
dencia que existe entre esas relaciones de las variables, e incluso buscar el va-
lor para otra caracterstica distinta de la variable.

Nuestro objetivo en este tema ser conocer las caractersticas numricas
que ya hemos visto en variables unidimensionales, pero para las variables bidi-
mensionales, de forma que podamos realizar estudios bsicos descriptivos en
este tipo de variables.

El clculo de las medidas de asociacin, dispersin, se hace en las varia-
bles bidimensionales de la misma manera que en las variables unidimensiona-
les; por ello, nos dedicaremos a estudiar slo las caractersticas numricas ms
importantes de este tipo de variables.


1. Tipos de relaciones de las variables

-- Si son dos variables cualitativas

(A, B) Variables cualitativas
(a
i ,
b
j
) pares de valores de las variables de estudio

2
Es decir: A: a
1
,a
2
,a
3,
,a
k


B: b
1
.b
2
,b
3
,,b
n.






-- Si la primera variable es cualitativa y la segunda cuantitativa

(A,Y) Variables de estudio
(a
i
, y
j
) pares de valores de las variables de estudio

Es decir: A: a
1
,a
2
,a
3,
,a
k

Y: y
1
,y
2
,y
3
,,y
m.

-- Si la primera es cuantitativa y la segunda cualitiva

(X, B) variables de estudio
(x
i
, b
j
) pares de valores de las variables de estudio.

Es decir: X: x
1
,x
2
,x
3
,,x
k


B: b
1
.b
2
,b
3
,,b
n.

-- Si las dos variables son cuantitativas

(X,Y) variables de estudio
(x
i
,y
j
) pares de valores de las variables de estudio

Es decir: X: x
1
,x
2
,x
3
,,x
k


Y: y
1
,y
2
,y
3
,,y
m.



2. Distribucin de frecuencias conjuntas

Sea cual sea la naturaleza de las variables, la distribucin de frecuencias
se realiza de forma similar a como o hacamos en el capitulo anterior con las
variables unidimensionales, pero ahora lo hacemos con dos valores.
De forma que tenemos

N Tamao total de la poblacin de estudio
(X , Y) Variables de estudio.

Las variables de estudio X e Y toman los valores de la siguiente forma:
X: x
1
,x
2
,x
3
,,x
k

Y: y
1
,y
2
,y
3
,,y
m

De manera que se obtienen los pares de valores:
(x
i
, y
j
), siendo: i = 1,2,3,,k
j = 1,2,3,,m

Podemos definir entonces las distribuciones de frecuencias conjuntas de
la siguiente manera:

3
-- Distribucin de frecuencias absolutas conjuntas: Es el conjunto de-
finido como:

{ n
ij
, i= 1,2,3,,k ; j=1,2,3,,m }, siendo:
n
ij
= frecuencias absolutas conjuntas de los valores de las variables de
estudio.

Se cumple que:

= =
=
k
1 i
m
1 j
N
ij
n






-- Distribucin de frecuencias relativas conjuntas: Se define como el
conjunto formado por:

{ f
ij
, i=1,2,3,,k ; j=1,2,3,,m }, siendo:

f
ij
= frecuencias relativas de los valores de las variables de estudio.
[Me indican la proporcin de individuos que toman el valor x
i
de la variable
X, y el valor y
j
de la variable Y a la vez].

Se cumple que:



N
ij
n
ij
f =


= =
=
k
1 i
m
1 j
1
ij
f


Tanto para la distribucin de frecuencias absolutas como para las relati-
vas, se utiliza la tabla de distribucin de frecuencias que vimos en las variables
unidimensionales cuando las frecuencias que nos dan son las conjuntas. En el
caso de que nos den las frecuencias individuales de cada variable (es decir, las
frecuencias marginales), utilizaremos las tablas de doble entrada.

Cuando las variables son cualitativas, las denominamos tablas de contin-
gencia. Cuando tenemos una variable cualitativa y otra cuantitativa las llamamos
tablas mixtas. Cuando las dos variables son cuantitativas, las llamaremos tablas
de contingencia o tablas estadsticas. Veamos cmo son las tablas que utilizare-
mos:





4
-- Tabla de distribucin conjunta

X Y n
ij
f
ij
x
1
y
1
n
1
1
f
1
1
x
1
y
2
n
1
2
f
1
2

x
1
y
m
n
1
m
f
1
m
x
2
y
1
n
2
1
f
2
1
x
2
y
2
n
2
2
f
2
2



x
2
y
m
n
2
m
f
2
m

.


x
k
-
1
y
1
n
(
k-
1)
m
f
(k
-
1)
m



x
k
y
m
n
k
m
f
k
m


-- Tabla de doble entrada


X
Y
y
1 2 3 4 5 j
y

y

y y y ... y
m
x
1

x
2

x
3

x
4

x
5

x
i

x






k
n
11
n
12
n
13
n
14
n
15
n
1j
... n
1m

n
21
n
22
n
23
n
24
n
25
n
2j
n
2m

n
31
n
32
n
33
n
34
n
35
... n
3j
n
3m

n
41
n
42
n
43
n
44
n
45
n
4j
... n
4m

n
51
n
52
n
53
n
54
n
55
n
5j
n
5m

n
i1
n
i2
n
i3
n
i4
n
i5
n
ij
n
im

n
k1
n
k2
n
k3
n
k4
n
k5
... n
kj
... n
km



5
Ejemplo de distribucin de frecuencias conjuntas:

En cierto lago del sur de la Pennsula Ibrica se ha detectado una nueva
especie de lagartija, cuyas dimensiones se miden segn las variables: X= longi-
tud del animal; Y= peso en gramos del animal. Considerando que la variable X la
clasifican en intervalos de la misma amplitud y que el primero es [25-35),
representar la tabla bidimensional con los siguientes datos:


X 35 31 42 60 52 49 61 50 55 58
Y 100 140 120 110 200 200 110 160 160 200


Lo primero debemos hacer son los intervalos en que distribuiremos la va-
riable X, longitud del animal. Como el primer intervalo que nos dan tiene ampli-
tud 10 y sta debe ser constante, tenemos que los intervalos nos quedaran:

[25-35) , [35-45) , [45-55) , [55-65)

Luego entonces la tabla bidimensional o de doble entrada quedara.


X
Y
100 110 120 140 160 200
25-35 0 0 0 1 0 0
35-45 1 0 1 0 0 0
45-55 0 0 0 0 1 2
55-65 0 2 0 0 1 1


3. Distribucin de frecuencias marginales y condicionadas.

-- Distribucin de frecuencias marginales. Las distribuciones de fre-
cuencias marginales son cada una de las distribuciones de las variables que for-
man la variable bidimensional. Tenemos, por lo tanto, la distribucin marginal de
X y la distribucin marginal de Y. Veamos cmo son las dos:

1. Distribucin marginal de X

Distribucin de frecuencias absolutas marginal de la variable X: Es el con-
junto definido por:
{n
i -
, i = 1,2,3,, k }



n
i -
=

=
m
1 j
ij
n


Siendo:
n
i -
= frecuencias absolutas de la variable X.

=
k
1 i

n
i -
=
N


6


Distribucin de frecuencias relativas marginal de la variable X: Es el
conjunto formado por:

{ f , i = 1,2,3,, k }


i -


N
i
n
i
f
-
=
-


=
=
-
k
1 i

Siendo:
f
i -
= frecuencias relativas de la variable X
1
i
f




2. istribucin marginal de Y
recuencias absolutas marginal de la variable Y: Es el
conjunto definido por:

{ n , j=1,2,3,, m }



D

Distribucin de f

- j

=
=
-
k
1 i
ij
n
j
n

=
=
-
m
1 j

Siendo:
n
- j
N
j
n
= frecuencias absolutas de la variable Y.




recuencias relativas marginal de la variable Y: Es el
conjunto formado por:

{ , j=1,2,3,, m }

Distribucin de f
f
- j

=
=
-
m
1 j
1
j
f


Siendo:
f
- j
N
j
n
j
-
=
-
f
= Frecuencias relativas de la variable Y.





Ejemplo de frecuencias marginales:

dieron du-
rante su estancia en el hospital, obteniendo los siguientes resultados:


Se ha realizado un anlisis comparativo sobre el promedio de das en que
permanecieron ingresados ochenta nios con gripe y el peso que per
7
Das ingresados Peso que perdieron Numero de nios
1 0 6
2 1 2
2 0 6
3 2 16
3 1 7
4 3 13
4 2 3
5 3 8
5 2 7
6 4 12











Se pide: a) La tabla de correlacin correspondiente a esta distribucin; b)
las tablas de las distribuciones marginales; c) calcular la media y varianza y la
desviacin tpica de las distribuciones marginales. Que distribucin es ms dis-
persa?

Definiremos las variables de la siguiente manera:

X = Numero de das que permanecieron ingresados los nios
Y = Peso en kilos que perdieron los nios.

La tabla de doble entrada o tabla de correlaciones quedar:



X
Y
0 1 2 3 4
1 6 0 0 0 0
2 6 2 0 0 0
3 0 7 16 0 0
4 0 0 3 13 0
5 0 0 7 8 0
6 0 0 0 0 12









a) Distribucin marginal de X:


Das ingresados ( X ) n
1 -
f
i -
1 6 6/80
2 6+2 = 8 8/80
3 7+16 = 23 23/80
4 3+13 = 16 16/80
5 7+8 = 15 15/80
6 12 12/80


b) Distribucin marginal de Y:


8
Peso que pierden ( Y ) n
- j
f
- j

0 6+6 = 12 12/80
1 2+7 = 9 9/80
2 16+3+7 = 26 26/80
3 13+8 = 21 21/80
4 12 12/80


c)

=
-
=
k
1 i
i
n
i
x
N
1
x = | | 12) * (6 15) * (5 16) * (4 23) * (3 8) * (2 6) * (1
80
1
+ + + + + = 3,775

V
X
=
80
1
k
1 i
i
n
2
) x
i
(x
N
1

=
=
-

[((1-3,775)
2
*6)+((2-3,775)
2
*8)+((3-3,775)
2
*23)+

((4-3,775)
2
*16)+((5-3,775)
2
*15)+((6-3,775)
2
*12)]=2,0993


= =
x
V
x
o 1,44892


=
-
=
=

j
n
m
1 j
j
y
N
1
Y | | 15 , 2 12) * (4 21) * (3 26) * (2 9) * (1 12) * 0 (
80
1
= + + + +

V
Y
=

=
=
-

m
1 j
j
n
2
) Y
j
(y
N
1
80
1
[((0-2,15)
2
*12)+((1-2,15)
2
*9)+((2-
2,15)
2
*26)+((3-2,15)
2
*21)+((4-2,15)
2
*12)]=0,92846


= =
y
V
y
o 0,96356


Por el valor de la desviacin tpica podemos ver cul de las dos distribu-
ciones es ms dispersa, pero para asegurarnos ms, calculamos el valor del co-
eficiente de variacin:

CV
X
= =
X
x
o
38381 , 0
775 , 3
44892 , 1
=

CV
Y
= =
Y
Y
o
44816 , 0
15 , 2
96356 , 0
=

Luego, como podemos ver, la distribucin con mayor dispersin es la va-
riable Y.


9
Distribucin de frecuencias condicionales

1) Distribucin de frecuencias de X condicionada por valores de Y. Exis-
ten tantas distribuciones de frecuencias condicionadas como valores tome la va-
riable Y.

-- Frecuencia de x
i
condicionada por y
j
: Es la proporcin de individuos de
la poblacin que toman el valor x
i
de entre los individuos de la poblacin que
presentan el valor y
j
de la variable X. Es decir:



j
f
ij
f
j
n
ij
n
)
j
y
i
(x f
-
=
-
=







Obtenemos un conjunto de nmeros que describen el comportamiento de
la variable X en una subpoblacin de la poblacin inicial, y esta subpoblacin es
aqulla en la que la variable Y toma el valor y
j
.

Distribucin de frecuencias relativas de la variable X condicionada por y
j
:
Es el conjunto definido por:

{ )
j
y
i
(x f , i = 1,2,3,,k }


1
k
1 i
)
j
y
i
(x f =
=




Siendo:
s 0 )
j
y
i
(x f 1 s



2) Distribucin de frecuencias de Y condicionada por valores de X. Exis-
ten tantas distribuciones de frecuencias de Y condicionadas como valores tome
la variable X.

Frecuencia de y
j
condicionada por x
i
: Es la proporcin de individuos que
toman el valor y
j
de la variable Y de entre los individuos de la poblacin que to-
man el valor x
i
de la variable X. Es decir,



=

- -
=
i
f
ij
f
i
n
ij
n
)
i
x
j
(y f



Distribucin de frecuencias relativas de la variable Y condicionada por x
i
:
Es el conjunto definido por:
10
{ )
j
x
j
(y f , j=1,2,3,, m }

=
=
m
1 j
1 )
i
x
j
(y f


Siendo:
0 )
j
x
j
(y f 1



Ejemplo de distribuciones condicionadas

La siguiente tabla recoge, en frecuencias relativas, la distribucin del n-
mero de controles a que son sometidas las unidades de un yacimiento encontra-
do al norte del pas en un proceso de identificacin. Estos controles son realiza-
dos por dos equipos distintos del modo siguiente:

EQUIPO B
EQUIPO A

0 1 2 3
0 0,02 0,08 0,08 0,06
1 0,11 0,12 0,14 0,03
2 0,3 0,03 0,02 0,01

a) Hallar la distribucin del nmero de controles hechos por el equipo B con-
dicionada a que el equipo A no ha efectuado ningn control.
b) Calcular la distribucin marginal de los dos equipos, as como la media y
la desviacin tpica.
c) Hallar la distribucin conjunta del total de controles.

a) Lo primero que me piden es la distribucin del equipo B cuando el equipo
A toma el valor 0, de forma que nos queda:

EQUIPO B
EQUIPO A

0
0 0,02
1 0,11
2 0,3

Si los datos nos los dieran en frecuencias absolutas, tendramos que ha-
llar las frecuencias relativas para hacer la distribucin condicionada, es decir,
hallaramos los )
i
x f(y
j
, que son los valores que nos dan en nuestro ejemplo.

b) Marginal del equipo B, media y desviacin tpica:

Equipo B f
i -
0 0,02+0,08+0,08+0,06 =0,24
1 0,11+0,12+0,14+0,03 =0,4
2 0,3+0,03+0,02+0,01 =0,36

11
=
=
-
=

k
1 i
i
f
i
x x
B
1,12

Para calcular la desviacin tpica, primero necesitamos saber el valor de
la varianza, de forma que tenemos,

V
B
= 87475 , 0
k
1 i
i
f
2
) x
i
x (
B
=
=
-


7652 , 0 V
B B
= = o

Marginal del equipo A, media y desviacin tpica

Equipo A f
- j

0 0,02+0,11+0,3 = 0,43
1 0,08+0,12+0,03 = 0,23
2 0,08+0,14+0,02 = 0,24
3 0,06+0,03+0,01 =0,1







01 , 1
m
1 j
j
f
j
y y
A
=
=
-
=

; V
A
=

=
=
-

m
1 j
017029 , 1
j
f
2
) y
j
y (
A
; 03435 , 1 V
A A
= = o

c) Para hallar la distribucin conjunta lo nico que necesitamos es hacer una
tabla que ser de la forma:


Equipo A Equipo B Controles
0 0 0,02
0 1 0,11
0 2 0,3
1 0 0,08
1 1 0,12
1 2 0,03
2 0 0,08
2 1 0,14
2 2 0,02
3 0 0,06
3 1 0,03
3 2 0,01















4. Dependencia e independencia

-- Independencia:

-- X es independiente de Y si y slo si para cada valor x
i
se verifica que:

12
)
m
y
i
f(x ... )
2
y
i
f(x )
1
y
i
f(x = = = , k 1,2,3,..., x=

Es decir, X es independiente de Y si las distribuciones condicionadas son
idnticas entre s.

-- Y es independiente de X si y slo si para cada valor y
j
se verifica que:

m 1,2,3,..., y ),
k
x
j
f(y ... )
2
x
j
f(y )
1
x
j
f(y = = = =

Es decir, Y es independiente de X si las distribuciones condicionadas son
idnticas entre s.



Observacin 1: X es independiente de Y si y slo si se verifica:

m 1,2,3,..., j ; k 1,2,3,..., i , j
f
i
f
ij
f
= = - -
=

Observacin 2: Y es independiente de X si y slo si se verifica:

m 1,2,3,..., j ; k 1,2,3,..., i , i
f
j
f
ij
f
= = - -
=

-- Dependencia funcional

La dependencia es el polo opuesto de la independencia; pero la relacin
que se da entre ellas no es reciproca.

X depende funcionalmente de Y si, dado un valor y
j
, y dada una modali-
dad de la variable Y, a esa modalidad le corresponde una nica modalidad de la
variable X, es decir, que habr un nico x
i
tal que la frecuencia conjunta ser
dis-tinta de cero. Dicho de otra forma, en la tabla de doble entrada
encontraremos que en cada columna abre un solo elemento distinto de cero,
pero en las filas puede haber ms de un elemento que sea distinto de cero.
Veamos el esquema de la tabla:


X
Y
y
1
y
2
i
m.-1
y
m-1
x
1
0 0 0 0
x
2
5 1 0 0



x
k-1
0 0 0 0
x
k
0 0 7 9


Y depende funcionalmente de X si, dado un valor x
i,
y dada una modali-
dad de la variable X, a esa modalidad le corresponde una nica modalidad de la
variable Y, es decir, que habr un nico y
j
tal que la frecuencia conjunta ser
13
dis-tinta de cero. Dicho de otro modo, en cada fila habr un nico elemento no
nulo, pudiendo haber en la misma columna ms de un elemento distinto de cero.
Vea-mos el esquema de la tabla:


X
Y
y
1
y
2
y
m-1
y
m
x
1
0 4 0 0
x
2
0 1 0 0



x
k-1
0 0 4 0
x
k
0 0 7 0







Ejemplo de dependencia e independencia:

La siguiente tabla bidimensional se corresponde con un tipo de medicin
de unas piezas dentales, encontradas en dos yacimientos distintos y separados
por unos 500 metros de distancia en la sierra de Atapuerca. Son independien-
tes las piezas (P) encontradas? O podemos decir que pertenecen a la misma
especie a pesar de estar distanciados?


YACIMIENTO 2

YACIMIENTO 1
P 1 P 2 P 3 P 4 P 5 P 6
Pieza 1 0,04 0,05 0,05 0,03 0 0,05
Pieza 2 0,06 0,10 0 0,07 0,05 0,10
Pieza 3 0,12 0,05 0,05 0,03 0,10 0,05

Sabemos que X es independiente de Y
m 1,2,3,..., j ; k 1,2,3,..., i , j
f
i
f
ij
f
= = - -
=

Entonces lo primero que vamos a calcular son las distribuciones margina-
les para obtener los y los :
i
f
- j
f
-
Marginal de X:

Yacimiento 2
i
f
-

Pieza 1 0,04+0,05+0,05+0,03+0+0,05 = 0,22
Pieza 2 0,06+0,10+0+0,07+0,05+0,10 = 0,38
Pieza 3 0,12+0,05+0,05+0,03+0,10+0,05 = 0,4

Marginal de Y:

Yacimiento 1
j
f
-

Pieza 1 0,04+0,06+0,12 = 0,22
Pieza 2 0,05+0,10+0,05 = 0,2
Pieza 3 0,05+0+0,05 = 0,1
Pieza 4 0,03+0,07+0,03 = 0,13
Pieza 5 0+0,05+0,10 = 0,15
Pieza 6 0,05+0,10+0,05 = 0,2

14

Ahora ya podemos calcular los productos para obtener las frecuencias re-
lativas conjuntas de la siguiente forma:

j
f
i
f
ij
f
- -
= :

0,04 = f
11
= 0,22*0,22 = 0,0484
0,05 = f
12
= 0,22*0,2 = 0,48
0,05 = f
13
= 0,22*0,1 = 0,04
0,03 = f
14
=0,22*0,13 = 0,16
0 = f
15
=0,22*0,15 = 0,24
0,05 = f
16
= 0,22*0,2 = 0,48
0,06 = f
21
= 0,38*0,22 = 0,44
0,10 = f
22
= 0,38*0,2 = 0,22
0 = f
23
= 0,38*0,1 = 0,11
0,07 = f
24
= 0,38*0,13 = 0,44
0,05 = f
25
= 0,38*0,15 = 0,66
0,10 = f
26
= 0,38*0,2 = 0,22
0,12 = f
31
= 0,4*0,22 = 0,16
0,05 = f
32
= 0,4*0,2 = 0,08
0,05 = f
33
= 0,4*0,1 = 0,04
0,03 = f
34
= 0,4*0,13 = 0,16
0,10 = f
35
= 0,4*0,15 = 0,24
0,05 = f
36
= 0,4*0,2 = 0,08


Como vemos ningn producto de las frecuencias relativas marginales da
como resultado la frecuencia conjunta correspondiente, por lo que podemos afir-
mar que las variables Yacimiento 1 y Yacimiento 2 son independientes, es decir
que las piezas dentales encontradas corresponden con poblaciones distintas.

De la misma forma podemos ver de manera directa que la tabla de doble
entrada del enunciado, es decir, de la distribucin conjunta no se corresponde
con los esquemas de tablas de independencia vistos anteriormente.



5. Momentos

Los momentos de una distribucin de frecuencias son nicos, es decir, si
tenemos dos distribuciones de frecuencias iguales, los momentos de ambas co-
inciden.


-- Momentos de orden (r,s) con respecto (a,b). Es la media aritmtica
de los productos de las potencias de orden r, de las desviaciones de los valores
de la variable X al valor dado por a por las potencias de orden s de las desvia-
ciones de los valores de la variable Y a b. Es decir,


15

. 0,1,2,3,.. s ; 1,2,3,... , 0 r ,
k
1 i
m
1 j
ij
n
s
b)
j
y (
r
a)
i
x (
N
1
s r,
= =
= =
=




Siendo:

n
ij
= frecuencias absolutas conjuntas de la variable bidimensional.
x
i
= valores de la variable marginal X
y
j
= valores de la variable marginal Y

-- Momentos no centrales o respecto del origen. El punto viene defini-
do por ( a, b ) = ( 0, 0 )


0,1,2,.... s ; 0,1,2,... r
k
1 i
,
m
1 j
ij
n
s
j
y
r
i
x
N
1
rs
= =
= =
=

a


-- Momentos centrales. El punto viene definido por ( a, b ) = ( ) y , x

= =
=
k
1 i
m
1 j
ij
n
s
) y
j
y (
r
) x
i
x (
N
1
rs
m


-- Momentos marginales. Son los momentos que resultan de dar el valor
cero, bien a r, o bien a s.

a) Momentos no centrales marginales. En general:


-- Cuando s = 0:



= = =
=
-
=
k
1 i
k
1 i
m
1 j
ij
n
r
i
x
N
1
i
n
r
i
x
N
1
r0
a


Se corresponde con el momento no central de orden r de la variable mar-
ginal X.



-- Cuando r = 0:
16



= =
=
=
-
=
k
1 i
ij
n
m
1 j
s
j
y
N
1
m
1 j
j
n
s
j
y
N
1
0s
a


Se corresponde con el momento no central de orden r de la variable mar-
ginal Y. Los momentos no centrales marginales ms importantes son:

x
10
= a
y
01
= a

b) Momentos marginales centrales.

-- Cuando s = 0:



= =
-
=
=
=
k
1 i
k
1 i
i
n
r
) x
i
(x
N
1
m
1 j
ij
n
r
) x
i
(x
N
1
r0
m


Se corresponde con el momento central de orden r de la variable
marginal de X

-- Cuando r = 0:


m
j
n
s
) y
j
y
1 j
(
N
1
0s -

=
=

m


Se corresponde con el momento central de orden s de la variable margi-
nal Y.

Los momentos centrales marginales ms importantes son:

m
10
= 0
m
01
= 0
m
20
= V
x
2
Varianza de la variable marginal X

m
02
= V
y
2
Varianza de la variable marginal Y


6. Covarianza y sus caractersticas (Atencin al siguiente cuadro)

La covarianza de una variable bidimensional es el momento central de or-
den ( r, s ) = ( 1, 1 ) respecto a x ( , ) y . Es decir:
17



= =
=
k
1 i
ij
n
m
1 j
) y
j
)(y x
i
(x
N
1
11
m




Tambin se denota por S
xy
y por cov (x, y)

-- Caractersticas de la covarianza:

1) Se cumple que:


S
xy
= a
11
a
10
*
a
01



2) Decimos que X e Y son independientes cov (x, y) = 0; pero esta re-
lacin no es recproca, es decir, si cov (x, y) = 0 X e Y son independientes.
/
3) cov (x, x) = V
x
2
4) cov (x, y) = cov (y, x)


Ejemplo completo donde calcularemos la covarianza, as como
las distribuciones marginales y condicionadas

En cierta regin se observ el tamao de cierta ave en centmetros y el
peso en gramos de la misma, obtenindose la siguiente tabla.

Ancho ( X ) 35 31 42 60 52 49 61 50 55 58
Longitud ( Y ) 100 140 120 110 200 200 110 160 160 200

Consideramos la variable X dividida en intervalos de amplitud 10, y cuyo
primer extremo del primer intervalo es 25. Calcular:
a) Tabla bidimensional
b) Distribuciones marginales
c) Distribucin de X condicionada a que Y=200
d) Media, moda,y cuartiles de la variable X
e) Covarianza

a) La tabla de doble entrada quedar:

X
Y
100 110 120 140 160 200
- i
n
25-35 1 1
35-45 1 1 2
45-55 1 2 3
55-65 2 1 1 4
j
n
-

1 2 1 1 2 3
18


b) Marginal de X:

X
- i
n
25-35 1
35-45 2
45-55 3
55-65 4


Marginal de Y:


Y
j
n
-

100 1
110 2
120 1
140 1
160 2
200 3










c) Veamos ahora los valores de la variable marginal X

X Y=200
25-35 0
35-45 0
45-55 2
55-65 1







X Mc
- i
n

- i
N
25-35 30 1 1
35-45 40 2 3
45-55 50 3 6
55-65 60 4 10






d) Veamos ahora los valores medio, mediano, etc.

=
=
-

k
1 i
i
n
i
x
N
1
50 = x
Calculamos la mediana: 5
2
N
= ; entonces el intervalo mediano ser [45,
55).

19
Luego la mediana ser: Me =
i
i
1 - i 2
N
1 - i
a
n
N
L

+ = 51,66

Calculamos la moda: El intervalo modal es [55, 65), luego la moda es
Md =
i
1 - i 1 i i
1 - i i
1 - i
a
h h 2h
h h


+
+
L = 55


Calculamos ahora los cuartiles:

Q
25: 5 , 2
100
10 * 25
= .
Luego el intervalo ser [35, 45) y por tanto tenemos que,
Q
25
=
i
i
1 - i
100
N
1 i
a
n
N
L

+
+
p
= 42,5
Q
75: 5 , 7
100
10 * 75
= ,
el intervalo ser [55, 65) y por tanto Q
75
= 58,75

e) Veamos el valor de la covarianza:

= =
=
k
1 i
ij
n
m
1 j
) y
j
)(y x
i
(x
N
1
11
m

Tambin hemos visto que la covarianza es: S
xy
= a
11
a
10 *
a
01


Luego si usamos este ltimo mtodo, obtenemos que:

0,1,2,.... s ; 0,1,2,... r
k
1 i
,
m
1 j
ij
n
s
j
y
r
i
x
N
1
rs
= =
= =
=

a

Por lo que:
a
11 =
7580
a
10
= x = 50

a
01
= y = 150

Y, por lo tanto, la cov (x, y) = 7580- 50*150 = 80



Resumen

Hemos visto los clculos estadsticos bsicos que nos permiten describir
las variables bidimensionales y tambin poder hacer comparaciones entre las
marginales que forman la variable bidimensional. Los clculos ms importantes
que hemos visto en este tema son:

20
-- Tabla de doble entrada:

X
Y


y
1
y
2
y
3
y
4
y
5
y
j
... y
m
x
1

x
2

x
3

x
4

x
5

x
i

x






k
n
11
n
12
n
13
n
14
n
15
n
1j
... n
1m

n
21
n
22
n
23
n
24
n
25
n
2j
n
2m

n
31
n
32
n
33
n
34
n
35
... n
3j
n
3m

n
41
n
42
n
43
n
44
n
45
n
4j
... n
4m

n
51
n
52
n
53
n
54
n
55
n
5j
n
5m

n
i1
n
i2
n
i3
n
i4
n
i5
n
ij
n
im

n
k1
n
k2
n
k3
n
k4
n
k5
... n
kj
... n
km



-- Distribucin de frecuencias marginales de X, tanto de frecuencias abso-
lutas como relativas:

-
=

=
m
1 j
ij
n
N
i
n
i
f
-
=
-
n
i

-- Distribucin de frecuencias marginales de Y, tanto de frecuencias abso-
lutas como relativas:

=
=
-
k
1 i
ij
n
j
n
N
j
n
j
f
-
=
-


-- Distribucin de frecuencias de X condicionado por Y: { )
j
y
i
(x f , i =
1,2,3,,k , siendo la frecuencia condicionada:

j
f
ij
f
j
n
ij
n
)
j
y
i
(x f
-
=
-
=
-- Distribucin de frecuencias de Y condicionada por X: { )
j
x
j
(y f ,
j=1,2,3,, m }, siendo la frecuencia condicionada:

-
=
-
=
i
f
ij
f
i
n
ij
n
)
i
x
j
(y f

-- X es independiente de Y si y slo si para cada valor x
i
se verifica que:

21
)
m
y
i
f(x ... )
2
y
i
f(x )
1
y
i
f(x = = = , k 1,2,3,..., x =

-- Y es independiente de X si y solo si para cada valor y
j
se verifica que:

m 1,2,3,..., y ),
k
x
j
f(y ... )
2
x
j
f(y )
1
x
j
f(y = = = =


-- X depende funcionalmente de Y:


X
Y
y
1
y
2
y
m-1
y
m
x
1
0 4 0 0
x
2
0 1 0 0



x
k-1
0 0 4 0
x
k
0 0 7 0







-- Y depende funcionalmente de X:

X
Y
Y
1
y
2
y
m-1
y
m
x
1
0 0 0 0
x
2
5 1 0 0



x
k-1
0 0 0 0
x
k
0 0 7 9









-- Momentos no centrales: 0,1,2,.... s ; 0,1,2,... r
k
1 i
,
m
1 j
ij
n
s
j
y
r
i
x
N
1
rs
= =
= =
=

a


-- Momentos centrales:

= =
=
k
1 i
m
1 j
ij
n
s
) y
j
y (
r
) x
i
x (
N
1
rs
m


-- Momentos no centrales marginales:


= = =
=
-
=
k
1 i
k
1 i
m
1 j
ij
n
r
i
x
N
1
i
n
r
i
x
N
1
r0
a


= =
=
=
-
=
k
1 i
ij
n
m
1 j
s
j
y
N
1
m
1 j
j
n
s
j
y
N
1
0s
a


22
-- Momentos centrales marginales:


= =
-
=
=
=
k
1 i
k
1 i
i
n
r
) x
i
(x
N
1
m
1 j
ij
n
r
) x
i
(x
N
1
r0
m

j
n
s
) y
j
y
m
1 j
(
N
1
0s -

=
=

m

-- Covarianza:

= =
=
k
1 i
ij
n
m
1 j
) y
j
)(y x
i
(x
N
1
11
m



EJERCICIOS DE EVALUACIN

[Envense las respuestas de estos ejercicios por e-mail, con la extensin que se estime
necesaria, a la autora de este tema: carmen_perez_pintos@hotmail.com]

1. Se quiere hacer un estudio comparativo entre la longitud de cierto pez y el di-
metro de su cabeza, medidos en centmetros, encontrado en el ro Mississipi.
Los datos vienen dados por la siguiente tabla:

LONGITUD (X)
DIAMETRO

(Y)
10-
20
20-
30
30-
70
70-
130
0-2 54 6 0 0
2-6 26 73 32 10
6-10 17 62 23 9
10-12 2 75 41 13
12-18 0 28 17 12

Calcular la distribucin de frecuencias marginal de X y de Y, la distribu-
cin de frecuencias de Y condicionada a que la longitud del pez es de 6-10 cen-
tmetros; hallar la covarianza, la media, varianza y desviacin tpica de la distri-
bucin de X condicionada a Y=(30-70].


2. Se han realizado dos test en un hospital para ver el grado de satisfaccin de
los pacientes con el servicio medico que los atendi y el nmero de das que es-
tuvieron ingresados obteniendo los siguientes resultados:

GRADO DE
SATISFACCIN
NMERO DE
DIAS
NMERO DE PACIENTES
ENTREVISTADOS
0-20 0-15 16
0-20 15-30 5
20-40 0-15 3
20-40 15-30 23
20-40 30-45 15
40-60 15-30 18
60-80 15-30 20

23
Calcular: a) La tabla de doble entrada de la distribucin; b) las distribucio-
nes marginales de X e Y; c) la media y desviacin tpica de las distribuciones
marginales (cul es ms dispersa?); d) la covarianza de la distribucin.


3. Se ha hecho un estudio comparativo entre la estatura media de 50 matrimo-
nios y la de sus hijos, obteniendo los resultados siguientes:

PADRES
HIJOS
150-
160
160-
165
165-
170
170-
175
175-
180
180-
190
150-160 1
160-165 2 2
165-170 3 4 5 2
170-175 3 6 2
175-180 1 5 4 3
180-190 4 1 1 1

Calcular: a) Las distribuciones marginales; b) la distribucin de X condi-
cionada a Y= (165-170]; c) la distribucin de Y condicionada a X (es sim-
trica?); d) la media, varianza y desviacin tpica de la marginales (cul tiene
ms dispersin?); e) la covarianza.

4. Se quiere comparar la probabilidad de supervivencia de un pez de agua sala-
da mantenido en cautividad en una poza de agua dulce durante dos semanas en
funcin de su peso en gramos. Para el estudio se cogieron desde larvas hasta
peces adultos. Se obtuvieron los siguientes datos:


X
Y
<20gr 20-50gr 50-100gr 100-250gr >250gr
<0,1 48 21 14 7 6
0,1-0,3 11 8 5 6
>0,3 2 1 1
Calcular: a) Las distribuciones marginales (son independientes?); b) la
media y mediana de la variable Y; c) el tercer cuartil de la variable X; d) la dis-
tribucin de Y cuando X es (0,1-0,3].

Вам также может понравиться