You are on page 1of 10

D I S T R I B U C I O N E S B I D I M E N S I O N A L E S

1. VARIABLES ESTADSTICAS BIDIMENSIONALES


En numerosas ocasiones interesa estudiar simultneamente dos !o ms" caracteres de una #o$laci%n. En
el caso de dos !o ms" &aria$les estudiadas con'untamente se (a$la de variable bidimensional
!multidimensional ") si se trata de dos caracteres cualitati&os* de par de atributos.
Si de un cierta #o$laci%n se estudian dos caracteres simultneamente se o$tienen dos series de datos.
Individuos A B C .......
Carcter + ,1 ,- ,. ........
Carcter / 01 0- 0. ...........
La lista de #ares de datos corres#ondientes a cada indi&iduo de la #o$laci%n !re#etidos o no"* es lo 1ue
llamamos &aria$le estad2stica $idimensional.
Ejemplos
1. A cada uno de los reclutas de un reem#la3o se les talla 0 #esa. Se trata de dos &aria$les cuantitati&as.
,i 1*45
! tallas en m "
1*45 1*67 1*68 ........
0i 64
! #eso en 9: "
4; 45 66 .......
-. Entre los em#leados de una em#resa se (a reali3ado una encuesta so$re el consumo del t$aco* 1ue (a
arro'ado los si:uientes resultados<
=$ito
Se,o
>umadores No ?umadores Totales de ?ilas
Varones
Mu'eres
@7
@.
6@
.4

11.
85
Totales de columnas 7- 151 Total :eneral 17.
Nota. En este tema nos limitaremos al estudio de caracteres cuantitati&os discretos* #uesto 1ue si el
carcter es continuo o discreto a:ru#ado en inter&alos* se tra$a'ar con las marcas de clase.
-. DISTRIBACIONES DE >RECAENCIAS
Se dis#onen las ?recuencias en una ta$la de do$le entrada donde las ,i 0 la 0' estn ordenadas en ?orma
creciente. Reci$e el nom$re de ta$la de ?recuencias o tabla de correlacin.
Si (a0 #ares 1ue se re#iten se a:ru#an siendo ni' la ?recuencia a$soluta del #ar !,i* 0'".
Las sumas
ni' B ni * ?recuencia a$soluta de ,i.
'
ni' B nC' * ?recuencia a$soluta de 0'
i
se llaman ?recuencias a$solutas mar:inales de las &aria$les + e / res#ecti&amente.

ni' B NBnDmero total de #ares.
' 0
Euedando la si:uiente ta$la de do$le entrada<
X
Y
,1 ,- ....... ,9 >rec. a$solutas
mar:inales de Y
01 n11 n-1 ..... n91 nC1
0- n1- n-- ...... n9- nC-
...... ..... .... .... ... ....
.
0r n1r n-r ... n9r nCr
>rec. a$solutas
mar:inales de X
n1 n- .. n9 ni' B N
i '
En la #rctica al:unas de las ni' #uede ser cero. En tal caso la casilla corres#ondiente se de'ar en $lanco.
Ejemplo 3.
Dada la distri$uci%n $idimensional<
X 1 - 1 - . - - - . 1
Y . ; - . ; @ . ; ; .
la ta$la corres#ondiente es<
+
/
1 - . >rec. a$solutas
mar:inales de
0
- 1 1
. - - @
@ 1 1
; - - @
>rec. a$solutas
mar:inales de +
. ; - NB15
Al estudiar una &aria$le $idimensional se o$tienen &arias distri$uciones unidimensionales* se:Dn se
consideren las ?ilas o las columnas de la ta$la en estudio.
Las distri$uciones unidimensionales del total de los indi&iduos de la #o$laci%n* res#ecto a cada una de las
caracter2sticas reci$en el nom$re de distribuciones marginales.
Distri$uci%n mar:inal de la /<
Y >rec. a$solutas
mar:inal de /
01
0-
.
.
0r
nC1
nC-
.
.
nCr
Anlo:amente la distri$uci%n mar:inal de la +
Ejemplo 4. O$tener la distri$uci%n mar:inal de la &aria$le +.
X >rec. a$solutas
mar:inal de+
1
-
.
3
5

Si en la ta$la de correlaci%n consideramos la #rimera columna 0 una columna intermedia * la


corres#ondiente a 0'* se o$tiene una distri$uci%n unidimensional 1ue llamaremos distribucin condicionada de la
variable X #or la modalidad 0' de la &aria$le /.
+
>rec. a$solutas
condicionadas #or
0'
,1
,-
.
.
n1'
n-'
.
.
,9 n9'
Analo:amente se de?ine la distribucin condicionada de la variable Y #or la modalidad ,i de la
&aria$le +.
Ejemplo 5.
O$tener la ta$la de la distri$uci%n condicionada de la &aria$le / #or la modalidad ,-.
/
>rec. a$solutas
condicionadas #or
,-
-
.
@
;
5
-
1
-
.. REFRESENTACIONES GRH>ICAS
Consideremos la distri$uci%n<
,1 ,- ..... ,N
01 0- ....... 0N
! Los #ares #ueden estar re#etidos "
Los #ares de &alores o$ser&ados !,i * 0'" se #ueden re#esentar en unos e'es coordenados*.
0


! ,i * 0' "



,

El con'unto de #untos 1ue resulta se llama dia:rama de dis#ersi%n o nube de puntos de la distri$uci%n
$idimensional.
Cuando el nDmero de datos es :rande !se usa una ta$la de do$le entrada" los datos se re#resentan con un
dia:rama de dis#ersi%n reticulado de tal manera 1ue la &isi%n de la nu$e de #untos indi1ue realmente c%mo es la
distri$uci%n.
En estos casos tam$iIn se suele usar un dia:rama de $arras so$re un sistema catesiano de tres dimensiones
!estereo:ramas".
Ejemplo !.
=acer el dia:rama de dis#ersi%n de la distri$uci%n del e'em#lo ..

. . . .
.
. . . .
" # 3
Ejercicio para el alumno$ di$u'a el estereo:rama corres#ondiente
@. FARHMETROS DE LA V. E. BIDIMENSIONAL
Considerando las distri$uciones mar:inales* como son unidimensionales es #osi$le calcular los si:uiente
#armetros<
Donde NB

n
i
B

nC
'
es el numero total de #ares
Llamadas medias marginales.
Nota. En una distri$uci%n $idimension al #unto !%& ' " se le llama centro de :ra&edad de la distri$uci%n.
$" (arian)as
Se de?ine<
(arian)a marginal de la variable X
Anlogamente la varianza marginal de la variable Y.
De ellas (extrayendo la raz cuadrada ) se obtienen las correspondientes desviaciones tpicas.
Ejercicio #. Calcula las medias mar:inales 0 las &arian3as de la &.e. del e'em#lo ..
Soluci%n % B 17J15B1*7 ) ' B.8J15B .*8 ) S
,
-
B @*1K!1*7"
-
B 5*@7 ) S
0
-
B 1;*6 K 1@*@@B1.16.
c" Covarian)a
Fara las &aria$les estad2sticas $idimensionales se de?ine la L covarianza CC como la media aritmItica de
los #roductos de las des&iaciones res#ecto de la media de cada una de las &aria$les com#onentes. Es decir <
Se demuestra 1ue
#ro#iedad 1ue ?acilita el clculo de la co&arian3a
a" *edias
% +
%ini

,.
'+

'
j
n
j
,
S
-
,B
!,
i
K %"-n
i
B ,
i
-n
i
K !%-
N N
S
,0 B

!,
i
K%"!0
'
K'"n
i'
N
S
,0 B

,
i
0
'
n
i'
K %.' + M
,0
K % .'
,

Ejercicio . Calcula la co&arian3a de la distri$uci%n del e'em#lo ..
Soluci%n < S
,0
B
- 6 1- 8 -5 .5
15
+ + + + +
K !1*7"M!.*87 B 5*;8.
@. REGRESINN LINEAL
Al considerar los dos caracteres de una &aria$le $idimensional #uede ocurrir.
K Eue (a0a una dependencia .uncional entre ellos* de tal manera 1ue a cada &alor le corres#onda un
Dnico &alor del otro. E'em#lo< la tem#eratura a la 1ue calentamos una $arra de (ierro 0 la lon:itud alcan3ada.
KEue (alla una dependencia estad/stica o correlati&a* de tal manera 1ue los &alores si:an unas #autas
similares. For e'em#lo el nmero de horas de estudio 0 las notas obtenidas.
K Eue se de una independencia entre los caracteres. For e'em#lo la estatura 0 las cali?icaciones en
Matemticas.
El estudio de la relaci%n entre dos caracteres de una &aria$le estad2stica $idimensional es el o$'eto de la
regresin lineal.
La nu$e de #untos de una distri$uci%n $idimensional nos da una #rimera idea de la relaci%n e,istente
entre los datos de la misma.
Cuando la nu$e de #untos del dia:rama de dis#ersi%n #ermita deducir al:Dn ti#o de de#endencia entre las
dos &aria$les +* /* concentrndose los #untos alrededor de una cierta l2nea !l2nea de re:resi%n" se #lantean dos
cuestiones<
A" Definir la lnea.
B" Medir el nivel de aproximacin de dic(a l2nea.
S2 la l2nea es una recta * el #ro$lema es un caso t2#ico de re:resi%n lineal.
A) Rectas de regresin.
Se llama recta de regresin a a1uella 1ue me'or se a'usta a la nu$e de #untos.
El #rocedimiento ms usado* #ara (allar dic(a recta* es el los m2nimos cuadrados.
Se calcula la recta <
0 B a, O b& de tal manera 1ue <
SB P0i K !a ,i O b "]
-
sea m2nima

.
. . .
. .
. .
. .
. .
El clculo de a 0 b inclu0e conocimientos 1ue no se dan en este ni&el !deri&aci%n #arcial..."* #or lo 1ue
s%lo daremos el resultado<
Se &eri?ica<
a+
S
,0
b+ ' K S
,0
%
S
,
- S
,
-
lue:o se #uede escri$ir <
0B
S
,0
%
O
' K S
,0
% o lo 1ue es i:ual < 0 K ' B S
,0
! , K % - .
S
,
- S
,
- S
,
-
Esta es la ecuaci%n de la recta de regresin de Y sobre X. Sir&e #ara (acer estimaciones o #redicciones
de los &alores de / conocidos los de +.
Anlo:amente la recta de re:resi%n de + so$re / tiene #or ecuaci%n<
, Q % + S
,0
!0 Q ' -
S
0
-
A m0, B
S
,0
0

m
,0
B

S
,0
se les llama los coe.icientes de regresin
.
S
,
- S
0
-
Ejercicio 3. =allar las rectas de re:resi%n #ara la distri$uci%n del e'em#lo ..
Soluci%n < recta de re:resi%n de / so$re + 0 Q .*8 B 1*18 !,K 1*7"
recta de re:resi%n de + so$re / , Q 1*7 B 5*; ! 0 Q .*8 ".
Nota. Daremos sin demostracin al:unas #ro#iedades del coe?iciente de re:resi%n 1ue ?acilitan los
clculos de estos* #ues #ermiten (acer un cam$io de &aria$le.
Fro#iedades del coe?iciente de re:resi%n<
1" Si se suma o resta una constante a todos los &alores de + o de / el coe?iciente de re:resi%n
m0, no &ar2a
.
-" Si se multi#lican todos los &alores de + #or una constante* el coe?iciente de re:resi%n 1ueda di&idido
#or esa constante.
Si se multi#lican todos los &alores de 0 #or una constante* el coe?iciente de re:resi%n m0, 1ueda
multi#licado #or es constante.
Ejemplo 0. Si se consideramos la ta$la
1785 @.5555
178. @;5555
1786 @4;555
1787 ;55555
Si (acemos +CB
1785
.
/C B
! @;5555
1555

Se o$tiene <
5 K-5
1 5
- -;
. ;5
Far la &aria$le +C */C es ms ?cil el clculo del co?iciente de re:resi%n 0 la relaci%n entre Iste 0 el de +/
es<
mC
0,
B
.
1555
mxy
B" Correlacin lineal.
Se entiende #or correlacin la de#endencia 1ue e,iste entre las &aria$les de una distri$uci%n.* cuando Ista
es* en cierta ?orma* lineal se (a$la de correlacin lineal. Cuando no e,iste tal de#endencia se dice 1ue las
&aria$les estn incorreladas.
Fara medir* de una ?orma cuantitati&a* dic(a de#endencia se utili3a el llamado coe.iciente de correlacin
lineal& o de 1earson& 1ue se de?ine as2<
El si:no es O si la co&arian3a es #ositi&a 0 K si es ne:ati&a..
"ropiedades de r
a" K1=r =1
$" Si r es #ositi&o la correlaci%n es directa* es decir* al aumentar una &aria$le tam$iIn aumenta la otra
!coe?iciente de re:resi%n #ositi&o". En este caso las #endientes de las rectas de re:resi%n son #ositi&as.
. .
. .
. .
. .
. .
.
Si r es ne:ati&o la correlaci%n es inversa& es decir&al aumentar una &aria$le disminu0e la otra. En este
caso las #endientes de la rectas de re:resi%n son ne:ati&as.
c" Si r
-
B 1* es decir* r i:ual a 1 o a K1* las dos rectas de re:resi%n coinciden 0 la nu$e de #untos est
contenida en la recta!correlaci%n #er?ecta". =a0 4e#endencia ?uncional entre las &aria$les.
d" Si r B 5 las rectas de re:resi%n son #er#endiculares entre s2 0 #aralelas a los e'es. Las &aria$les son
incorreladas.
Fara los dems &alores de r la de#endencia es tanto ms ?uerte cuanto ms #r%,imo estI a 1 o a K1. Ser
ms dI$il cuando se a#ro,ime a 5<
Fara la correlaci%n directa<
Si 5*4; r 1 correlaci%n mu0 alta.
Si 5*@5 r 5*4; correlaci%n $a'a
Si r R 5*@5 la correlaci%n es casi des#recia$le .
Ejercicio 4. =allar el coe?iciente de correlaci%n lineal #ara la distri$uci%n del e'em#lo ..
Soluci%n < r BO ! * ".! * " 118 5 ; B 5*46. Se trata de una correlaci%n directa alta.
,ota. En las calculadoras el coe?iciente &iene re#resentado #or

R B
#
# #
m m
xy
x y
yx xy
.
. = +
Problemas modelos resueltos:
#. Ana asociaci%n dedicada a la #rotecci%n de la in?ancia decide estudiar la relaci%n entre la mortalidad
in?antil en cada #a2s 0 el nDmero de camas de (os#itales #or cada mil (a$itantes.. Datos
% ;5 155 45 65 1-5 185 -55 -;5 .5 75
' ; - -*; .*4; @ 1 1*-; 5*4; 4 .
Donde % es el nS de camas #or mil (a$itantes e ' el tanto #or ciento de mortalidad.
Se #ide calcular las rectas de re:resi%n 0 el coe?iciente de correlaci%n lineal.
T Si se dis#usiese de 14; camas #or mil (a$itantes 1ue tanto #or ciento de mortalidad ca$ria es#erarU. TLa
estimaci%n es ?ia$leU Ra3ona la res#uesta.
Soluci%n <
Fara ?acilitar los clculos de los #armetros se utili3a la si:uiente ta$la<
%i 'i %i

'i

% i 'i
;5 ; -;55 -; -;5
155 - 15555 @ -55
45 -*; @755 6*-; 145
65 .*4; .655 1@*56-; --;
1-5 @ 1@@55 16 @85
185 1 .-@55 1 185
-55 1*-; @5555 1*;6-; -;5
-;5 5*4; 6-;55 5*;6-; 184*;
.5 4 755 @7 -15
75 . 8155 7 -45
B
11;5 .5*-; 147.55 1-6*@.4; -@--*;
% B11;) 'B .*5-;V) S, B
147.5 1.--; =
68*;7) S0B 1- 6@.4; 7 1;56-; * * B 1*84 ) S,0B
-@- -; 11; . 5-; * ! "! * "
B K15;*6-;
Las rectas de re:resi%n sern #or tanto<
0 K .*5-; B K5*5--@@7 !, K 11;"
, 2 11; B K.5*-5;. ! 0 K .*5-;"
El coe?iciente de correlaci%n lineal<
rB
15; 6-;
68 ;7 184
*
! * "! * "
B K 5*8-.;
es una correlaci%n in&ersa alta .
Fara la estimaci%n 1ue nos #iden utili3aremos la recta de re:resi%n de / so$re +.
0B .*5-; K 5*5--@@7!14;K 11;" B 1*648. 1ue ser2a ?ia$le #or ser alto el coe?iciente de correlaci%n.
. Dada la distri$uci%n $idimensional<
X 1 - 1 - . - - - . 1
Y . ; - . ; @ . ; ; .
Encuentra el &alor del coe?iciente de correlaci%n lineal usando una ta$la de correlaci%n.
Soluci%n.
Se usa la si:uiente ta$la de do$le entrada 1ue ?acilita los clculos<
+
/
1 - . nC' n'C0' nC'0'
-
ni',i0'
- 1 1 - @ -
. - - @ 1- .6 18
@ 1 1 @ 16 8
; - - @ -5 155 ;5
ni . ; - 15
B.8 B1; B48
ni,i . 15 6
B17
ni,i
-
. -5 18
B@1
ni',i0' 4 @5 .5
B48
De a1u2 se tiene<
% + 17J15B 1*7) ' B .8J15B .*8) S,
-
B @*1 K !1*7"
-
B 5*@7* S, B5*4 ) S0
-
B1;*6 K !.*8"
-
B 1*16*
S0 B 1*544) S,0 B 4*8 K !1*7"!.*8"B 5*;8.
Lue:o r B
5 ;8
5 4 1 544
*
! * "! * "
B 5*467
Problemas propuestos
#. Las tallas 0 los #esos de 15 #ersonas &ienen reco:idos en la si:uiente ta$la<
talla 3cm- 165 16; 145 185 18; 175 17- 14; 18- 14-
pesos !9:- ;8 61 6; 4. 85 8; 8. 68 4@ 64
Estimar el #eso medio de una #ersona 1ue mida 168cm.
. El nDmero de licencias de ca3a* en miles* 0 el nDmero de &otantes a un determinado #artido en 6
comunidades aut%nomas* en decenas de miles* est e,#resado en la si:uiente ta$la<
,4de licencias !X" 15. -6 . 4 -6 ;
,4 de &otantes !Y" -56 -6 -4 1@ -@ 1-
Determinar<
1" Media 0 &arian3a de las &aria$les + e /.
-" Coe?iciente de correlaci%n* inter#retando su &alor.
." En el caso de 1ue e,ista correlaci%n< si en una determinada comunidad e,isten ;5 decenas de
millar de &otantes* Tcuntas licecias de ca3a* en miles* se #uede estimar 1ue e,isten.
3. Las distancias medias de los 17 #lanetas al Sol son<
1.Merc -. Ven. .. Tie. @. Ma. ;. Ast. 6. Wu#. 4. Sat. 8. Ar. 7. Ne#. 15. Flu
5*.7 5*4- 1 1*;- -*6; ;*- 7*;@ 17*17 .5*54 .7*;-
!Se (a tomado como unidad la distancia entre la Tierra 0 el Sol* a lo 1ue se llama unidad
astron%mica !u.a.". El 1uinto lu:ar est ocu#ado #or los asteroides 1ue* #ara estos e?ectos* son
considerados como un #laneta ms".
Re#resenta la nu$e de #untos corres#ondiente* tra3a la rectaa de re:resi%n 0 calcula el coe?iciente
de correlaci%n.
Si (u$iera un nue&o #laneta ms all de Flut%n* Ta 1uI distancia en u.a. estar2a del SolU. TSer2a
L?ia$leX esta medidaU
4. O$ser&aciones reali3adas con estudiantes de Matemticas* so$re el e?ecto del #aso del tiem#o en
los conocimientos ad1uiridos* arro'an los si:uientes resultados<
1 d2a ..................... 75 V de #ermanencia de conocimientos.
- d2as .................... 4; V L L
. d2as .................... @- V L L
@ d2as .................... .5 V L L
; d2as .................... -1 V L L
Tomando los d2as transcurridos !+" 0 el tanto #or ciento !/" como &aria$les de una distri$uci%n
dimensional* (alla la recta de re:resi%n de / so$re + 0 estima* si e,iste una correlaci%n ?uerte* el tanto #or
ciento de conocimientos 1ue #ermanecern a los oc(o d2as. Or:ani3a los clculos 0 e,#lica el resultado.