Вы находитесь на странице: 1из 80

U B I V U L .

T UNIVERSIDAD PERUANA CAYETANO HEREDIA

Escuela De Postgrado Vctor Alzamora Castro


Facultad De Salud Pblica y Administracin
Carlos Vidal Layseca

Maestra en Gerencia de Proyectos y


Programas Sociales

Lectura seleccionada:

A n lisis M u ltivarian te

Autores:

Joseph F. H air, Rolph E. A nderson, Ronald L.


Tatham y W illiam C. Black

En: Hair, Joseph F., Rolph E. Anderson, Ronald L.


Tatham y William C. Black. Anlisis Multivariante -
quinta edicin. Prentice Hall Iberia S.R.L., Madrid, 1999

Reproduccin del presente material con fines estrictamente acadmicos


ANALISIS MULTIVARIANTE
Quinta edicin

Joseph F. HAIR, Jr.


Louisiana State University

Rolph E. ANDERSON
Drexel University

Ronald L. TATHAM
Burke Marketing Research

William C, BLACK
Louisiana State University

Traduccin:
Esm e Prentsce

Diego C ano
Universidad Autnoma de Madrid

Revisin tcnica y com pilacin de las lecturas com plem entarias:


M nica Gmez Surez
Profesora titular de Com ercializacin e Investigacin de M ercados
U niversidad A u t n o m a d e M adrid

PRENTICE HALL
M adrid Upper Saddle River Buenos Aires * Londres M xico Nueva Delhi Ro de Janeiro
Santaf' de Bogot Singapur Sydney Tokio * Toronto
^ /~ D a l o s J e c a ta lo g a c i n b ib lio g r fic a

J . F. H a ir . J r R . E . A n d c r s o n , R . L . T a i h a m , \V . C . B la c k
A N L IS IS M U L T JV A R IA N T E . 5 . ' c d .
P R E N T IC E H A L L I B E R IA . M a d rid . 1999

IS B N : 8 4 -8 3 2 2 -0 3 5 -0
M a te ria : E s ta d is tic a -T c o ria , p r o c e d im ie n to s y m to d o s . 311

F o rm a to 195 X 2 6 5 P g in a s : S32

J . F. H a ir, J r ., R . E . A n d c r s o n . R . L . T a ih a m , W . C . B la c k
A N L IS IS M U L T IV A R IA N T E , 5. ed .

N o est p erm itid a la rep ro d u c ci n toial o p arcial d e esta obra


ni su tratam ien to o tra n sm isi n p o r cu a lq u ie r m edio o m to d o
sin auto rizaci n esc rita de la E ditorial.

D E R E C H O S R E SER V A D O S
O 19 9 9 resp ec to a la p rim e ra ed ici n en e s p a o l por.
P R E N T IC E H A L L IB E R IA . S.R .L .
N ez de B alboa, 120
2 8 0 0 6 M aurid

IS B N : 8 4 -8 3 2 2 -0 3 5 -0
D ep sito L egal: M 3 1 .5 1 3 -1 9 9 9

T r a d u c id o d e :
M U LT IV A R IA TE DA TA A N A LY S1S, F ifth ed itio n
P renlicc Hall In tern atio n al. Inc.
M C M X C V 1 II
ISB N : 0 -1 3 -9 3 0 5 8 7 -4

E d ic i n e n e s p a o l:
E ditor: A ndrs O lero
A sstem e e d ito ria l: A n a Isabel G arca
D ise o tle cu b ierta: D o m in g o R ufo
C o m p o sici n : C O P IB O O K . S . L.
Im p reso por:

IM P R E S O E N E S P A A - P R IN T E D IN SPA1N

E s te lib r o h:i s id o im p r e s o c o n p a p e l y tin ta s e c o l g ic o s


Introduccin

O B JE T IV O S DE A P R E N D IZ A JE
Explicar qu es el anlisis m ultivarian te y cu n d o es apropiada su aplicacin.
D efinir y com entar las tcnicas concretas incluidas en el anlisis m ultivariante.
D eterm inar q u tcnica m ultivariante es la indicada para un problem a de investigacin
especifico.
Explicarte naturaleza d las escalas d e m edida y su relacin con las tcnicas multivariantes.
Describir los aspectos conceptuales y estadsticos propios del anlisis m ultivariante.

E l C a p tu lo 1 constituye una re v isi n sim p lific ad a de las tcnicas del anlisis m ultivariante. Se
resalta la influ en cia crecien te de lo s m to d o s del an lisis m ultivariante, n o s lo e n los aspectos
a n a ltic o s de la investigacin, sino ta m b i n e n el^diseo y form a en q u e se reco g en datos para la
ad opcin d e decisiones y la resolucin de problem as. A unque las tcnicas m ultivariantes com parten
b astantes caractersticas con sus anlogas u n i y bivariantes, son evidentes las d iferencias que exis
ten al p a sa r al m b ito del anlisis m u ltiv ariante. P ara ilu strar stas, este captulo p resen ta u n a c la
sificaci n d e las tcnicas m ultiv arian tes. D espus, p ro p o rcio n a unas indicaciones generales para
la ap licaci n d e estas tcnicas ju n to c o n u n a ap ro x im aci n estructurada a su fo rm ulacin, esti
m aci n y a la interpretacin de resu ltad o s m ultivariantes. El captulo co n clu y e co n u n co m en ta
rio so b re la b ase de datos u tilizad a en la m a y o r parte d e l libro para ilustrar las ap licacio n es de las
tcnicas.
A N L IS IS M U L T IV A R lA N T lf

L a te c n o lo g a in fo rm tic a d isp o n ib le b o y e n d ia , ca si in im ag in a b le h a c e s lo d o s d c a d a s , h a h e c h o
p o s ib le a v a n c e s e x tra o rd in a rio s e n el a n lis is d e d a to s p sic o l g ic o s, so c io l g ic o s y d e o tro tip o d e
d a to s re fe rid o s al c o m p o rta m ie n to h u m a n o . E s te im p a c to es m s e v id e n te en la r e la tiv a fa c ilid a d
co n la q u e lo s o rd e n a d o re s p u ed e n a n a liz a r e n o rm e s ca n tid a d e s d e d a to s c o m p le jo s. C a si c u a lq u ie r
p r o b le m a s e p u e d e a n a liz a r f c ilm e n te h o y e n d a p o r u n n m e ro ilim ita d o d e p r o g r a m a s
e s ta d stic o s, in c lu so e n o rd e n a d o re s p e rs o n a le s . A d e m s , lo s e fe c to s d el p ro g re s o te c n o l g ic o h an
e x te n d id o a n m s la c a p a c id a d d e m a n ip u la r d a to s , lib e r a n d o a lo s in v e s tig a d o r e s d e las
re stric c io n e s del p a s a d o y p e rm iti n d o le s as a b o rd a r in v e stig a c io n e s m s s u sta n tiv a s y e n s a y a r sus
m o d e lo s te ric o s. L a s lim ita c io n e s m e to d o l g ic a s n o so n y a u n a s u n to c rtic o p a r a e l te ric o
e m p e a d o e n la b sq u e d a de e v id e n c ia em p rica . G ra n p a rte d e esta c re c ie n te c o m p re n si n y p ericia
e n e l a n lis is d e d a to s h a v e n id o a tra v s d e l e s tu d io d e la e s ta d stic a y d e la in fe re n c ia e s ta d stic a .
I g u a lm e n te im p o rta n te , sin e m b a rg o , h a sid o el d ila ta d o c o n o c im ie n to y a p lic a c i n d e un g ru p o d e
t c n ic a s e s ta d stic a s c o n o c id a s c o m o a n lis is m u lt iv a r ia n te .
L a s t c n ic a s d e l a n lis is m u ltiv a r ia n te e s t n s ie n d o a m p lia m e n te a p lic a d a s a la in d u stria ,
ad m in istra c i n y ce n tro s d e in v e stig a c i n d e m b ito u n iv e rsita rio . P o r o tra p a rte , p o c o s c a m p o s de
in v e stig a c i n o e s tu d io h a n fra c a sa d o e n in te g ra r las t c n ic a s m u ltiv a ria n te s en s u c a ja d e h e r r a
m ie n ta s a n a ltic a . P a ra a te n d e r este c re c ie n te in te r s, se h a n p u b lic a d o n u m e ro s o s lib ro s y a rt
c u lo s so b re lo s a s p e c to s te ric o s y m a te m tic o s d e e s ta s h e rra m ie n ta s, y h a n a p a re c id o te x to s
in tro d u c to rio s e n ca si to d o s lo s c a m p o s. S in e m b a rg o , s e h a n e s c rito p o c o s lib ro s p a ra e) in v e s ti
g a d o r q u e n o es u n e sp e c ia lista e n m a te m tic a s o e s ta d s tic a . Y m e n o s a n q u e tra te n las a p lic a
c io n e s d e la e s ta d stic a m u ltiv a ria n te a s c o m o q u e s u m in istre n u n tra ta m ie n to c o n c e p tu a l d e los
m to d o s e s ta d stic o s. E ste lib ro se ha e s c rito p a ra c u b r ir e s te v aco.
L o s lib ro s o rie n ta d o s a la s a p lic a c io n e s s o n d e u n in te r s c ru c ia l p a ra lo s e s tu d io s o s del
c o m p o rta m ie n to , lo s d ire c tiv o s d e e m p re s a o lo s fu n c io n a rio s d e la a d m in is tra c i n p b lic a , sea
c u a l s e a su e n lo m o , q u e tie n e n q u e d e s a r ro lla r su s c o n o c im ie n to s d e l a n lis is m u ltiv a r ia n te p ara
c o n s e g u ir u n a m e jo r c o m p re n s i n d e lo s c o m p le jo s fe n m e n o s d e s u s m b ito s d e tra b a jo .
C u a lq u ie r in v e s tig a d o r q u e e x a m in a s lo re la c io n e s d e d o s v a r ia b le s y q u e e v ita ei a n lis is
m u ltiv a r ia n te e s t ig n o r a n d o p o d e r o s a s h e r r a m ie n ta s q u e p o d r a n s u m i n is tr a r in f o rm a c i n
p o te n c ia lm e n te til. C o m o a firm a u n in v e s tig a d o r, p a ra lo s p r o p s ito s d e... c u a lq u ie r... d is c ip li
n a a p lic a d a , la m a y o r p a rte d e n u e s tra s h e rra m ie n ta s so n , o d e b e r a n ser, m u ltiv a ria n te s . Lino
lle g a a u n a c o n c lu si n q u e a m e n o s.... q u e e l p r o b le m a se a tra ta d o c o m o u n p r o b le m a m u ltiv a ra n -
te , e s t tra ta d o s u p e rfic ia lm e n te . S e g n lo s e s ta d s tic o s H a rd y c k y P e trin o v ic b :

El anlisis de los m todos m ultivariantes predom inar en el futuro y dar por resultado cam bios
drsticos en el m odo en que los investigadores piensan sobre los problem as y en cm o disean sus
in v e stig a cio n e s. E sos m to d o s h a c e n p o s ib le p la n te a r p re g u n ta s e s p e c ific a s y p re c is a s de
considerable com plejidad en m arcos idneos, lo que p o sib ilita llev ar a cab o in v estig acio n es
tericam ente significativas y evaluar los efectos de las variaciones param ctricas ocurridas de forma
natural en el contexto en que norm alm en te ocu rren . De esta form a, se p ueden p rese rv a r las
correlaciones naturales entre las m ltiples influencias sobre el com portam iento y se pueden estudiar
estadsticam ente los efectos aislados de esas influencias sin provocar el tpico aislam iento de esos
individuos o variables.

P o r e je m p lo , en la m a y o r p a rte d e lo s m e rc a d o s a c tu a le s, lo s d ire c tiv o s n o p u e d e n fia rs e d e las


a n tig u a s a p ro x im a c io n e s d o n d e se c o n s id e ra b a n c o n s u m id o re s h o m o g n e o s y c a ra c te riz a d o s p o r
u n re d u c id o n m e ro de v a ria b le s d em o g r fica s. E n su lu g ar, d e b e n d e sa rro lla r estra te g ia s p a ra atraer
a n u m e ro s o s se g m e n to s de c lie n te s c o n d iv e rsa s c a ra c te rstic a s d e m o g r fic a s y p s ic o g r ftc a s en un
m e rc a d o co n m ltip le s re s tric c io n e s (le g a le s , e c o n m ic a s, c o m p e titiv a s, te c n o l g ic a s , e tc .). S lo
a tra v s d e la s t c n ic a s de a n lisis m u ltiv a ria n te se p u ed e n e x a m in a r a d e c u a d a m e n te la s re la c io n e s
m ltip le s d e este tip o p a ra lle g a r a u n a c o m p re n s i n d e la to m a d e d e c is io n e s m s c o m p le ta y
rea lista .
IN TRODUCCIN 3

E n to d o el te x to u sa m o s e l t rm in o in v e s tig a d o r c u a n d o n o s re fe rim o s a u n an a lista, tan to


e n la co m u n id ad em p resarial co m o ac ad m ic a. N o co n sid eram o s o p o rtu n o liacer u n a distincin entre
e s ta s d o s re as, p u e s to q u e la in v e stig a c i n en c u a lq u ie ra d e las d o s tie n e q u e d e p e n d e r d e b ases
te ric a s y c u a n tita tiv a s. A u n q u e lo s o b je tiv o s d e la in v e stig a c i n y e l n fa sis e n la in terp retaci n
p u e d e n v a ria r, u n in v e s tig a d o r tie n e q u e a b o r d a r to d o s lo s a s u n to s , ta n to c o n c e p tu a le s co m o
e m p ric o s, q u e s u rg e n en lo s d e b a te s d e lo s m to d o s e sta d stic o s.

G tQ Etirtfi

E s p o c o m e n o s q u e im p o s ib le d is c u tir la a p lic a c i n d e la s t c n ic a s m u itiv a ria n te s sin u n a m en ci n


a! im p a c to d e la in fo rm tic a . C o m o s e h a e x p u e sto an tes, el a m p lio d e s a rro llo d e la a p lic a c i n de
lo s c o m p u ta d o re s (p rim e ro e l c o m p u ta d o r y m s re c ie n te m e n te lo s c o m p u ta d o re s p e rso n a le s o los
m ic ro c o m p u ta d o re s ) p a ra p ro c e s a r g ra n d e s y c o m p le ja s b a s e s d e d a to s, h a e s tim u la d o d e m a n era
im p re s io n a n te e l u so d e lo s m to d o s d e e s ta d s tic a m u ltiv a ria n te . T o d a la e s ta d s tic a te ric a d e las
t c n ic a s m u itiv a ria n te s a c tu a le s fu e d e s a rro lla d a m u c h o a n te s d e la ap a ric i n d e lo s co m p u tad o res,
p e ro s lo c u a n d o e s tu v o d isp o n ib le el p o d e r d e la in fo rm tic a p a ra re a liz a r c lc u lo s c a d a v ez m s
c o m p le jo s lle g a c o n o c e rse la e x is te n c ia d e e s a s t c n ic a s fu e ra d el c rc u lo d e los esta d stic o s
te ric o s. L o s c o n tin u o s a v a n c e s te c n o l g ic o s en in fo rm tic a , p a rtic u la rm e n te en lo s c o m p u tad o res
p e rs o n a le s , h a n p u e s to a d isp o s ic i n d e c u a lq u ie r in v e s tig a d o r in te re sa d o e l a c c e so a to d o s los
r e c u rs o s n e c e s a rio s p a ra re s o lv e r u n p r o b le m a m u ltiv a ria n te d e c a s i c u a lq u ie r d im e n si n . D e
h e c h o , m u c h o s in v e stig a d o re s se lla m a n a s m is m o s a n a lis ta s d e d a to s e n lu g a r d e e sta d stic o s o
( e n le n g u a je lla n o ) a fic io n a d o s a lo c u a n tita tiv o . E s to s a n a lis ta s d e d a to s h a n c o n trib u id o
s u s ta n c ia lm e n te al a u m e n to del u so y a c e p ta c i n d e la e s ta d stic a m u ltiv a ria n te e n lo s n e g o c io s y
e n la a d m in istra c i n . E n la c o m u n id a d a c a d m ic a , d isc ip lin a s d e to d o s lo s c a m p o s d el s a b e r han
a d o p ta d o las t c n ic a s m u itiv a ria n te s , y lo s a c a d m ic o s d e b e n e s ta r c a d a v e z m s v e rsa d o s en las
t c n ic a s m u itiv a ria n te s a p ro p ia d a s p a r a s u s in v e stig a c io n e s e m p ric a s . In c lu s o p a ra p e rs o n a s con
s lid a p r e p a r a c i n c u a n tita tiv a , la d is p o n ib ilid a d d e p r o g ra m a s p r e p a r a d o s p a r a e l a n lis is
m u ltiv a ria n te h a fa c ilita d o la c o m p le ja m a n ip u la c i n d e m a tric e s d e d a to s q u e d u ra n te m u ch o
tie m p o h a re tra s a d o e l c re c im ie n to d e t c n ic a s m u itiv a ria n te s .
M u c h a s d e las p rin c ip a le s u n iv e rsid a d e s a m e ric a n a s e s t n p id ie n d o y a a lo s es tu d ia n te s com o
r e q u is ito d e e n tra d a c o m p ra r su s p ro p io s c o m p u ta d o re s in c lu so a n te s d e s u m a tric u la c i n . L o s es
tu d ia n te s y p ro fe so re s a n a liz a n ru tin a ria m e n te d ato s m u itiv a ria n te s p a ra re s p o n d e r a cu estio n es su r
g id a s e n d isc ip lin a s de la a n tro p o lo g a y la z o o lo g a . T o d o s lo s p ro g ra m a s c o m p le to s d e estad stica
d ise a d o s p a ra c o m p u tad o res (p o r e je m p lo , S P S S , S A S y B M D P ) a h o ra se en c u e n tra n tam b in para
c o m p u ta d o re s p e rso n a le s. L os p ro g ra m a s e s p e c ia liz a d o s p a ra to d o tip o d e a n lis is m u ltiv aria n te,
in c lu y e n d o lo s de esca la m u ltid im e n sio n a l, m o d e lo s d e ec u a c io n e s sim u lt n e a s/e stru c tu ra le s y an
lis is c o n ju n to , e n s u d a se o fre c ie ro n s lo p a ra c o m p u ta d o re s sie n d o h o y e n d a c o m p a tib le s con
lo s c o m p u ta d o re s p e rso n a le s . S e e s t n d e s a rro lla n d o sis te m a s e x p e rto s d irig id o s in c lu so a tem as
ta le s c o m o la se le c c i n d e u n a t c n ic a e s ta d s tic a [4] o d is e a r u n p la n d e m u e stre o q u e aseg u re
lo s o b je tiv o s p r c tic o s y e s ta d stic o s d e s e a d o s [3],
L o s p ro g ra m a s esta d stic o s y a n o se d e s a rro lla n p rim e ro en siste m a s d e c o m p u ta d o re s cen trales
p a ra d e s p u s tra sla d a rlo s a c o m p u ta d o re s p e rso n a le s o m ic ro c o m p u ta d o re s, sin o q u e se d esarro llan
d ire c ta m e n te p a ra c o m p u ta d o re s p e rso n a le s . Q u iz la c a te g o ra d e p ro g ra m a s d e e sta d stic a de
m a y o r d e s a rro llo se a n los p a q u e te s e s ta d stic o s d ise a d o s e s p e c fic a m e n te p a ra a p ro v e c h a rse de
la f le x ib ilid a d d e l c o m p u ta d o r p e rs o n a l. L a s t c n ic a s m u itiv a ria n te s e s t n ta n e x te n d id a s q u e
to d a s la s t cn ic as ilu stra d a s e n este te x to p u e d e n se r estim a d as c o n p a q u e te s e s ta d stic o s fcilm en te
a c c e s ib le s ta n to p a ra u n co m p u ta d o r, u n m ic ro c o m p u ta d o r o u n c o m p u ta d o r p e rso n a l. L a lista
c o m p le ta d e lo s p ro g ra m a s p rin c ip a le s d is p o n ib le s d e so ftw a re p a ra e l a n lis is m u ltiv a ria n te se
p u e d e e n c o n tra r en el A p n d ic e A . E s n e c e s a rio p re s ta r u n a a te n c i n e sp e c ia l a lo s p ro g ra m as p ara
e l c o m p u ta d o r p e rso n a l.
4 A N L IS IS M ULTIVAR1ANTE

El a n lis is m u ltiv a ria n te n o e s f c il d e d e fin ir. E n u n se n tid o a m p lio , s e re fie re a ro d o s lo s m to d o s


e s ta d s tic o s q u e a n a liz a n sim u lt n e a m e n te m e d id a s m ltip le s d e c a d a in d iv id u o u o b je to so m e tid o
a in v e s tig a c i n . C u a lq u ie r a n lisis sim u lt n e o d e m s d e d o s v a ria b le s p u e d e s e r c o n s id e ra d o ap ro
x im a d a m e n te c o m o u n a n lisis m u ltiv a ria n te . E n s e n tid o e s tric to , m u c h a s t c n ic a s m u ltiv a ria n te s
s o n e x te n s io n e s de) a n lis is u n iv a ria n te (a n lis is d e d istrib u c io n e s d e u n a s o la v a ria b le ) y d e l a n
lis is b iv a ria n te (c la sific a c io n e s c ru z a d a s , c o rre la c i n , a n lis is d e la v a ria n z a y re g re s io n e s sim p le s
u tiliz a d a s p a ra an a liz ar d o s v ariab les). P o r eje m p lo , u n a reg resi n sim p le (co n u n a v a ria b le p red icto r)
s e e x tie n d e a l c a s o m u ltiv a ria n te p a ra in c lu ir v a ria s v a ria b le s p re d ic to r. D e la m is m a f o n u a , la v a
ria b le d e p e n d ie n te q u e se e n c u e n tra en e l a n lis is d e la v a ria n z a s e e x tie n d e p a r a in c lu ir m ltip le s
v a ria b le s d e p e n d ie n te s en el a n lis is m u ltiv a ria n te d e la v a ria n z a . C o m o v e re m o s m s a d e la n te , en
m u c h a s o c a sio n e s las tcn icas m u ltiv a ria n te s so rv u n m e d io d e re p rese n tar e n u n an lisis sim p le a q u e
llo q u e re q u iri v a rio s a n lisis u tiliz a n d o t c n ic a s u n iv a ria n te s. O tra s t c n ic a s m u ltiv a ria n te s , sin
e m b a rg o , e s t n d ise a d a s e x c lu siv a m e n te p a ra tra ta r c o n p ro b le m a s m u ltiv a ria n te s , ta le s c o m o el
a n lis is fa c to ria l q u e sirv e p a ra id e n tific a r la e s tru c tu r a s u b y a c e n te d e u n c o n ju n to d e v a ria b le s o el
a n lis is d is c rim in a n te q u e sirv e p a ra d ife r e n c ia r e n tre g ru p o s b a s a d o s en u n c o n ju n to d e v a ria b le s .
U n a d e las ra z o n e s d e la d ific u lta d d e d e f in ir e l a n lis is m u ltiv a ria n te e s q u e e l t rm in o m u l
tiv a ria n te n o se u s a d e la m is m a fo rm a e n la lite ra tu ra . P a ra a lg u n o s in v e s tig a d o re s , m u ltiv a ria n -
te s ig n ific a sim p le m e n te ex a m in a r re la c io n e s e n tre m s d e d o s v ariab les. O tro s u sa n el te rm in o s lo
p a ra p ro b le m a s e n lo s q u e se su p o n e q u e to d a s la s v a ria b le s m ltip le s tie n e n u n a d is trib u c i n n o r
m a l m u ltiv a ria n te . S in em b a rg o , p a ra se r c o n s id e ra d o v e rd a d e ra m e n te m u ltiv a ria n te , to d a s la s v a
ria b le s d e b e n se r a le a to ria s y estar, in te rre la c io n a d a s d e ta! fo rm a q u e s u s d ife r e n te s e fe c to s no
p u e d a n s e r in te rp re ta d o s s e p a ra d a m e n te c o n a lg n s e n tid o . A lg u n o s a u to re s a firm a n q u e e l pro
p s ito d e l a n lis is m u ltiv a ria n te e s m e d ir, e x p lic a r y p re d e c ir el g ra d o d e r e la c i n d e lo s va lo res
te ric o s (c o m b in a c io n e s p o n d e ra d a s d e v a ria b le s ). P o r ta n to , e l c a r c te r m u ltiv a ria n te re s id e en los
m ltip le s valores te ric o s (c o m b in a c io n e s m ltip le s d e v a ria b le s ) y n o s lo e n el n m e ro d e v a
ria b le s u o b se rv a c io n e s. A e fe c to s d e e s te lib ro , n o in sis tire m o s e n u n a d e fin ic i n r g id a de) a n
lisis m u ltiv a ria n te . E n lu g a r de esto , el a n lis is m u lt iv a r ia n te in c lu ir ta n to t c n ic a s m u ltiv a ria b le s
c o m o t c n ic a s m u ltiv a ria n te s , d e b id o a q u e lo s a u to re s c re e n q u e el c o n o c im ie n to d e las t c n ic a s
m u ltiv a ria b le s es u n p rim e r p a s o e se n c ia l e n la c o m p re n s i n d e l a n lis is m u ltiv a ria n te .

Algunos coriceptosfo
A u n q u e el a n lis is m u ltiv a ria n te tie n e s u s r a c e s e n la e s ta d s tic a u n iv a ria n te y b iv a ria n te , la e x
te n s i n a l d o m in io m u ltiv a ria n te in tro d u c e c o n c e p to s y c u e stio n e s ad icio n a le s. E sto s c o n c e p to s van
d e s d e la n e c e s id a d d e u n e n te n d im ie n to c o n c e p tu a l d e l e le m e n to b s ic o d e l a n lis is m u ltiv a ria n
te e l v a lo r te ric o a la s c u e s tio n e s e s p e c ific a s a c e rc a d e lo s tip o s d e e s c a la s d e m e d id a u tili
z a d a s y lo s re su lta d o s e s ta d stic o s d e lo s te s t d e sig n ific a c i n y lo s in te rv a lo s d e c o n fia n z a . C ada
c o n c e p to ju e g a u n p a p e l im p o rta n te e n la c o rre c ta a p lic a c i n d e c u a lq u ie r t c n ic a m u ltiv a ria n te

E vaor terico
C o m o y a se h a m e n c io n a d o , el e le m e n to e s e n c ia l d e l a n lisis m u ltiv a ria n te es el v a l o r te r ic o , un.
c o m b in a c i n lin e a l d e v a ria b le s c o n p o n d e ra c io n e s d e te rm in a d a s e m p ric a m e n te . E l in v e stig a d o
e s p e c ific a las v a ria b le s , m ie n tras q u e las p o n d e ra c io n e s so n o b je to e s p e c fic o d e d e te rm in a c i n po
p a r te d e la t c n ic a m u ltiv a ria n te . U n v a lo r te ric o d e n v a ria b le s p o n d e ra d a s (A", a X ) pu ed i
e x p r e s a r s e m a te m tic a m e n te asi:

V a lo r le rc o = w tX + w 7X 2 + w 2X 2 + ... + w l
IN TRO D U C CI N 5

d o n d e X e s la v a ria b le o b s e rv a d a y w n e s la p o n d e ra c i n d e te rm in a d a p o r la t c n ic a m u ltiv a
ria n te .
E l re su lta d o es u n v a lo r n ic o q u e re p re se n ta u n a c o m b in a c i n d e to d o e l c o n ju n to d e v ariab les
q u e m e jo r se a d a p ta n a l o b je to d e l a n lis is m u ltiv a ria n te e sp e c fic o . E n re g re s io n e s m ltip le s, el
v a lo r te ric o s e d e te rm in a de ta l fo rm a q u e g u a rd e la m e jo r c o rre la c i n c o n la v a ria b le q u e se est
p re d ic ie n d o . E n e l a n lis is d isc rim in a n te , e l v a lo r te ric o s e fo rm a d e ta l m a n e ra q u e p ro d u zc a
re s u lta d o s p a ra c a d a o b se rv a c i n q u e d ife re n c ie n d e fo rm a m x im a e n tre g ru p o s d e o b se rv a cio n e s.
Y e n el a n lis is fa c to ria l, lo s v a lo re s te ric o s s e fo rm a n p a ra re p re s e n ta r m e jo r la s e stru c tu ra s
s u b y a c e n te s o la d im e n sio n a lid a d d e las v a ria b le s ta l y c o m o se re p re s e n ta n e n s u s in te rco rre -
la c io n e s.
E n c a d a c a so , el v a lo r te ric o c a p ta e l c a r c te r m u ltiv a ria n te d e l a n lis is. P o r ta n to , e n n u e s
tra s d is c u s io n e s d e c a d a t c n ic a , e l v a lo r te ric o es e l p u n to c e n tra l de! a n lis is p o r v a ria s razo n es.
D e b e m o s en te n d e r n o s lo su im p a cto c o n ju n to p a ra lo g ra r c u m p lir el o b je tiv o d e c a d a t cn ic a, sino
ta m b i n la c o n trib u c i n d e c a d a v a ria b le s e p a ra d a a l e fe c to d e l v a lo r te ric o e n su co n ju n to .

Escalas de m edida
El a n lis is d e lo s d a to s im p lic a la s e p a ra c i n , id e n tific a c i n y m e d id a d e la v a r ia c i n e n un
c o n ju n to d e v a ria b le s , ta n to e n tre e lla s m is m a s c o m o e n tre u n a v a ria b le d e p e n d ie n te y u n a o m s
v a ria b le s in d e p e n d ie n te s. E l t rm in c la v e a q u i e s m e d id a , d a d o q u e e l in v e s tig a d o r n o p u ed e
s e p a r a r o id e n tific a r u n a v a ria c i n a m e n o s q u e p u e d a s e r m e su ra b le . L a m e d id a es im p o rta n te p ara
r e p re s e n ta r c o n p re c isi n el c o n c e p to d e n u e s tro in te r s y es c ru c ia l e n la s e le c c i n d e l m to d o de
a n lis is m u ltiv a ria n te ap ro p ia d o . E n lo s sig u ie n te s p rra fo s v a m o s a d is c u tir e l c o n c e p to d e m ed id a
e n lo q u e s e r e f ie r e a l a n lis is d e d a to s y p a r ti c u la r m e n te a la s d iv e r s a s t c n ic a s m u lti-
v a ria n te s.
E x iste n d o s tip o s b s ic o s de d ato s: n o m tr ic o s (c u a lita tiv o s ) y m tr ic o s (c u a n tita tiv o s). L o s
d ato s n o m trico s so n atributos, ca ra c te rstic a s o p ro p ie d a d e s ca te g ric as q u e id e n tific a n o describen
a u n su je to . D e sc rib e n d ife re n c ia s en tip o o c la s e in d ic a n d o la p re s e n c ia o a u s e n c ia d e u n a ca ra c
te rs tic a o p ro p ie d a d . M u c h a s p ro p ie d a d e s s o n d isc re ta s p o rq u e tie n e n u n a c a ra c te rs tic a p ec u lia r
q u e e x c lu y e to d a s las d e m s c a ra c te rstic a s . P o r e je m p lo , si u n o es h o m b re , n o p u e d e s e r m ujer.
N o h a y c a n tid a d d e g n e ro , s lo la c o n d ic i n d e s e r h o m b re o m u jer. P o r e l c o n tra rio , la s m e
d id a s d e d a to s m tric o s e st n c o n s titu id a s d e ta! fo rm a q u e lo s s u je to s p u e d e n s e r id e n tific a d o s p o r
d ife re n c ia s e n tre g ra d o o c a n tid a d . L as v a ria b le s m e d id a s m tric a m e n te re fle ja n c a n tid a d e s re la
tiv a s o g ra d o . L a s m e d id a s m tric a s so n las m s a p ro p ia d a s p a ra c a s o s q u e in v o lu c ra n c a n tid a d o
m a g n itu d , ta le s c o m o el n iv el de s a tis fa c c i n o la d e m a n d a d e trab a jo .

Escalas de medida no mtricas


L a s m e d id a s n o m tric a s p u e d e n te n f e s c a la s n o m in a le s u o rd in a le s. L a m e d id a c o n u n a escala
n o m in a l a s ig n a n m e ro s q u e s e u sa n p a ra e tiq u e ta r o id e n tific a r s u je to s u o b je to s. L a s esc a la s no
m in a le s , ta m b i n c o n o c id a s c o m o e s c a la s d e c a te g o ra , p ro p o rc io n a n e l n m e ro d e o c u rre n c ia s en
c a d a c la s e o c a te g o ra d e la v a ria b le q u e se e s t e stu d ia n d o . P o r ta n to , lo s n m e ro s o sm b o lo s asig
n a d o s a lo s o b je to s n o tie n e n m s s ig n ific a d o c u a n tita tiv o q u e in d ic a r la p re s e n c ia o a u s e n c ia d el
a trib u to o c a ra c te rstic a b a jo in v e stig a c i n . L o s e je m p lo s d e d a to s c o n e s c a la n o m in a l in c lu y en el
se x o , la re lig i n o e l p a rtid o p o ltic o d e u n a p e rs o n a . P a ra tra b a ja r c o n e sto s d a to s, e l a n a lis ta p u e
d e a s ig n a r n m e ro s a c a d a c a te g o ra , p o r e je m p lo , 2 p a ra m u je re s y 1 p a ra h o m b re s . E sto s n m e
ro s s lo re p re s e n ta n c a te g o ra s o c la se s y n o im p lic a n c a n tid a d e s d e u n a trib u to o ca ra c te rstic a .
L a s esca las o rd in ales rep resen tan u n n iv e l S u p erio r d e p rec isi n d e la m e d id a . L a s v a ria b le s p u e
d e n s e r o rd e n a d a s o c la sific a d a s c o n e s c a fa s o rd in a le s e n re la c i n a la c a n tid a d d e l a trib u to p o s e
d o . C a d a su b c la se p u e d e se r c o m p a ra d a c o n o tra e n t rm in o s d e u n a re la c i n d e m a y o r q u e o
m e n o r q u e . P o r e je m p lo , lo s d ife re n te s n iv e le s d e s a tis fa c c i n d el c o n s u m id o r in d iv id u a l co n d i
fe re n te s p ro d u cto s n u e v o s p u ed e ilu stra rse e n -u n a e s c a la o rd in al. L a sig u ie n te e sc a la m u e stra la idea
6 A N L IS IS m u l t i v a r i a n t e

q u e tie n e u n e n c u e s ta d o a c e rc a d e tre s p ro d u c to s. E l e n c u e s ta d o e s t m s sa tisfe c h o c o n A q u e co n


B y m s sa tisfe c h o c o n B q u e c o n C.

Producto A P ro d u c to B Producto C

M uy No .satisfecho
satisfecho en absoluto

L o s n m e ro s u tiliz a d o s e n e s c a la s o rd in a le s c o m o s ta s n o so n c u a n tita tiv o s, d a d o q u e in d ic an


s lo p o s ic io n e s re la tiv a s e n se rie s o rd e n a d a s . N o h a y m e d id a d e c u n ta s a tis fa c c i n re c ib e e l c o n
s u m id o r e n t rm in o s a b s o lu to s, el in v e s tig a d o r n i c o n o c e la d ife re n c ia e x a c ta e n tre p u n to s d e la es
c a la d e sa tis fa c c i n . M u c h a s e s c a la s d e la s c ie n c ia s d e l c o m p o rta m ie n to c a e n d e n tro d e e sta
c a te g o ra o rd in al.

Escalas de medida mtrica


L a s e s c a la s d e in te rv a lo s y de ra z n (a m b a s m tric a s ) p ro p o rc io n a n el n iv e l m s a lto d e m e d id a
d e p re c is i n , p e rm itie n d o r e a liz a r c a s i to d a s la s o p e ra c io n e s m a te m tic a s . E s ta s d o s e s c a la s tie n e n
u n id a d e s co n sta n te s d e m e d id a, d e ta l fo rm a q u e la s d ife re n c ia s e n tre d o s p u n to s ad y a c e n te s d e c u a l
q u ie r p a n e d e la e sc a la so n ig u a le s. L a n ic a d ife re n c ia re a l e n tre la s e s c a la s d e in te rv a lo y las de
r a z n es q u e las de in te rv a lo tie n e n u n p u n to c e ro a rb itra rio , m ie n tra s q u e la s e s c a la s d e ra z n tie
n en u n p u n to de cero ab so lu to . L a s esc a la s d e in te rv alo m s fam iliares so n las esca las d e te m p eratu ra
C e ls iu s y F a h re n h e it. A m b a s tie n e n u n p u n to d e c e ro a rb itra rio , p e ro e se c e ro n o in d ic a u n a c a n
tid a d c e ro o a u se n c ia de te m p e ra tu ra , d a d o q u e p o d e m o s re g istra r te m p e ra tu ra s p o r d e b a jo d e l p u n
to c e ro d e e sa e sc a la . P o r ta n to , n o es p o s ib le d e c ir q u e u n v a lo r c u a lq u ie ra s itu a d o e n u n in te rv alo
d e la e sc a la e s u n m ltip lo d e c u a lq u ie r o tro p u n to d e la e sc a la . P o r e je m p lo , si u n d a se re g istra n
80F. n o se p u e d e d e c ir q u e sea d o s v e c e s m s c a lu ro s o q u e u n o d e 4QF p o rq u e s a b e m o s q u e 80F.
e n u n a e s c a la d ife re n te c o m o C e ls iu s , e q u iv a le n a 2 6 ,7 "C . D e la m is m a fo rm a . 4 0 F e n C e ls iu s co
rre sp o n d e n a 4,4 C . A u n q u e 80F so n , d e s d e lu e g o , d o s v e c e s 40F, no se p u ed o a firm a r q u e el c a
lo r d e 80nF se a d o s v e c e s el c a lo r de 4 0 F p o rq u e u s a n d o d ife re n te s esca las, el c a lo r n o es d o s \ eces
m a yo r; e s to es, 4,4F X 2 ^ 2 6 ,7 UC.
L a s e s c a la s d e ra z n re p re s e n ta n la fo rm a s u p e rio r d e m e d id a d e p re c is i n , d a d o q u e p o se e n
la s v e n ta ja s d e to d a s las e s c a la s in fe rio re s m s u n p u n to d e c e ro a b s o lu to . C o n la s m e d id a s d e e s
ca la d e ra z n se p e rm ite n to d a s las o p e ra c io n e s m a te m tic a s. E l p eso q u e te n e m o s e n el b a o u otras
m q u in a s d e p e s o c o m u n e s u tiliz a n e s ta s e s c a la s , d a d o q u e tie n e n u n p u n to d e c e ro a b s o lu to y que
p u e d e n s e r e x p re sa d o s e n t rm in o s d e m ltip lo s c u a n d o s e re la c io n a un p u n to c o n o tro d e la e s
c a la ; p o r e je m p lo , 100 k ilo s es d o s v e c e s m s p e s a d o q u e 50 k ilo s.
E s im p o rta n te e n te n d e r lo s d ife re n te s tip o s d e e s c a la s d e m e d id a p o r d o s ra z o n e s. E n p rim e r
lu g a r, e l in v e s tig a d o r d e b e id e n tific a r la e s c a la d e m e d id a d e c a d a v a ria b le e m p le a d a , d e ta l fo rm a
q u e n o se e s t n u tiliz a n d o d a to s n o m tric o s c o m o si fu e ra n m tric o s . E n s e g u n d o lu g a r, la e sc a la
d e m e d id a e s c ru c ia l p a ra d e te rm in a r q u t c n ic a m u ltiv a ria n te es la m s c o n v e n ie n te p a ra lo s d a
to s, c o n s id e ra c i n h e c h a ta n to p a ra las v a r ia b le s d e p e n d ie n te s c o m o las in d e p e n d ie n te s. E n la d is
c u s i n d e las t c n ic a s y su c la s ific a c i n , q u e h a re m o s e n p o ste rio re s se c c io n e s d e e s te c a p itu lo , las
p r o p ie d a d e s m tric a s o n o m tric a s d e la s v a r ia b le s d e p e n d ie n te s o in d e p e n d ie n te s s o n lo s fa c to
re s d e te rm in a n te s e n la se le c c i n d e la t c n ic a a p ro p ia d a .

Error de m edida y m edidas m ultivariantes


E l u so d e m ltip le s v a ria b le s as c o m o la d e p e n d e n c ia d e su c o m b in a c i n (e l v a lo r te ric o ) en las
t c n ic a s m u ltiv a ria n te s ta m b i n d irig e s u a te n c i n a u n te m a c o m p le m e n ta rio , el e rro r d e m e d id a.
IN T R O D U C C I N 7

E l e r r o r d e m e d id a es el g ra d o e n q u e lo s v a lo re s o b se rv a d o s n o so n re p re s e n ta tiv o s d e los
v alo re s v erd ad ero s . E l e rro r de m e d id a tie n e m ltip le s fuentes, q u e v an d e sd e e rro re s e n la entrada
d e d a to s a la im p re c isi n en la m e d ic i n ( p o r e je m p lo , im p o n ie n d o e s c a la s d e p u n tu a c i n d e siete
p u n to s a la a c titu d m e d id a c u a n d o el in v e s tig a d o r sa b e q u e lo s e n c u e s ta d o s s lo p u e d e n resp o n d e r
c o n p re c isi n a u n a p u n tu a c i n d e tre s p u n to s ) p a s a n d o p o r la in c a p a c id a d d e lo s e n c u e s ta d o s a
p ro p o rc io n a r in fo rm a c i n p re c is a ( p o r e je m p lo , la s re sp u e s ta s a la re n ta d e u n a e c o n o m a fam iliar
p u e d e n s e r ra z o n a b le m e n te p re c is a s p e ro ra ra v e z lo so n c o m p le ta m e n te ). P o r ta n to , se d eb e
a s u m ir q u e to d a s la s v a ria b le u s a d a s e n la s t c n ic a s m u ltiv a ria n te s tie n e n a lg n g ra d o d e e rro r d e
m e d id a . E l im p a cto d e l e rro r d e m e d id a es a a d ir m id o a las v a ria b le s m e d id a s u o b se rv a d as.
P o r ta n to , el v a lo r o b se rv a d o o b te n id o re p re se n ta tan to e l nivel v erd a d ero c o m o el m id o . C u a n
d o se c a lc u la n c o rre la c io n e s o m e d ia s , n o rm a lm e n te el e fe c to v e rd a d e ro e s t p a rc ia lm e n te
c a m u fla d o p o r el e rro r d e m e d id a , c a u s a n d o la d e b ilid a d d e las c o rre la c io n e s y la p rd id a d e
p re c isi n d e las m e d ias. E l im p a cto e s p e c fic o del e rro r d e m e d id a e n la s re la c io n e s d e d ep e n d en c ia
se tr a ta c o n m s d e ta lle e n el C a p tu lo 11.
El o b je tiv o del in v e s tig a d o r d e r e d u c ir el e rro r d e m e d id a p u e d e s e g u ir v a rio s c a m in o s. Al
v a lo ra r e l g rad o d e erro r d e m e d id a p re s e n te e n c u a lq u ie r m e d ici n , el a n a lista d eb e e n fren ta rse tan
to c o n la v a lid e z c o m o c o n la f ia b i lid a d d e la m e d id a . L a v a lid e z e s el g ra d o e n q u e la m e d id a
re p re se n ta co n p re c isi n lo q u e s e su p o n e q u e re p re se n ta . P o r e je m p lo , si q u e re m o s m e d ir ia ren
ta d isc re c io n a l, n o p re g u n ta re m o s p o r ia re n ta to ta l d e las e c o n o m a s d o m stic a s. A se g u ra r la
v a lid e z e m p ie z a c o n u n c o n o c im ie n to p r o fu n d o d e lo q u e se v a a m e d ir y s lo e n to n c e s re a liz a r la
m e d id a ta n c o rre c ta y p re c is a c o m o s e a p o sib le . S in em b a rg o , la p re c isi n n o a s e g u ra la v a li
d e z . E n n u e s tro e je m p lo d e la ren ta , e l in v e s tig a d o r p o d ra d e fin ir m u y p re c isa m e n te e l to tal d e la
re n ta fa m ilia r p e ro n o tie n e u n a m e d id a v lid a d e la re n ta d isc re c io n a l p o rq u e n o s e h a p la n tea d o
la p re g u n ta c o rre c ta .
S i la v a lid e z e s t a se g u ra d a , e l in v e s tig a d o r d e b e c o n s id e ra r la fia b ilid a d d e las m e d id as. La
fia b ilid a d es el g ra d o e n q u e la v a ria b le o b se rv a d a m id e e l v a lo r v erd a d ero y e s t lib re d e error;
p o r ta n to es lo o p u esto al e rro r d e m e d id a . S i la m is m a m e d id a se rea liza re p e tid a s v e c e s , p o r ejem
p lo , la s m e d id a s m s fia b le s m o stra r n u n a m a y o r c o n s iste n c ia q u e la s m e d id a s m e n o s fiab les. El
in v e s tig a d o r d e b e r v a lo ra r sie m p re las v a ria b le s q u e e st n sie n d o u sa d a s y si s e p u e d e n e n c o n
tra r m e d id a s a lte rn a tiv a s v lid a s , e le g ir la v a ria b le c o n la m a y o r fiab ilid ad .
E ! in v e s tig a d o r p u e d e ta m b i n o p ta r p o r d e s a rro lla r m e d ic io n e s m u lt iv a r ia n te s , ta m b i n c o
n o c id a s co m o e s c a la s s u m a d a s , d o n d e d iv e rs a s v a ria b le s se u n en en u n a m e d id a c o m p u e s ta p ara
re p rese n tar un co n c ep to (p o r eje m p lo , u n a e sc a la d e p e rso n a lid a d d e e n tra d a m ltip le o p u n tu a cio n e s
su m a d a s d e u n p ro d u cto ). El o b je tiv o es e v ita r u sa r s lo u n a n ic a v aria b le p a ra re p re se n ta r un c o n
c e p to , y e n su lu g a r u tiliz a r v a ria s v a ria b le s c o m o in d ic a d o r e s , re p re se n ta n d o to d o s ello s d iferen tes
fa c e ta s del c o n c e p to p a ra o b te n e r u n a p e r s p e c tiv a m s c o m p le ta . E l uso d e in d ic a d o re s m ltip le s
p e rm ite al in v e stig a d o r lle g a r a u n a e s p e c ific a c i n m s p re c is a d e las re sp u e sta s d e s e a d a s y no d eja
la fia b ilid a d p le n a a u n a n ic a re s p u e s ta s in o e n la re s p u e sta m e d ia o tp ic a d e u n co n ju n to
d e re sp u e sta s re la c io n a d a s . P o r e je m p lo , a l m e d ir la s a tisfa c c i n , u n o p o d ra p re g u n ta r u n a n ic a
c u e s ti n , c u l es s u g ra d o d e s a tis fa c c i n ? , y b a s a r el a n lis is e n u n a n ic a re sp u e sta . O se p o
d ra d e s a rro lla r u n a e s c a la a d itiv a q u e c o m b in a ra v a ria s re sp u e sta s d e sa tisfa c c i n , q u iz e n d ife
re n te s fo rm a to s de re sp u e sta y e n d ife re n te s re a s d e in te r s, q u e c o n te m p le la sa tisfa c c i n total.
L a p re m is a b s ic a es q u e la s re sp u e sta s m ltip le s re fle ja n c o n m a y o r p re c isi n la re s p u e sta v er
d a d e ra q u e la re sp u e sta n ic a . P a ra u n a in tro d u c c i n m s d e ta lla d a d e lo s m o d e lo s d e m e d id as
m ltip le s y c o n s tru c c i n d e e s c a la s, v a s e el C a p tu lo 3 (A n lisis fa c to ria l) y e l C a p itu lo 11 (M o
d e la c i n m e d ia n te e c u a c io n e s e s tru c tu ra le s ) o re c u rso s a d ic io n a le s [10], A d e m s, se h a n p u b lic a
d o e n lo s ltim o s a o s c o m p ila c io n e s d e e s c a la s q u e p ro p o rc io n a n al in v e s tig a d o r u n a esca la
lis ta p a ra s e r e m p le a d a c o n u n a f ia b ilid a d d e m o s tra d a [ l , 5].
E l im p a c to del e rro r d e m e d id a y la e s c a s a fia b ilid a d n o p u e d e n s e r o b s e rv a d a s d ire c ta m e n te ,
d a d o q u e se e n c u e n tra n e n las v a ria b le s o b se rv a d a s. E l in v e stig a d o r d e b e , p o r ta n to , tra b a ja r sie m
p re p a r a a u m e n ta r la v a lid e z y la fia b ilid a d , lo q u e a l fin a l lle v a r a u n re tra to m s a u t n tic o d e
las v a ria b le s d e in te rs. L o s m a lo s re s u lta d o s n o sie m p re se d e b e n al e rro r d e m e d id a , p e ro la p re
se n c ia d e l e rro r de m e d id a es g a ra n ta de d is to rs i n e n las re la c io n e s o b se rv a d a s y h a c e m e n o s p o
d e ro sa s las t c n ic a s m u ltiv a ria n te s . R e d u c ir e l e rro r d e m e d id a , a u n q u e im p liq u e e s fu e rz o , tie m p o
8 A N L IS IS M U L TIV A R IA N TE

y re c u rso s a d ic io n a le s, p u e d e m e jo ra r re s u lta d o s d b ile s o m a rg in a le s, asi c o m o f o rta le c e r re s u l


ta d o s p ro b a d o s.

Significacin estadstica frente a potencia estadstica


T odas las t cn ic as m u ltiv aria n tes, ex c ep to el a n lisis c lu ste r y el a n lisis m u ltid im c n sio n a l, se b asan
en la in fe re n c ia e s ta d s tic a d e lo s v a lo re s d e u n a p o b la c i n o la re la c i n e n tre v a ria b le s d e u n a
m u e s tra e s c o g id a a le a to ria m e n te d e esa p o b la c i n . Si e sta m o s re a liz a n d o u n c e n s o d e to d a la
p o b la ci n , en to n c e s la in fe re n c ia e sta d stic a n o es n e c e s a ria , p o iq u e c u a lq u ie r d ife re n c ia o re la c i n ,
p o r p e q u e a q u e se a , es v e rd a d y e x iste . P e r o ra ra v e z , ca si n u n c a , se re a liz a un c e n so ; p o r ta n to ,
el in v e stig a d o r e s t o b lig a d o a d e d u c ir in fe re n c ia s d e u n a m u e stra.
P a ra in te rp re ta r la s in fe re n c ia s e s ta d s tic a s , e l in v e s tig a d o r d e b e e s p e c ific a r lo s n iv e le s a c e p
ta b le s d e e rro r e sta d stic o . E l m o d o d e a p ro x im a c i n m s c o m n es d e te rm in a r e l n iv e l d e e r r o r
d e T ip o I , ta m b i n c o n o c id o c o m o a lf a ( a ). E l e r r o r d e T ip o I es la p ro b a b ilid a d d e re c h a z a r la h i
p te sis n u la c u a n d o e s cie rta , o e x p re sa d o en t rm in o s m s se n c illo s, la p o s ib ilid a d d e q u e la p r u e
b a m u e s tre sig n ific a c i n e s ta d stic a c u a n d o e n re a lid a d n o e st p re s e n te (e l c a s o d e u n p o sitiv o
fa lso ). E sp e c ific a n d o u n n iv e l a lfa , e l in v e s tig a d o r fija lo s m rg e n e s a d m is ib le s d e e r r o r e s p e c i
fic a n d o la p ro b a b ilid a d d e c o n c lu ir q u e la sig n ific a c i n e x iste c u a n d o en re a lid a d n o e x iste .
Al e s p e c ific a r el n iv e l d e e rro r de T ip o I, el in v e s tig a d o r ta m b i n d e te rm in a u n e r r o r a s o c ia d o ,
d e n o m in a d o el e r r o r d e T ip o II o b e t a (/). E l e rro r d e T ip o II es la p ro b a b ilid a d d e f a lla r en re
c h a z a r la h ip te s is n u la c u a n d o e s re a lm e n te fa lsa . U n a p ro b a b ilid a d m s in te r e s a n te e s 1 - //, d e
n o m in a d o la p o te n c ia del te s t de in fe re n c ia e s ta d s tic a . P o te n c ia e s la p r o b a b ilid a d d e re c h a z a r
c o rre c ta m e n te la h ip te s is n u la c u a n d o d e b e s e r re c h a z a d a . P o r ta n to , la p o te n c ia e s la p r o b a b ili
d a d d e q u e la in fe re n c ia e s ta d stic a se in d iq u e c u a n d o est p re se n te . L a re la c i n d e la s d ife re n te s
p ro b a b ilid a d e s de e rro r se m u e s tra a c o n tin u a c i n en el h ip o t tic o p la n te a m ie n to d e la e v a lu a c i n
d e la d ife re n c ia e n tre d o s m e d ia s:

R e a lid a d
H: C ierta i! : Falsa

H: A ceplar 1- s
P
E rror T ipo II
D e cisi n
e sta d stic a
Ha: N o aceplar
2 1-P
E rror T ipo I Potencia

A u n q u e la e s p e c ific a c i n a lfa e s ta b le c e el n iv e l d e sig n ific a c i n e s ta d s tic a a c e p ta b le , es el n i


vel d e p o te n c ia el q u e d ic ta la p r o b a b ilid a d d e x ito e n la b s q u e d a d e la s d ife re n c ia s si es q u e
re a lm e n te ex iste n . E n to n c e s, p o r q u n o se p la n te a n n iv e le s a c e p ta b le s ta n to d e a lfa c o m o d e b eta?
P o rq u e lo s erro re s d e T ip o I y T ip o 11 e st n in v e rs a m e n te re la c io n a d o s , y a m e d id a q u e e l e rro r d e
T ip o 1 se h a c e m s re s tric tiv o (se a c e rc a a c e ro ), el e rro r d e T ip o II a u m e n ta . A l d is m in u ir el e rro r
d e T ipo I ta m b i n se re d u c e el p o d e r d e la p ru e b a e s ta d s tic a . P o r ta n to , e l a n a lis ta tie n e q u e c o n
s e g u ir u n e q u ilib rio e n tre el n iv e l d e a lfa y la p o te n c ia re su lta n te .
L a p o te n c ia no e s s lo u n a fu n c i n de alfa . R e a lm e n te e s t d e te rm in a d a p o r tr e s fa c to re s:

1. E fe c to ta m a o L a p r o b a b ilid a d d e c o n s e g u ir s ig n ific a c i n e s ta d s tic a s e b a s a n o s lo


e n c o n s id e ra c io n e s e s ta d s tic a s s in o ta m b i n e n la m a g n itu d re a l d e l e f e c to q u e n o s in
te re sa ( p o r e je m p lo , u n a d if e r e n c ia d e m e d ia s e n tre d o s g ru p o s o Ja c o r r e la c i n e n tr e v a
ria b le s ) en la p o b la c i n , d e n o m in a d o e f e c to ta m a o . C o m o c a b ria e s p e ra r, u n e fe c to
g ra n d e es m s p r o b a b le d e e n c o n tr a r q u e u n e fe c to p e q u e o y p o r ta n to , a fe c ta a la p o
te n c ia d e la p ru e b a e s ta d s tic a . P a ra e v a lu a r la p o te n c ia d e c u a lq u ie r p r u e b a e s ta d s tic a ,
e l in v e s tig a d o r d e b e e n te n d e r p rim e ro el e f e c to e x a m in a d o . L o s e fe c to s d e ta m a o se m i
d e n e n t rm in o s e s ta n d a riz a d o s p a ra fa c ilita r la c o m p a ra c i n . L a s d ife re n c ia s re s p e c to d e
IN T RO DU CCIN 9

la m e d ia s e d e te rm in a n e n t rm in o s d e d e s v ia c io n e s e s t n d a r, a s q u e u n e fe c to ta m a o
d e 0 ,5 in d ic a q u e !a d if e r e n c ia re s p e c to d e la m e d ia es la m ita d d e la d e s v ia c i n e s t n
d ar. P a r a la s c o r r e la c io n e s , e l e f e c to ta m a o s e b a s a e n la c o r r e la c i n e fe c tiv a e n tre las
v a ria b le s.
2. A lfa (a) C o m o y a se h a d isc u tid o , a m e d id a q u e alfa se v u elv e m s restric tiv o , la p o ten cia
d ec rece . E sto s ig n ific a q u e c o m o e l a n a lis ta re d u c e la o p o rtu n id a d d e e n c o n tra r un efecto
in c o rre c to sig n ific a tiv o , la p ro b a b ilid a d d e e n c o n tra r c o rre c ta m e n te u n e fe c to ta m b i n d is
m in u y e. L as d ire c tric e s c o n v e n c io n a le s su g ie re n n iv e le s a lfa d e 0 ,0 5 o 0 ,0 1 . P ero el in
v estig a d o r d eb e c o n s id e ra r el im p a cto d e e sta d ec isi n so b re la p o te n c ia a n te s d e seleccio n ar
el n iv e l alfa. E n d isc u sio n e s p o s te rio re s se ilu stra r n las re la c io n e s e n tre las d o s p ro b a b i
lid ad es.
3. El ta m a o de la m u estra P a ra c u a lq u ie r n iv el d e alfa d a d o , el a u m e n to d e la m u e stra sie m
p re p ro d u c e u n a m a y o r p o te n c ia d e l te st e s ta d stic o . P ero a u m e n ta r ei ta m a o d e la m u e s
tra ta m b i n p u e d e p r o d u c ir d e m a s ia d a p o te n c ia . P o r e s te h e c h o , e n te n d e m o s q u e a!
a u m e n ta r el ta m a o de a m u e stra , se o b s e rv a r q u e e fe c to s c a d a v e z m s y m s p e q u e
o s se r n sig n ific a tiv o s, h a s ta q u e p a r a m u e s tra s m u y g ra n d e s ca si c u a lq u ie r e fe c to e s sig
n ific a tiv o . El in v e s tig a d o r d e b e te n e r s ie m p re p re s e n te q u e el ta m a o d e la m u e stra p u ed e
a fe c ta r a la p ru e b a e s ta d s tic a ta n to p o r h a c e rlo in se n s ib le (p a ra m u e s tra s m u y p e q u e a s)
o d e m a sia d o s e n sib le (p a ra m u e s tra s m u y g ra n d e s).

L a s re la c io n e s e n tre a lfa , ta m a o d e la m u e s tra , e f e c to ta m a o y p o te n c ia s o n b a s ta n te c o m


p lic a d a s , p e ro s e p u e d e n e n c o n tra r c ie r to s p u n to s d e p a rtid a . C o h n [6 ] h a e x a m in a d o la p o te n c ia
p a r a la m a y o r p a r te d e la s p r u e b a s d e in f e r e n c ia e s ta d s tic a y h a p r o p o rc io n a d o p a u ta s p a ra los
n iv e le s a c e p ta b le s d e p o te n c ia , s u g ir ie n d o q u e lo s e s tu d io s d e b e n d is e a r s e p a r a c o n s e g u ir n i
v e le s d e a lf a d e al m e n o s 0 ,0 5 c o n n iv e le s d e p o te n c ia d e l 80 p o r c ie n to . P a r a c o n s e g u ir d ic h o s
n iv e le s , d e b e n c o n s id e r a r s e s im u lt n e a m e n te lo s tr e s fa c to re s . E s ta s in te r r e la c io n e s s e p u e d e n
ilu s tr a r m e d ia n te d o s e je m p lo s s e n c illo s . E l p r im e ro im p lic a la c o m p ro b a c i n d e la d ife re n c ia
e n tre las p u n tu a c io n e s m e d ia s d e d o s g r u p o s . S u p o n ie n d o q u e e l e f e c to ta m a o s e a e n tre p e
q u e o ( 0 ,0 2 ) y m o d e ra d o (0 ,5 ) , e l in v e s tig a d o r d e b e d e te r m in a r e l n iv e l a lf a y e l ta m a o d e
m u e s tr a n e c e s a r io d e c a d a g r u p o . L a T a b la . l ilu s tra el im p a c to ta n to d e l ta m a o d e la m u e s
tr a c o m o d e l n iv e l a lfa so b re la p o te n c ia . C o m o p u e d e v e rs e , la p o te n c ia lle g a a s e r a c e p ta b le
p a r a ta m a o s d e m u e s tra d e 100 o m s e n s itu a c io n e s c o n u n e f e c to ta m a o m o d e ra d o p a r a a m
b o s n iv e le s d e alfa . P e r o c u a n d o o c u r r e u n e f e c to ta m a o p e q u e o , la s p r u e b a s e s ta d s tic a s tie
n e p o c a p o te n c ia , in c lu s o c o n n iv e le s d e a lf a e x p a n d id o s a m u e s tra s d e 2 0 0 o m s. P o r e je m p lo ,
u n a m u e s tra d e 2 0 0 e n c a d a g r u p o c o n u n a lfa d e 0 ,0 5 to d a v a tie n e un 5 0 p o r c ie n to d e p o s i
b ilid a d e s d e e n c o n tr a r s e d if e r e n c ia s s ig n if ic a tiv a s si e l e f e c to ta m a o e s p e q u e o . E s to s u g ie
r e q u e e l a n a lis ta , a l a n tic ip a r q u e lo s e f e c to s v a n a s e r p e q u e o s , d e b e d is e a r e l e s tu d io c o n
m u e s tr a s m u c h o m a y o re s y /o n iv e le s d e a lf a m e n o s r e s tr ic tiv o s (0 ,0 5 o 0 ,1 0 ). E n el se g u n d o

T A B L A 1 .1 . N i v e l e s d e p o t e n c i a p a r a la c o m p a r a c i n e n t r e d o s m e d i a s : v a r i a c i o n e s p o r el t a m a o d e
la m u e s t r a , e l n iv e l d e s i g n i f i c a c i n y e l e f e c t o t a m a o

alfa (x) - 0 ,0 5 alfa (d) = 0 ,0 1


Efecto tam ao (ET) Efecto tam ao (ET)

Tamao m aestral Pequeo ( 0 ,2 ) M oderado (0 ,5 ) Pequeo ( 0 ,2 ) M oderado ( 0 ,5 )

20 0 ,0 9 5 0 ,3 3 8 0 ,0 2 5 0 ,1 4 4
40 0 ,1 4 3 0 ,5 9 8 0 ,0 4 5 0 ,3 4 9
60 0 ,1 9 2 0 ,7 7 5 0 ,0 6 7 0 ,5 4 9
80 0 ,2 4 2 0 ,8 8 2 0 .0 9 2 0 ,7 0 9
100 0 ,2 9 0 0 ,9 4 0 0.120 0 .8 2 3
150 0 .4 1 1 0 ,9 9 0 0,201 0 ,9 5 9
200 0 ,5 1 6 0 ,9 9 8 0 ,2 8 4 0 ,9 9 2

F u en te: S o lo P o w e r A ualv-iis. B M D P S latislical S o ftw a re , Inc.


A N L IS IS M U L T IV A R IA N T E

Potencia

Tam ao m uestral por grupo

F IG U R A 1 . 1 . I m p a c t o d e l t a m a o d e la m u e s t r a e n la p o t e n c i a d e a l g u n o s n iv e l e s a lf a (0 ,0 1 ; 0 ,0 5 ; 0 ,1 0 ) c o n e f e c t o
t a m a o d e 0 ,3 5 .

e je m p lo , la F ig u ra 1.1 re p re s e n ta g r fic a m e n te la p o te n c ia p a ra n iv e le s d e s ig n ific a c i n d e 0 .0 1 ;


0 ,5 y O JO c o n ta m a o s de m u e s tr a d e 2 0 a 3 0 0 p o r g ru p o , c u a n d o e l e f e c to ta m a o ( 0 .3 5 ) es
e n tre p e q u e o y m o d e ra d o . E n fre n ta d o a ta le s p e rs p e c tiv a s , la e s p e c ific a c i n d e u n n iv e l d e s ig
n if ic a c i n d e u n 0,01 r e q u ie r e u n a m u e s tr a d e 2 0 0 p o r g ru p o p a r a c o n s e g u ir e l n iv e l d e s e a d o
d e p o te n c ia d e l 80 p o r c ie n to . P e r o si s e r e la ja el n iv e l a lfa , s e a lc a n z a la p o te n c ia d e l 8 0 p o r
c ie n to p a ra m u e s tr a s d e 130 p a r a u n n iv e l a lfa 0 ,0 5 y m u e s tr a s d e 100 p a r a u n n iv e l d e s ig n i
f ic a c i n d e u n 0 ,1 0 .
T ales a n lis is p e n n ite n al in v e s tig a d o r to m a r d e c is io n e s m s a d e c u a d a s en el e s tu d io , d ise o
e in te rp re tac i n d e lo s resu ltad o s. A l p la n ific a r la in v e stig a ci n , el in v e stig a d o r d eb e e s tim a r el efe c
to ta m a o e s p e ra d o p a ra s e le c c io n a r e n to n c e s el ta m a o d e la m u e s tra y el n iv e l a lfa p a ra c o n s e
g u ir el n iv e l de p o te n c ia d e se a d o . A d e m s d e su s u s o s p a ra la p la n ific a c i n , e l a n lis is d e p o te n c ia
se u tiliz a ta m b i n d e s p u s de q u e el a n lis is a te rm in a d o p a ra d e te rm in a r la p o te n c ia re a l c o n s e
g u id a , d e ta l fo rm a q u e lo s re s u lta d o s p u e d a n s e r c o rre c ta m e n te in te rp re ta d o s . S e d e b e n lo s r e
s u lta d o s al e fe c to ta m a o , ta m a o m u e s tra l o n iv e le s d e s ig n ific a c i n ? L o s a n a lis ta s p u e d e n
e v a lu a r c a d a u n o de e sto s fa c to re s p o r s u im p a c to s o b re la sig n ific a tiv id a d o n o s ig n ific a tiv id a d d e
lo s re su lta d o s. El in v e s tig a d o r p u e d e re fe rirs e h o y e n d ia a e s tu d io s p u b lic a d o s d o n d e se a n a liz a n
lo s d e ta lle s c o n c re to s de la d e te rm in a c i n d e la p o te n c ia [6] o a c u d ir a v a rio s p ro g ra m a s d e o rd e
n a d o r p e rso n a l q u e a s is le n e n lo s e s lu d io s d e p la n ific a c i n p a ra c o n s e g u ir la p o te n c ia d e s e a d a o
c a lc u la r la p o te n c ia d e lo s re s u lta d o s re a le s [2, 3]. E n lo s C a p tu lo s 4 y 6 se d is c u tir n co n m s-
d e ta lle las a p lic a c io n e s m s c o m u n e s del a n lis is d e p o te n c ia y las p a u ta s e s p e c fic a s a s e g u ir c u a n
d o s e a p lic a re g re si n m ltip le y el a n lis is m u ltiv a ria n te d e la v a ria n z a .
H a b ie n d o y a e x p u e sto la e x te n si n d e las t cn ic as m u ltiv aria n tes d e s d e sus o rg e n e s u n iv a rian tc s
o b iv a ria n te s , in tro d u c ire m o s a o ra b r e v e m e n te c a d a m to d o m u ltiv a ria n te . A p a r tir d e la in tro
d u c c i n d e la s t c n ic a s , p re s e n ta m o s u n e s q u e m a d e c la sific a c i n p a ra a y u d a r e n la s e le c c i n d e
la t c n ic a a p ro p ia d a re sp e c to d e la id e n tific a c i n d e lo s o b je tiv o s d e in v e s tig a c i n (re la c io n e s de
d e p e n d e n c ia o in d e p e n d e n c ia ) y el tip o de d a to s (m tric o s o no m tric o s).
IN T RO DU CCIN 11

E l a n lis is m u ltiv a ria n te es u n c o n ju n to d e t c n ic a s d e a n lisis d e d a to s e n ex p a n si n . E n tre las


t c n ic a s m s c o n o c id a s e x p u e sta s e n e s te te x to te n e m o s (1 ) re g re si n m ltip le y co rre la c i n m l
tip le ; (2 ) a n lisis d isc rim in a n te m ltip le ; (3 ) c o m p o n e n te s p rin c ip a le s y a n lis is fa c to ria l co m n ;
(4 ) a n lis is m u ltiv a ria n te de v a ria n z a y c o v a ria n z a ; (5 ) c o rre la c i n c a n n ic a ; (6 ) a n lisis clu ster;
(7 ) an lisis m ultid im en sio n al y (8 ) an lisis co n ju n to . E n tre las tcn icas em erg en tes ta m b i n incluidas
e s t n (9 ) a n lis is d e c o rre sp o n d e n c ia s; (1 0 ) m o d e lo s d e p ro b a b ilid a d lin e a l c o m o lo g it y p ro b it; y
(1 1 ) m o d e lo s d e e c u a c io n e s sim u lt n e a s /e s tru c tu ra le s . E n e s te a p a rta d o , in tro d u c ire m o s ca d a u n a
d e la s t c n ic a s m u ltiv a ria n te s , d e fin ie n d o b re v e m e n te la t c n ic a y el o b je tiv o d e s u a p lica ci n .

C om ponentes principales y anlisis factorial com n


E l a n lisis facto rial, q u e inclu y e v a ria c io n e s ta le s c o m o el a n lisis d e c o m p o n e n te s y el an lisis fac
to ria l c o m n , es u n a a p ro x im a c i n e s ta d s tic a q u e p u e d e u s a rs e p a ra a n a liz a r in te rre la c io n e s e n
tre u n g ra n n m e ro d e v a r ia b le s y e x p lic a r e s ta s v a r ia b le s e n t rm in o s d e s u s d im e n sio r.e s
su b y a c e n te s co m u n es (factores). E l o b je tiv o es e n c o n tra r un m o d o d e c o n d e n s a r la in fo rm aci n co n
te n id a e n u n n m e ro d e v a ria b le s o rig in a le s en u n c o n ju n to m s p e q u e o d e v a ria b le s (fa cto res)
c o n u n a p rd id a m n im a de in fo rm a c i n .
Si se p ro p o rc io n a u n a e s tim a c i n e m p ric a d e la e s tru c tu ra d e las v a ria b le s c o n s id e ra d a s, el
a n lis is fa c to ria l s e c o n v ie rte en u n a b a s e o b je tiv a p a ra c re a r e s c a la s ad itiv as.

R egresin m ltiple
L a re g re s i n m ltip le es el m to d o d e a n lis is a p ro p ia d o c u a n d o e l p r o b le m a d e l in v e stig a d o r in
clu y e u n a n ic a variab le m trica d e p e n d ie n te q u e se s u p o n e est rela cio n a d a c o n u n a o m s variables
m tric a s in d e p e n d ie n te s. El o b je tiv o d e l a n lis is d e la re g re si n m ltip le es p re d e c ir lo s c a m b io s
e n la v a ria b le d e p e n d ie n te en re s p u e s ta a c a m b io s e n v a ria s d e las v a ria b le s in d e p e n d ie n te s . E ste
o b je tiv o s e c o n s ig u e m u y a m e n u d o a tra v s d e la r e g la e s ta d stic a d e lo s m n im o s cu a d rad o s.
L a re g re si n m ltip le es til s ie m p re q u e e l in v e s tig a d o r es t in te re sa d o e n p r e d e c ir la ca n tid a d
o la m a g n itu d d e la v a ria b le d e p e n d ie n te . P o r e je m p lo , se p u e d e h a c e r la p re d ic c i n d e lo s g asto s
m e n s u a le s d e c e n a r fu e ra d e c a s a (v a ria b le s d e p e n d ie n te s) c o n in fo rm a c i n re fe re n te a la ren ta
fa m ilia r, su ta m a o y la e d a d d e l c a b e z a d e fa m ilia (v a ria b le s in d e p e n d ie n te s). D e la m is m a fo rm a,
el in v e s tig a d o r p u e d e in te n ta r p re d e c ir la s v e n ta s d e u n a c o m p a a a p a rtir d e in fo rm a c i n so b re
su s g a s to s e n p u b lic id a d , el n m e ro d e v e n d e d o re s y el n m e ro d e tie n d a s q u e d istrib u y e n sus
p ro d u c to s.

A nlisis discrim inante m ltiple


Si la n ic a v a ria b le d e p e n d ie n te es d ic o t m ic a (es d ec ir, c o m p ra d o r-n o c o m p ra d o r) o m u itid ic o -
t m ic a (e s d ec ir, a lto -m e d io -b a jo ) y p o r ta n to n o m tric a , la t c n ic a m u ltiv a ria n te a p ro p ia d a es un
an lisis d isc rim in a n te m ltip le (M D A ). C o m o co n la reg resi n m ltip le, las v aria b les indep en d ien tes
se su p o n e q u e so n m trica s. E l a n lis is d is c rim in a n te es til e n s itu a c io n e s d o n d e la m u e stra total
p u e d e d iv id irse en g ru p o s b a s n d o se e n u n a v a ria b le d e p e n d ie n te c a ra c te riz a d a p o r v a ria s c lase s
c o n o c id a s. L o s o b je tiv o s p rim a rio s d e l a n lis is d is c rim in a n te m ltip le s o n e n te n d e r la s d iferen c ia s
d e lo s g ru p o s y p r e d e c ir la v e ro s im ilitu d d e q u e u n a e n tid a d (p e rs o n a u o b je to ) p e rte n e z c a a u n a
c la se o g ru p o p a rtic u la r b a s n d o se e n v a ria s v a ria b le s m trica s in d e p e n d ie n te s. P o r e je m p lo , el an
lis is d isc rim in a n te p u e d e u sa rse p a ra d is tin g u ir in n o v a d o re s d e n o in n o v a d o re s d e a c u e rd o a sus
p e rfile s d e m o g r fic o s y p sic o g r fic o s. O tra s a p lic a c io n e s in c lu y e n la d istin c i n e n tre u su a rio s
12 A N LIS IS M U L TIV A R IA N TE

h a b itu a le s u o c a sio n a le s de u n p ro d u c to , c o m p ra d o re s d e m a rc a s d e m b ito n a c io n a l o re s trin g i


d o y e l rie sg o d e c r d ito b u e n o de! rie s g o d e c r d ito m a lo . In c lu so la A g e n c ia T rib u ta ria u tiliz a un
a n lis is d isc rim in a n te p a ra c o m p a ra r las d e c la ra c io n e s s e le c c io n a d a s c o n la s d e v o lu c io n e s c o m
p u e s ta s h ip o t tic a s d e l c o n trib u y e n te n o rm a l (p a ra d is tin to s n iv e le s d e re n ta ) c o n el fin d e id e n ti
fic a r la s d e v o lu c io n e s y re a s m s p ro m e te d o ra s p a ra la au d ito ra.

Anlisis m ultivariante de la varian za y covarianza


E l a n lis is m u ltiv a ria n te d e la v a ria n z a (M A N O V A ) es u n a t c n ic a e s ta d s tic a q u e p u e d e s e r u s a
d a sim u lt n e a m e n te p a ra e x p lo ra r la s re la c io n e s e n tre d iv e rs a s c a te g o ra s d e v a ria b le s in d e p e n
d ie n te s ( u s u a lm e n te d e n o m in a d a s c o m o t r a t a m i e n t o s ) y d o s o m s v a ria b le s m tric a s d e p e n
d ie n te s . C o m o tal, re p re se n ta u n a e x te n s i n d e l a n lis is u n i v a r i a n t e d e la v a r i a n z a (A N O V A ).
El a n lis is m u ltiv a ria n te de la c o v a r ia n z a (M A N C O V A ) p u e d e u s a rs e en c o n ju n c i n c o n M A
N O V A p a ra e lim in a r (d e sp u s del e x p e r im e n to ) e l e fe c to d e c u a lq u ie r v a ria b le in d e p e n d ie n te no
c o n tro la d a s o b re las v a ria b le s d e p e n d ie n te s . E l p ro c e d im ie n to e s s im ila r al q u e s e e n c u e n tra en
la c o r r e la c i n p a r c ia l b iv a r i a n te . M A N O V A es til c u a n d o el in v e s tig a d o r d is e a u n a situ a c i n
e x p e rim e n ta l (m a n ip u la c i n d e v a ra s v a ria b le s d e tra ta m ie n to n o m tric a s ) p a r a c o m p ro b a r
h ip te s is c o n c e rn ie n te s a la v a r ia n z a d e re s p u e s ta s d e g ru p o s s o b re d o s o m s v a r ia b le s m tric a s
d e p e n d ie n te s .

Anlisis conjunto
E l a n lis is co n ju n to es u n a t c n ic a d e d e p e n d e n c ia e m e rg e n te q u e h a in tro d u c id o u n a n u e v a s o
fistic a c i n en la e v a lu a c i n de o b je to s, sean n u e v o s p ro d u c to s, se rv ic io s o id e as. L a a p lic a c i n m s
d ire c ta est en p ro d u c to s n u e v o s o d e s a rro llo d e s e rv ic io s, p e rm itie n d o la e v a lu a c i n d e p ro d u c
to s c o m p le jo s m ie n tra s q u e m a n tie n e u n c o n te x to d e d e c isi n re a lis ta p a ra el e n c u e s ta d o . E l a n a
lista de m e rc a d o es c a p a z de ev a lu a r la im p o rta n cia d e atrib u to s as c o m o lo s n iv e le s d e cad a atrib u to
m ie n tra s q u e lo s c o n s u m id o re s e v a l a n s lo lo s p e rfile s d e u n o s p o c o s p ro d u c to s , q u e s o n c o m
b in a c io n e s d e n iv e le s de p ro d u c to . P o r e je m p lo , u n c o n c e p to d e un p ro d u c to q u e tie n e tre s a trib u
to s (p re cio , calid ad y color), ca d a u n o de lo s cu a le s a tres n iv e le s (p o r ejem p lo , ro jo , a m a rillo y azul).
En lu g a r d e te n e r q u e e v a lu a r to d a s la s 27 c o m b in a c io n e s p o sib le s (3 X 3 X 3 ), se p u e d e ev a lu a r
un su b c o n ju n to (9 o m s) p o r su a tra c tiv o p a ra lo s c o n s u m id o re s, y e l in v e s tig a d o r sa b e n o s lo
c u l es la im p o rta n c ia d e ca d a a trib u to sin o ta m b i n la im p o rta n c ia d e ca d a n iv e l (e l a tra c tiv o del
ro jo fre n te al a m a rillo y fre n te al az u l). M s a n . c u a n d o se c o m p le ta n las e v a lu a c io n e s d el c o n
su m id o r, p u e d e n u sa rse lo s re s u lta d o s del a n lis is c o n ju n to en s im u la d o re s d el d is e o d el p ro d u c
to . q u e m o stra r n la a c e p ta c i n d e l c lie n te p a ra c u a lq u ie r n m e ro d e fo rm u la c io n e s d e p ro d u c to y
a y u d a r e n el d ise o del p ro d u c to p tim o .

Correlacin cannica
El a n lis is de c o rre la c i n c a n n ic a p u e d e v e rs e c o m o u n a e x te n si n l g ic a d e un a n lis is d e re
g re si n m ltip le . R e c o rd e m o s q u e el a n lis is d e re g re si n m ltip le im p lic a u n a n ic a v a ria b le d e
p e n d ie n te m tric a y v a ria s v a ria b le s m tric a s in d e p e n d ie n te s. C o n el a n lisis c a n n ic o el o b je tiv o
e s c o rre la c io n a r sim u lt n e a m e n te v a ria s v a ria b le s d e p e n d ie n te s m tric a s y v a ria s v a ria b le s m tri
c a s in d e p e n d ie n te s. M ie n tra s q u e la re g re s i n m ltip le im p lica u n a n ic a v a ria b le d e p e n d ie n te , la
co rrela ci n can n ica im p lica m ltip les v aria b les d ep e n d ie n tes. El p rin cip io su b y a ce n te es d esarro llar
u n a c o m b in a c i n lin e al de ca d a c o n ju n to d e v a ria b le s (ta n to in d e p e n d ie n te s c o m o d e p e n d ie n te s )
p ara m a x im iz a r la c o rre la c i n e n tre lo s d o s c o n ju n to s. O d ic h o d e o tra fo rm a , el p ro c e d im ie n to im
p lic a o b te n e r un co n ju n to de p o n d e ra c io n e s p a ra la s v a ria b le s d e p e n d ie n te s e in d e p e n d ie n te s que
p ro p o rc io n e la co rre la c i n n ic a m x im a e n tre el c o n ju n to d e v a ria b le s d e p e n d ie n te s y el c o n ju n
to d e v a ria b le s in d e p en d ie n te s.
I N T R O D U C C I N 13

A nlisis clu ster

E l a n lis is c lu s te r e s u n a t c n ic a a n a ltic a pava d e s a rro lla r s u b g ru p o s s ig n ific a tiv o s d e in d iv id u o s


u o b je to s. D e fo rm a e sp e c fic a , el o b je tiv o e s c la s ific a r u n a m u e s tra d e e n tid a d e s (p e rso n a s u
o b je to s ) en un n m e ro p e q u e o d e g ru p o s m u tu a m e n te e x c lu y e n te s b a s a d o s e n sim ilitu d e s en tre
la s e n tid a d e s. E n el a n lisis cluster, a d ife re n c ia d e l a n lis is d isc rim in a n te , lo s g ru p o s no e st n p re
d e fin id o s. P o r c o n s ig u ie n te , se u sa la t c n ic a p a ra id e n tific a r los g ru p o s.
H a b itu a lm e n te , el a n lisis c lu s te r im p lic a a l m e n o s d o s etap a s. L a p rim e ra e s la m e d id a d e a l
g u n a fo rm a d e sim ilitu d o a s o c ia c i n e n tre las e n tid a d e s p a ra d e te rm in a r c u n to s g ru p o s ex isten
e n re a lid a d en la m u e stra. L a se g u n d a e ta p a e s d e s c r ib ir las p e rso n a s o v a ria b le s p a ra d e te rm in a r
su c o m p o sic i n . E ste p a s o p u e d e lle v a rse a c a b o a p lic a n d o el a n lis is d is c rim in a n te a lo s g ru p o s
id e n tific a d o s p o r la t c n ic a cluster.

A nlisis m ultidim ensional

E n e l a n lis is m u ltid im e n sio n a l. e l o b je tiv o es tra n s fo rm a r los ju ic io s d e lo s c o n s u m id o re s d e s i


m ilitu d o p re fe re n c ia (p o r eje m p lo , p re fe re n c ia s p o r tie n d a s o m arcas, c o m e rc ia le s ) en d istan c ias
r e p r e s e n ta d a s e n u n e s p a c io m u ltid im e n s io n a l. S i lo s o b je to s A y B so n e n o p in i n d e los
e n c u e s ta d o s m s sim ila re s q u e el re sto d e lo s p are s p o sib le s d e o b je to s, las t c n ic a s d e an lisis m u l
tid im e n s io n a l situ arn a los o b je to s A y B d e tal fo rm a q u e la d ista n c ia e n tre e llo s en un esp ac io
m u ltid im e n sio n a l es m e n o r q u e la d is ta n c ia e n tre c u a lq u ie r o tro p a r d e o b je to s. L o s m ap as per-
c c p tu a le s re su lta n te s m u e stran el p o s ic io n a m ie n to re la tiv o e n tre lo so b jeto s, p e ro e s n e c e sa rio un
a n lis is a d ic io n a l p a ra e v a lu a r q u a trib u to s p re d ic e n la p o sic i n d e ca d a o b je to .

A nlisis de correspondencias
P a ra fin alizar, el an lisis de c o rre sp o n d e n c ia s e s u n a t c n ic a d e in te rd e p e n d e n c ia re c ie n te m e n te d e
sa rro lla d a q u e fac ilita ta n to la re d u c c i n d im e n sio n a l d e u n a c la s ific a c i n d e o b je to s (p o r ejem p lo ,
p ro d u c to s , p e rso n a s, e tc .,) so b re un c o n ju n to d e a trib u to s y el m a p a p e rc e p tu a l d e o b je to s re la ti
v o s al e s to s a trib u to s. L os in v e stig a d o re s s e e n fre n ta n c o n s ta n te m e n te a la n e c e s id a d d e cu a n ti-
f ic a r d a to s c u a lita tiv o s q u e e n c u e n tra n e n v a ria b le s n o m in a le s. El a n lis is d e co rre sp o n d e n c ia s
d ifie re d e o tra s t c n ic a s de in te rd e p e n d e n c ia d is c u tid a s a n te s e n su c a p a c id a d p a r a a c o m o d a r ta n
to d a to s n o m tric o s c o m o re la c io n e s n o lin e ales.
E n su fo rm a m s b s ic a , el a n lis is d e c o r r e s p o n d e n c ia s e m p le a u n a ta b la d e c o n tin g e n c ia ,
q u e e s la ta b u la c i n c r u z a d a de d o s v a r ia b le s c a te g ric a s . A c o n tin u a c i n tra n s f o r m a lo s d ato s
n o m tr ic o s e n u n n iv e l m tr ic o y r e a liz a u n a re d u c c i n d im e n s io n a l ( s im ila r a l a n lis is fa c to
r ia l) y u n m a p a p e rc e p tu a l ( s im ila r al a n lis is m u ltid im e n s io n a l). A m o d o d e e je m p lo , las p r e
f e re n c ia s p o r u n a m a rc a d e lo s e n c u e s ta d o s p u e d e n s e r ta b u la d a s d e fo rm a c r u z a d a c o n v a ria b le s
d e m o g r fic a s (p o r e je m p lo , g e n e ro , c a te g o ra s d e re n ta , o c u p a c i n ) in d ic a n d o c u n ta g e n te q u e
p r e f ie r e c a d a u n a d e la s m a rc a s e n tra d e n tro d e c a d a c a te g o ra d e la s v a ria b le s d e m o g r fic a s . A
tr a v s d e l a n lis is d e c o rre s p o n d e n c ia s , la a s o c ia c i n o c o r r e s p o n d e n c ia d e m a rc a s y la s c a
r a c te r s tic a s d is tin tiv a s d e a q u e llo s q u e p re f ie r e n c a d a m a rc a s e m u e s tra n e n un m a p a bi o tr i
d im e n s io n a l, ta n to d e m a rc a s c o m o c a r a c te r s tic a s d e lo s e n c u e s ta d o s . L a s m a rc a s p e rc ib id a s
c o m o s im ila re s e s t n lo c a liz a d a s en u n a c e r c a n a p r o x im id a d u n a s d e o tra s. D e la m is m a fo rm a ,
las c a r a c te r s tic a s m s d is tin tiv a s d e lo s e n c u e s ta d o s q u e p re f ie r e n c a d a m a rc a e s t n d e te r m i
n a d a s ta m b i n p o r la p r o x im id a d d e las c a te g o ra s d e la s v a r ia b le s d e m o g r fic a s re s p e c to d e la
p o s ic i n d e la m a rc a . E l a n lis is d e las c o rr e s p o n d e n c ia s p r o p o rc io n a u n a re p re s e n ta c i n m u l-
tiv a r ia n te d e la in te r d e p e n d e n c ia d e d a to s n o m tric o s q u e n o es p o s ib le r e a liz a r c o n o tro s
m to d o s .
14 A N L IS IS M U LTIVA RIAN TE

Modelos de probabilidad lineal


L o s m o d e lo s d e p ro b a b ilid a d lin e al, a m e n u d o lla m a d o s a n lis is ogit, c o n s iste n en u n a c o m b in a
ci n d e re g re si n m ltip le y a n lis is de d is c rim in a n te m ltip le . E sta t c n ic a es s im ila r a l a n lisis
de re g re si n m ltip le e n q u e u n a o m s v a ria b le s in d e p e n d ie n te s se u san p ara p re d e c ir u n a n ic a
v a ria b le d e p e n d ie n te . L o q u e d istin g u e u n m o d e lo d e p ro b a b ilid a d lin eal d e la r e g re s i n m ltip le
es q u e la v a ria b le d e p e n d ie n te e s n o m tric a , c o m o e n el a n lisis d isc rim in a n te . L a e s c a la n o m
tric a d e la v a ria b le d e p e n d ie n te re q u ie re d ife re n c ia s en el m to d o d e e s tim a c i n y su p u e sto s so b re
el tip o d e d istrib u c i n su b y a c e n te , s ie n d o en la m a y o ra d e sus o tra s fa c e ta s s im ila r a la re g re si n
m ltip le . P o r ta n to , u n a v e z q u e la v a ria b le d e p e n d ie n te est e s p e c ific a d a c o rre c ta m e n te y se e m
p le a la t c n ic a d e e stim a c i n a p ro p ia d a , se u s a n ig u a lm e n te lo s su p u e sto s b s ic o s c o n s id e ra d o s en
ia re g re si n m ltip le . L os m o d e lo s d e p ro b a b ilid a d lin e a l se d istin g u e n d el a n lis is d is c rim in a n te
en q u e ac o m o d a n to d o s los tip o s de v a ria b le s in d e p e n d ie n te s (m tric as y n o m trica s) y n o req u ie re n
el su p u e sto d e n o rm a lid a d m u ltiv a ria n te . S in e m b a rg o , en m u c h o s c a so s, p a rtic u la rm e n te c o n m s
d e d o s n iv e le s d e la v a ria b le d e p e n d ie n te , e l a n lis is d isc rim in a n te es la t c n ic a m s a p ro p ia d a .

Modelos de ecuaciones estructurales


E l m o d e lo d e ecu acio n es estru c tu rale s, a m e n u d o d e n o m in a d o sim p lem en te c o m o L IS R E L (el n o m
b re d e u n o d e lo s p a q u e te s in fo rm tic o s m s p o p u la re s ), es u n a t c n ic a q u e p e rm ite s e p a r a r las re
la c io n e s p a ra ca d a co n ju n to de v a ria b le s d e p e n d ie n te s . E n su a c e p c i n m s s im p le , e l m o d e lo d e
e c u a c io n e s e s tru c tu ra le s p ro p o rc io n a la t c n ic a d e e s tim a c i n m s a d e c u a d a y e fic ie n te p a ra se
rie s d e e stim a c io n e s d e e c u a c io n e s sim u lt n e a s m e d ia n te re g re sio n e s m ltip le s. S e c a ra c te riz a p o r
do s c o m p o n e n te s b sico s: (1 ) el m o d e lo e s tru c tu ra l y (2 ) el m o d e lo d e m e d id a . El m o d e lo e s tr u c
tu r a l es el m o d e lo g u a , q u e re la c io n a v a r ia b le s in d e p e n d ie n te s y v a ria b le s d e p e n d ie n te s . E n ta
le s situ a c io n e s, la te o ra, a n te s q u e la e x p e rie n c ia u o tra s d ire c tric e s, p e rm itir al in v e stig a d o r
d istin g u ir q u v a ria b le s in d e p e n d ie n te s p re d ic e n c a d a v a ria b le d e p e n d ie n te . L o s m o d e lo s p r c \ ia-
m e n te d isc u tid o s q u e in c lu y en m ltip le s v a ria b le s d e p e n d ie n te s a n lis is m u ltiv a ria n te d e la \ a-
ria n z a y co rre la c i n c a n n ic a n o so n a p ro p ia d o s e n esta situ a c i n , d a d o q u e p e rm ite n s lo u n a
n ic a re la c i n en tre v a ria b le s d e p e n d ie n te s e in d e p e n d ie n te s.
E l m o d e lo d e m e d id a p e r m ite al in v e s tig a d o r u s a r v a r ia s v a r ia b le s i i n d i c a d o r e s ) , p a ra u n a
n ic a v a r ia b le d e p e n d ie n te o in d e p e n d ie n te . P o r e je m p lo , la v a r ia b le d e p e n d ie n te p u e d e s e r un
c o n c e p to r e p r e s e n ta d o p o r u n a e s c a la a d itiv a , ta l c o m o el a m o r p r o p io . E n el m o d e lo d e m e
d id a e l in v e s tig a d o r p u e d e e v a lu a r la c o n tr ib u c i n d e c a d a te m d e la e s c a la a s c o m o in c o r
p o ra r c m o la e sc a la m id e e l c o n c e p to (fia b ilid a d ) e n la e s tim a c i n d e la s v a ria b le s d e p e n d ie n te s
e in d e p e n d ie n te s . E s te p r o c e d im ie n to e s s im ila r al d e s a r r o llo d e l a n lis is f a c to r ia l ( d is c u tid o
e n u n a s e c c i n p o s te r io r ) d e lo s te m s d e la e s c a la y u tiliz a la s c a rg a s f a c to r ia le s e n la r e g r e
si n .

Otras tcnicas m ultivariantes em ergentes


E l u s o g e n e ra liz a d o d e las h e rra m ie n ta s in fo rm tic a s a y u d a in ic ia r ia e ra d e l a n lis is m u ltiv a
ria n te tal y c o m o lo c o n o c e m o s hoy, c o n u n n m e ro d e t c n ic a s e s p e c ia liz a d a s q u e s e p u e d e n a p li
c a r a u n a g a m a a m p lia d e s itu a c io n e s. N o o b s ta n te , a h o ra n o s e n c o n tra m o s a l p r in c ip io d e u n a era
e n la cu a l el a n lis is m u ltiv a ria n te in c o rp o ra n u e v o s e n fo q u e s p a ra id e n tific a r y r e p r e s e n ta r las
re la c io n e s m u ltiv a ria n te s . U n re a d e d e s a r ro llo e n e l a n lis is m u ltiv a ria n te es la b s q u e d a d e
d a to s y las re d e s n e u ro n a le s. L a b s q u e d a d e d a to s es el in te n to d e c u a n tific a r las re la c io n e s
e n tre g ra n d e s c a n tid a d e s d e in fo rm a c i n c o n u n a e s p e c ific a c i n p re v ia m n im a d e la n a tu ra le z a
d e las re la c io n e s. U n a t c n ic a q u e se u s a m u c h a s v e c e s ju n to c o n la b s q u e d a d e d a to s so n la s r e
d e s n e u ro n a le s . una t c n ic a d e a n lis is f le x ib le q u e e s c a p a z d e lle v a r a c a b o u n a id e n tific a c i n
IN T R O D U C C I N 15

d e re la c io n e s (p a re c id a a la re g re si n m ltip le o a l a n lis is d is c rim in a n te ) o la re d u c c i n d e


d a to s y el a n lis is e s tru c tu ra l (s e m e ja n te al a n lis is fa c to ria l o c lu s te r). L a s re d e s n e u ro n a le s son
d ife r e n te s a las t c n ic a s m u ltiv a ria n te s m s tra d ic io n a le s c ita d a s p re v ia m e n te ta n to en la fo rm u
la c i n d e l m o d e lo c o m o en lo s tip o s d e r e la c io n e s m s c o m p le jo s q u e s e p u e d e n fo rm u lar. O tra
r e a q u e in c lu y e u n d is ta n c ia m ie n to d e la te o ra e s ta d s tic a in fe re n c ia l tra d ic io n a l es el d e s a rro
llo d e la t c n ic a d e la m u e s tra r e p e tid a o a rra n q u e . E s ta t c n ic a e lim in a la n e c e s id a d d e c u m
p lir d e te rm in a d o s su p u e sto s e sta d stic o s (c o m o la n o rm alid ad ), m e d ia n te el u so d e l o rd e n a d o r p ara
r e p lic a r u n a m u e s tra re p e tid a d e la m u e s tra o rig in a l, c o n el re e m p la z o y la g e n e ra c i n d e u n a
e s tim a c i n e m p ric a d e ia d is trib u c i n m u e s tra l. S e p u e d e e n c o n tra r un re su m e n d e e s ta s n u ev a s
t c n ic a s en el C a p tu lo 12.

P a ra a y u d a rle a fa m ilia riz a rse c o n la s t c n ic a s m u ltiv a ria n te s , p re se n ta m o s u n a c la sific a c i n d e los


m to d o s m u ltiv a ria n te s en la F ig u ra 1.2. E s ta c la s ific a c i n se b a s a e n tre s ju ic io s q u e el an a lista
d e b e h a c e r s o b re e l o b je to a in v e s tig a r y la n a tu ra le z a d e lo s d ato s: ( ) p u e d e n d iv id irse las v a
ria b le s en d e p e n d ie n te s o in d e p e n d ie n te s b a s n d o s e la c la sific a c i n en a lg u n a te o ra ? (2 ) S p u e
d e h a c e rse , c u n ta s d e e s ta s v a ria b le s s o n tra ta d a s c o m o d e p e n d ie n te s en u n a n lis is sim p le ? (3)
C m o s o n la s v a ria b le s m e d id a s ? L a s e le c c i n d e la t c n ic a m u ltiv a ria n te a p ro p ia d a d e p e n d e d e
las re sp u e sta s a estas tre s c u e stio n e s.
C u a n d o c o n s id e ra m o s la a p lic a c i n d e las t c n ic a s e s ta d stic a s m u ltiv a ria n te s , la p rim e ra
c u e s ti n q u e n o s d e b e m o s p re g u n ta r e s , p u e d e n d iv id irse la s v a ria b le s m e d ia n te la c la sific a c i n
d e d e p e n d ie n te e in d e p e n d ie n te ? L a re s p u e s ta a e s ta c u e s ti n in d ic a si se d e b e ra u tiliz a r un
a n lisis d e d e p e n d e n c ia o in te rd e p e n d e n c ia . N te s e q u e en la F ig u ra 1.2, las t cn ic as d e d ep en d en cia
e s t n e n e l lad o iz q u ie rd o y las t c n ic a s d e in te rd e p e n d e n c ia e s t n a a d e re c h a . U n a n lis is d e
d e p e n d e n c i a p u e d e d e fin irs e c o m o a q u e l e n e l q u e u n a v a ria b le o c o n ju n to d e v a ria b le s es
id e n tific a d o c o m o la v a r ia b le d e p e n d ie n te y q u e v a a se r e x p lic a d a p o r o tra s v a ria b le s c o n o c id a s
c o m o v a r ia b le s in d e p e n d ie n te s . C o m o e je m p lo d e u n a d e p e n d e n c ia t c n ic a te n e m o s el an lisis
d e r e g re s i n m ltip le . C o m o c o n tra s te , u n a n lis is d e i n te r d e p e n d e n c i a es a q u e l e n q u e n in g u n a
v a r ia b le o g ru p o d e v a r ia b le s e s d e f in id o c o m o in d e p e n d ie n te o d e p e n d ie n te . M s b ie n , el
p ro c e d im ie n to im p lic a el a n lis is d e to d a s la s v a ria b le s d el c o n ju n to s im u lt n e a m e n te . E l an lisis
fa c to ria l es u n e je m p lo d e u n a n lis is d e in te rd e p e n d e n c ia . P ero c e n tr m o n o s e n e l a n lis is de
d e p e n d e n c ia p rim e ro y u s e m o s la c la s if ic a c i n d e la F ig u ra 1.2 p a ra s e le c c io n a r e l m to d o
m u ltiv a ria n te a p ro p ia d o .
L o s d ife re n te s m to d o s q u e c o n s titu y e n e l a n lis is d e d e p e n d e n c ia p u e d e n s e r a su v ez d iv id i
d o s e n d o s tip o s se g n : (1 ) el n m e ro d e v a ria b le s d e p e n d ie n te s y (2 ) e l tip o d e e s c a la s d e m e d i
d a e m p le a d a s p a ra las v a ria b le s . T e n ie n d o e n c u e n ta el n m e ro d e v a ria b le s d e p e n d ie n te s, e!
a n lisis d e d ep e n d en c ia p u ed e c la sific a rse c o m o aq u e l q u e tie n e ta n to u n a v a ria b le d e p e n d ie n te n i
c a c o m o v a ria s v a ria b le s d e p e n d ie n te s o in c lu s o v a ria s re la c io n e s d e d e p e n d e n c ia /in d e p e n d e n c ia .
E l a n lis is d e d e p e n d e n c ia p u e d e in c lu s o s e r c la sific a d o en f u n d n d e l tip o d e e s c a la d e la v a ria
b le c o n v a ria b le s m tric a s (n u m ric a s /c u a n tita tiv a s ) o n o m tric a s (c u a lita tiv a s/c a te g ric a s). S i el
a n lis is im p lic a u n a n ic a v a ria b le d e p e n d ie n te q u e es m trica , la t c n ic a a p ro p ia d a es ta n to e l an
lisis d e re g re si n m ltip le c o m o el a n lis is c o n ju n to . E l a n lisis c o n ju n to es u n c a s o es p e c ia l. S e
tr a ta d e u n p ro c e d im ie n to d e d e p e n d e n c ia q u e p u e d e tra ta r ta v a ria b le d e p e n d ie n te c o m o m tric a
o n o m tric a , e n fu n c i n d e las c irc u n s ta n c ia s . P o r o tro lad o , si la n ic a v a ria b le d e p e n d ie n te es
n o m tric a (c a te g ric a ), en to n c e s la t c n ic a a p ro p ia d a es, o b ien e l a n lis is d is c rim in a n te m ltip le,
o b ie n lo s m o d e lo s de p ro b a b ilid a d lin e al. E n c o n tra ste , c u a n d o el p ro b le m a d e l in v e s tig a d o r im
p lic a v a ria s v a ria b le s d e p e n d ie n te s, h a y o tra s c u a tro t c n ic a s e s ta d stic a s a p ro p ia d a s. Si v a ria s v a
ria b le s d e p e n d ie n te s so n m tric a s , d e b e m o s e n to n c e s m ira r a las v a ria b le s in d e p e n d ie n te s. S i las
v a ria b le s in d e p e n d ie n te s s o n n o m tric a s, d e b e m o s e le g ir la t c n ic a m u ltiv a ria n te d e a n lis is d e la
v a ria n z a . S i la s v a ria b le s in d e p e n d ie n te s so n m tric a s, la a p ro p ia d a es la c o rre la c i n ca n n ic a. Si
A N L IS IS MULTIVARIANTE;

,.Cul e s la escala
J e mcdiila
J e las variables
prediclor?

I
Mtrica No mtrica

F IG U R A 1 .2 . S e le c c i n d e u n a t c n ic a m u ltiv a ria n te .
I N T R O D U C C I N

Interdependencia
i

Es la estructura
de relaciones entre:

Variables C asos/E ncuestados O bjetos


i _ 1 _______

A nlisis factorial A nlisis cluster


(C apitulo 3) (C aptulo 9)

No mtrico

/-
rx r
L ey en d a
i
A nlisis A nlisis de
m ultidim ensional correspondencias
(C aptulo 10) (C aptulo 10)

j
........ -r- _ J

Tcnica
m ultivariante
elegida
A N L IS IS M U L T IV A R IA N T E

v aria s v a ria b le s d e p e n d ie n te s so n n o m tric a s, e n to n c e s p u e d e n tra n s fo rm a rse a tra v s d e u n a v a


ria b le fic tic ia de c d ig o (0 -1 ) y p u e d e u tiliz a rs e ta m b i n el a n lis is c a n n ic o * . F in a lm e n te , si se
p o stu la u n c o n ju n to d e re la c io n e s d e v a ria b le s d e p e n d ie n te s, in d e p e n d ie n te s , e n to n c e s el m o d e lo
d e e c u a c io n e s e s tru c tu ra le s es el a p ro p ia d o .
E x iste u n a e s tre c h a re la c i n e n tre lo s d iv e rs o s p ro c e d im ie n to s d e d e p e n d e n c ia , q u e p u e d e n s e r
v isto s c o m o u n a fa m ilia d e t c n ic a s. L a T ab la 1.2 d e fin e v a rio s d e Sos a n lisis d e d e p e n d e n c ia m u l-
tiv a ria n tc e n t rm in o s d e la n a tu ra le z a y n m e ro d e la s v a ria b le s d e p e n d ie n te s e in d e p e n d ie n te s .
C o m o p o d e m o s ver. la co rre la c i n c a n n ic a p u e d e c o n s id e ra rse c o m o el m o d e lo g e n e ra l e n e l cu a l
se b a sa n o tra s m u c h a s t c n ic a s m u itiv a ria n te s, d a d o q u e sit a la m n im a re stric c i n re s p e c to al tip o
y n m e ro de v a ria b le s ta n to d e v a lo r te ric o d e p e n d ie n te c o m o in d e p e n d ie n te . C o m o la s re s tr ic
c io n e s e s t n b a s a d a s en v a lo re s te ric o s, p u e d e n a lc a n z a rs e c o n c lu sio n e s m s p r e c is a s a p o y n d o
n o s en la e s c a la e sp e c fic a e m p le a d a en la m e d ic i n d e lo s d ato s. T ales t c n ic a s m u itiv a ria n te s van
d e s d e el m to d o gen eral del an lisis c a n n ic o al m s esp ec ializa d o m to d o d e m o d e liz a c i n d e ecu a
c io n e s estru c tu ra le s.
E l a n lis is d e in te rd e p e n d e n c ia se m u e s tra e n e l la d o d e re c h o d e la F ig u ra 1.2. L o s le c to re s
re c o rd a r n q u e en el a n lisis d e in te rd e p e n d e n c ia las v a ria b le s no p u e d e s e r c la s ific a d a s c o m o

T A B L A 1 .2 . L as r e la c io n e s e n tr e m to d o s d e d e p e n d e n c ia m u ltiv a ria n te

C o r r e la c i n c a n n ic a
y, + y, + y, + . . . + y = x, + x 2 + xy+ . . . + x
(m trica, no m trica) (m trica, no m trica)

A n l i s i s m u l t i v a r i a n t e d e l a v a r ia n z a
y | + y: + y , + . . . + y = , v , + a > a; + ... + ^,
(mtrica) (no mtrica)

A n l i s i s d e la v a r i a n z a
y , = A 1 + A ', + X, + . . . + X
(mtrica) (no mtrica)

A n l i s i s d i s c r i m i n a n t e m l t ip le
Y, =., + A", + A + . . . + X
(no mtrica) (m trica)

A n l i s i s d e r e g r e s i n m lt ip le
y , = A '1+ Ar; +Ar, + ... + A-,
(mtrica) (m trica, no mtrica)

A n lis is c o n ju n to
)', = A , + A-, + A'j + . . . + X a
(no mtrica, m trica) (no m trica)

M o d e lo d e e c u a c io n e s e s t r u c t u r a le s
F , = A 'n + A-, , + A j , + . . . * X u

y,=A f: i + A y

(m trica) (m trica, no mtrica)

* L a s v a r ia b le s fic tic ia s se tra ta n con m s d e ta lle m s ad elan te. En resum en, la c o d ific a c i n d e la v a ria b le ficticia es
una m a n e ra d e tra n sfo rm a r dalos n o m tric o s en d a to s m tric o s, in c lu y e la creaci n d e las d e n o m in a d a s v a ria b le s ficticias,
en la s cu a le s se asig n an unos y ce ro s al su je to , d e p e n d ie n d o d e si cu e n ta o n o con cie rta c aracterstica. P o r e je m p lo , si un
su je to e s m asc u lin o se le asigna un 0 y si el su je to e s fem en in o se le a sig n a un 1. o al con trario .
IN TRODUCCIN 19

d e p e n d ie n te s o in d e p en d ie n te s. E n v ez d e e sto , to d a s las v a ria b le s so n a n a liz a d a s sim u lt n eam en te


e n u n e s fu e rz o p o r e n c o n tra r u n a e s tru c tu r a s u b y a c e n te p a ra el c o n ju n to to tal d e v a ria b le s o su je
to s. S i se est a n a liz a n d o la e s tru c tu ra d e las v a ria b le s , e n to n c e s el a n lis is fa c to ria l es la t cn ic a
a p ro p ia d a . Si lo s c a so s o lo s e n c u e s ta d o s s e v a n a a g ru p a r p a ra re p re s e n ta r u n a e stru c tu ra , en to n
ce s se le c c io n a re m o s el an lisis cluster. F in a lm e n te , s i el in te r s e s t e n a e s tru c tu ra d e o b je to s, d e
b e ra n a p lic a rs e las t c n ic a s d e a n lis is m u ltid im e n s io n a l. C o m o o c u r r e c o n el a n lis is de
d e p e n d e n c ia , d e b e ra n c o n s id e ra rse la s p ro p ie d a d e s d e las t c n ic a s d e m e d ic i n . G e n e ra lm e n te , el
a n lis is fa c to ria l y el a n lisis c lu s te r se c o n s id e ra n a n lis is d e in te rd e p e n d e n c ia m trico s. S in e m
b a rg o , lo s d a to s n o m tric o s p u e d e n se r tra n s fo rm a d o s a tra v s d e u n a v a ria b le fic tic ia c o d ific a d a
p a ra u sa rlo s c o n a n lisis fac to rial y a n lis is clu ste r. S e lian d e s a rro lla d o ta n to las a p ro x im a c io n e s
m tric a s c o m o la s n o m tric a s al a n lis is m u ltid im e n s io n a l. Si se v a n a a n a liz a r las in te rd e p e n
d e n c ia s e n tre o b je to s m e d id o s p o r d a to s n o m tric o s, e l a n lis is d e c o rre s p o n d e n c ia s es la t cn ic a
a p ro p ia d a .

C o m o se h a p o d id o co m p ro b a r, el a n lis is m u ltiv a ria n te tie n e u n c a r c te r v a ria d o y p u e d e s e r b a s


ta n te p o d e ro so . E ste p o d e r es e s p e c ia lm e n te te n ta d o r c u a n d o el in v e s tig a d o r n o e s t se g u ro d el d i
se o d e l a n lisis m s ap ro p ia d o y u tiliz a e l a n lis is m u ltiv a ria n te c o m o u n su s titu to d el n ec esario
a n lis is co n c e p tu a l. In clu so c u a n d o se a p lic a c o rre c ta m e n te , lo s e s fu e rz o s p o r a c o m o d a r la s m l
tip le s v a ria b le s y re la c io n e s cre an c o m p le jid a d e s a d ic io n a le s en lo s re su lta d o s y s u in te rp retaci n .
P o r ta n to , a d v e rtim o s c o n tra s u u so s in ia b a s e c o n c e p tu a l a p ro p ia d a p a ra a p o y a r la t c n ic a se le c
c io n a d a s o b re a q u e llo s co n c e p to s b s ic o s m e n c io n a d o s p re v ia m e n te y lo s te m a s a b o rd a d o s en la
sig u ie n te se cc i n .
H e m o s d isc u tid o ta m b i n v a rio s a s u n to s p a rtic u la rm e n te a p lic a b le s al a n lis is m u ltiv aria n tes.
P o r ta n to , m ie n tra s n o e x ista u n a n ic a re sp u e s ta , h e m o s e n c o n tra d o q u e el a n lis is y ia in ter
p re ta c i n de c u a lq u ie r p ro b le m a m u ltiv a ria n te p u e d e v e rse a y u d a d o p o r u n c o n ju n to g en e ral d e di
re c tric e s. N o se tra ta d e n in g n m o d o d e u n a lis ta e x h a u s tiv a d e c o n s id e ra c io n e s , sin o q u e la lista
re p re s e n ta m s b ie n u n a filo s o fa d e l a n lis is m u ltiv a ria n te . L a s s ig u ie n te s s e c c io n e s d isc u te n
e s to s p u n to s p e ro n o e n u n o rd e n c o n c re to , sin o h a c ie n d o ig u al n fa sis e n to d o s ello s.

Establecer la significacin prctica a s com o la estadstica


L a fu e rz a d e l a n lis is m u ltiv a ria n te re s id e e n su s m e d io s a p a re n te m e n te m g ic o s p a ra c la sifi
c a r u n a v a rie d a d de p o sib le s a lte rn a tiv a s y e n c o n tra r a q u e lla s q u e tie n e n sig n ific a c i n estad stica.
P e ro c o n e ste p o d e r d e b e m o s te n e r p re c a u c i n . M u c h o s in v e stig a d o re s se v u e lv e n m io p e s al fijarse
so la m e n te e n la sig n ific a c i n c o n s e g u id a p o r lo s re s u lta d o s sin e n te n d e r su s in te rp re ta c io n e s , b u e
n a s o m a la s. E n s u lugar, el in v e s tig a d o r d e b e a te n d e r n o s lo a la sig n ific a c i n e s ta d stic a d e los
re s u lta d o s sin o ta m b i n a su sig n ific a c i n p r c tic a . L a s ig n ific a c i n p r c t i c a se re fie re a la c u e s
ti n . y p a ra q u ? . P a ra c u a lq u ie r a p lic a c i n e n la g e s ti n , lo s re s u lta d o s d e b e n te n e r u n efecto
d e m o s tra b le q u e ju s tifiq u e la a c c i n . E n e l te rre n o a c a d m ic o , e l in v e s tig a d o r se lle g a a fija r no
s lo e n la sig n ific a c i n e s ta d stic a d e lo s re s u lta d o s sin o ta m b i n e n s u s im p lic a c io n e s te ric a s y
s u sta n tiv a s, q u e e n m u c h a s o c a sio n e s se d e d u c e n d e s u s ig n ific a c i n p r c tic a .
C o m o e je m p lo ilu s tra tiv o d e e s ta situ a c i n c o n s id e ra m o s u n a n lis is d e r e g re s i n p a ra p re d e
c ir la s in te n c io n e s de co m p ra , m e d id a s c o m o la p ro b a b ilid a d e n tre 0 y 100 d e q u e el c lie n te v ol
v e r a c o m p ra r a la em p re sa. El e s tu d io se lle v a a c a b o y e l re su lta d o e s sig n ific a tiv o al n iv el de
sig n ific a c i n d e 0,0 5 . L o s ejec u tiv o s a c e p ta n lo s re su lta d o s y m o d ific a n la e s tra te g ia d e la em presa.
P e ro lo q u e no se h a p e rc ib id o es q u e m ie n tra s la re la c i n e ra sig n ific a tiv a , la c a p a c id a d p red ic-
tiv a e ra b aja, ta n b a ja q u e la e stim a c i n d e la p o sib ilid a d d e rep e tir c o m p ra p o d ra v a ria r tan to com o
20 A N L IS IS M U L T IV A R IA N T L

u n 2 0 p o r c ie n to ai n iv e l do sig n ific a c i n d e l 0 ,0 5 . L a re la c i n d e la s ig n ific a c i n e s ta d stic a


p o d r a e n to n c e s te n e r un ra n g o d e e rro r d e 4 0 p u n to s p o rc e n tu a le s! U n c lie n te d e! c u a l s e p r e d i
c e q u e tie n e u n a o p o rtu n id a d d e v o lv e r d e 5 0 /5 0 p o d ra re a lm e n te te n e r p r o b a b ilid a d e s de! 3 0 al
7 0 p o r c ie n to , re p re se n ta n d o n iv e le s in a c e p ta b le s s o b re lo s c u a le s ac tu ar. L o s in v e s tig a d o re s y los
g e re n te s n o h a n p ro b a d o la sig n ific a c i n p r c tic a o d e g e s ti n d e lo s re su lta d o s, o lv id a n d o q u e la
re la c i n to d a v ia n e c e s ita b a u n u lte rio r re fin a m ie n to .

El tam ao m uestral afecta a tod o s los resultados


L a d is c u s i n d e la p o te n cia e sta d stica d e m u e str a q u e e l im p a c to su sta n c ia l d el ta m a o m u estra)
o p e ra e n la c o n s e c u c i n de la sig n ific a c i n e s ta d s tic a , ta n to en ta m a o s m u s tra le s g ra n d e s co m o
p e q u e o s. P a ra m u e stras p eq u e as, la so fislific a c i n y la co m p lejid ad del an lisis m u ltiv a ria n te p u e
d e f c ilm e n te r e s u lta r ta n to en (1 ) m u y p o c a p o te n c ia e s ta d stic a d e la p ru e b a p a ra id e n tific a r d e
fo rm a r e a lis ta re su lta d o s s ig n ific a tiv o s o (2 ) f c ilm e n te u n s o b re a p ro v e c h a m ie n to d e lo s d ato s
d e ta l fo rm a q u e se a n a rtific ia lm e n te b u e n o s p o rq u e se a ju sta n m u y b ie n a la m u e stra , a u n q u e no
se a n g e n e r a liz a r e s . L o m is m o o c u rre p a ra m u e s tra s g ra n d e s q u e , c o m o y a se h a d is c u tid o an tes,
p u e d e n h a c e r a lo s te st e s ta d stic o s a lta m e n te se n s ib le s . S ie m p re q u e lo s ta m a o s m u s tra le s
e x c e d a n lo s 2 0 0 o 4 0 0 e n c u e s ta d o s, el in v e s tig a d o r d e b e ra e x a m in a r to d o s lo s r e s u lta d o s s ig n ifi
c a tiv o s p ara a s eg u rarse q u e tie n en sig n ific ac i n p r c tic a d eb id o al au m en to d e la p o te n c ia estad stic a
c o m o c o n s e c u e n c ia del ta m a o m u e stra l. L o s ta m a o s m u stra le s ta m b i n a fe c ta n a lo s re su lta d o s
c u a n d o lo s a n lis is im p lic a n g ru p o s de e n c u e s ta d o s , c o m o o c u rre e n el a n lisis d is c rim in a n te o en
M A N O V A . T am a o s m u strale s d esig u ales e n tre lo s g ru p o s in flu en cian a lo s re s u lta d o s y req u ie re n
u n a n lis is y /o in te rp re ta c i n a d ic io n a l. P o r ta n to , e l in v e s tig a d o r o u su a rio d el a n lis is m u ltiv a
ria n te d e b e ra sie m p re v a lo ra r io s re s u lta d o s a la lu z d e la m u e s tra u tiliza d a.

Conocer los datos


L a s t c n ic a s del a n lis is m u ltiv a ria n te , p o r s u p ro p ia n a tu ra le z a , id e n tific a n re la c io n e s c o m p le ja s
q u e so n d ifc ile s d e re p re s e n ta r d e fo rm a s im p le . C o m o re su lta d o , la te n d e n c ia es a c e p ta r io s re
s u lta d o s sin el tip ic o e x a m e n q u e u n o e m p re n d e e n lo s a n lis is u n iv a ria n te y b iv a ria n te (p o r e je m
p lo , g r fic o d e d is p e rs i n d e c o rre la c io n e s y b o x p io ts d e c o m p a ra c io n e s d e m e d ia ). P e ro esto s
a ta jo s p u e d e n se r el p re lu d io d e l d e s a stre . K1 a n lis is m u ltiv a ria n te re q u ie re u n e x a m e n in c lu so
m s r ig u r o so d e lo s d a to s p o rq u e la in flu e n c ia d e a lp ic o s, v io la c io n e s d e lo s s u p u e s to s y la p r
d id a d e d ato s p u e d e agrav arse a travs d e v a ria s v a ria b le s y te n e r efecto s su sta n c ia lm e n te d iferen tes.
P a ra s e rv irs e d e to d o s lo s b e n e fic io s d e la s t c n ic a s m u ltiv a ria n te s , el a n a lis ta d e b e ta m b i n s a
b e r d n d e m ira r c o n fo rm u la c io n e s a lte rn a tiv a s d e l m o d e lo o rig in a l, ta le s c o m o r e la c io n e s n o li
n e a le s e in te ra c tiv a s . El a n a lista tie n e , s in e m b a rg o , un c o n ju n to d e t c n ic a s d e d ia g n s tic o en
c o n tin u a e x p a n si n q u e p e rm ite n q u e e s ta s r e la c io n e s m u ltiv a ria n te s sean d e s c u b ie rta s p o r m e d io s
s im ila re s a lo s m to d o s u n iv a ria n te s y b iv a ria n te s . E l in v e s tig a d o r d e u n p ro b le m a m u ltiv a ria n te
d e b e to m a rs e s u tie m p o en u tiliz a r e s ta s m e d id a s d e d ia g n s tic o p a ra un m a y o r e n te n d im ie n to de
lo s d a to s y d e las re la c io n e s b s ic a s q u e e x iste n .

Procurar la parsim onia del m odelo


L a s t c n ic a s m u ltiv a ria n te s s e d ise a n p a ra a c o m o d a r la s v a ria b le s en el a n lis is. E ste c a r c te r, sin
e m b a rg o , n o d e b e ra s u stitu ir e l d e s a rro llo d e m o d e lo s c o n c e p tu a le s a n te s d e q u e se a p liq u e n las
t c n ic a s m u ltiv a ria n te s . A u n q u e e s s ie m p re im p o r ta n te e v ita r o m itir u n a v a ria b le p r e d ic to r c riti
c a , d e n o m in a d a e r r o r d e e s p e c ific a c i n , p o r v a ria s ra z o n e s el a n a lis ta d e b e ta m b i n in te n ta r e v i
ta r in se rta r v a ria b le s in d iscrim in a d am en te . E n p rim e r lu g a r, la s v aria b les irre le v a n te s h a b itu a lm e n tc
a u m e n ta n la c a p a c id a d del a n lis is p a ra a ju s ta r la m u e s tra d e d a to s p e ro a c o s ta d e s o b re a ju s ta r lo s
d ato s y h a c e rlo s m e n o s g en e raliz ab les p a ra la p o b la c i n . E n se g u n d o lu g ar, las v a ria b le s irrc le v an te s
IN TRODUCCIN 21

no se sg an tp ica m en te las estim a c io n e s de las v a ria b le s rele v an te s, p e ro p u ed e n e n m a sc a ra r los efe c


to s v erd a d ero s d eb id o a la m u ltico iin ca d ad . L a m u ltic o lin e a lid a d re p re se n ta el g rad o en el q u e cu a l
q u ie r e fe c to d e u n a v a ria b le p u e d e se r p re v is ta o e x p lic a d a p o r las o tra s v a ria b le s d el an lisis. A
m e d id a q u e a u m e n ta la m u ltic o lin e a lid a d , la c a p a c id a d p a ra d e fin ir el e fe c to d e c u a lq u ie r v aria b le
d ism in u y e . P o r ta n to , in c lu y e n d o v a ria b le s q u e no s o n re le v a n te s c o n c e p tu a lm e n te p o d e m o s te n e r
v a rio s e fe c to s p o te n c ia lm e n te d a in o s, in c lu so si la s v a ria b le a d ic io n a le s n o se sg a n d ire c ta m e n te
lo s re su lta d o s del m o d elo .

A tend er a los errores


In c lu so c o n la c a p a c id a d del a n lis is m u ltiv a ria n te , d ifc ilm e n te c o n s e g u ire m o s la m e jo r p re d ic
c i n e n el p rim e r anlisis. E l an a lista se e n fre n ta co n la cu esti n , a d o n d e p o d e m o s ir d e s d e aqu?.
L a m e jo r re sp u e sta es m ira r a lo s e rro re s e n la p re d ic c i n , ta n to si s o n lo s re sid u o s d el a n lis is de
re g re si n , la a u s e n c ia d e c la sific a c i n de o b s e rv a c io n e s e n el a n lis is d is c rim in a n te o lo s a tip ic o s
d e l a n lisis cluster.
E n c a d a ca so , el a n a lista d e b e ra u tiliz a r lo s erro re s d e p re d ic c i n no c o m o u n a m e d id a d e erro r
o c o m o alg o m e ra m e n te a elim in a r, sin o c o m o u n p u n to d e p a rtid a p a ra d ia g n o s tic a r la v a lid e z de
lo s re su lta d o s o b te n id o s y c o m o u n a in d ic a c i n d e la s re la c io n e s q u e q u e d a n sin ex p licar.

Validar los resultados


L a c a p a c id a d de! a n lisis m u ltiv a ria n te p a ra id e n tific a r in tc rre la c io n e s c o m p le ja s ta m b i n im p li
c a q u e p u e d e d a rse el c a so d e q u e lo s re s u lta d o s se a n e s p e c fic o s s lo p a ra la m u e stra y n o g e n e
r a l i z a r e s a la p o b la c i n . El in v e s tig a d o r d e b e s ie m p re a s e g u r a r q u e e x is te n o b s e rv a c io n e s
su fic ie n te s p o r p a r m e tro e s tim a d o p a ra e v ita r el s o b re a ju ste d e la m u e stra , c o m o se h a d isc u
tid o an tes. P ero ig u al d e im p o rta n tes s o n lo s e s fu e rz o s d e s tin a d o s a v a lid a r lo s re s u lta d o s m e d ian te
d ife re n te s m to d o s, q u e in c lu y e n (1 ) d iv is i n d e la m u e stra y el u so d e u n a s u b m u e s tra p a ra e s ti
m a r e l m o d e lo y u s a r u n a se g u n d a su b m u e s tra p a ra e s tim a r la p re c is i n p re d ic tiv a , (2 ) e m p leo de
u n a n lis is d e b o o tstra p p in g [9], o (3 ) in c lu so c o n s e g u ir u n a m u e s tra d istin ta p a ra a s e g u ra r q u e
lo s re su lta d o s s o n a p ro p ia d o s p a ra o tra s m u e stra s. C u a lq u ie ra q u e se a la t c n ic a m u ltiv a ria n te e m
p le a d a , e l in v e stig a d o r d e b e c e n tra rs e n o s lo en e s tim a r u n m o d e lo sig n ific a tiv o sin o ta m b i n en
a s e g u ra r q u e es re p re se n ta tiv o d e la p o b la c i n e n s u c o n ju n to . R e c o rd e m o s q u e e l o b je tiv o n o es
e n c o n tra r el m e jo r a ju ste s lo p a ra la m u e s tra sin o d e s a rro lla r el m o d e lo q u e m e jo r d e sc rib a a
la p o b la c i n e n s u co n ju n to .

A l d is c u tir las n u m e ro sa s t c n ic a s m u ltiv a ria n te s a d is p o s ic i n d el in v e s tig a d o r y la g ra n ca n tid a d


d e s u p u e sto s q u e im p lic a su a p lic a c i n , se h a c e e v id e n te q u e fin a liz a r c o n x ito u n a n lisis m u l
tiv a ria n te im p lica a lg o m s q u e la se le c c i n d e l m to d o co rrec to . D eb e n re s o lv e rse asu n to s q u e van
d e s d e e l p ro b le m a d e d e fin ic i n al d ia g n stic o c rtic o d e lo s re su lta d o s. P a ra a y u d a r al in v e stig a
d o r o u su a rio en la a p lic a c i n d e lo s m to d o s m u ltiv aria n tes, p re se n ta m o s u n a ap ro x im aci n al a n
lisis m u ltiv a ria n te e n se is p aso s. L a in te n c i n n o es p ro p o rc io n a r u n c o n ju n to rg id o d e p ro c e d i
m ie n to s a se g u ir, sin o m s b ie n o f re c e r u n a se rie d e p a u ta s q u e fa c ilita n la a p ro x im a c i n a l d ise o
d e m o d e lo s. L a a p ro x im a c i n a la m o d e liz a c i n se c e n tra e n e l a n lis is d e u n p la n d e in v e stig a
c i n b ie n d e fin id o , c o m e n z a n d o c o n un m o d e lo c o n c e p tu a l q u e d e ta lle las re la c io n e s a ex am in ar.
U n a v e z d e fin id o e n t rm in o s c o n c e p tu a le s, se p u e d e n in ic ia r lo s tra b a jo s e m p ric o s , in c lu y en d o
INTRODUCCIN 23

Tercer p aso : Evaluacin de los supuestos bsicos


de la tcnica m ultivariante
C o n la re c o g id a d e d a to s, el p rim e r a n lis is n o c o n s is te en e s tim a r el m o d e lo m u ltiv a ria n te , sino
en e v a lu a r lo s s u p u e sto s su b y a c e n te s. T o d a s las t c n ic a s m u ltiv a ria n te s tie n e n s u p u e sto s su b y a
c e n te s, ta n to e s ta d stic o s c o m o c o n c e p tu a le s , q u e a fe c ta n su s ta n c ia lm e n te a s u c a p a c id a d p a ra re
p re s e n ta r re la c io n e s m u ltiv a ria n te s . P a ra la s t c n ic a s b a s a d a s en la in fe re n c ia e s ta d s tic a se d e b e n
ten er en c u e n ta los su p u e sto s de n o rm a lid a d m u ltiv aria n te, lin ealid ad , in d e p en d e n cia d e los trm in o s
d e e rro r e ig u a ld a d d e las v a ria n z a s e n u n a re la c i n d e d e p e n d e n c ia . E n el C a p tu lo 2 se d iscu te
so b re la v a lo ra c i n d e e s to s s u p u e sto s c o n m s d e ta lle . C a d a t c n ic a tie n e u n a s e rie d e su p u e sto s
c o n c e p tu a le s q u e tra ta n s o b re a s u n to s c o m o la fo rm u la c i n d e m o d e lo s y io s tip o s d e re p re se n ta
cio n es. A n te s d e in te n ta r c u a lq u ie r e s tim a c i n d el m o d e lo , el in v e s tig a d o r d e b e a s e g u ra rs e q u e se
e n c u e n tra n c u m p lid o s ta n to lo s su p u e s to s e s ta d stic o s c o m o lo s c o n c e p tu a le s.

C uarto p aso : Estim acin del m odelo m ultivariante


y valoracin del ajuste del m odelo
U n a v e z s a tis fe c h o s lo s m o d e lo s , se p ro c e d e a la e s tim a c i n e fe c tiv a d e l m o d e lo m u ltiv a ria n te y
a u n a v a lo ra c i n g lo b a l del a ju ste d e l m o d e lo . E n e l p ro c e s o d e e s tim a c i n , e l a n a lis ta p u e d e o p
ta r p o r d is tin ta s o p c io n e s p a ra e le g ir la s c a ra c te rs tic a s e s p e c fic a s d e lo s d a to s ( p o r e je m p lo , u so
d e c o v a ria n z a s en M A N O V A ) o m a x im iz a r el aju ste d e lo s d a to s (p o r e je m p lo , ro ta c i n d e lo s fac
to re s o fu n c io n e s d is c rim in a n te s ). D e s p u s d e h a b e r e s tim a d o el m o d e lo , se e v a l a el a ju ste p ara
a v e rig u a r si c o n sig u e n n iv e le s a c e p ta b le s s o b re lo s c rite rio s e s ta d stic o s (p o r e je m p lo , n iv e l d e sig
n ific a c i n ), id e n tific a la s r e la c io n e s p ro p u e s ta s y c o n s ig u e la s ig n ific a c i n p r c tic a . E n m u c h as
o c a sio n e s, el m o d e lo se v o lv e r a e s p e c ific a r e n u n in te n to d e c o n s e g u ir m e jo r a r lo s n iv e le s d e
a ju ste y /o ex p lic a c i n .
C o n in d e p e n d e n c ia d e l n iv e l d e a ju s te q u e se e n c u e n tre , el a n a lis ta d e b e ta m b i n d e te rm in a r
si lo s re s u lta d o s e s t n e x c e s iv a m e n te a fe c ta d o s p o r u n n ic o o p e q u e o c o n ju n to d e o b se rv a c io
n es q u e in d ic a n q u e lo s re s u lta d o s p u e d e n s e r in e sta b le s. E sto s e s fu e rz o s a s e g u ra n q u e lo s re su l
ta d o s s o n r o b u s to s y e s ta b le s a l a p lic a rlo s ra z o n a b le m e n te a to d a s las o b s e rv a c io n e s d e la
m u e stra . L a s o b se rv a c io n e s m a l a ju s ta d a s p u e d e n id e n tific a rse c o m o a tp ic a s, o b s e rv a c io n e s in
flu y e n te s u o tro s re s u lta d o s d is p e rs o s ( p o r e je m p lo , c o n g lo m e ra d o s d e u n n ic o m ie m b ro o caso s
s e ria m e n te d e s c la sific a d o s e n e! a n lis is d isc rim in a n te ).

Q uinto paso : Interpretar el valor terico


C o n u n n iv e l a c e p ta b le d e a ju ste d e l m o d e lo , a l in te rp re ta r el v a lo r o v a lo re s te ric o s se re v e la la
n a tu ra le z a d e la s re la c io n e s m u ltiv a ria n te s . L a in te rp re ta c i n d e lo s e fe c to s p a ra v a ria b le s in d iv i
d u a le s s e re a liz a e x a m in a n d o lo s c o e fic ie n te s e s tim a d o s (p o n d e ra c io n e s) p a ra c a d a v a ria b le e n e!
v alor terico (p o r ejem plo, p o n d era cio n e s d e reg resi n , ca rg as d e lo s facto res o u tilid a d e s conjuntas).
M s a n , a lg u n a s t c n ic a s ta m b i n e s tim a n lo s v a lo re s te ric o s m ltip le s q u e re p re se n ta n las d i
m e n sio n e s s u b y a c e n te s de la c o m p a ra c i n o a s o c ia c i n (p o r e je m p lo , fu n c io n e s d is c rim in a n te s o
c o m p o n e n te s p rin c ip a le s). L a in te rp re ta c i n p u e d e c o n d u c ir a re -e s p e c ific a c io n e s a d ic io n a le s d e
las v a ria b le s y /o fo rm u la c i n d e l m o d e lo , d o n d e e l m o d e lo se e s tim a d e n u e v o y se in te rp re ta u n a
v e z m s. E l o b je tiv o es id e n tific a r la e v id e n c ia e m p ric a d e la s re la c io n e s m u ltiv a ria n te s d e ios
d a to s m u stra le s q u e p u e d e n g e n e ra liz a rs e p a ra el to ta l d e la p o b la ci n .
Sexto p aso : Validacin del m odelo m ultivariante
A n te s d e a c e p ta r lo s re su lta d o s, el in v e s tig a d o r d e b e s o m e te rlo s a u n c o n ju n to fin a l d e d ia g n s ti
c o s q u e aseguran e! g ra d o d e g e n e ra lid a d d e lo s re s u lta d o s p o r lo s m to d o s d e v a lid a c i n d is p o
n ib le s. L os in te n to s de v a lid a r el m o d e lo se d irig e n d ire c ta m e n te h a c ia la d e m o s tra c i n d e la
g e n e ra lid a d de los re su lta d o s al c o n ju n to d e la p o b la c i n (v a se la a n te rio r d is c u s i n d e la s t c n i
ca s d e v a lid a c i n ). A m b o s d ia g n stic o s a a d e n p o c o a la in te rp re ta c i n d e lo s re s u lta d o s p e ro sir
v en p a ra a s e g u ra r lo s re su lta d o s m s d e s c rip tiv o s d e lo s d ato s y su g e n e ra liz a c i n al c o n ju n to de
la p o b la c i n .

Un diagram a de flujos de decisiones


P a ra ca d a t c n ic a m u ltiv a ria n te , el u so d e lo s seis p a s o s d e c o n stru c ci n d e un m o d e lo m u ltiv aria n te
se in d ic a r en un d ia g ra m a d e flu jo s d e d e c is io n e s se g re g a d o en d o s se c c io n e s. L a p rim e ra se cc i n
(lo s p a s o s 1 a 3 ) se re fie re a lo s te m a s a b o rd a d o s c o n la p re p a ra c i n p a ra la p ro p ia e s tim a c i n d e
m o d e lo s (es d ec ir, lo s o b je tiv o s de in v e s tig a c i n , c o n s id e ra c io n e s p a ra el d ise o d e la in v e s tig a
c i n y e l e n s a y o p a ra las s u p o sic io n e s). L a se g u n d a se c c i n d el d ia g ra m a d e flu jo s d e d e c isio n e s
(lo s p a s o s 4 a 6 ) se re fie re a la s c u e stio n e s p e rtin e n te s a un m o d e lo d e e s tim a c i n , in te rp re ta c i n
y v a lid a c i n . El d ia g ra m a d e flu jo s d e d e c is io n e s p ro p o rc io n a al in v e s tig a d o r u n m to d o s im p li
fic a d o p e ro sistem tic o p a ra la a p lic a c i n d e la ap ro x im aci n o rg a n iz a d a al d ise o d e m o d e lo s m u l-
tiv a ria n ie s c u a n d o se a p lic a c u a lq u ie r t c n ic a m u ltiv a ria n te .

P a ra e x p lic a r e ilu stra r ca d a u n a d e las t c n ic a s m u ltiv a ria n te s d e fo rm a m s e x te n s a , a lo la rg o del


lib ro u tiliz a re m o s c o n ju n to s d e d a to s h ip o t tic o s . E sto s c o n ju n to s d e d a to s se o b tu v ie ro n to d o s d e
la C o m p a a H air, A n d erso rt y T a th a m (H A T C O ), u n e n o rm e (a u n q u e in e x iste n te ) d is trib u id o r in
d u stria l. C a d a u n a d e la s se rie s d e d a to s s e o b tu v o d e la s e n c u e s ta s d e c lie n te s d e H A T C O , re a li
z a d a s p o r u n a e m p re sa d e in v e stig a c i n d e l m e rc a d o re c o n o cid a .

La principal base de datos


L a p rin cip al b a se d e d ato s, co n s iste n te e n 100 o b se rv a c io n e s d e 14 v a ria b le s se p a ra d a s , es u n e je m
p lo de u n estu d io d e se g m e n ta c i n d e la situ a c i n e m p re s a a e m p re sa , e s p e c fic a m e n te un in fo r
m e so b re lo s c lie n te s a c tu a le s d e H A T C O . S e u tiliz a n tre s tip o s d e d ato s. L a p r im e ra c la s e es la
p e rc e p c i n d e H A T C O so b re sie te a trib u to s id e n tific a d o s en e s tu d io s p a s a d o s c o m o lo s m s in
flu y e n te s en la e le c c i n d e d istrib u id o r. L o s c n c u e s ta d o s . e je c u tiv o s d e c o m p ra s d e e m p re sa s
c lie n te s de H A T C O , p u n t a n a H A T C O s o b re c a d a atrib u to . L a s e g u n d a c la s e d e in fo rm a c i n h ace
re fe re n c ia a lo s re s u lta d o s de c o m p ra s re a le s, b ie n s o b re la s e v a lu a c io n e s d e la s a tis fa c c i n d e los
c n c u e s ta d o s co n H A T C O , b ie n s o b re el p o rc e n ta je d e su s c o m p ra s d e p ro d u c to s a H A T C O , L a te r
c e ra c ia se de in fo rm a c i n c o n tie n e c a ra c te rs tic a s g e n e ra le s d e la s e m p re sa s c lie n te s ( p o re je m p lo ,
ta m a o de la em p re sa , tip o de in d u stria ).
L os d a to s p ro p o rc io n a d o s d e b e ra n d a r a H A T C O u n a m e jo r c o m p re n s i n ta n to d e las c a ra c
te rstic a s d e su s c lie n te s c o m o d e la s re la c io n e s e n tre su s p e rc e p c io n e s d e H A T C O y su s a c c io n e s
h ac ia H A T C O (c o m p ra s y sa tis fa c c i n ). E n la T ab la 1.3 se p r o p o rc io n a u n a b r e v e d e s c rip c i n d e
la s v a ria b le s d e las b a s e s d e d a to s, q u e a p a re c e n c la sific a d a s c o m o d e p e n d ie n te s o in d e p e n d ie n
te s y m tric a s o n o m tric a s. E n el A p n d ic e A s e p ro p o rc io n a un listad o d e la s b a s e s d e d a to s p ara
a q u e llo s q u e d e se e n re p ro d u c ir las so lu c io n e s a las q u e se lle g a en e s te lib ro . E n las s ig u ie n te s s e c
c io n e s se da u n a d e fin ic i n d e c a d a v a ria b le y u n a e x p lic a c i n d e s u c o d ific a c i n .
IN T RO DU CCIN 25

T A B L A 1 .3 . D e s c r i p c i n d e i a s v a r i a b l e s d e la b a s e d e d a t o s

Descripcin de variable Tipo d e variable

P E R C E P C IO N E S D E HATCO
Xt Velocidad de entrega M trica
X, Nivel de precios M trica
X. Flexibilidad de precios M trica
X4 Imagen del fabricante M trica
X, Servicio conjunto M trica
X. Imagen de fuerza de ventas M trica
Xn Calidad de producto M trica
RESULTADO S D E CO M PRA
A, Nivel de fidelidad Mtrica
X n Nivel de satisfaccin M trica
C A R A C T E R IS T IC A S D E L C O M P R A D O R
Xf Tamao de em presa No mtrica
Xu Com pra al detalle No mtrica
X l2 Estructura de adquisicin No mtrica
An Tipo de industria No mtrica
X lt Tipo de situacin de com pra No mtrica

Percepciones de HATCO
C a d a u n a de e s ta s v a ria b le s se m id i c o n u n a e s c a la d e p u n tu a c i n g r fic a , d o n d e s e d ib u j u n a
ln e a e n tre lo s p u n to s fin a le s d e d ie z c e n tm e tro s , q u e se d e n o m in a ro n P o b re y E x c e le n te :

Pobre E xcelente

L o s e n c u e s ta d o s in d ic an s u s in g re s o s h a c ie n d o u n a m a rc a en la ln e a . L a m a rc a s e m id i y se
re g is tr la d is ta n c ia d e sd e c e ro (e n c e n tm e tro s ). E l re su lta d o fue u n a e s c a la q u e ib a d e s d e cero a
d ie z , re d o n d e a d o a u n n ic o d e c im a l. L o s sie te a trib u to s d e H A T C O p u n tu a d o s p o r lo s en c u esta-
d o s so n lo s sig u ien te s:

Xt V elo c id a d d e e n tre g a tie m p o q u e tra n sc u rre h a s ta q u e se e n tre g a e! p ro d u c to , u n a v ez


q u e se h u b o c o n firm a d o e l p ed id o .
X 2 N iv e l d e p re c io n iv e l d e p r e c io s p e rc ib id o p o r lo s c lie n te s in d u stria le s.
X 2 F le x ib ilid a d d e p re c io s la d is p o s ic i n p e r c ib id a e n lo s re p re se n ta n te s d e H A T C O p ara
n e g o c ia r e l p re c io d e to d a s la s c o m p ra s . .
X 4 Im a g e n d e l fa b ric a n te im a g e n c o n ju n ta d el fa b ric a n te /d istrib u id o r.
X } S e rv ic io n iv e l c o n ju n to d e se rv ic io n e c e s a rio p a ra m a n te n e r u n a re la c i n sa tisfa c to ria
e n tre e l o fe re n te y e l co m p ra d o r.
X Im a g e n d e la fu e rz a d e v e n ta s im a g e n c o n ju n ta d e la fu e rz a d e v e n ta s de! fab rican te.
X 7 C a lid a d del p ro d u c to n iv e l d e c a lid a d p e rc ib id o e n u n p ro d u c to p a r tic u la r ( p o r e je m
p lo , el a c a b a d o o el re n d im ie n to ).

Resultados de compra
S e o b tu v ie ro n d o s m e d id a s e s p e c fic a s q u e re fle ja ro n lo s re su lta d o s d e las re la c io n e s d e c o m p ra
d e l e n c u e s ta d o c o n H A T C O . E sta s m e d id a s in c lu y en :

X9 N iv e l d e fid e lid a d c u n to se c o m p ra a H A T C O d e l to ta l d e l p ro d u c to d e la em p re sa,


m e d id o e n u n a e s c a la d e p o rc e n ta je d e 1 00, q u e v a d e sd e 0 a l 10 0 p o r cien .
26 A N L IS IS M U L TIV A R IA N TE

X 0 N iv e l d e sa tisfa c c i n s a tis fa c c i n d e i c o m p ra d o r c o n (as c o m p ra s a n te rio re s re a liz a


d as a H A T C O , m e d id a s en el m is m o g r fic o d e la e s c a la d e c la s ific a c i n d e la s e n tra d a s
A, a A'..

Caractersticas del comprador

L a s c in c o c a ra c te rstic a s u tiliz a d a s en el e s tu d io , a lg u n a s m tric a s y o tra s n o m tric a s , s o n las


sig u e n te s:

Xy T a m a o de la e m p re sa ta m a o d e la e m p re sa re la tiv o re sp e c to a o tra s e m p re s a s en el
m is m o m e rc a d o . E s ta v a ria b le tie n e d o s c a te g o ra s: 1 = g ra n d e y 0 = p e q u e a .
X C o m p ra d e ta lla d a m e d id a p o r la c u a l un c o m p ra d o r p a rtic u la r e v a l a c a d a c o m p ra se
p a ra d a m e n te (a n lisis del v a lo r to ta l) o en fu n c i n d e u n a c o m p ra d e ta lla d a , d o n d e se e s
p e c ific a n p re c isa m e n te las c a ra c te rs tic a s d el p ro d u c to d es e a d o . E sta v a ria b le tie n e d o s
c a te g o ra s: 1 = e m p le a la a p ro x im a c i n a l a n lis is d e l v a lo r to ta l, e v a lu a n d o c a d a c o m
p ra p o r se p a ra d o y 0 = u so d e la c o m p ra d etallad a .
X 2 E stru c tu ra d e la a d q u isic i n m to d o d e a d q u isic i n /c o m p ra d e p r o d u c to s a u n a c o m
p a a en p articu la r. E s ta v a ria b le tie n e d o s c a te g o ra s: 1 = a d q u is ic i n c e n tra liz a d a y
0 = a d q u isic i n d e s c e n tra liz a d a .
X t. T ip o d e in d u stria c la s ific a c i n d e la in d u s tria a la q u e p e rte n e c e e l c o m p ra d o r d el
p ro d u c to . E sta v a ria b le tie n e d o s c a te g o ra s : 1 = in d u s tria d e la c la s e A y 0 = o tra s
in d u strias.
X ]A T ip o de situ a c i n d e c o m p ra tip o d e situ a c i n a la q u e se e n fre n ta e l c o m p ra d o r. E sta
v a ria b le tie n e tre s c a te g o ra s: 1 = n u e v a ta re a . 2 = re -c o m p ra s im ila r m o d if ic a d a y 3 = re
c o m p ra sim p le.

Otras bases de datos


E n el te x to se u tiliz a n o tra s tre s b a s e s d e d a to s e s p e c ia liz a d a s. El C a p itu lo 2 e m p le a u n a b a s e d e
d a to s m s p e q u e a d e v a ria s de e s ta s v a ria b le s o b te n id a s en a lg u n o s e s tu d io s p re v ia m e n te r e a li
z a d o s. E l p ro p sito es ilu s tra r la id e n tific a c i n d e a tip ic o s. m a n ip u la c i n d e d a to s p e rd id o s y
c o m p ro b a c i n de h ip te sis e s ta d stic a s. L o s C a p tu lo s 8 y 1 e x a m in a n las b a s e s d e d a lo s p a rti
c u la riz a d a s p a ra e s ta s t c n ic a s. E n ca d a c a so , la b a se d e d ato s se d e s c rib e m s e x te n s a m e n te q u e
en o tro s c a p tu lo s. L a lista c o m p le ta d e e s ta s b a s e s d e d ato s se d a en e l A p n d ic e A .

L o s c a p tu lo s re sta n te s del te x to se o rg a n iz a n e n c u a tro se c c io n e s, p r e s e n ta n d o c a d a u n o d e e llo s


u n a fa s e in d e p e n d ie n te en la e je c u c i n d e l a n lis is m u ltiv a ria n te .

S e c c i n 1: P r e p a r a c i n p a r a e l a n l i s i s m u l t i v a r i a n t e se p ro n u n c ia so b re c u e stio n e s
q u e d e b e n s e r re su e lta s a n te s d e la e je c u c i n del an lisis m u ltiv a ria n te . E sta se c c i n c o m ie n z a
co n el C a p itu lo 2, q u e a b o rd a lo s te m a s d e d e c isio n e s s o b re d a to s a u s e n te s , c u m p lim ie n to d e
su p u e sto s estad stic o s su b y a ce n tes e id en tificaci n d e facto res q u e p o d ra n te n e r u n a in flu en cia
d e s p ro p o rc io n a d a s o b re lo s re su lta d o s. E l C a p itu lo 3 c u b re el a n lis is fa c to ria l, u n a t c n ic a
q u e r e s u l t a e s p e c ia lm e n te a d e c u a d a p a r a e x a m in a r la s r e l a c i o n e s e n t r e v a r i a b l e s y
o p o rtu n id a d e s p ara c re a r e s c a la s su m a d a s. S e co m b in an e sto s d o s c a p tu lo s p a ra p ro p o rc io n a r
al in v e stig a d o r ta n to las h e rra m ie n ta s d e d ia g n o sis n e c e sa ria s p a ra la p re p a ra c i n d e lo s d ato s,
c o m o las m e d id a s p a ra la re d u c c i n d e d a to s y c o n s tru c c i n d e e s c a la s q u e se p u e d a n in c lu ir
e n o tra s t c n ic a s de a n lis is in u ltiv a ria n te .
IN T R O D U C C I N 27

S e cci n 2 : Tcnicas d e d e p e n d e n cia a b o rd a cin co t cn ic as d e d e p e n d e n c ia -re g re si n


m ltip le , a n lisis d is c rim in a n te , a n lis is m u ltiv a ria n te d e la v a ria n z a , a n lis is co n ju n to y
co rrelaci n ca n n ic a (C ap tu lo s 4-8 , re sp e ctiv am e n te). L as t cn ic as d e d ep en d en cia, tal y com o
se h a co m en ta d o antes, p e rm ite n al in v e stig a d o r v a lo ra r el g ra d o d e re la c i n en tre lo s v ariab les
d e p e n d ie n te s e in d e p e n d ie n te s. L as t c n ic a s d e d e p e n d e n c ia v a ra n se g n el tip o y n atu ra lez a
d e la relacin, tal y co m o se refleja en las p ro p ied ad es d e m ed ici n d e las v ariab les d ependientes
e in d e p en d ie n te s. S e e x a m in a c a d a t c n ic a e n fu n c i n d e la v a lo ra c i n d e las rela cio n e s d e
d e p e n d e n c ia y d e su c a p a c id a d d e a f ro n ta r un tip o d e o b je tiv o d e in v e stig a c i n esp ecfico .
S e c c i n 3: T cn ica s d e in te rd e p e n d e n c ia (C a p tu lo s 9 y 10) a b o rd a n las t cn ic as
del anlisis c lu ste r y esca la m u ltid im e n sio n a l. E sta s tcn icas p ro p o rc io n a n al in v e stig a d o r unas
h e rra m ie n ta s q u e re s u lta n p a rtic u la rm e n te a d e c u a d a s p a ra v a lo ra r la e s tru c tu ra , d a d o q u e se
c o n c e n tra n e n la d e s c rip c i n d e la s r e la c io n e s e n tre o b je to s, ta n to s u je to s (a n lis is c lu ste r)
c o m o o b jeto s ta le s co m o e m p re sa s , p ro d u c to s, etc., (e sc a la m u ltid im e n sio n a l). C a b e n o ta r q u e
e n la S e c c i n 1 y a se h a tra ta d o u n a d e la s t c n ic a s d e in te rd e p e n d e n c ia p rin c ip a le s, el
a n lis is fac to rial, as c o m o s u c a p a c id a d d e v a lo ra r la r e la c i n e n tre v aria b les.
S e c c i n 4 : T cn ica s a va n za d a s y e m e rg e n te s (C a p tu lo s 11 y 12) p ro p o rc io n a n al
in v e stig a d o r la in tro d u c c i n a u n t c n ic a m u ltiv a ria n te a v a n z a d a d e u so g e n e ra liz a d o , los
m o d e lo s de e c u a c io n e s e s tru c tu ra le s , ju n to c o n n u e v a s t c n ic a s e m e rg e n te s en las re a s d e
la b sq u e d a de d ato s, red e s n e u ro n a le s y b o o tstra p p in g . L o s o b je tiv o s d e e sto s d o s captulos
no e s p re se n ta r u n tra ta m ie n to c o m p le to d e la s c u e stio n e s y u s o s d e e s ta s t c n ic a s, sino
p ro p o rc io n a r u n a in tro d u c c i n q u e p e rm ita al in v e s tig a d o r e l u so p o te n c ia l d e e s ta s t cn ic as
e n situ a c io n e s d e in v e stig a c i n e s p e c fic a s.

E s te c a p tu lo h a in tro d u c id o el te m a d e l a n lis is d e d a to s m u ltiv a ria n te . L o s c a p tu lo s sig u ien tes


d e s c rib e n c a d a u n a de la s t c n ic a s e n su fic ie n te d e ta lle c o m o p a ra p e rm itir a l a n a lis ta n o v el c o m
p r e n d e r q u es lo q u e p u e d e c o n s e g u ir u n a t c n ic a p a rtic u la r, c u a n d o y c m o d e b e ra n a p lic a rs e y
c m o in te rp re ta r lo s re su lta d o s d e s u in te rp re ta c i n . L as le c tu ra s situ a d a s al fin a l d e c a d a c a p itu
lo, e x tra d a s d e la lite ra tu ra a c a d m ic a e s p a o la , m o stra r n la a p lic a c i n y la in te rp re ta c i n d e las
t c n ic a s.

1. D e fin a el a n lisis m u ltiv a ria n te c o n su s p ro p ia s p alab ras.


2. N o m b re v ario s fa c to re s q u e h a n c o n trib u id o a a u m e n ta r la a p lic a c i n d e las t cn ic as del
a n lis is de d a to s m u ltiv a ria n te s en lo s ltim o s aos.
3. E n u m e re y d e sc rib a las t c n ic a s d e a n lis is d e d a to s m u ltiv a ria n te d e s c rita s e n e ste c a p
tu lo . C ite e je m p lo s a d e c u a d o s p a ra c a d a t cn ic a.
4. E x p liq u e c m o y p o r q u lo s d iv e rs o s m to d o s m u ltiv a ria n te s p u e d e n v e rse c o m o u n a
fa m ilia d e t cn ic as.
5. P o r q u es im p o rta n te el c o n o c im ie n to d e la s e s c a la s d e m e d id a p a ra e n te n d e r el an lisis
de d a to s m u ltiv a ria n te ?
6. C u le s so n la s d ife re n c ia s e n tre la sig n ific a c i n p r c tic a y e s ta d stic a ? E s u n p rerre q u i-
sito de la o tra?
7. C u le s so n las im p lic a c io n e s d e u n a p o te n c ia e s ta d s tic a b a ja ? C m o p u e d e a u m e n ta r
s e la p o te n c ia si se c o n s id e ra m u y b aja?
8. E x p liq u e d etallad a m en te la ap ro x im a c i n al d ise o d e m o d e lo s m u ltiv a ria n te s, ce n trn d o se
e n lo s su p u e sto s p rin c ip a le s e n c a d a p aso .
28 a n lisis m u ltiv a ria n te

| B e a rd c n , W illia m O ., R ic h a r d G . N c t e m e y c r . a n d M a r y te m M e a su re s. C h i c a g o : A m e r i c a n M a r k e t i n g
F M o b l e y ( 1 9 9 3 ) , H andhook o f M arketing Scales, A s s o c ia t io n .
M itlti- lr e n i M ensures f o r M arketing a nd Consum ar Statisticai P ow er A n a lysis f o r the
6 . C o h n , J. (1 9 7 7 ),
ffehavior. N c w b u r y P a r k , C a lif .: S a g e . B ehavioral Sciences. N e w Y o rk : A c a d c m i c P re s s .
2 B M D P S t a tis tic a i S o f t w a r e , I n c . ( 1 9 9 1 ) , SO LO Power 7 . G a tty , R . ( 1 9 6 6 ) , M u l l i v a r i a t e A n a l y s i s f o r M a r k e t in g
AnuIr-iis. L o s A n g e le s . R e search : An E v a l u a tio n . A pplied Statistics 15
3. B rc n i, E d w a r d E ., E d w a r d J . M ir ie l li . a n d A la n (N o v e m b e r): 1 5 7 -1 7 2 .
T h o m p s o n ( 1 9 9 3 ) , Ex-Sample : An Expert System lo 8 . H avdyck, C. D .. and L. F. P c trin o v ic h (1 9 7 6 ),
Assist in D ctennining Santple Size, Versin 3.0. ntroduction to Statistics fo r the B ehavioral Sciences,
C o tu m b a , M o .: I d e a W o r k s . 2 d e d . P h ila d e lp h ia : S a u n d e r s .
4 . B re n t, E d w a r d E ., e t a l. ( 1 9 9 1 ) ,Statisticai Navigator 9 . M o o n e y , C h r i s t o p h c r Z ., a n d R o b e r t D . D u v a l ( 1 9 9 3 ) ,
pm fcssional : A n E xpert System to A ssist in B o o ts tr a p p in g : A N o n p a r a m e tr ic A p p r o a c h to
Selecting Appropriate Statisticai Analyses. Versin Statisticai lnference. B e v c r l y H i i l s , C a li f .: S a g e .
1.0. C o lu m b ia , M o .: I d e a W o r k s . 10. S u l l i v a n , J o h n L . , a n d S t a n l e y F e l d m a n ( 1 9 7 9 ) ,
5. B r u n n e r , G o r d o n C . , a n d P a u l J . H e n s e l ( 1 9 9 3 ) , M ltiple Indieators: Alt ntroduction. B e v e r l y H ills ,
Marketing Scales Handhook, A Compilado o f Multi- C a lif .: S a g e .
SE CC I N

P r e p a r a c i n p a r a e l a n l is is
M U L T IV A R IA N T E

V a lo r a c i n g e n e ra l

La Seccin 1 proporciona una serie de herram ientas y anlisis que ayudan a preparar
al investigador para la naturaleza crecientem ente compleja del anlisis multivariante.
El investigador p ru de n te aprecia la necesidad de un conocim iento ms pro fu n do de
los datos, tan to en trm inos estadsticos com o de concepto. A unque las tcnicas
m ultivariantes que se abordan en este texto ofrecen al investigador una serie de
herram ientas poderosas de anlisis, tam bin presentan el riesgo de [a) separar ei
investigador an ms de la posibilidad de a d q u irir una com prensin slida de los
datos y |b) conducir a nociones errneas que presentan una manera fcil y rpida
de identificar relaciones. Dado q ue el investigador depende ms de estas tcnicas
para encontrar la respuesta y m enos d e una base conceptual y de com prensin de las
propiedades fundam entales de los datos, aum enta el riesgo de que aparezcan
problem as serios de aplicacin errnea de las tcnicas, de violacin de las propiedades
estadsticas, o de inferencia e interpretacin de los resultados errneos. Nunca se
pueden elim inar com pletam ente estos riesgos. N o obstante, las herram ientas y anlisis
abordados en esta seccin m ejorarn la capacidad del investigador a la hora de
reconocer muchos de estos problem as conform e aparecen y aplicar el remedio
apropiado.

C a p t u lo s d o la S e c c i n I

Esta seccin comienza con el Captulo 2, Anlisis previo de los datos, q ue aborda los
temas de decisin sobre datos ausentes, cum plim iento de los supuestos estadsticos
subyacentes e identificacin de factores que podran tener un im pacto
desproporcionado sobre los resultados. Estos anlisis proporcionan valoraciones
empricas simples que detallan las propiedades estadsticas crticas de los datos. El
C aptulo 3, referido al anlisis factorial, presenta un debate sobre una tcnica de
interdependencia particularm ente adecuada para exam inar las relaciones entre las
variables y la creacin de escalas sumadas. La bsqueda de la estructura con el
A N L IS IS M U L TIV A R IA N TE

anlisis factorial puede revelar interreaciones im portantes entre variables y puede


p roporcionar una base objetiva para el desarrollo del m odelo conceptual. Por tanto,
los dos captulos de esta seccin se com binan para proporcionar ai investigador no
solam ente las herramientas necesarias para preparar los datos para el anlisis, sino
tam bin la manera apropiada de reduccin de datos y construccin de escalas que
pueden m ejorar notablem ente otras tcnicas de anlisis m ultivariante.
Anlisis previo de los datos

O B J E T IV O S DE A P R E N D IZ A JE
Seleccionar el m todo grfico a prop iad o para exam inar las caractersticas de los datos o
relaciones de inters.
C om prender los diferentes tipos de procesos de datos ausentes.
Evaluar el tip o y el im pacto p otencial d e los datos ausentes.
Explicar las ventajas y desventajas de los enfoques disponibles para tratar con los datos
ausentes.
Identificar los casos atpicos univariantes, bivarlantes y multivariantes.
C om probar en los datos la m ayor parte de los supuestos de las tcnicas multivariantes.
D eterm inar el m ejor m todo de transform acin de los datos dado un problem a especfico.
C om prender la m anera de in co rp o ra r variables n o mtricas com o ciatos mtricos.

E / n este ca p itu lo rev isa rem o s y d e s c rib ire m o s lo s m to d o s h a b itu a lm e n te u tiliz a d o s p a ra ex am in ar


lo s d a to s. E l e x a m e n d e lo s d a to s es u n p a s o n e c e s a rio , q u e lle v a tie m p o , y q u e h a b itu a lm e n te se
d e s c u id a p o r p a r te d e lo s a n a lista s d e d a to s. U n a n lis is c u id a d o so d e lo s d a to s c o n d u c e a u n a m e
j o r p re d ic c i n y a u n a e v a lu a c i n m s p r e c is a d e la d im e n sio n a lid a d . L a s e c c i n in tro d u c to ria d e
e s te c a p tu lo o fre c e u n re su m e n d e v a ria s t c n ic a s g r fic a s q u e se p o n e n a d is p o s ic i n d el in v e s
tig a d o r c o m o m e d io p a ra p re s e n ta r lo s d a to s. E s ta s t c n ic a s p ro p o rc io n a n al a n a lis ta u n c o n ju n to
d e fo rm a s sim p le, au n q u e co m p leto , d e e x a m in a r tan to las v aria b les in d iv id u ales c o m o las relaciones
e n tre ellas. O tro s p ro b le m a s q u e c o n c ie rn e n al a n a lista c u a n d o e s t e x a m in a n d o lo s d a to s so n c m o
e v a lu a r y so lu c io n a r lo s p ro b le m a s e n el d is e o d e la in v e stig a c i n y e n la re c o g id a d e d a to s. M s
c o n c re ta m e n te , este c a p itu lo s e d irig e a la e v a lu a c i n d e lo s d a to s a u s e n te s , id e n tific a c i n d e
c a s o s a tp ic o s y c o m p ro b a c i n d e lo s s u p u e s to s s u b y a c e n te s en la m a y o r p a r te d e la s tcn icas
m u ltiv a ria n te s . L o s d a to s a u s e n te s so n u n a m o le s tia p a ra lo s in v e stig a d o re s. P u e d e n se r p ro d u c to
A N L IS IS M U L TIV A R IA N TE

d e e rro re s en la in tro d u c c i n d e lo s d a lo s o d e la o m isi n d e re s p u e s ta s p o r p a n e d e lo s e n c u e s ta -


d os. E n e ste c a p itu lo se d isc u tir la c la sific a c i n d e lo s d a to s a u s e n te s y lo s p ro c e so s o ra z o n e s q u e
ex p lic a n su p re se n c ia . L o s c a so s a lip ic o s, o re sp u e s ta s ex tre m as, p u ed e n in flu e n c ia r in d e b id a m e n te
el resu ltad o de un an lisis m u ltiv aria n te. P o r e s ta raz n , se d isc u te n a co n tin u ac i n lo s m to d o s p ara
ev a lu a r su im pacto. F in alm en te , se rev isa n lo s su p u e sto s q u e su b y acen en la m a y o r p a rte d e lo s a n
lisis m ultiv arian tes. P ara a p lic a r c u a lq u ie r t c n ic a m u ltiv arian te. el in v e stig a d o r d eb e e v a lu a r el aju s
fe d e la m u e stra d e d a to s co n lo s su p u e sto s s u b y a c e n te s e n la t c n ic a m u ltiv a ria n te . P o r e je m p lo ,
lo s in v e stig a d o re s q u e d e se a n a n a liz a r el a n lis is d e re g re si n (C a p tu lo -i) e s ta r n p a r tic u la rm e n
te in te re sa d o s en e v a lu a r lo s su p u e sto s d e n o rm a lid a d , h o m o c c d a stic id u d . in d e p e n d e n c ia d e l e rro r
y lin e a lid a d . C a d a u n a de e s ta s c u e s tio n e s d e b e ra n s e r a b o rd a d a s en cierta m e d id a p a ra c a d a a p li
ca ci n d e la t c n ic a m u ltiv a ria n te .
A d ic io n a lm e n te , e n este c a p tu lo se in tro d u c e al in v e stig a d o r en lo s m to d o s p a ra in c o rp o ra r
las v a ria b le s n o m tric a s en a p lic a c io n e s q u e r e q u ie re n v a ria b le s m tric a s m e d ia n te la c re a c i n d e
un tip o de v a ria b le m tric a e sp e c ia l c o n o c id a c o m o v a ria b le ficticia . L a a p lic a b ilid a d d e l u s o de
las v a ria b le s fic tic ia s v a ria co n c a d a p ro y e c to d e a n lis is d e d atos.

tf t i ; t-' t ' <

L a s ta re a s im p lc ita s e n el e x a m e n p r e v io d e lo s d a to s p u e d e n p a r e c e r in s ig n if ic a n te s y sin
c o n s e c u e n c ia s a p rim e ra v ista , p e ro s o n u n a p a rte e s e n c ia l d e l a n lis is m u ltiv a ria n te . S i b ie n las
t c n ic a s m u ltiv a ria n te s s u p o n e n un Ire m e n d o p o d e r a n a ltic o e n m a n o s d el in v e s tig a d o r, ta m b i n
c re a n u n a g ra n ca rg a p a ra s te , y a q u e tie n e q u e a s e g u ra rse d e q u e se m a n te n g a n lo s c im ie n to s
te ric o s y e s ta d s tic o s so b re la s q u e se b a s a n . E x a m in a n d o c o n a n te r io r id a d lo s d a to s d e ht
a p lic a c i n de u n a t c n ic a m u ltiv a ria n te , el in v e s tig a d o r g a n a u n a c o m p re n si n b s ic a d e lo s d ato s
y las re la c io n e s e n tre las v a ria b le s. E n p rim e r lu g a r, el in v e s tig a d o r o b tie n e u n c o n o c im ie n to
b sic o d e lo s d ato s y las re la c io n e s e n tre las v a ria b le s. L as t cn ic as m u ltiv a ria n te s p la n te a n g ra n d e s
d e m a n d a s al a n a lis ta en la c o m p re si n , in te rp re ta c i n y a rtic u la c i n d e re s u lta d o s b a s a d o s en
re la c io n e s c u y a c o m p le jid a d e s t e n c o n tin u o a u m e n to . El c o n o c im ie n to d e las in ie rre la e io n c s de
v a ria b le s p u ed e a y u d a r e n o rm e m e n te e n la e s p e c ific a c i n y re fin a m ie n to d el m o d e lo m u ll uriante.
asi c o m o p ro p o rc io n a r u n a p e rs p e c tiv a ra z o n a b le p a ra la in te rp re ta c i n d e lo s r e s u lta d o s . En
se g u n d o lugar, las t c n ic a s m u ltiv a ria n te s d e m a n d a n m u c h o m s d e lo s d ato s q u e s e v a n a analizar.
L a p o te n c ia e s ta d s tic a d e la s t c n ic a s m u ltiv a r ia n te s re q u ie re g ra n d e s c o n ju n to s d e d a to s y
s u p u e sto s m s c o m p le jo s q u e lo s q u e e n c o n tra m o s en lo s a n lis is u n iv a ria n te s. L a s o fistic a c i n
a n a ltic a n e c e s a ria p a ra a s e g u ra r q u e se c o n s ig u e n lo s re q u e rim ie n to s e s ta d s tic o s al a p lic a r la
t c n ic a m u ltiv a ria n te e le g id a , o b lig a al a n a lis ta a u s a r u n a se rie d e t c n ic a s d e e x a m e n d e lo s d ato s
q u e en m u c h a s o c a sio n e s r iv a liz a en c o m p le jid a d c o n la p ro p ia t c n ic a m u ltiv a ria n te . A d e m s, los
e fe c to s d e lo s d a to s a u s e n te s, lo s c u a le s p o r d e fin ic i n n o se re p re se n ta n d ire c ta m e n te en los
re su lta d o s, p u e d e n s e r su sta n c ia le s p o r el im p a c to q u e tie n e n s o b re la n a tu ra le z a y c a r c te r d e lo s
re su lta d o s. El p ro p sito d e e s te c a p itu lo es p ro p o rc io n a r u n a v isi n g e n e ra l d e la s t c n ic a s d e
ex a m e n d e los d ato s, q u e v an d esd e el sim p le p ro c e so d e in sp ecci n v isu al d e lo s g r fic o s al p ro ceso
e s ta d stic o m u ltiv a ria n te q u e re q u ie re el a n lis is d e d a to s a u s e n te s y a la c o m p ro b a c i n d e los
s u p u e sto s su b y a c e n te s en lo d o s los m to d o s m u ltiv a ria n te s .
T an to lo s a n a lis ta s n o v e le s c o m o lo s e x p e rim e n ta d o s p u e d e n se n tirse te n ta d o s d e le e r p o r
e n c im a o in c lu so s a lta rse e s te c a p tu lo , p a ra ir d ire c ta m e n te a lo s c o n o c im ie n to s re fe r e n te s a la
a p lic a c i n d e u n a t c n ic a o t c n ic a s m u ltiv a ria n te s . A u n q u e p u e d a p a re c e r q u e es m a lg a s ta r el
tie m p o , el esfu e rz o y los re c u rso s d e d ic a d o s al p ro c e s o d e ex a m e n d e los d a to s, el in v e s tig a d o r d eb e
v e r e s ta s t c n ic a s co m o u n a in v e rsi n en un s e g u ro m u ltiv a ria n te . In c lu so a u n q u e u n a t c n ic a
sirv a p a ra h a c e r u n a e s tim a c i n a d e c u a d a y o b te n e r re s u lta d o s , lo s p ro b le m a s o c u lto s q u e
su rg en d e las c u e stio n e s e x p u e sta s en e s te c a p tu lo p u e d e n c o n d u c ir a p ro b le m a s p o te n c iu lm e n te
ca ta str fic o s. S e p u ed e n e v ita r e sto s p ro b le m a s al s e g u ir e sto s a n lis is ca d a v e z q u e se a p liq u e una
t c n ic a m u ltiv a ria n te . E sto s e s fu e rz o s re c o m p e n s a r n el e s fu e rz o a larg o p la z o , e v ita n d o c o m e te r
A N L IS IS P R E V IO D E L O S DATOS 33

un e rro r se rio y p o sib le m e n te fatal. D e sd e a q u i a n im a m o s ai le c to r a a d o p ta r e s ta s t c n ic a s antes


d e v e rse o b lig a d o a re c tific a r p o ste rio rm e n te a c a u s a d e lo s p ro b le m a s su rg id o s d u ra n te el an lisis.
El c a p itu lo n o s re m ite a c u a tro fa se s d is tin ta s d e l e x a m e n d e lo s d a to s. sta s in c lu y en : ( ! ) un
e x a m e n g r fic o d e la n a tu ra le z a d e las v a ria b le s a a n a liz a r y la s re la c io n e s q u e fo rm a n ias b ases
del a n lis is m u ltiv a ria n te , (2 ) u n p ro c e s o d e e v a lu a c i n p a ra e n te n d e r el im p a c to q u e p u ed e n te
n e r lo s d a to s a u s e n te s s o b re el a n lis is, y u n a s e rie d e a lte rn a tiv a s p a ra c a s o s re ite ra d o s d e a u s e n
c ia de d a to s en e l a n lis is, (3 ) la s t c n ic a s q u e m e jo r se a ju sta n p a ra la id e n tific a c i n d e ca so s
a tip ic o s, a q u e llo s c a so s q u e p o r s u sin g u la rid a d p u e d e n d is to rs io n a r las re la c io n e s s o b re u n a o m s
v a ria b le s e s tu d ia d a s y (4 ) lo s m to d o s a n a ltic o s n e c e s a rio s p a ra e v a lu a r a d e c u a d a m e n te la c a p a
c id a d d e lo s d a to s p a ra c u m p lir lo s s u p u e sto s e s ta d s tic o s e s p e c fic o s d e m u c h a s t c n ic a s m u lti
v a ria n te s . E s te c a p tu lo se c o n c lu y e c o n la in tro d u c c i n d e u n a t c n ic a p a r a in c o rp o ra r v a ria b le s
n o m tric a s c u a n d o s e re q u ie re n v a ria b le s m tric a s. S e c re a n u n a se rie d e v a ria b le s m tric a s d e
re e m p la z o p a ra re p re s e n ta r las c a te g o ra s d e las v a ria b le s n o m trica s.

C o m o se h a d is c u tid o a n te s, e l u s o d e las t c n ic a s m u ltiv a ria n te s s u p o n e u n a m a y o r c a rg a p a ra el


in v e s tig a d o r a la h o ra d e e n te n d e r, e v a lu a r e in te rp re ta r os re s u lta d o s m s c o m p le jo s. E n e s ta s ta
re a s, la a y u d a p ro v ie n e d e la c o m p re n s i n d e la s c a ra c te rs tic a s b s ic a s d e lo s d a to s y d e su s re la
c io n e s su b y a c e n te s. C u a n d o se c o n s id e ra u n a n lis is u n iv a ria n te , el n iv e l d e c o m p re n s i n es m u y
sim p le. P ero a m e d id a q u e e l in v e stig a d o r se in tro d u c e e n lo s m s c o m p le jo s an lisis m u ltiv arian tes,
la n e c e s id a d y el n iv e l de c o m p re n s i n a u m e n ta n c o n s id e ra b le m e n te . E sta se c c i n re v isa alg u n o s
d e lo s m to d o s g r fic o s b s ic o s q u e e x is te n p a ra a y u d a r a la o b te n c i n d e u n a c o m p re n s i n b si
c a d e las c a ra c te rs tic a s de lo s d a to s, p a rtic u la rm e n te e n u n s e n tid o m u ltiv a ria n te .
L a a p a ric i n y la d ifu si n del u s o d e p ro g ra m a s e s ta d stic o s d ise a d o s p a ra o rd e n a d o re s p e r
so n a le s h a lle v a d o a u n a m e jo ra d e l a c c e s o a ta le s m to d o s. L a m a y o ra d e lo s p ro g ra m a s e s ta d s
tic o s tie n e n m d u lo s p a rtic u la rm e n te c o m p re n siv o s d e t cn ic as g r fic a s p re p a ra d a s p a ra e l ex a m e n
d e lo s d a to s q u e se v e n m e jo ra d a s m u c h a s v e c e s c o n m e d id a s e s ta d stic a s m s d e ta lla d a s d e la d e s
c rip c i n d e lo s d a to s. L a s sig u ie n te s s e c c io n e s ilu s tra r n a lg u n a s d e la s t c n ic a s u s a d a s d e fo rm a
m s c o m n e n el e x a m e n de la s c a ra c te rs tic a s d e la d is trib u c i n , re la c io n e s b iv a ria n te s , d ife re n
c ia s p o r g ru p o s e in c lu so p e rfile s m u ltiv a ria n te s .

La naturaleza de la variable: A nlisis de la form a


de la distribucin

E l p u n to d e p a rtid a p a ra e n te n d e r la n a tu ra le z a d e c u a lq u ie r v a ria b le es c a ra c te riz a r la fo rm a d e su


d istrib u c i n . A lg u n a s m e d id a s e s ta d stic a s s e d isc u tir n en u n a se c c i n p o s te rio r d e d ic a d a a la n o r
m a lid a d . N o o b sta n te , m u c h a s v e c e s el in v e s tig a d o r p u e d e o b te n e r u n a p e rs p e c tiv a a d e c u a d a de
la v a ria b le a tra v s d e u n h is t o g r a m a . U n h is to g ra m a es u n a re p re s e n ta c i n g r fic a d e lo s d ato s
q u e m u e s tra la fre c u e n c ia de lo s c a so s (v a lo re s d e lo s d a to s ) e n c a te g o ra s d e d a to s. L a s fre c u e n
cia s se re p re se n ta n p a ra ex a m in a r la fo rm a d e la d istrib u c i n d e resp u estas. S i el ra n g o d e resp u estas
v a d e 1 a 10, e l in v e stig a d o r p u e d e c o n s tru ir u n h isto g ra m a c o n ta n d o el n m e ro d e re s p u e sta s que
fu e ro n u n u n o , un d o s, e tc . P a ra las v a ria b le s c o n tin u a s se fo rm a n c a te g o ra s, d e n tro d e la s cu a le s
la fre c u e n c ia d e lo s v a lo re s d e d a to s es t ta b u la d a . P o r e je m p lo , las re sp u e sta s p a ra Aj d e la b ase
d e d a to s in tro d u c id a e n el C a p tu lo 1 se m u e s tra n en la F ig u ra 2 .1 . S e u sa n las c a te g o ra s d e p u n
to s in te rm e d io s 0,0, 0 ,5 , 1,0, 1,5..., h a s ta 6 ,0 . L a a ltu r a d e la s b a rra s re p re se n ta la fre c u e n c ia d e los
v a lo re s d e lo s d a to s en ca d a c a te g o ra . Si e l e x a m e n d e la d istrib u c i n tie n e c o m o o b je tiv o ev a lu a r
su n o rm a lid a d (p a ra m s d e ta lle s s o b re este a s u n to v a s e u n a s e c c i n p o s te rio r so b re lo s su p u e s
to s d e c o m p ro b a c i n ), se p u e d e su p e rp o n e r la c u r v a n o rm a l s o b re la d is trib u c i n , c o m o se h a he-
A N L IS IS M U L T IV A R IA N T E

X ,: V elocidad de entrega

F IG U R A 2 .1 . U n a r e p r e s e n t a c i n g r f i c a d e u n a d i s t r i b u c i n u n i v a r i a n t e : El h i s t o g r a m a .

c h o e n la F ig u ra 2 .1 . E l h isto g ra m a p u e d e u tiliz a rs e p a ra e x a m in a r c u a lq u ie r tip o d e v a ria b le , d e s


d e lo s v a lo re s o rig in a le s a lo s re s id u o s d e u n a t c n ic a m u ltiv a ria n te .
U n a v a ria n te d e l h isto g ra m a es el d i a g r a m a d e ta llo y h o ja s q u e p re s e n ta el m is m o cu a d ro
g r fic o p e ro q u e ta m b i n p ro p o rc io n a u n a e n u m e ra c i n d e lo s v a lo re s d e lo s d a to s re a le s . E l d ia
g ra m a d e ta llo y h o ja s d e la F ig u ra 2 .2 s e c o m p o n e d e ta llo y h o ja s. E l ta llo es e l v a lo r ra z , al cual
se le a a d e n h o jas. P o r e je m p lo , e n la F ig u ra 2 .2 , el p rim e r ta llo es 0 ,0 . A e s to se le a a d e la hoja
de 0, re su lta n d o e n un v a lo r de cero.
E n el s ig u ie n te ta llo , a u n v a lo r de 0 .6 se le a a d e el ta llo d e ce ro , re s u lta n te e n u n v a lo r d e 0.6.
S i se c o m p ila n la s fre c u e n c ia s d e A j, 0 ,0 y 0 ,6 so n lo s d o s p rim e ro s v a lo re s. E n el o tro e x tre m o d e
la fig u ra , el ta llo es 6,0. S e a s o c ia c o n d o s h o ja s (0 y 1), re p re se n ta n d o lo s v a lo re s 6 .0 y 6 .1 . s-

F rc cu en d a Tallo y hojas

1.00 0 * 0
1,00 0 6
3,00 1 * 013
7,00 1 6688999
12,00 2 001333444444
10,00 2 5566788899
18.00 3 N, 000001111233444444
10,00 3 5666777889
10,00 4 * (XII122233
10,00 4 556778999
11.00 5 * OOII2223344
5.00 5 55689
2,00 6 * 01

A nchura del tallo: 1.0


Cada hoja: 1 caso (s)

C asos vlidos: I00. C asos perdidos: 0 .0 Porcentaje perdido: 0,0

F IG U R A 2 .2 . G r f ic o d e t a l l o y h o j a s d e X , ( v e l o c i d a d d e e n t r e g a ) .
36 A N L I S IS M U L T IV A R IA N T E

- 0 .3 4 9 0 .5 0 9 0 .0 5 0 0 .6 1 2 0 .0 7 7 - 0 .4 8 3 0 ,6 7 6

- 0 .4 8 7 0 .2 7 2 0 .5 1 3 0 ,1 8 6 0 .4 7 0 0 ,0 8 2

Gk

A' - 0 .1 1 6 0 .0 6 7 - 0 ,0 3 4 - 0 .4 4 8 0 ,5 5 9

nll

0 .2 9 9 0 .7 8 8 0.200 0 ,2 2 4

0,241 - 0 .0 5 5 0,701

0 .1 7 7 0 ,2 5 6

x7 - 0 ,1 9 2
.* #>
JL

th
X; A, X, X* x7 X*
V e lo c id a d N iv e l F le x ib ilid a d Im a g e n S e rv ic io tin a g e n d e la C a lid a d d e l N iv e l d e
d e en tres: d e p re c io s d e p re c io s d e l f a b ric a n te c o n ju n to f u e rz a d e v e n ta s p ro d u c to fid e lid a d

F IG U R A 2 .3 . M a tr iz d e l g r f i c o d e d i s p e r s i n d e v a r i a b l e s m t r i c a s .
N ota: L os v a lo re s p o r e n c im a d e ia d ia g o n a l s o n c o r re la c io n e s b i v a ria n te s, c o n g r fic o s d e d is p e r s i n c o r r e s p o n d ie n te s p o r d e b a jo d e
la d ia g o n a l. La d ia g o n a l p r e s e n ta la d is trib u c i n d e c a d a v a ria b le .

L os v a lo re s e x tre m o s so n a q u e lla s o b se rv a c io n e s m a y o re s q u e e st n a 1.5 c u a rtilc s fu e ra d e los


lim ite s d e la caja.
La F ig u ra 2 .4 m u e s tra el g r fic o d e c a ja s p a ra A", (v e lo c id a d d e e n tre g a ) p a ra c a d a g ru p o deA j^
(tip o s d e s itu a c io n e s d e c o m p ra ) d e la b a s e d e d a to s d e H A T C O . L o s tre s g ru p o s tie n e n un c o n
ju n to d e v alo re s m u y d ife re n te , lo q u e ind ica q u e e x iste n v e rd a d e ra s d ife re n c ia s e n tre lo s g ru p o s
en t rm in o s d e p e rc e p c io n e s d e la v e lo c id a d d e e n tre g a . El g r fic o p a ra el p rim e r tip o d e situ a c i n
de c o m p ra ta m b i n in d ic a q u e e x iste u n c a s o a tip ic o . El in v e s tig a d o r d e b e ra e x a m in a r es ta o b
s e rv a c i n y c o n s id e ra r las p o s ib le s s o lu c io n e s. L as m ism a s p a ra la e x is te n c ia d e c a so s a tp ic o s se
d isc u tir n en p ro fu n d id a d p o s te rio rm e n te .
A N L IS IS P R E V IO D E L O S DATOS 35

to s so n lo s d o s m a y o re s v a lo re s p a ra A j. E! d ia g ra m a d e h o ja s y ta llo s p r o p o rc io n a un p erfil g e
n e ra l d e la d istrib u c i n d e la m is m a fo rm a q u e se e n c u e n tra en e l h isto g ra m a , a d e m s d e lo s v a
lo re s d e lo s d a to s reales.

Anlisis de relacin entre variables


El e x a m e n d e la d istrib u c i n de u n a v a ria b le es e s e n c ia l, p e ro m u c h a s v e c e s e! in v e s tig a d o r est
in te re sa d o e n e x a m in a r la s re la c io n e s e n tre d o s o m s v a ria b le s. E l m to d o m s p o p u la r d e a n li
sis d e las re la c io n e s b iv a ria n te s e s el g r f ic o d e d is p e r s i n , un g r fic o d e p u n to s d e d ato s b a s a
d o s e n d o s v a ria b le s . S e p re se n ta u n a v a ria b le e n el e je h o riz o n ta l y la o tra e n el v e rtic a l. Las
v a ria b le s p u e d e n se r v alo re s o b se rv a d o s, v a lo re s e s p e ra d o s o in c lu so r e s id u o s . L o s p u n to s d e l g r
fic o re p re se n ta n lo s c o rre sp o n d ie n te s v a lo re s c o n ju n to s d e las v a ria b le s p a ra c u a lq u ie r c a so dado.
El p a tr n de lo s p u n to s re p re se n ta la r e la c i n e n tre las v a ria b le s. C u a n d o lo s p u n to s se o rg an iz an
a lo larg o d e u n a ln e a re c ta , te n e m o s u n a re la c i n lin e al d e c o rre la c i n . U n c o n ju n to d e p u n to s c u r
v a d o s p u e d e in d ic a r u n a re la c i n n o lin e a l, q u e se p u e d e tra ta r d e v a ria s fo rm a s (v a s e la u lte rio r
d isc u si n so b re lin e a lid a d ). O p u e d e q u e n o e x is ta n p a tro n e s, s lo un c o n ju n to d e p u n to s a p a
r e n te m e n te a le a to rio s. E n e s te c a so , n o h a y re la c i n .
E x iste n m u c h o s tip o s d e g r fic o s d e d isp e rs i n , p e r o u n fo rm a to q u e se a ju s ta p a rtic u la rm e n
te a la s t c n ic a s m u ltiv a ria n te s e s la m a triz d e l g r fic o d e d is p e rs i n (v a se F ig u ra 2.3 ). A q u se
re p re se n ta e l g r fic o d e d isp e rs i n p a ra to d a s la s c o m b in a c io n e s d e v a ria b le s en la p o rc i n in fe
r io r de la m a triz. L as d ia g o n a le s c o n tie n e n lo s h isto g ra m a s d e las v a ria b le s . E n la p a rte su p e rio r
d e la m a triz se in c lu y e n las c o rre la c io n e s c o rre s p o n d ie n te s p a ra q u e e l le c to r p u e d a v a lo ra r la c o
rre la c i n re p re s e n ta d a en c a d a g r fic o d e d is p e rs i n . L a F ig u ra 2 .3 p re s e n ta lo s g r fic o s d e d is
p e rs i n de u n c o n ju n to d e v a ria b le s d e la b a s e d e d a to s d e H A T C O (A j, Af2, A j, X A, X s, Aj., X v Aj, y
Afy). P o r e je m p lo , e l g r fic o de d is p e rs i n e n tre X ] y A j d e la e s q u in a d e a b a jo a la iz q u ie rd a re
p re s e n ta u n a c o rre la c i n d e 0 ,6 7 6 . L o s p u n to s e s t n m u y a lin e a d o s a lre d e d o r d e u n a ln e a recta,
in d ic a n d o u n a e le v a d a c o rre la c i n . E l g r fic o d e d is p e rs i n d e la c o lu m n a m s a la iz q u ie rd a y te r
c e ro d e s d e a rrib a (Aj v e rsu s A j) d e m u e s tra lo c o n tra rio , u n a a u s e n c ia ca si to ta l d e re la c i n co m o
e v id e n c ia la a m p lia d isp e rs i n d e lo s p u n to s y la c o rre la c i n d e 0 ,0 5 0 . L a s m a tric e s d e g r fic o s de
d isp e rs i n y lo s g r fic o s in d iv id u a le s se e n c u e n tra n y a e n to d o s lo s p ro g ra m a s d e e sta d stic a . D is
c u tire m o s e n u n a se c c i n p o s te rio r u n a v a ria n te d e l g r fic o d e d is p e rs i n p a ra d e te c ta r c a so s at-
p ic o s , d o n d e s o b re p o n d r e m o s u n a e lip s e q u e r e p r e s e n ta u n in te rv a lo d e c o n f ia n z a p a ra u n a
d is trib u c i n n o rm a l b iv a ria n te p a ra p o d e r id e n tific a r lo s c a s o s atp ic o s.

A nlisis de las diferencias entre grupos


E l in v e s tig a d o r s e e n fre n ta ta m b i n c o n la ta re a d e e n te n d e r e l c a r c te r y la d ife re n c ia e n tre d o s o
m s g ru p o s d e u n a v a ria b le p a ra d o s o m s v a ria b le s m tric a s, ta l y c o m o o c u rre e n el a n lisis d is
c rim in a n te , a n lis is d e la v a ria n z a y a n lis is m u ltiv a ria n te d e la v a ria n z a . E n e sto s c a so s, el in
v e s tig a d o r n e c e sita e n te n d e r c m o se d istrib u y e n lo s v a lo re s p a ra ca d a g ru p o y si ex isten suficientes
d ife re n c ia s e n tre ello s c o m o p a ra te n e r sig n ific a c i n e s ta d stic a . O tro a sp e c to im p o rta n te es id en
tif ic a r lo s c a s o s a tp ic o s q u e p u e d e n re s u lta r s e r a p a re n te s s lo c u a n d o lo s v a lo re s d e lo s d ato s se
s e p a ra n e n g ru p o s. El m to d o q u e se u tiliz a p a ra e s ta ta re a es el g r fic o d e c a ja s ( b o x p lo t) , u n a r e
p re s e n ta c i n g r fic a d e la d istrib u c i n d e lo s d a to s. L o s lm ite s s u p e rio r e in fe rio r d e la ca ja m a r
c a n io s c u a rtile s s u p e rio r e in fe rio r d e la d is trib u c i n d e lo s d a to s. P o r ta n to , la lo n g itu d d e la caja
e s la d ista n c ia e n tre e l p rim e r y el te rc e r c u a rtil, d e fo rm a q u e la c a ja c o n tie n e el 5 0 p o r c ie n to de
lo s d a to s c e n tra le s d e la d istrib u c i n . L a ln e a d e n tro d e la c a ja s e a la la p o s ic i n d e la m ed ian a.
Si s ta c a e c e rc a d e l fin a l d e la c a ja , se in d ic a la p re s e n c ia d e a sim e tra . C u a n to m a y o r es la caja,
m a y o r es la e x te n si n d e la s o b se rv a c io n e s. L a s ln e a s q u e s e e x tie n d e n d e s d e c a d a c a ja (lla m a
d a s b ig o te s ) re p re se n ta n la d is ta n c ia e n tre la m a y o r y la m e n o r d e las o b se rv a c io n e s q u e e s t n a
m e n o s d e u n c u a rtil d e la caja. E sto s v a lo re s e s t n m a rc a d o s c o n u n a X . L o s c a s o s atp ic o s so n o b
s e rv a c io n e s q u e se sit a n e n tre 1,0 y 1,5 c u a rtile s fu e ra d e la caja.
A N L IS IS P R E V IO D E L O S DATOS 37

,
U

l 4
3
.*2
j* 2
*
>T
o

-2
i 2 3
X] 4* T ipo de situacin de com pra

F IG U R A 2 .4 . G r fic o d e c a ja s y b ig o te s .

Perfiles m ultivariantes
H a sta a h o ra , lo s m to d o s g rfico s s e h a n c e id o a re p re se n ta c io n e s u n iv a ria n te s o b iv a rian te s. P ero
e n m u c h a s in sta n c ia s, e l in v e stig a d o r p u e d e d e s e a r c o m p a ra r o b s e rv a c io n e s c a ra c te riz a d a s p o r la
p re s e n c ia d e m s de d o s v a ria b le s , n e c e s ita n d o u n m e d io d e p r e s e n ta r u n p e rfil m u ltiv a ria n te de
u n a o b se rv a c i n , ta n to si es p a ra p ro p sito s d e s c rip tiv o s c o m o si e s u n c o m p le m e n to p a ra p ro c e
d im ien to s analticos. P a ra sa lv ar estas d ific u lta d e s se h an elab o rad o v ario s m to d o s d e g rfico s m u l
tiv a ria n te s q u e se c e n tra n e n u n a d e e s ta s tr e s a p ro x im a c io n e s [7 ], L o s p rim e ro s s o n (a ) lo s g ly p h s
o m e tro g ly p h s, q u e so n un tip o d e c rc u lo c o n ra d io s q u e c o rre s p o n d e n a los v a lo re s d e lo s d ato s
o (b ) u n p e rfil m u ltiv a ria n te , q u e re p re s e n ta u n d ia g ra m a d e b a rra s p a ra c a d a o b s e rv a c i n . U n a se
g u n d a fo rm a d e re p re se n ta c i n m u ltiv a ria n te im p lic a u n a tra n s fo rm a c i n m a te m tic a d e lo s d ato s
o rig in a le s e n u n a re la c i n m a te m tic a , q u e p u e d a se r re p re s e n ta d a g r fic a m e n te . L a t c n ic a m s
c o m n es la tra n sfo rm a c i n d e A n d re w F o u rie r. L a ltim a a p ro x im a c i n es e l u so d e re p re se n ta
c io n e s g r fic a s c o n re p re se n ta tiv id a d ic n ic a , s ie n d o la m s p o p u la r la c a ra [3 ]. E l v a lo r d e este
tip o d e re p re se n ta c i n es la in h e re n te c a p a c id a d q u e tie n en lo s se re s h u m a n o s p a ra p ro c e s a r su
in te rp re ta c i n . C o m o s e a la C h e m o f f [3. p a g . 9]:

C r e o q u e a p r e n d e m o s m u y p r o n to a e s t u d i a r y r e a c c i o n a r a lo s r o s tr o s . N u e s t r o c a t l o g o d e r e s p u e s ta s
a l o s r o s t r o s a g o ta u n a g r a n p a r t e d e n u e s t r o d i c c i o n a r i o d e e m o c i o n e s e id e a s . P e r c i b i m o s l a s c a r a s
c o m o u n e s p r it u y n u e s t r o o r d e n a d o r e s m u y r p i d o e n o b t e n e r la i n f o r m a c i n r e le v a n t e y f iltr a r
e l r u id o c u a n d o n o s e n f r e n t a m o s a u n n m e r o lim i ta d o d e c a r a s .

L a s re p re se n ta c io n e s fa c ia le s p ro p o rc io n a n u n p o te n te fo rm a to g r fic o p e ro ta m b i n d a n lu g a r
a u n n m e ro de c o n s id e ra c io n e s e n tre las q u e se e n c u e n tra n la a s ig n a c i n d e v a ria b le s a ca ra c te
re s fa c ia le s, p e rc e p c io n e s in v o lu n ta ria s y la c a n tid a d d e in fo rm a c i n q u e re a lm e n te p u e d e se r tra
ta d a . L a d isc u si n d e e sto s a su n to s est m s a ll d el o b je tiv o d e es te te x to y a c o n se ja m o s a los
le c to r e s in te re sa d o s q u e lo s T epasen a n te s d e u tiliz a r e s to s m to d o s [10- 1
L a F ig u ra 2 .5 c o n tie n e u n a ilu s tra c i n d e e s to s tre s tip o s d e r e p r e s e n ta c io n e s g r f ic a s m u l
t i v a r i a n t e s q u e fu e ro n re a liz a d a s c o n SY S T A T , p e ro q u e se p u e d e n o b te n e r c o n m u c h o s p ro g ra
m a s estad stic o s d e o rd e n a d o r perso n al. L a p a rte su p e rio r d e la F ig u ra 2.5 c o n tie n e e je m p lo s d e cad a
u n a d e las re p re se n ta c io n e s g r fic a s m u ltiv a ria n te s : p e rfile s, tra n sfo rm a c io n e s d e F o u rie r y caras
c n ic as. L o s v a lo re s d e c u a tro o b s e rv a c io n e s s o b re sie te v a ria b le s e s t n en u n a ta b la a! fin al d e
la fig u ra . E n este e je m p lo , lo s d a to s so n p e rfile s d e lo s c u a tro g ru p o s d e c lie n te s re sp e c to d e los
sie te fa c to re s d e re su lta d o s d e la b a se d e d a to s d e H A T C O . A p a rtir d e lo s v a lo re s d e lo s d ato s
38 A N L IS IS M U L TIV A R IA N TE

P e rfile s n w lU v a ria n te s
G rupo I G rupo 2 G rupo 3 G rupo 4

T ra n s fo rm a c io n e s d e A n d rc w F o u r ie r
G rupo 1 G rupo 2 G rupo 3 G rupo 4
Componentes Fourier

3
O o
Si. u-

E
a o
U u 6

G rados G rados Grados Grados

C a r a s d e C h e rn o f f
G rupo 1 G rupo 2 G rupo 3

D a to s re a le s

G rupo V, .Y, Y, -Y, X< x* X-

1 4.794 1,622 8.267 4,717 3.222 2.067 5.044

2 2.011 2.133 6.544 5.267 2.039 2.672 8.483

3 3,700 4.138 6.008 6.242 3.90U 3.233 8.258

4 4.809 1.510 9.319 5,690 3.148 3,195 6.48 i

F IG U R A 2 .5 . E jem plos de representacin grfica m ultivariante.

re a le s , la s sim ilitu d e s y las d ife re n c ia s s o n d ifc ile s d e d istin g u ir, in c lu so en la m e d id a e n q u e p u e


d e q u e n o e x ista n d ife re n c ia s. El o b je tiv o d e lo s p e rfile s m u ltiv a ria n te s es r e p re s e n ta r lo s d a to s de
ta l fo rm a q u e p e rm ita n id e n tific a r f c ilm e n te la s s im ilitu d e s y las d ife re n c ia s . L a p r im e ra re p re
se n ta c i n c o n s iste en p e rfile s m u ltiv a ria n te s , q u e m u e stra n q u e la p a rle s itu a d a e n el e x tre m o iz
q u ie rd o d e la d istrib u c i n es m u y b a ja p a ra el g ru p o d o s, y a lta p a ra lo s g ru p o s u n o y c u a tro . E ste
p a tr n c o rre sp o n d e a lo s v a lo re s d e A j. y se p u e d e n h a c e r c o m p a ra c io n e s e n tre lo s g ru p o s e n una
so la v a ria b le o a tra v s de v a ria b le s p a ra u n so lo g ru p o . El s e g u n d o tip o d e re p re s e n ta c i n g r fi
c a m u ltiv a ria n te e n la fig u ra es la tra n s fo rm a c i n d e A n d re w F o u rie r, q u e re p r e s e n ta lo s v a lo re s
m e d ia n te u n a e x p re si n m a te m tic a . A u n q u e as c o m p a ra c io n e s p a ra un v a lo r n ic o s o n m s d i
fc ile s, e s ta fo rm a d e re p re se n ta c i n g r fic a n o s p re s e n ta e n u n so lo g r fic o u n a c o m p a ra c i n g e
n e ra liz a d a y la a g ru p a c i n de o b s e rv a c io n e s . F in a lm e n te , se h an c o n s tru id o lo s s m b o lo s c n ico s
( la s c a ra s de C h e rn o ff) co n las s ie te v a ria b le s a s ig n a d a s a la s c a ra c te rs tic a s f a c ia le s . E n este
e je m p lo , X c o n tro la la re p re s e n ta c i n d e la b o c a , se a s ig n a A) p a ra la s fa c c io n e s d e c e ja s , s e a s ig
n a A', p a ra la s c a ra c tc ristic a s d e la n a riz , s e a s ig n a X 4 p a ra lo s o jo s, X f c o n tro la la fo rm a d e la cara.
X i%se re fie re a la o re ja y se a s ig n a X 1 a la p o s ic i n d e la p u p ila . C o n re la c i n a X r lo s g r u p o s u n o
A N L IS IS P R E V IO DE L O S DATOS 39

y c u a tro tie n e n so n risa s y el g ru p o d o s tie n e un ce o . E sto c o rre sp o n d e a v a lo re s g ra n d e s p a ra los


g ru p o s u n o y c u a tro y v a lo re s p e q u e o s p a ra e l g ru p o d o s. E sta fo rm a d e re p re s e n ta c i n g rfica
c o m b in a la c a p a c id a d d e h a c e r c o m p a ra c io n e s e s p e c fic a s e n tre g ru p o s o d e n tro d e lo s g ru p o s v is
to s en los p e rfile s a d e m s d e las c o m p a ra c io n e s g lo b a le s m s g e n e ra liz a d a s q u e se e n c u e n tra n en
las tra n sfo rm a c io n e s d e A n d re w F o u rie r. El in v e s tig a d o r p u e d e e m p le a r c u a lq u ie ra d e esto s m
to d o s cu a n d o e x a m in a d ato s m u ltiv a ria n te s p a ra p ro p o rc io n a r un fo rm a to q u e es m u c h a s v ec es m s
p e n e tra n te q u e u n a sim p le re v isi n d e lo s d a to s reales.

Resum en
N o h a y q u e e n te n d e r las r e p r e s e n ta c io n e s g r fic a s d e e s ta s e c c i n c o m o un s u s titu to d e las
m e d id a s de d ia g n stic o e s ta d s tic o d is c u tid a s en las ltim a s se c c io n e s d e e s te c a p tu lo y en otros
c a p tu lo s, P ero p ro p o rc io n a n u n a fo rm a a lte rn a tiv a d e d e s a rro lla r u n a p e rs p e c tiv a d e l c a r c te r d e
los d a to s y de las in te rre la c io n e s q u e e x is te n , in c lu so si so n m u ltiv a ria n te s en s u n atu ra lez a. El
a n tig u o re fr n u n a im a g en v a le m s q u e m il p a la b ra s es v e rd a d m u c h a s v e c e s en el u so d e las
re p re se n ta c io n e s g r fic a s p a ra las a p lic a c io n e s c o m p a ra tiv a s o d e d ia g n stic o .

L o s d a to s a u s e n te s so n a lg o h a b itu a l e n el a n lis is m u ltiv a ria n te ; d e h e c h o , ra ra m e n te el in v es


tig a d o r e v ita e n fre n ta rs e c o n a lg u n a fo rm a d e l p ro b le m a d e lo s d a to s a u s e n te s. P o r e s ta raz n , el
d e s a fio c o n s iste en e n fre n ta rs e a lo s re s u lta d o s p ro d u c id o s p o r lo s d a to s a u s e n te s e n lo s p ro ceso s
d e e s tim a c i n y q u e a fe c ta n a la g e n e ra lid a d d e lo s re su lta d o s. P a ra h a c e r e s to , la o c u p a c i n p ri
m a ria d e l in v e s tig a d o r es d e te rm in a r las ra z o n e s q u e su b y a c e n e n e l d a to a u s e n te , s ie n d o e n m u
c h o s c a s o s la e x te n s i n d e la a u s e n c ia d e d a to s u n a c u e s ti n s e c u n d a ria . E s ta n e c e s id a d d e
c e n tra rs e e n las raz o n es d e la a u s e n c ia d e d a to s se d e s p re n d e d el h e c h o d e q u e el in v e stig a d o r d eb e
e n te n d e r e l p ro c e s o p rin c ip a l d e e s ta a u s e n c ia d e d a to s p a ra s e le c c io n a r el c u rs o d e a c c i n apro
piad o .
U n p ro c e s o d e d a to s au sen te s es c u a lq u ie r ev e n to sistem tico ex tern o al en c u estad o (tales com o
e rro re s e n la in tro d u c c i n d e lo s d a to s o p ro b le m a s d e s u re c o le c c i n ) o a c c i n p o r p a n e d el e n
c u e sta d o (ta le s c o m o re h u s a r a c o n te sta r) q u e d a lu g a r a la a u s e n c ia d e d a to s. L o s e fe c to s d e c ie r
to s p ro c e s o s d e a u s e n c ia d e d a to s s o n c o n o c id o s y d ir e c ta m e n te in tr o d u c id o s e n el p la n d e
in v e stig a c i n . P ero h ay o tro s, p a rtic u la rm e n te a q u e llo s b a s a d o s e n a c c io n e s p o r p a rte d e l e n c u e s
ta d o , q u e ra ra v e z so n co n o c id o s. C u a n d o lo s p ro c e so s d e a u se n c ia d e d a to s so n d e s c o n o c id o s, ei
in v e stig a d o r in te n ta id e n tific a r c u a lq u ie r p a tr n en lo s d ato s a u s e n te s q u e c a ra c te riz a ra n d ic h o p ro
c e so . A l h a c e rlo , p la n te a c u e stio n e s ta le s c o m o : (5 ) e s t n lo s d a to s a u s e n te s d is trib u id o s a le a to
ria m e n te e n tre las o b se rv a c io n e s o se p u e d e n id e n tific a r d is tin ta s p a u ta s? y (2 ) e n q u m e d id a son
re le v a n te s ? S i se e n c u e n tra n p a u ta s y la e x te n s i n d e lo s d a to s a u s e n te s e s su fic ie n te c o m o p ara
g a ra n tiz a i'u n cu rso d e a c c i n , e n to n c e s se a s u m e q u e e s ta o p e ra n d o alg n p ro c e s o d e a u s e n c ia d e
d a to s y q u e a lg u n o s d e lo s re s u lta d o s e s ta d s tic o s b a s a d o s en e so s d a to s p o d ra n e s ta r se s g a d o s en
la m e d id a e n q u e la s v a ria b le s in c lu id a s en e l a n lis is e st n in flu id a s p o r lo s p ro c e s o s d e p rd id a
d e d a to s. Ei in te rs p o r e n te n d e r lo s p ro c e s o s d e a u s e n c ia d e d a to s es sim ila r a la n e c e s id a d d e e n
te n d e r la s ca u sa s d e la a u s e n c ia d e re s p u e s ta s e n el p ro c e so d e re c o le c c i n d e d a to s. P o r eje m p lo ,
so n d ife re n te s a q u e lla s p e rso n a s q u e no re s p o n d ie ro n d e las p e rso n a s q u e s lo h ic ie ro n ? Si es as,
tie n e n alg n im p a cto e s ta s d ife re n c ia s e n el a n lis is , lo s re s u lta d o s o su in te rp re ta c i n ? A su n to s
sim ila re s a sto s s u rg e n ta m b i n d e la in e x is te n c ia d e re sp u e sta s a v a ria b le s in d iv id u a le s.
E l im p a c to d e lo s d a to s a u s e n te s e s p e rju d ic ia l n o s lo p o r su s p o te n c ia le s s e s g o s esco n d id o s
sin o ta m b i n p o r su e fe c to en e l ta m a o d e la m u e stra d isp o n ib le p a ra el a n lis is. P o r eje m p lo , si
n o s e a p lic a n so lu c io n e s p a ra la a u s e n c ia d e d a to s, n in g u n a o b se rv a c i n c o n d a to s a u s e n te s so b re
c u a lq u ie ra de las v a ria b le s se r in c lu id a e n e l a n lis is. E n m u c h o s a n lis is m u ltiv a ria n te s , en p a r
40 A N L IS IS M U L TIVA RIAN TE

tic u la r e n ap licacio n es a investig acio n es g e n ric a s, fa au sen cia d e d ato s elim in a la m a s o b se rv a c io n e s


q u e lo q u e en p rin c ip io e ra u n a m u e stra a d e c u a d a s e re d u c e a u n a in a d e c u a d a . E n ta le s s itu a c io
nes. el in v e stig a d o r debe b u sc a r o b se rv a c io n e s a d ic io n a le s o e n c o n trar u n a so lu c i n p a ra la au sen c ia
d e d a to s en la m u e stra o rig in a l. A u n q u e e n c o n tra r un re m e d io p a ra la a u s e n c ia d e d a to s es la s o
lu c i n m s p r c tic a , ex isten p o c a s g u ia s p a ra e l d ia g n stic o y so lu c i n d e la a u s e n c ia d e d a to s. P o r
esta raz n , las sig u ie n te s se c c io n e s d is c u te n lo s d ife re n te s tip o s d e p ro c e so s d e a u s e n c ia d e d a to s,
m to d o s p ara id e n tific a r su n a tu ra le z a y las s o lu c io n e s e x is te n te s p a ra d a r c a b id a a la a u s e n c ia d e
d a to s e n el a n lisis m u ltiv a ria n te .

Un ejem plo sencillo del anlisis de datos ausentes


L a T ab la 2.1 co n tie n e un e je m p lo se n c illo d e d a to s a u s e n te s en tre 20 ca so s. D e la m is m a fo rm a que
re s u lta tp ic o p a ra m u c h a s se rie s de d a to s , e s p e c ia lm e n te e n la in v e stig a c i n d e e n c u e s ta s , e) n
m e ro de d ato s a u s e n te s v a ria m u c h o e n tre lo s c a s o s y la s v a ria b le s. E n e s te e je m p lo , p o d e m o s v e r
q u e to d a s las v a ria b le s ( L a Vf ) tie n e n a lg u n o s d a to s a u se n te s, en Vx fa lta m s d e la m ita d (5 5 p o r
c ie n to ) d e to d o s lo s v a lo re s. T re s c a so s (3 . 13 y 15) tie n e n m s de! 50 p o r c ie n to d e d a to s a u s e n
te s y s lo c in c o c a so s tie n e n d a to s c o m p le to s . E n c o n ju n to , u n 22 p o r c ie n to d e lo s v a lo re s e st n
a u s e n te s. S i se h ic iera un a n lis is m u ltiv a ria n te q u e n ecesita ra d a to s c o m p le to s , lo s d a to s s e v e r
an re d u c id o s a so la m e n te c in c o c a so s, d e m a s ia d o p o c o p a r a c u a lq u ie r tip o d e a n lis is . E s te n iv el
d e re d u c c i n e n lo s c a so s d isp o n ib le s e s fre c u e n te e n m u c h a s a p lic a c io n e s.
L as so lu c io n e s m s so fistic a d a s p a ra d a to s a u s e n te s se ab o rd a r n c o n d e ta lle e n s e c c io n e s p o s
te rio res. N o o b stan te, u n a o p ci n o b v ia es la elim in a ci n d e las v ariab les y /o caso s. E n n u e s tro e je m
plo. si suponem os q u e los fu n d am en to s co n c ep tu ale s d e la in v estig aci n no se alteran su stan cialm en te
p o r la su p re si n de u n a v a ria b le , la e lim in a c i n d e '. es u n a m a n e ra d e re d u c ir e l n m e ro d e d ato s
a u se n te s. S o lam e n te con la su p re si n d e I73, sie te ca so s ad ic io n a le s, d e u n to ta l d e 12. a h o ra tien en

TABLA 2 .1 . Ejemplo hipottico d e d a to s au s en te s

D atos ausentes p o r easo

Caso !D r. r. i: V.5 N m ero Porcentaje

l 1.3 9 .9 6 .7 3 .0 2.6 0 0
2 4.1 5 .7 2 .9 2 40
3 9 .9 3 .0 3 60
4 0 .9 8.6 2.1 1,8 1 20
5 0 .4 8 .3 1.2 .7 ) 20
6 1.5 6 .7 4 .8 2 ,5 1 20
7 0.2 8,8 4 .5 3 .0 2 .4 0 0
8 2.1 8.0 3 ,0 3 .8 1,4 0 0
9 1.8 7 .6 3 .2 2 .5 1 20
10 4 .5 8.0 3 .3 2.2 1 20
II 2 .5 9 .2 3 .3 3 .9 j 20
(2 4 .5 6 ,4 5 .3 3 .0 2 .5 0 9
13 2 .7 4 80
14 2,8 6.1 6 ,4 3 ,8 I 20
15 3 .7 3 .0 3 60
16 1.6 6 .4 5 .0 2.1 1 20
17 0 .5 9 .2 3 ,3 2.8 1 20
18 2.8 5 ,2 5 .0 2 ,7 1 20
19 2.2 6 .7 2,6 2 .9 1 20
20 1.8 9 .0 5 ,0 2,2 3 .0 0 0
DATOS AUSHNTf.S POR VARIABLE TOTAL VALORES Al'SPNTRS
Nmero 2 2 11 6 2 Nmero: 2 3
Porcentaje 10 10 55 30 10 Porcentaje; 2 3
A N L IS IS P R E V IO D E L O S DATOS 41

in fo rm a c i n c o m p le ta . Si se e lim in a n los tre s ca so s (3 , 13 y 15) c o n c a n tid a d e s d e d ato s au sen tes


e x c c p c io n a lm e n te altas, el n m e ro total d e d a to s a u s e n te s se red u c e a h o ra a s o la m e n te cin co casos,
u n 7 .4 p o r c ie n to de to d o s lo s v a lo re s. N o o b sta n te , to d o s esto s c in c o d a to s a u s e n te s estn p resen
tes e n Vt , y te n e m o s q u e b u sc a r ta m b i n c u a lq u ie r p a tr n e n tre e sto s d ato s. Si c o m p a ra m o s los ca
so s co n lo s d ato s a u s e n te s p a ra Vt co n los q u e tie n en v alo re s Vi v lid o s, p o d e m o s v e r ev o lu cio n a r
un p a tr n co n re sp e c to al Vy L os c in c o c a s o s c o n lo s v alo re s a u s e n te s p a ra Vt ta m b i n tien en los
v alo re s m s b ajos p ara V2, lo cual in d ic a q u e los d ato s au sen tes p ara g e s t a n estre c h a m e n te asociados
c o n los n iv e le s m s b ajos de E,. E sta a s o c ia c i n sis te m tic a e n tre lo s d a to s a u s e n te s y los d ato s v
lid o s tie n e un im p a cto d ire c to s o b re c u a lq u ie r a n lis is e n lo s q u e se in c lu y en y K,. En este caso,
el in v e stig a d o r sie m p re tie n e q u e e x a m in a r lo s re su lta d o s q u e in c lu y en Vi o K, p a ra v e r el p o sib le
im p a c to d e este p ro ce so d e d a to s a u s e n te s so b re lo s resu ltad o s.

C onocim iento de las razones causantes de datos ausentes


A n te s de q u e se p u e d a in stru m e n ta r c u a lq u ie r so lu c i n p a ra la a u s e n c ia d e d a to s , e n p rim e r lu g ar
el in v e s tig a d o r d e b e d ia g n o s tic a r y c o m p re n d e r lo s p ro c e s o s d e a u s e n c ia d e d a to s q u e su b y a ce n
e n e s te fe n m e n o . A lg u n a s v e c e s e s to s p ro c e so s se e n c u e n tra n b a jo el c o n tro l de! in v e stig a d o r y
p u e d e n se r id e n tific a d o s e x p lc ita m e n te . E n ta le s c a so s, la a u s e n c ia d e c a so s s e d e n o m in a p r e s
c in d ib le , lo q u e sig n ific a q u e n o s e n e c e s ita n so lu c io n e s e sp e c fic a s p a ra la a u s e n c ia d e d ato s d ado
q u e lo s lim ite s de la a u s e n c ia d e lo s d a to s s o n in h e re n te s a la t c n ic a u sa d a [9],

Datos ausentes prescindibles


U n e je m p lo d e p ro c e so de d ato s a u s e n te s p re sc in d ib le s es el d a to a u s e n te d e a q u e lla s o b se rv a
c io n e s de u n a p o b la ci n q u e n o e st n in c lu id a s en la m u e stra. El p ro p sito d e la t c n ic a m u ltiv arian te
e s g e n e ra liz a r las o b se rv a c io n e s d e la m u e s tra a! c o n ju n to d e la p o b la c i n , lo q u e s u p o n e un in te n
to p o r sa lv a r lo s d ato s au sen te s de las o b se rv a c io n e s q u e n o e st n en la m u e stra. E l in v e stig a d o r hace
p re sc in d ib le s e sto s d ato s a u s e n te s u s a n d o u n a m u e s tra p ro b a b ils tic a d e lo s e n c u e s ta d o s se le c c io
n a d o s. L a m u e stra p ro b a b ils tic a p e rm ite al in v e s tig a d o r e s p e c ific a r q u e lo s p ro c e so s d e d ato s
a u s e n te s c a u sa n te s d e la s o b s e rv a c io n e s o m itid a s s o n a le a to rio s y q u e lo s d a to s a u s e n te s p u ed e n
e x p lic a rs e c o m o u n e rro r m u e stra l en lo s p ro c e d im ie n to s e s ta d s tic o s. P o r ta n to , lo s d a to s a u s e n
te s d e las o b se rv a c io n e s n o se le c c io n a d a s so n p re sc in d ib le s.
O tro c a so de d ato s a u s e n te s p re s c in d ib le s tie n e lu g a r c u a n d o lo s d a to s e s t n c e n su ra d o s. L os
d a t o s c e n s u r a d o s so n o b se rv a c io n e s in c o m p le ta s c o m o c o n s e c u e n c ia d e su e ta p a en el p ro c e so d e
a u s e n c ia d e d ato s. U n e je m p lo tp ic o es un a n lis is d e las c a u s a s d e fa lle c im ie n to . L o s en c u esta-
d o s q u e to d a v a v iv e n n o p u e d e n p ro p o rc io n a r in fo rm a c i n c o m p le ta (e s d ec ir, c a u sa d e la m u e r
te ) y p o r ta n to e s t n c e n su ra d o s. O tro e je m p lo in te re sa n te d e d ato s c e n su ra d o s se e n c u e n tra en c!
in te n to de e s tim a r las a ltu ra s d e u n a p o b la c i n c o m o la n o rte a m e ric a n a b a s n d o s e e n la a ltu ra d e
lo s re c lu ta s d e las fu erza s a rm a d a s [c o m o s e c ita e n 9 ], L o s d a to s e st n c e n s u ra d o s p o rq u e d u ra n
te a lg u n o s a o s las fu erza s a rm a d a s te n ia n re stric c io n e s a la a ltu ra q u e v a ra n e n n iv e l y c u m p li
m ie n to . P o r ta n to , lo s in v e stig a d o re s se e n fre n ta n c o n la ta re a d e e s tim a r la s a ltu ra s d e to d a la
p o b la c i n c u a n d o se sa b e q u e c ie rto s in d iv id u o s (e s d ecir, a q u e llo s q u e e s t n p o r d e b a jo d e las re s
tric c io n e s de a ltu ra ) n o e st n in c lu id o s e n las m u e stra s. E n a m b o s c a so s el c o n o c im ie n to d el in
v e s tig a d o r del p ro c e so d e a u s e n c ia d e d a to s p e rm ite e l u so d e m to d o s e s p e c ia liz a d o s, ta le s co m o
u n a n lis is d e la h isto ria del e v e n to p a ra d a r c a b id a a lo s d a to s c e n s u ra d o s [9],
L a ju s tific a c i n p a ra d e s ig n a r a lo s d a to s a u s e n te s c o m o p re s c in d ib le s es q u e e l p ro c e so d e au
s e n c ia d e d ato s est o p e ra n d o a le a to ria m e n te (es d ecir, lo s v alo re s o b se rv a d o s so n u n a m u e stra ale
a to ria d e l c o n ju n to to ta l d e v a lo re s, o b s e rv a d o s y p e rd id o s ) y q u e e so s e fe c to s a le a to rio s son
i d e n tif ic a r e s y e x p lc ita m e n te a ju sta d o s a la t c n ic a u sad a. S in e m b a rg o , en m u c h o s ca so s, el p ro
c e s o d e a u s e n c ia d e d ato s no e s t e x p lc ita m e n te p ro v o c a d o p o r la t c n ic a u sa d a. N o o b sta n te , el
in v e stig a d o r d e b e ev a lu a r la m e d id a y el im p a c to e n q u e lo s d ato s a u s e n te s d e te rm in a n si es un p ro
c e s o a le a to rio o, en c a so c o n tra rio , si s e p u e d e re m e d ia r c o n a lg u n a d e la s so lu c io n e s ex isten tes.
42 A N L IS IS M U L T IV A R IA N T E

Otros tipos de procesos de ausencia de datos

L a a u s e n c ia de d a to s p u e d e o c u rrir p o r m u c h a s ra z o n e s y en m u c h a s s itu a c io n e s . U n tip o d e


p r o c e s o d e d a to s a u s e n te s q u e p u e d e o c u r r ir e n c u a lq u ie r s itu a c i n s e d e b e a f a c to r e s d e
p ro c e d im ie n to , ta le s c o m o erro re s en la e n tra d a d e d a to s q u e c re a n c d ig o s in v lid o s, re s tric c io n e s
d e re p re s e n ta tiv id a d (p o r e je m p lo , lo s d a to s d e lo s c o n d a d o s p e q u e o s en el c e n s o d e to s E s ta
d o s U n id o s ) , f a llo s al c o m p le ta r el c u e s tio n a r io o in c lu s o la m o r b id e z d e l e n c u e r a d o . E n
e s ta s s itu a c io n e s, el in v e s tig a d o r tie n e e s c a s o c o n tro l s o b re los p ro c e so s d e a u s e n c ia d e d a to s ,
a u n q u e p u e d e n a p lic a rs e c ie rta s so lu c io n e s si se e n c u e n tra q u e los d a to s a u s e n te s so n d e c a r c te r
a le a to rio . O tro tip o d e p r o c e s o s d e p e rd id a d e d a to s tie n e lu g a r c u a n d o la re s p u e s ta e s in a p lic a b le ,
c o m o las p re g u n ta s en r e la c i n a lo s a o s d e m a trim o n io p a ra a d u lto s q u e n u n c a h a n e s ta d o
c a sa d o s. D e n u e v o , lo s a n lis is p u e d e n s e r e s p e c fic a m e n te fo rm u la d o s p a ra a c o m o d a r a e s to s
e n c u e s ta d o s.
O tro s tip o s de p ro c e so s d e d ato s a u s e n te s se id e n tific a n y m a n eja n c o n m e n o s fa c ilid a d . L a m a
y o ra d e e sto s tip o s e st n re la c io n a d o s d ire c ta m e n te co n el e n c u e sta d o . U n b u e n e je m p lo e s la r e
n u n c ia del e n c u e s ta d o a re s p o n d e r a c ie rta s c u e s tio n e s . E s o e s h ab itu al e n c u e stio n e s d e n a tu ra le z a
se n sib le (tales c o m o a q u e lla s q u e c o n c ie rn e n a la re n ta o a asu n to s p a rtic u la rm e n te c o n tro v e rtid o s )
o c u a n d o el e n c u e s ta d o n o tie n e o p in i n o s u c o n o c im ie n to es in su fic ie n te p a ra c o n te s ta r la p re
g u n ta . E l in v e stig a d o r d e b e ra a n tic ip a r e s to s p ro b le m a s e in te n ta r m in im iz a rlo s e n e i d is e o d e la
in v e stig a c i n y en lo s n iv e le s de re c o g id a d e d a to s. S in em b a rg o , p u e d e o c u rrir m u y b ie n q u e el
in v e s tig a d o r d e b a e n fre n ta rs e c o n lo s d a to s a u s e n te s re su lta n te s. P ero n o to d o e s t p e rd id o . C u a n
d o lo s d a to s a u s e n te s o c u rre n s ig u ie n d o u n a p a u ta a le a to ria , p u e d e n e x is tir so lu c io n e s p a ra m iti
g a r su s efe cto s.

Exam en de los tipos de datos ausentes


P a ra d e c id ir si se p u e d e a p lic a r u n a so lu c i n p a ra la a u s e n c ia d e d a to s, en p r im e r lu g a r e! in v e s ti
g a d o r d e b e a v e rig u a r e! g ra d o de a le a to rie d a d p re s e n te en lo s d ato s a u se n te s. S u p o n g a m o s q u e se
o b s e rv a n d o s v a ria b le s (A' e ) ) . M ie n tra s q u e X n o tie n e d a to s p e rd id o s. )' tie n e a lg u n o s d ato s
a u se n te s. Si se e n c u e n tra un p ro c e so d e d a to s a u s e n te s e n tre X e Y, d o n d e e x is te n d ife re n c ia s
s ig n ific a tiv a s p a ra ca so s d e Y c o n d a lo s v lid o s y d a to s a u s e n te s en fu n c i n d e lo s v a lo re s d e .V.
e n to n ce s lo s d ato s au sen tes n o so n alea to rio s. C u a lq u ie r an lisis tie n e q u e c o m p ro b a r e x p lcitam en te
lo s p ro c e so s d e d a to s a u s e n te s e n tre X y Y o si 110 se in tro d u c e se sg o en lo s re su lta d o s.
L o s ciatos a u s e n te s o b e d e c e n a u n p ro c e s o a le a to rio (M A R ) si lo s v a lo re s a u s e n te s d e Y d e
p e n d e n d e A, p e ro n o e n C o n esto q u e re m o s d e c ir q u e lo s v a lo re s o b s e rv a d o s d e Y re p re se n ta n
u n a m u e s tra d e lo s v a lo re s r e a le s de Y p a ra c a d a v a lo r d e X , p e ro lo s d a to s o b s e rv a d o s p a ra Y no
re p re se n ta n n e c e sa ria m e n te u n a m u e stra v e rd a d e ra m e n te alea to ria p ara to d o s lo s v a lo re s d e ) . A u n
q u e el p ro c e s o d e d a to s a u s e n te s es a le a to rio e n la m u e s tra , su s v a lo re s n o so n g e n e r a liz a d le s p ara
la p o b la c i n . P o r e je m p lo , su p o n g a m o s q u e c o n o c e m o s el g n e ro d e lo s e n c u e s ta d o s (la v a ria b le
A") y s to s so n p re g u n ta d o s a c e rc a de la re n ta f a m ilia r (la v a ria b le Y). E n c o n tra m o s q u e lo s d alo s
a u s e n te s so n a le a to rio s p a ra a m b o s se x o s p e ro q u e o c u rre n c o n m a y o r fre c u e n c ia p a ra lo s h o m
bres' q u e p a ra las m u je re s. M ie n tra s q u e el p r o c e s o d e a u s e n c ia d e d a lo s est o p e ra n d o d e fo rm a
a le a to ria , c u a lq u ie r so lu c i n a p lic a d a a lo s d a lo s a u s e n te s d e b e te n e r en c u e n ta el g n e ro d e los
e n c u e s ta d o s p o rq u e el g n e ro a fe c ta a la d is trib u c i n d e fin itiv a d e lo s v a lo re s d e la s re n ta s d o
m stic a s.
C u a n d o h ay un m a y o r n iv el d e a le a to rie d a d el p ro c e so es c o m p le ta m e n te a le a to rio ( M C A R ) .
E n e sto s c a so s, lo s v a lo re s o b se rv a d o s d e Y so n v e rd a d e ra m e n te u n a m u e stra a le a to ria d e to d o s los
v a lo re s de )', sin un p ro c e so su b y a c e n te q u e tie n d e a se s g a r lo s d a to s o b se rv a d o s. E n n u e s tro e je m
p lo an te rio r, esto se m o stra ra p o r el h e c h o d e q u e lo s d a to s a u s e n te s p a ra las re n ta s d o m stic a s
e st n a le a to ria m e n te a u s e n te s e n la m is m a p ro p o rc i n ta n to p a ra h o m b re s c o m o p a ra m u je re s . Si
esta es la fo rm a del p ro c e s o d e a u s e n c ia d e d a to s, c u a lq u ie r so lu c i n se p o d ra a p lic a r sin te n e r en
c u e n ta el im p a cto de c u a lq u ie r o tra v a ria b le o p ro c e s o d e d a to s au sen te s.
A N L IS IS P R E V IO D E L O S DATOS 43

D iagnstico de la aleatoriedad en el proceso de prdida


de observaciones
C o m o y a se h a a p u n ta d o , e! in v e s tig a d o r d e b e a v e rig u a r s i e l p ro c e s o d e a u s e n c ia d e d a to s tie n e
lu g a r d e fo rm a a le a to ria . E x iste n tre s m to d o s p a r a a y u d a r e n e s te d ia g n s tic o . El p rim e ro v a lo
ra lo s d a to s a u s e n te s p a ra u n a n ic a v a r ia b le Y a l fo rm a r d o s g ru p o s o b s e rv a c io n e s c o n d ato s
a u s e n te s p a ra Y y a q u e llo s co n v a lo re s v lid o s d e Y. S e re a liz a n e n to n c e s lo s te st p a ra d e te rm in a r
si e x is te n d ife re n c ia s s ig n ific a tiv a s e n tre lo s d o s g ru p o s s o b re o tra s v a r ia b le s d e in te r s. S i se e n
c u e n tr a n p a tro n e s d e d ife re n c ia s s ig n ific a tiv a s , in d ic a ra q u e e x is te u n p ro c e s o d e p rd id a d e d a
to s n o a le a to rio . U tilic e m o s o tra v e z n u e s tro e je m p lo d e la re n ta d o m s tic a y el g n e ro . E n p rim e r
lu g a r fo rm a ra m o s d o s g ru p o s d e e n c u e s ta d o s , a q u e llo s c o n d a to s a u s e n te s e n la p re g u n ta so b re
la s e c o n o m a s d o m s tic a s y a q u e llo s q u e r e s p o n d e n a la p re g u n ta . P o d e m o s e n to n c e s c o m p a ra r
lo s p o rc e n ta je s d e g n e ro d e c a d a g r u p o . S i u n g n e ro ( p o r e je m p lo , h o m b re s ) se e n c o n tra ra en
m a y o r p ro p o rc i n e n e l g ru p o d e d a to s a u s e n te s , s o s p e c h a ra m o s q u e e l p ro c e s o n o h a o p era d o
d e fo rm a a le a to ria . Si la v a ria b le q u e e s t b a m o s c o m p a ra n d o fu e s e m tr ic a ( p o r e je m p lo , u n a
a c titu d o p e rc e p c i n ) e n lu g a r d e c a te g ric a (g n e ro ), e n to n c e s e l a p ro p ia d o es el te s t d e la /. El
in v e s tig a d o r d e b e ra e x a m in a r u n n m e ro d e v a ria b le s p a r a v e r si s u rg e c u a lq u ie r tip o d e p atrn
c o n s is te n te . R e c o rd e m o s q u e c ie r ta s d if e r e n c ia s p u e d e n o c u rrir p o r a z a r, p e r o q u e c u a lq u ie r
s e rie d e d ife re n c ia s p u e d e in d ic a r u n p a tr n s u b y a c e n te .
U n a se g u n d a a p ro x im a c i n c o n s is tira e n u tiliz a r las c o rre la c io n e s d ic o to m iz a d a s p a ra ev a lu a r
la c o rre la c i n de los d ato s a u s e n te s e n c u a lq u ie r p a r d e v a lo re s. P a ra c a d a v a ria b le , lo s v alo re s v
lid o s se re p re se n ta n p o r el v a lo r u n o , m ie n tra s q u e lo s d a to s a u s e n te s s o n re e m p la z a d o s p o r v a lo
r e s d e c e r o . E s to s in d ic a d o r e s d e v a l o r e s p e r d i d o s p a r a c a d a v a r i a b l e e s ta r a n e n to n c e s
c o rre la c io n a d o s. L as c o rre la c io n e s in d ic a n el g ra d o d e a s o c ia c i n e n tre lo s v a lo re s p e rd id o s so b re
c a d a p a r de v a ria b le s. B a ja s c o rre la c io n e s im p lic a n a le a to rie d a d e n el p a r d e v a ria b le s. A u n q u e no
e x is te n lin e a s m a e stra s p a ra id e n tific a r e l n iv e l d e c o rre la c i n n e c e s a rio p a ra in d ic a r q u e los d a
to s a u s e n te s n o s o n a le a to rio s, lo s te s t d e sig n ific a c i n e s ta d stic a d e las c o rre la c io n e s p ro p o r
c io n a n u n a e s tim a c i n c o n s e rv a d o ra d e l g ra d o d e a le a to rie d a d . Si la a le a to rie d a d es in d ic ativ a
p a t a to d o s lo s p a re s d e v a ria b le s , e n to n c e s e l in v e s tig a d o r p u e d e s u p o n e r q u e lo s d a to s au sen te s
p u e d e n c la sific a rse c o m o M C A R . Si e x is te n c o rre la c io n e s s ig n ific a tiv a s e n tre a lg u n o s p are s d e
v a ria b le s , en to n c e s el in v e stig a d o r p u e d e te n e r q u e s u p o n e r q u e lo s d a to s so n s lo M A R y estas
r e la c io n e s d eb e n s e r te n id a s e n c u e n ta e n c u a lq u ie r so lu c i n q u e s e q u ie ra ap licar.
F in a lm e n te , se p u e d e re a liz a r u n te s t c o n ju n to d e a le a to rie d a d q u e d e te rm in e si lo s d ato s a u
s e n te s p u ed e n s e r c la sific a d o s c o m o M C A R . E s te te st a n a liz a e l p a tr n d e d a to s a u s e n te s so b re to
d a s la s v a ria b le s y la s c o m p a ra c o n e l p a tr n e s p e ra d o p a ra u n p ro c e s o d e d a to s a u s e n te s alea to rio .
S i n o se e n c u e n tra n d ife re n c ia s s ig n ific a tiv a s , lo s d a to s a u s e n te s p u e d e se r c la sific a d o s com o
M C A R . Si se e n c u e n tra n d ife re n c ia s sig n ific a tiv a s, s in em b a rg o , e l in v e stig a d o r d eb e u sa r las ap ro
x im a c io n e s d e s c rita s m s a rrib a p a ra id e n tific a r lo s p ro c e s o s e s p e c fic o s d e d a to s a u s e n te s q u e no
so n alea to rio s.

L a s a p ro x im a c io n e s o so lu c io n e s q u e tra ta n c o n lo s d a to s a u s e n te s p u e d e n c la s ific a rs e en cu a tro


c a te g o ra s b asad a s en la a le a to rie d a d d e lo s p ro c e s o s d e d a to s a u s e n te s , en fu n c i n d el m to d o
e m p le a d o p a ra e s tim a rlo s [ 9 j. S i s e e n c u e n tra n p ro c e s o s d e d a to s a u s e n te s M A R o n o ale a to rio s,
e l in v e s tig a d o r d e b e ra a p lic a r s lo e l m to d o d is e a d o e s p e c fic a m e n te p a ra e s te p ro c e s o [9], La
a p lic a c i n d e c u a lq u ie r o tro m to d o in tro d u c e se s g o s e n lo s re su lta d o s. S lo si el in v e stig a d o r d e
te rm in a q u e el p ro c e so d e a u s e n c ia d e d a to s p u e d e c la s ific a rs e c o m o M C A R p u e d e n u tiliza rs e
to d a s las a p ro x im a c io n e s d isc u tid a s e n la s s ig u ie n te s se c c io n e s.
N o o b sta n te , m u c h a s v e c e s lo s in v e stig a d o re s e v a l a n la a le a to rie d a d d e lo s d a to s a u s e n te s an tes
d e a p lic a r u n a d e la s so lu c io n e s d e d a to s a u s e n te s . E in c lu so s i la s o lu c i n e s la a p ro p ia d a , e l
44 A N L IS IS M U L T IV A R IA N T E

in v e s tig a d o r d e b e te n e r en c u e n ta lo s im p a c to s e s p e c fic o s d e io s re s u lta d o s a s o c ia d o s c o n ella.


D e m a sia d a s v e c e s s e a p lic a u n a so lu c i n sin u n a e v a lu a c i n d e lo s p ro c e s o s d e a u s e n c ia d e d a
to s, la c o n v e n ie n c ia d e la s o lu c i n s e le c c io n a d a o las c o n s e c u e n c ia s q u e te n d r . E n tal c a s o , el
in v e s tig a d o r n u n c a s e d a r c u e n ta d e lo s e fe c to s p o rq u e e s t n c a m u fla d o s b a jo lo s re s u lta d o s
g e n e ra le s.

Utilizar slo aquellas o b servaciones con datos com pletos


L a a p ro x im a c i n m s sim p le y d ire c ta p a ra tra ta r c o n lo s d a to s a u s e n te s c o n s is te en in c lu ir s lo
a q u e lla s o b s e rv a c io n e s c o n d a lo s c o m p le to s , ta m b i n c o n o c id a c o m o la a p r o x im a c i n d e c a s o s
c o m p le to s . E ste m to d o se e n c u e n tra en to d o s lo s p ro g ra m a s e s ta d stic o s y es el m to d o p o r d e
le c to e n m u c h o s p ro g ra m a s . N o o b sta n te , e s ta a p ro x im a c i n d e b e ra u s a rs e s lo si lo s d a to s a u
se n te s so n M C A R . p o rq u e lo s d a to s a u s e n te s q u e n o lo so n tie n e n e le m e n to s n o a le a to rio s q u e
se sg a ra n lo s re su lta d o s. P o r ta n to , in c lu so a u n q u e s lo se u se n o b s e rv a c io n e s v lid a s , lo s r e s u l
ta d o s n o so n g e n e r a liz a b a s p a ra la p o b la c i n . M s a n . en m u c h a s s itu a c io n e s , e l ta m a o d e la
m u e stra re s u lta n te q u e d a re d u c id a a u n a m u e s tra in a p ro p ia d a p a ra lo s p r o p s ito s d e l a n lis is. L a
a p ro x im a c i n d e c a so s c o m p le to s se a ju sta m e jo r a c a so s e n lo s q u e la e x te n s i n d e la a u s e n c ia d e
d a to s es p e q u e a , e n lo s q u e la m u e s tra e s s u fic ie n te m e n te g ra n d e p a ra p e rm itir la su p re s i n d e los
c a so s c o n lo s d a to s a u s e n te s y en lo s q u e la s re la c io n e s e n tre lo s d a to s so n ta n fu e rte s q u e n o p u e
d e n v e rse a fe c ta d a s p o r c u a lq u ie r p ro c e so d e d a to s au sen te s.

Supresin de caso(s) y/o variable(s)


O tra so lu c i n sim p le p a ra lo s d a to s a u s e n te s c o n siste e n su p rim ir el c a so (s) y /o v a ria b lc (s) q u e p e o r
se c o m p o rta (n ) re s p e c to a lo s d a to s a u s e n te s. E n e s ta a p ro x im a c i n , el in v e s tig a d o r d e te rm in a la
e x te n si n d e lo s d a to s a u s e n te s so b re c a d a c a so y v a ria b le y e n to n c e s d e s tru y e lo s c a so s y v a ria
b le s q u e e x c e d e n el n iv el e s p e c ific a d o . E n m u c h o s c a so s d o n d e se p re s e n ta un p a tr n d e J a to s no
a le a to rio , p u e d e c o n s titu ir la so lu c i n m s e fic ie n te . El in v e s tig a d o r p u e d e e n c o n tra r q u e lo s
d a to s a u s e n te s e s t n c o n c e n tra d o s en un p e q u e o s u b c u n ju n to d e c a so s y o v a r ia b le s , c o n cu y a
e x c lu si n se re d u c e su s ta n c ia lm e n te la e x te n s i n d e lo s d a to s a u s e n te s . D e n u e v o , no e x is te n li
n c a s m a e stra s p ara el n iv el d e e x c lu s i n n e c e s a rio , p e ro c u a lq u ie r d e c is i n d e b e ra basar.se ta n to
en c o n s id e ra c io n e s e m p ric a s c o m o te ric a s. Si se e n c u e n tra n los v a lo re s a u s e n te s p ara !o q u e ser
u n a v a ria b le d e p e n d ie n te en el a n lis is p ro p u e s to , h a b ilu a lm e n te se e x c lu y e el c a s o . D e esta fo r
m a se ev ita c u a lq u ie r au m en to artificial en el p o d e r ex p lica tiv o d el an lisis q u e p u d ie ra o c u rrir c u a n
d o el in v e s tig a d o r e s tim e en p r im e r lu g a r lo s d a to s a u s e n te s p a ra la v a ria b le d e p e n d ie n te p o r u n o
d e lo s p ro c e s o s de im p u ta c i n d e s c rito s a c o n tin u a c i n y d e s p u s u s e lo s v a lo re s e s tim a d o s e n el
a n lis is d e las re la c io n e s de d e p e n d e n c ia . Si u n a v a ria b le q u e 110 se a la d e p e n d ie n te tie n e v alo re s
a u s e n te s y e s u n a c a n d id a ta a la e lim in a c i n , el in v e s tig a d o r d e b e a s e g u ra rs e d e q u e e x is ta n v a
ria b le s a lte rn a tiv a s , q u e se e s p e ra e s t n a lta m e n te c o rre la c io n a d a s , p a ra re p re s e n ta r la in te n ci n
d e la v a ria b le o rig in a l. El in v e s tig a d o r d e b e s ie m p re c o n s id e ra r lo q u e g a n a al e lim in a r u n a fu e n
te d e d a to s a u s e n te s y lo q u e p ie rd e al n o c o n ta r c o n u n a d e te rm in a d a v a ria b le e n el a n lis is m u l-
ti v a ria n te .

M todos de im putacin
U n a te rc e ra c a te g o ra p ara tr a ta r c o n d a to s a u s e n te s es a tra v s d e u n o d e lo s m u c h o s m to d o s d e
im p u ta c i n . La im p u ta c i n es e l p ro c e s o d e e s tim a c i n d e v a lo re s a u s e n te s b a s a d o e n v a lo re s v
lid o s de o tra s v a ria b le s y /o c a s o s d e la m u e stra . F.l o b je tiv o es e m p le a r re la c io n e s c o n o c id a s q u e
p u e d a n id e n tific a rse en lo s v a lo re s v lid o s d e la m u e stra p a ra a y u d a r en la e s tim a c i n d e v alo re s
a u s e n te s. S in e m b a rg o , el in v e s tig a d o r d e b e ra c o n s id e ra r c u id a d o s a m e n te el u so d e la im p u ta c i n
en c a d a in sta n c ia , d a d o s sus p o te n c ia le s im p a c to s s o b re el a n lis is []:
A N L IS IS P R E V IO D E LOS DATOS 45

La idea de imputacin es lan seductora com o peligrosa. Es seductora porque puede llevar al usuario
a erecr que los datos estn com pletos despus de todo, y es peligrosa porque une situaciones donde
el problem a es suficientem ente m enor con situaciones donde los estim adores estndar aplicados a los
datos reales e imputados tienen sesgos sustanciales.

L o s m to d o s a b o rd a d o s en esta se c c i n su e le n u tiliza rse p rin c ip a lm e n te c o n v a ria b le s m tricas


p o r d o s razo n es. E n p rim e r lugar, s e p u e d e n h a c e r estim a c io n e s d e io s d ato s a u s e n te s p ara v aria b les
m tric a s co n v alo re s c o m o u n a m e d ia d e to d o s lo s v a lo re s v lid o s. E n s e g u n d o lu g a r, la s v aria b les
n o m trica s req u ie re n u n a e s tim a c i n d e u n v a lo r e s p e c fic o en v e z d e u n a e stim a c i n en u n a esca la
co n tin u a. E xiste m u c h a d iferen c ia e n tre e stim a r un v a lo r a u s e n te p ara u n a v a ria b le m trica, tal co m o
u n a a c titu d o u n a p e rc e p c i n e in c lu so la re n ta , q u e e s tim a r el g n e ro d e l e n c u e s ta d o c u a n d o este
d a to e s t au sen te . P o r ta n to , las v a ria b le s n o m trica s n o se lo g ran tp ic a m e n te m e d ia n te el p ro ce so
d e im p u ta c i n , sin o q u e re q u ie re n la a p ro x im a c i n d e la m o d e fiz a c i n e s p e c fic a a b o rd a d a e n la
sig u ie n te se c c i n o se o m ite n p o r e s ta r a u se n te s.
S e p u e d e n d e f in ir lo s m to d o s d e im p u ta c i n c o m o p e r te n e c ie n te s a d o s tip o s : ( I ) c o m o el
u s o d e to d a la in fo rm a c i n d is p o n ib le a p a r tir d e u n s u b c o n ju n to d e c a s o s p a r a g e n e r a liz a r s o
b re la m u e s tra e n te ra , o ( 2 ) c o m o m to d o s p a r a e s tim a r v a lo re s d e re e m p la z o p a r a lo s d a to s a u
s e n te s q u e . d e e s ta fo rm a , s e a n a liz a n m e d ia n te t c n ic a s m u ltiv a r ia n te s e s t n d a r. E l sig u ie n te
d e b a te in d ic a r las d ife r e n te s o p c io n e s d e n tro d e c a d a tip o d e im p u ta c i n y s u s v e n ta ja s y d es
v e n ta ja s.

El uso de toda la informacin disponible como tcnica de


imputacin

El p rim e r tipo d e m to d o d e im p u ta c i n n o re e m p la z a lo s d a to s a u s e n te s sin o q u e im p u ta las


c a ra c te rstic a s d e d istrib u c i n ( p o r e je m p lo , la d e s v ia c i n m e d ia o e s t n d a r) o las re la c io n e s (p o r
e je m p lo , c o rre la c io n e s) d e to d o s lo s v a lo re s v lid o s d isp o n ib le s.
C o n o c id o co rn o e n f o q u e d e d is p o n i b ilid a d c o m p le ta , este m to d o ( la o p c i n P A IR W IS E en
S P S S y las o p c io n e s C O R P A IR . C O V P A IR o A L L V A L U E e n B M D P ) se u s a p rin c ip a lm e n te p ara
e s tim a r c o rre la c io n e s y m a x im iz a r la in fo rm a c i n d isp o n ib le e n la m u e stra . L a c a ra c te rstic a d i
fe re n c ia ! de esta a p ro x im a c i n es q u e c a d a c o rre la c i n se b a s a e n un c o n ju n to d e o b se rv a c io n e s
p o te n c ia lm e n te n ic o y q u e el n m e ro d e o b s e rv a c io n e s e m p le a d a s e n lo s c lc u lo s p u e d e v a ria r
e n c a d a c o rre la c i n . El p ro c e s o d e im p u ta c i n no c o n s iste e n re e m p la z a r lo s d a to s a u s e n te s p o r el
re sto d e lo s c a so s, sin o en u tiliz a r las c o rre la c io n e s o b te n id a s c o m o re p re s e n ta n te s p a ra la m u e s
tra e n te ra . S e p u e d e c o m p a ra r e s ta a p ro x im a c i n al e n fo q u e d e d is p o n ib ilid a d c o m p le ta m e n c io
n a d o a n te rio rm e n te , q u e u sa s o la m e n te d a to s d e o b s e rv a c io n e s q u e n o tie n e n d a to s a u se n te s.
C u a lq u ie ra d e las d o s a p ro x im a c io n e s p u e d e in tro d u c ir se sg o s si e! p ro c e so d e d a to s au sen te s no
es M C A R . -
A u n q u e el m todo d e d isp o n ib ilid a d c o m p le ta m a x im iz a lo s d ato s u tiliz a d o s y sa lv a el pro b lem a
d e lo s d a to s au sen te s d e u n a n ic a v a ria b le e lim in a n d o u n c a so d e l a n lis is e n te ro , p u e d e n ta m b i n
s u rg ir m u c h o s p ro b le m a s d e esta a p ro x im a c i n . E n p rim e r lu g ar, la s c o rre la c io n e s p u e d e n c a lc u
la rse fu e ra de ran g o y de fo rm a in c o n s is te n te co n o tras c o rre la c io n e s d e la m a triz d e co rrelaci n .
C u a lq u ie r co rre la c i n e n tre X e Y q u e d a re s trin g id a p o r su c o rre la c i n c o n u n a te rc e ra v aria b le Z,
tal y c o m o in d ic a la s ig u ie n te f rm u la:

R g n g o d e r n = r ^ r ^ J { \ - r ; ;) ( l - r'~y )

L a c o rre la c i n e n tre X e Y p u e d e v a r ia r s lo d e +1 a - 1 s i ta n to X c o m o Y tie n e n u n a c o


r r e la c i n c e ro c o n to d a s la s o tr a s v a r ia b le s d e la m a tr iz d e c o r r e la c i n . P e ro r a r a v e z s e d a n c o
r re la c io n e s c o n o tra s v a ria b le s d is tin ta s d e c e ro . E n la m e d id a e n q u e ias c o r r e la c io n e s c o n o tra s
v a r ia b le s a u m e n te n , e l r a n g o d e p o s ib le s c o r r e la c io n e s e n tre X t Y d is m in u y e , a u m e n ta n d o d e
e s ta fo rm a la p o s ib ilid a d d e q u e la c o r r e la c i n e n u n n ic o c o n ju n to d e c a s o s s e a in c o n s is te n
te c o n la s c o rre la c io n e s d e r iv a d a s d e o tr o s c o n ju n to s d e c a s o s . P o r e je m p lo , si X y Y tie n e n c o -
A N L IS IS MUI T IV A R IA N T L

v ic ia c io n e s d e 0 .6 y 0 .4 r e s p e c tiv a m e n te c o n 2 e n to n c e s el ra n g o d e c o r r e la c io n e s p o s ib le s
e n tre X t T e s 0 .2 4 ( ) . " . o d e - 0 .4 0 a 0 .9 7 . C u a lq u ie r v a lo r fu e ra d e e s te ra n g o es m a te
m tic a m e n te in c o n s is te n te , a u n q u e p o d ra o c u r r ir si se o b tie n e la c o r r e la c i n c o n u n n m e ro y
c o n ju n to d e c a s o s d if e r e n te s p a ra las d o s c o r r e la c io n e s e n el e n f o q u e d e d is p o n ib ilid a d c o m
p le ta .
U n p ro b le m a a s o c ia d o es q u e lo s a u to v a io r e s d e la m a triz d e c o r r e la c i n p u e d e n lle g a r a ser
n e g a tiv o s , a lte r a n d o a s las p r o p ie d a d e s d e v a ria n z a d e la m a tr iz d e c o r r e la c i n . A u n q u e la
m o lr ia d e c o r r e la c i n p u e d e a ju s fa r s e p a r a e lim in a r e s te p r o b le m a ( p o r e je m p lo , ia o p c i n
A L L Y A L U E e n B M D P ), m u c h o s p r o g ra m a s n o in c lu y e n e s te p r o g ra m a d e a ju s te . E n c a s o s e x
tre m o s . la m a tr iz e s tim a d a d e v a r ia n z a s /c o v a r ia n z a s n o es p o s itiv a d e fin id a . T o d o s e s to s p r o
b le m a s d e b e n s e r c o n s id e ra d o s al s e le c c io n a r e s ta a p ro x im a c i n , fre n te a e x c lu ir c a s o s c o n d ato s
a u s e n te s .

Sustitucin de datos ausentes

L a s e g u n d a fo rm a d e im p u ta c i n c o n s is te e n e l m to d o e fe c tiv o d e s u s titu c i n d e lo s d a to s
au s e n te s p o r v a lo re s e s tim a d o s s o b re la b a s e d e o tra in fo rm a c i n e x iste n te e n la m u e stra . E sta
m e d id a p u e d e lle v a rse a c a b o d e m u c h a s m a n e r a s , q u e v a n d e s d e u n a s u s titu c i n d ire c ta d e
valo re s, a p ro c e so s de e stim a c i n b a s a d o s e n re la c io n e s en tre v aria b les. L a e x p o s ic i n sig u ie n te se
c e n tra r en lo s m to d o s m s a m p lia m e n te u tiliz a d o s , a u n q u e e x is te n o tra s m u c h a s fo rm a s de
im p u ta c i n [9].

S u s titu c i n de c a s o E n e s te m to d o , las o b s e rv a c io n e s c o n d a to s a u s e n te s s e s u s titu y e n


c o n o tr a s o b s e rv a c io n e s no m u s tr a le s . U n e je m p lo c o m n e s r e e m p la z a r u n h o g a r q u e est
e n la m u e s tra p e ro co n el q u e n o s e p u e d e c o n ta c ta r o q u e tie n e g ra n c a n tid a d d e d a lo s a u s e n te s
co n o tr o h o g a r q u e n o e s t e n la m u e s tr a , p r e f e r ib le m e n te m u y s im ila r al d e la o b s e rv a c i n
o rig in a l.
E ste m to d o es el q u e m s se u tiliz a p a ra s u s titu ir la s o b s e rv a c io n e s co n d a to s a u s e n te s c o m
p le to s, a u n q u e ta m b i n p u e d e e m p le a rs e p a ra re e m p la z a r observ a c io n e s c o n m e n o re s ca n tid a d e s
d e d a to s a u se n te s.

S u s titu c i n p o r la m e d ia U n o de lo s m to d o s m s e m p le a d o s c o n s is te e n s u s titu ir lo s v a lo
re s a u s e n te s p o r u n a v a ria b le c u y o v a lo r m e d io se c a lc u la s o b re to d a s la s re sp u e sta s v lid a s . De
e s ta fo rm a , las re s p u e sta s d e la m u e s tra v lid a se u sa n p a ra c a lc u la r el v a lo r d e su stitu c i n . L a l
g ic a de e s ta ap ro x im a c i n es q u e la m e d ia es el m e jo r v a lo r d e su stitu c i n . E sta a p ro x im a c i n , a u n
q u e es e x te n sa m e n te u tiliz a d a , tie n e tre s d e s v e n ta ja s . E n p rim e r lugar, in v a lid a la s e s tim a c io n e s de
la v a ria n z a d e riv a d a s de las f rm u la s e s t n d a r d e la v a ria n z a p a ra c o n o c e r la v e rd a d e ra v aria n za
d e lo s d alo s. E n s e g u n d o lugar, la d istrib u c i n real d e lo s v a lo re s se e n c u e n tra d is to rs io n a d a p o r
la s u stitu c i n d e lo s d a to s a u s e n te s p o r la m e d ia . E n te rc e r lu g a r, e s te m to d o m o d ific a la c o rre la
ci n o b se rv a d a p o rq u e to d o s lo s d ato s a u s e n te s te n d r n un v a lo r n ic o c o n s ta n te . S in e m b a rg o , tie
ne la v e n ta ja d e q u e se p u ed e lle v a r a c a b o f c ilm e n te y d e p ro p o rc io n a r u n a in fo rm a c i n co m p leta
p a ra to d o s lo s caso s.

S u s titu c i n p o r v a lo r co n sta n te E n e ste m to d o , el in v e stig a d o r su stitu y e los d ato s au sen tes


p o r u n v a lo r c o n s ta n te d e riv a d o de fu e n te s e x te rn a s o in v e stig a c i n p re v ia . S u n a tu ra le z a es sim i
la r al m to d o de su stitu c i n de la m e d ia , q u e d ifie re s lo en la fu e n te d e l v a lo r d e su stitu c i n . La
im p u ta c i n de v a lo r co n sta n te tie n e las m is m a s d e s v e n ta ja s q u e el m to d o d e su stitu c i n d e la m e
d ia . y el in v e s tig a d o r d e b e a s e g u ra rs e q u e el v a lo r d e su stitu c i n d e u n a fu e n te e x te rn a es m s v
lid o q u e el v a lo r g e n e ra d o in te rn a m e n te p o r la m e d ia . E ste m to d o p u e d e p ro p o rc io n a r la o p ci n
d e r e e m p la z a r lo s d a to s a u s e n te s c o n u n v a lo r q u e p o d ra se r c o n s id e ra d o m s v lid o q u e la m e
d ia d e la m u e stra.
A N L IS IS P R E V IO D E L O S DATOS 47

Im p u ta c i n p o r r e g r e s i n E n e s te m to d o (ta l y c o m o se in d ic a e n e l C a p tu lo 4 ) se u s a
e l a n lis is d e r e g re s i n p a ra p r e d e c ir lo s v a lo re s a u s e n te s d e u n a v a ria b le b a s n d o s e en su re la
c i n c o n o tra s v a ria b le s d e l c o n ju n to d e d a to s. AI m is m o tie m p o q u e tie n e el a tra c tiv o d e u s a r
las r e la c io n e s ya e x is te n te s en la m u e s tra c o m o b aso d e p re d ic c i n , ta m b i n te n e m o s v a ria s d e s
v e n ta ja s a s o c ia d a s c o n e s te m to d o . E n p r im e r lu g a r, r e f u e r z a las re la c io n e s y a e x is te n te s en los
d a to s . C o n fo rm e a u m e n te el u so d e e s te m to d o , lo s d a to s re s u lta n te s s o n m s c a r a c te r s tic o s d e
la m u e s tr a y m e n o s g e n e ra liz a b le . E n s e g u n d o lu g a r, a m e n o s q u e s e a a d a n v a lo re s e s to c sti-
co s a lo s v a lo re s e s tim a d o s, se s u b e s tim a la v a ria n z a d e la d is trib u c i n . E n te r c e r lu g ar, e ste m
to d o s u p o n e q u e la v a r ia b le c o n d a to s a u s e n te s tie n e c o r r e la c io n e s s u s ta n c ia le s c o n o tra s
v a r ia b le s . S i e s ta s c o r r e la c io n e s n o s o n s u f ic ie n te s p a r a p ro d u c ir u n a e s tim a c i n s ig n ific a tiv a ,
e n to n c e s s o n p re fe rib le s o tr o s m to d o s , c o m o la su s titu c i n p o r la m e d ia . F in A lm cn te, el p ro c e
d im ie n to d e re g re si n nu e st re s trin g id o en las e s tim a c io n e s q u e h a c e . P o r ta n to , lo s v a lo re s pre-
d ie h o s p u e d e q u e n o c o rre s p o n d a n a lo s ra n g o s v lid o s d e la s v a ria b le s ( p o r e je m p lo , p re d e c ir
un v a lo r d e 11 p a ra u n a e s c a la d e 10 p u n to s ), r e q u irie n d o p o r ta n to a lg u n a f o rm a d e a ju s te a d i
c io n a l. In c lu s o c o n to d o s e s to s p ro b le m a s p o te n c ia le s , el m to d o d e re g r e s i n d e im p u ta c i n es
p r o m e te d o r en a q u e llo s c a s o s d o n d e se p r e s e n te n n iv e le s m o d e ra d o s d e d is p e rs i n d e lo s d ato s
a u s e n te s y d o n d e la s r e la c io n e s e n tre la s v a r ia b le s e s t n lo s u f ic ie n te m e n te e s ta b le c id a s co m o
p a r a q u e el in v e s tig a d o r c o n fie e n q u e el u so d el m to d o no te n d r im p a c to so b re la g e n e ra lid a d
d e lo s re su lta d o s.

Im p u ta c i n m ltip le E l ltim o m to d o d e im p u ta c i n es e n re a lid a d u n a c o m b in a c i n d e v a


rio s m to d o s. E n esta a p ro x im a c i n , s e u sa n d o s o m s m to d o s p a ra d e riv a r u n a e s tim a c i n c o m
p u e s ta , u su a lm e n te la m e d ia d e las d iv e rs a s e s tim a c io n e s p a ra e l d a to a u s e n te . L a l g ic a d e esta
a p ro x im a c i n es q u e e! uso de la a p ro x im a c i n m ltip le m in im iz a lo s p ro b le m a s e s p e c fic o s con
c u a lq u ie r m to d o sim p le sie n d o s u c o m p o sic i n la m e jo r estim a c i n . L a e le c c i n d e esta a p ro x i
m a c i n se b a s a fu n d a m e n ta lm e n te e n la c o n c e s i n m u tu a e n tre la p e rc e p c i n d e l in v e stig a d o r d e
lo s p o te n c ia le s b e n e fic io s p o n d e ra d a y el e s fu e rz o su s ta n c ia lm e n te su p e rio r q u e re q u ie re re a liz a r
y c o m b in a r las m ltip le s e s tim a c io n e s.

P rocedim ientos basados en el m odelo

E ste c o n ju n to tln a l d e p ro c e d im ie n to s in c o rp o ra e x p lc ita m e n te lo s d ato s a u s e n te s e n el an lisis,


b ie n s e a a tra v s d e u n p ro c e so e s p e c fic a m e n te d is e a d o p a ra la e s tim a c i n d e d a to s a u s e n te s, o
b ie n c o m o u n a p o rc i n in te g ra l d e l a n lis is m u ltiv a ria n te estn d ar. L a p r im e ra a p ro x im a c i n u ti
liz a e s tim a c io n e s de m x im a v e ro s im ilitu d q u e in te n ta n m o d e liz a r los p ro c e so s q u e su b y a e e n en
la a u s e n c ia d e d a to s y re a liz a r la e s tim a c i n m s p re c is a y ra z o n a b le [9 ], U n e je m p lo es la ap ro
x im a c i n E M e n S P S S . R e p re s e n ta u n m to d o fre c u e n te d e d o s e ta p a s (la s e ta p a s E y M ) e n los
q u e la e ta p a E re a liz a la s m e jo re s p o s ib le s e s tim a c io n e s d e lo s d a to s a u s e n te s y a c o n tin u a c i n la
e ta p a M re a liz a e stim a c io n e s d e lo s p a r m e tro s (m e d ia s, d e s v ia c io n e s tp ic a s o c o rre la c io n e s) co n
la su p o s ic i n d e q u e se re e m p la z a ro n to d o s lo s d a to s a u s e n te s. El p ro c e s o c o n tin a c o n estas dos
e ta p a s h a s ta q u e e l c a m b io de lo s v a lo re s e s tim a d o s es d e s p re c ia b le y se re e m p la z a n to d o s los
d a to s au sen te s.
L a se g u n d a ap ro x im a c i n in c lu y e los d ato s a u s e n te s d ire c ta m e n te e n e l a n lis is, d e fin ie n d o ob
s e rv a c io n e s c o n d ato s a u s e n te s c o m o u n su b c o n ju n to se le c to d e la m u e s tra . E s ta a p ro x im a c i n es
m s a p ro p ia d a p a ra tra ta r c o n lo s d a to s a u s e n te s d e las v a ria b le s in d e p e n d ie n te s c u n a d o h a y u n a
r e la c i n d e d e p e n d e n c ia . S u p re m is a q u e d a c a ra c te riz a d a p e rfe c ta m e n te e n e s te p a s a je d e C o h n
y C o h n [4 , p g . 299]:

Vemos por tanto los datos ausentes com o un hecho prctico que debe ser investigado, en lugar de como
un desastre a ser mitigado. A dem s, implcita en esta filosofa est la idea de que com o otros aspectos
de la m uestra de datos, los datos ausentes son una propiedad de la poblacin a la que se busca
generalizar.
48 A N L IS IS M U L TIV A R IA N TE

C u a n d o te n e m o s d ato s a u s e n te s en u n a v a ria b le no m trica , el in v e stig a d o r p u e d e d e fin ir f


c ilm e n te a q u e lla s o b se rv a c io n e s c o m o un g ru p o se p a ra d o y e n to n c e s in c lu irla s e n c u a lq u ie r a n
lisis, c o m o A N O V A o M A N O V A o in c lu s o el a n lis is d isc rim in a n te . C u a n d o lo s d a lo s a u s e n te s
se e n c u e n tra n en u n a v a ria b le in d e p e n d ie n te m tric a d e u n a re la c i n d e d e p e n d e n c ia , se h a d e s a
r ro lla d o un p ro c e d im ie n to p a ra in c o rp o ra r las o b s e rv a c io n e s en el a n lis is m ie n tra s se m a n tie n e n
las re la c io n e s e n tre las v a ria b le s v lid a s [4 ]. E ste p ro c e d im ie n to se p u e d e ilu s tra r m e jo r en el c o n
te x to d e un a n lisis de re g re si n , a u n q u e ta m b i n p u e d e u tiliz a rs e e n o tra s re la c io n e s d e d e p e n
d e n c ia . El p rim e r p aso es c o d ific a r to d a s las o b s e rv a c io n e s co n d a to s a u s e n te s c o m o v aria b les
fic tic ia s (d o n d e lo s ca so s co n d a to s a u s e n te s re c ib e n un v a lo r d e u n o y e l resto d e lo s c a s o s u n v a
lo r d e ce ro ). L os v alo re s a u s e n te s s e im p u ta n a s p o r el m to d o d e la s u s titu c i n p o r Ja m e d ia . F i
n alm en te. la relacin se estim a p o r m e d ia s n o rm a le s. L as v aria b les ficticias rep rese n tan la d iferen cia
en la v aria b le d e p e n d ie n te en tre aq u e lla s o b se rv a c io n e s co n d alo s au se n te s y a q u e lla s o b se rv a cio n e s
c o n d a to s v lid o s. El te st de! c o e fic ie n te d e la v a ria b le fic tic ia e v a l a la s ig n ific a c i n er-iadistica
de e s ta d ife re n c ia . El c o e fic ie n te d e la v a ria b le o rig in a l re p re s e n ta la re la c i n e n tre to d o s lo s c a
so s c o n d ato s no au sen tes. E ste m to d o p e rm ite al a n a lista rete n er to d a s las o b se rv a c io n e s en el a n
lisis co n el fin de m a n te n e r e l ta m a o d e la m u e stra , m ie n tra s q u e ta m b i n p ro p o rc io n a u n test
d ire c to de las d ife re n c ia s e n tre lo s d o s g r u p o s ju n t o c o n las re la c io n e s e s tim a d a s e n tre v aria b les
d e p e n d ie n te s e in d e p en d ie n te s.

Un ejem plo de diagnstico de d ato s ausentes


P a ra ilu s tra r e l p ro c e so de d ia g n stic o d e las p a u ta s d e d ato s a u s e n te s y la a p lic a c i n d e la s p o s i
b le s so lu c io n e s, v a m o s a in tro d u c ir un n u e v o c o n ju n to d e d a to s (v e s e A p n d ic e A p a ra u n a lisia
c o m p le ta d e las o b se rv a c io n e s). E ste c o n ju n to d e d a to s fu e re c o g id o d u ra n te u n a s p ru e b a s p rev ia s
del c u e stio n a rio u tiliz a d o p a ra re c o g e r lo s d a to s d e s c rito s en el C a p tu lo 1. E sta p ru e b a p re v ia se
re a liz a 7 0 in d iv id u o s y re c o g a re s p u e sta s s o b re las 14 v a ria b le s. E n e l c u rso d e esta p ru e b a , sin
e m b a rg o , se e n c o n tra re n d a to s a u s e n te s. L as s ig u ie n te s se c c io n e s d e ta lla n e! d ia g n s tic o d e la ex
te n s i n de lo s d ato s aumentes e n el c o n ju n to d e d a to s y lo s a n lis is p ro p o rc io n a d o s p a ra s e le c c io
n a r y a p lic a r la s d iv e rso s so lu c io n e s p a ra la a u s e n c ia d e d ato s d isp o n ib le s en la m a y o r p a r te d e io-
p ro g ra m a s e s ta d stic o s M u c h o s p ro g ra m a s d e s o ftw a re e st n in c o rp o ra n d o p ro g ra m a s d e a n lisis
d e d a lo s a u se n te s, en tre e ilo s B M D P y S P S S . L o s a n lis is in d ic a d o s a c o n tin u a c i n p u e d e n ser
re p ro d u c id o s m e d ian te la m a n ip u la c i n d e d a lo s y el a n lis is c o n v e n c io n a l. E n el A p n d ic e A se
p ro p o rc io n a n v a rio s ejem p lo s.

Examen de las pautas de datos ausentes

L a T a b la 2.2 co n tie n e las e s ta d stic a s d e s c rip tiv a s d e la s o b s e rv a c io n e s co n d a to s v lid o s, in c lu


y e n d o el p o rc e n ta je de c a so s c o n d a to s a u s e n te s so b re c a d a v a ria b le . S e h an e lim in a d o se is ca so s
del a n lis is d e b id o a q u e se tra ta b a e s e n c ia lm e n te d e d a to s a u s e n te s en to d a s as v a ria b le s d e in
ters. L a c a n tid a d de d ato s a u s e n te s p a ra las 6 4 o b s e rv a c io n e s re sta n te s v a d e s d e el m x im o d e un
3 0 p o r c ie n to de lo s c a so s p a ra Aj a u n m n im o d e un n ic o c a s o (1 .6 p o r c ie n to ) p a ra A'(>. P a ra las
v a ria b le s c o n un m a y o r n iv e l d e d a to s a u s e n te s (Aj. A", y X ) , lo s n iv e le s no s o n tan excesiv o s p ara
d ic ta r u n a e x c lu si n de la v a ria b le . D a d o el p a p e l in te g ral q u e se e s p e ra q u e ju e g u e n e s ta s v a ria
b le s en lo s d iv e rso s a n lisis m u ltiv a ria n te s . s e d e b e n re a liz a r to d o s lo s e s fu e rz o s p o sib le s pura r e
te n e rlo s en el an lisis.

Estadstica de resumen de los datos previos a la prueba

U n f a c to r q u e p o d r a a liv ia r a lg u n o s d e lo s a lto s n iv e le s d e d a to s a u s e n te s p a r a c ie r ta s v a r ia
b le s e s la e lim in a c i n de lo s c a s o s d e l a n lis is . P a ra d e te r m in a r si lo s d a to s a u s e n te s s e co n -
A N L IS IS P R E V IO D E L O S DATOS 49

TABLA 2 .2 . Estadstica de resu m en de las d a ta s previos a la prueba

Nmero de casos Datos ausentes


con datos Desviacin
vlidos M edia estndar Nmero Porcentaje

.V, Velocidad de entrega 45 4,0133 0,9664 19 29,7


X , Nivel de precios 54 1,8963 0,8589 10 15,6
.V, Flexibilidad de precios 50 8,1300 1,3194 14 21,9
A'j Imagen del productor 60 5,1467 1,1877 4 6,3
A", Servicio conjunto 59 2,8390 0,7541 5 7,8
X h Imagen de fuerza de ventas 63 2,6016 0,7192 1 1,6
A-, Calidad de producto 60 6,7900 1,6751 4 6,3
A', Nivel de fidelidad 60 45,9667 9,4204 4 6,3
A",0 Nivel de satisfaccin 60 4,7983 0,8194 4 6.3

N o ta: S eis d e los 70 ca so s o rig in a le s te n a n m s del 9 0 p o r c ie n to d e d a to s au se n te s y fuero n e x c lu id o s del anlisis. Todos


los a n lis is se basan e n los 6 4 ca so s restan tes. V eintisis ca so s n o tenan d a to s ausentes.

c e n tr a n e n u n c o n ju n to s e le c c io n a d o d e c a s o s , la T a b la 2.3 p r o p o rc io n a u n a r e p r e s e n ta c i n g r
f ic a d e la s p a u ta s d e d a to s a u s e n te s . E x c e p to lo s s e is c a s o s y a e lim in a d o s d e b id o a lo s n iv e le s
e x tre m a d a m e n te a lto s d e d a to s a u s e n te s , v e m o s q u e n in g n o tro c a s o tie n e u n n m e ro d e s p ro
p o r c io n a d o d e d a to s a u s e n te s . D e h e c h o , s lo d o s c a s o s tie n e n m s d e d o s d a to s a u s e n te s . P o r
ta n to , d e lo s 38 c a s o s c o n d a to s a u s e n te s , s o la m e n te c u a tro c a s o s tie n e n m s d e d o s v a lo re s a u
s e n te s .

TABLA 2 .3 . R epresentacin grfica d e las p a u ta s d e d ato s au se n te s

Clase de caso

Nmero D atos ausentes


de variables
Caso ausentes Af, *4 *5 ^ X,

202 2 S s
203 2 S s
204 3 S s s
205 1 s
207 3 s s s
213 2 s s
216 2 s s
218 2 s s
219 2 s s
220 1 s
221 3 s s s
222 2 s s
224 3 s s s
225 2 s s
227 2 s s
228 2 s s
229 1 s
231 1 s
232 2 s s
235 2 s s
237 1 s
238 1 s
240 1 s
A N A L I S IS M U L TIV A R IA N TE

TABLA 2 .3 . (continuacin) R epresentaci n grfica d e las p a u ta s d e d ato s a u s e n te s

Clase de cusa

Ntuneiv D alos alsenles


de valares
Caso ausentes X -n *4 a; A-, x,

241 2 s s
244 I s
246 1 s
248 2 S S
249 1 s
250 2 S s
253 1 s
255 2 s s
256 1 s
257 2 s s
259 1 s
260 I s
267 2 s s
268 I s
269 2 s s
L ey en d a: S = un v a lo r ausente.

L a T ab la 2 .4 re p re se n ta la s p a u ta s d e lo s d a to s a u se n te s. L a p a u ta m s fre c u e n te e s la q u e se
e n c u e n tra en lo s d ato s a u s e n te s d e X (s e is c a s o s ), y la s ig u ie n te p a u ta m s c o m n e s t e n lo s da-

TABLA 2 .4 . P autas de d ato s a u s e n te s ta b u lad a s

P autas de dalos ausentes"


Nmero
de casos AL X. A' X. a; x. X,

26
1 X
4 X X
6 X
1 X X
1 X
2 X X
o X X
X
X X
2 X X
3 X
2 X X
1 X X
1 X
1 X X
1 X
1 X X
1 X X X
X
X X
X X X
X X X

J L as v ariables estn o rd e n a d a s sobre las p a u la s au sen tes.


A N L IS IS P R E V IO D E LOS DATOS 51

to s a u s e n te s de Aj y X x (c u a tro c a so s ). T o d o s lo s c a s o s re sta n te s m u e stra n p a u ta s q u e so n e s e n


c ia lm e n te n ic a s o c o m p a rtid a s s o la m e n te e n u n n m e ro d e c a s o s m u y re d u c id o . Tal y c o m o d e
m u e s tra e ste a n lis is , n o o c u rre n p a u ta s c o n u n a fre c u e n c ia q u e su g ie re un p ro c e s o d e d ato s
a u s e n te s su b y a c e n te . P o r ta n to , n o se p u e d e e lim in a r n in g n c a s o o se rie d e c a so s.

La diagnosis de ia aleatoriedad de los datos ausentes

El sig u ie n te p aso es e x a m in a r las p a u ta s d e d a to s a u s e n te s y d e te rm in a r si lo s d a to s a u s e n te s se


d istrib u y e n a le a to ria m e n te a tra v s d e lo s c a s o s y d e las v a ria b le s . E l p rim e r te st p a ra e v a lu a r la
a le a to rie d a d es c o m p a ra r la s o b s e rv a c io n e s c o n y s in d a to s a u s e n te s p a ra c a d a v a ria b le e n fu n ci n
d e la s o tras variables. P o r ejem p lo , c o m p ro b a r si las o b se rv a cio n e s co n d ato s au s e n te s enA -, se sitan
e n un gru p o y las o b se rv a cio n e s c o n re sp u e sta s v lid a s en Aj se sit an en o tro g ru p o . A co n tin u aci n ,
e s to s d o s g ru p o s se c o m p a ra n p a ra id e n tific a r c u a lq u ie r d ife re n c ia e n tre las v a ria b le s re s ta n te s (de
A , a A jn). U n a v e z q u e se h a n h e c h o las c o m p a r a c io n e s s o b re las o tras v a ria b le s , se fo rm a n n u ev o s
g ru p o s s o b re los d ato s au se n te s p a ra a sig u ie n te v a ria b le (A-,) y se c o m p a ra n o tra v e z s o b re el resto
d e las v a ria b le s. E ste p ro c e so c o n tin a h a s ta q u e c a d a v a ria b le (d e sd e Aj a A j0) h a sid o e x a m in a d a
p a ra c a d a d ife re n c ia . El o b je tiv o es id e n tific a r c u a lq u ie r p ro c e so s is te m tic o d e d a to s au sen te s q u e
q u e d e re fle ja d o en p a u ta s de d ife re n c ia s sig n ific a tiv a s.
L a T a b la 2 .5 c o n tie n e lo s re su lta d o s d e e s te a n lis is p a ra las 6 4 o b se rv a c io n e s re sta n te s d e la
m u e s tra a n te s d e la p ru eb a . L a p rim e ra p a u ta n o ta b le d e v a lo re s t sig n ific a tiv o s se o b se rv a e n X 9,
d o n d e se h a n e n c o n tra d o d ife re n c ia s s ig n ific a tiv a s e n tre lo s d o s g ru p o s en seis d e las n u e v e c o m
p a ra c io n e s. S in e m b a rg o , el im p a c to d e e s ta s d ife re n c ia s es m a rg in a l d ad o q u e el n m e ro d e c a
so s c o n d ato s a u s e n te s e n A j o s c ila e n tre tre s y c in c o . X 1 m u e s tra u n a p a u ta d e d ife re n c ia s sim ila r
a A j c o n s lo c u a tro d ife re n c ia s sig n ific a tiv a s y p e q u e o s g ru p o s d e c a so s co n d ato s au sen te s. E ste
a n lisis in d ic a q u e au n q u e se p u ed e n e n c o n tra r d ife re n c ia s sig n ific ativ as d eb id o a los d ato s au sen tes
d e d o s v a ria b le s (Al, y A j), sin e m b a rg o , e l r e d u c id o n m e ro d e c a s o s im p lic a d o s h a c e q u e el in te
r s se a m a rg in a l. S i lo s te st d e a le a to rie d a d u lte rio re s in d ic a n u n a p a u ta n o a le a to ria d e lo s d ato s
a u s e n te s, e sto s re su lta d o s p ro p o rc io n a ra n e n to n c e s u n p u n to d e p a rtid a p a ra p o s ib le s so lu c io n e s.
U n s e g u n d o te st d e a le a to rie d a d im p lic a e l u so d e c o rre la c io n e s e n tre v a ria b le s d ic o t m ic a s. L as

TABLA 2 .5 . E v a l u a c i n d e la a l e a t o r i e d a d d e l o s d a t o s a u s e n t e s a t r a v s d e c o m p a r a c i o n e s d e g r u p o s d e
o b s e r v a c i o n e s c o n d a to s a u s e n te s fren te a d a to s v lid o s

Grupos form ados p o r


dalos ausentas sobre: Ai, *4 x, x* x,

X, t -0,3 1,3 2,2 2,6 1,9 - 1,1 2,6 2,1


Significacin 0,763 0,223 0,033 0,017 0,065 0,273 0,017 0,049
Nm ero presente 45 38 38 42 42 44 42 42 43
Nm ero ausente 0 16 12 18 17 19 18 18 17
M edia (presente) 4,01 1,87 8,27 5,34 3,02 2,71 6,61 48,17 4,95
M edia (ausente) 1.95 7,68 4,69 2,39 2.36 7,20 40,83 4,42
-0.5 0,7 - 2,2 -4 ,2 -2 .4 - 1,2 - 1,1 - 1,2
Significacin 0,646 0,528 0,044 0,001 0,034 0,260 0,318 0,233
Nm ero presente 38 54 42 50 49 53 51 52 50
Nm ero ausente 7 0 8 10 10 10 9 8 10
M edia (presente) 3,97 1,90 8,18 4,99 2,70 2.51 6,68 45,46 4,75
M edia (ausente) 4,23 7,86 5,94 3,50 3,11 7,40 49,25 5.02

x> 1 0.4 1,4 U 2,0 0.2 0,0 1,9 0,9


Significacin 0.693 0,180 0,286 0,066 0,818 0,965 0,073 0,399
Nm ero presente 38 42 50 48 47 49 47 46 48
N m ero ausente 7 12 0 12 12 14 13 14 12
Media (presente) 4,03 1,98 8,13 5,24 2,95 2,61 6,80 47,02 4,84
Media (ausente) 3,90 1.60 4,79 2,42 2,56 6,77 42,50 4,62
52 A N L I S IS M U L T iV A R IA N T E

TABLA 2 .5 . (continuacin) Evaluacin de la a le a to rie d a d d e los d ato s a u s e n te s a trav s d e c o m p a ra c io n e s de


g ru p o s d e o b se rv a cio n e s con d ato s a u s e n te s fren te a d a to s v lidos

Grupos fo rm ados p o r
daros ausentes sobre: Aj *4 x. a; x, x. x,

Aj t - 0.2 2.6 -0 ,3 0.2 1.4 1.5 0,2 -2 ,4


Significacin 0,882 0.046 0,785 0.88S 0,249 0,197 0,830 .064
Nmero presente 42 50 48 60 55 59 56 56 56
N m ero ausente 3 4 2 0 4 4 4 4 4
Media (presente) 4,01 1,94 8,12 5,15 2.84 2,63 6,83 46,02 4,76
Media (ausente) 4,07 1,33 8,35 2,80 2.25 6,20 45,25 5,38
Aj , - 0,1 -0 .3 0,8 0,4 -0 ,9 -0 ,4 0.5 0.6
Significacin 0.900 0,749 0,502 0,734 0,423 0,696 0,669 0,605
N m ero presente 42 49 47 55 59 58 55 55 55
i
N m ero ausente 3 5 5 0 5 5 5 5
Media (presente) 4,01 1.89 8,20 5,16 2,84 2.58 6,76 46.18 4,82
M edia (ausente) 4,10 1.98 7,10 5.04 2,86 7,14 43.60 4.56
a; t 3.0 0,9 0,2 2.1 0.9 -1,5 0,5 0.4
Significacin 0.036 0.440 0,864 0,118 0,441 0,193 0,658 0.704
Nmero presente 42 51 47 56 55 59 60 57 56
Nm ero ausente 3 3 3 4 4 4 0 3 4
Media (presente) 4,07 1.92 8,14 5.07 2,86 2,58 6,79 46,14 4,8!
M edia (ausente) 3,27 1.50 8.00 6 . 1S 2,55 2,90 42,67 4.70
X, t 6,1 -1 .4 2.2 - 1.1 -0 .9 - 1,8 1.7 1.6
Significacin 0.000 0.384 0,101 0,326 0.401 0.149 0,128 0,155
Nm ero presente 42 52 46 56 55 59 57 60 56
Nmero ausente 3 2 4 4 4 4 3 0 4
M edia (presente) 4,08 1.85 8.26 5.11 2,82 2,57 6,82 45.97 4.82
M edia (ausente) 3,10 3.00 6.63 5,62 3.08 3,03 6.30 4.47
1.7 0.8 - 2,1 2.5 2 ." 1.3 0.9 2.4
*10 '
Significacin 0.249 0.463 0.235 0.076 0.056 0.302 0,409 0,066
N m ero presente 43 50 48 56 55 60 56 56 60
Nmero ausente 2 4 2 4 4 3 4 4 0
Media (presente) 4.03 1.92 8.09 5.23 2,89 2.62 6,83 46,43 4.80
Media (ausente) 3.55 1,60 9.20 3.95 2.08 2,17 6,30 39,50

C ad a ce ld a c o n tie n e se is v alores: I ) v alor / para c o m p a ra r la v a ria b le d e c o lu m n a entre un g rupo a (o b se rv a c io n e s co n d a to s v lid o s so b re _


la v ariab le lin eal) y g ru p o b (o b serv acio n es co n d a lo s au se n te s so b re la v a ria b le lin eal); 2 ) sig n ificaci n d e v a lo r i p a ra co m p a ra c io n e s
d e g ru p o , 3 ) y 4 ) n u m ero d e o b se rv a c io n e s p ara e l g ru p o a (d a lo s v lid o s) y g rupo b (datos au sen tes); 5 ) y 6 ) m e d ia d e v a ria b le p ara el
g ru p o a (d a to s v lid o s) y g ru p o b (d a to s ausentes).
Interp retaci n d e la tab la:
L a celd a d e la d ere c h a su p e rio r indica q u e el v a lo r I p ara la c o m p a ra c i n d e ACI() entre el g ru p o a (d a to s v lid o s) y g ru p o b (d a to s a u
se n te s) so b re .V, e s 2 .1 , lo q u e tie n e un n iv el d e sig n ific a c i n d e 0 .0 4 9 . L os tam a o s m u strales del g rupo a y el g ru p o b so n 4 3 y 12,
resp ec tiv am en te . F in alm en te, la m ed ia d c X ltl p ara el g ru p o a (d a to s v a lid o s) e s 4 .9 5 , m ien tra s q u e la m e d ia p ara el g ru p o b (d a to s a u
sen tes) e s 4 ,4 2 .

v a ria b le s d ic o l m ic a s s e fo rm a n a! r e e m p la z a r lo s v a lo re s v lid o s p o r u n o y lo s d a lo s a u s e n te s por


ce ro . L a s c o rre la c io n e s re s u lta n te s e n tre la s v a ria b le s d ic o t m ic a s in d ic an la m e d id a e n q u e lo s d a
to s a u s e n te s e s t n re la c io n a d o s e n tre p a re s d e v a ria b le s . L as c o rre la c io n e s b a ja s in d ic a n u n a baja
a s o c ia c i n e n tre lo s p ro c e so s d e a u s e n c ia d e d a to s p a ra esas d o s v a ria b le s. L a T a b la 2 .6 co n tien e
la s c o rre la c io n e s en tre las n u e v e v a ria b le s d ic o to m iz a d a s . L a rev isi n d e los v a lo re s in d ic a q u e slo
u n a c o rre la c i n tie n e u n ra n g o m o d e ra d o (Aj y A ju p re s e n ta n u n a c o rre la c i n d e 0 ,4 8 8 ). E sto s u
g ie re q u e lo s p ro c e s o s d e d a to s a u s e n te s q u e in flu y e n en X (l c o rre sp o n d e n a lo s p r o c e s o s d e d ato s
a u s e n te s q u e a fe c ta n a A j. S in e m b a rg o , d a d a la a u s e n c ia d e c u a lq u ie r o tra c o rre la c i n c o n v a lo
re s in c lu so m o d e ra d o s, el in v e s tig a d o r p u e d e a s e g u ra rs e q u e n in g n p ro c e s o a is la d o d e d a lo s au
s e n te s e s t a fe c ta n d o sig n ific a tiv a m e n te a u n n m e ro su stan cial d e v a ria b le s.
A N L IS IS P R E V IO DE L O S DATOS 53

TABLA 2 .6 . E valuacin d e la a le a to rie d a d d e lo s d a to s a u s e n te s a tra v s d e c o rre la c io n e s d e una v ariab le


dicotom izada y el te st m ultivariante para au sen cia c o m p lem en te aleato ria (MCARI

X, X, x, x, x -v x>
Velocidad Nivel Flexibilidad Imagen Servicio imagen Calidad Nivel Nivel
de de de del conjunto de Jerza de de de
entrega precios precios productor d e ventas producto fidelidad satisfaccin

1,000
45
X, 0,003 1,000
38 54
x, 0.235 - 0,020 1.000
38 42 50
Xt 0.026 - 0,111 0,176 1,000
42 50 48 60
V 0,066 -0,125 0.128 -0,075 i .000
42 49 47 55 59
x -0.082 -0.054 -0,067 -0.033 -0 ,0 3 7 1,000
44 53 49 59 58 63
A'. -0.026 0,067 0.020 -0,067 -0 .0 7 5 -0.033 1,000
42 51 47 56 55 59 60
K 0,026 0,244 -0,137 -0.067 -0 .0 7 5 -0,033 0,200 \ ,000
42 52 46 56 55 59 57 60
X ia 0.115 - 0.111 0.176 -0,067 -0,075 0,488* -0,067 -0 .0 6 7 1,000
43 50 48 56 55 60 56 56 60

Test M C A R tic L ittle: C h i-cu ad rad o : 174.464


G rad o s de libertad: 159
P robabilidad: 0 ,1 9 0
Interpretacin:
E l p rim e r v alo r e n la ta b la re p re se n ta la c o rre la ci n entre las v a ria b le s d ico to m izad as. d o n d e los casos c o n un v alo r vlid o recib en un
1 y los d alo s au se n te s recib en un 0. El seg u n d o v a lo r p o r d eb a jo d e la co rre la ci n rep re sen ta e l n m ero d e ca so s q u e tien en datos vlidos
so b re las d o s v a ria b le s e n esta p a re ja d e co rre la ci n esp ecifica.
* S ig n ifcam e al n iv el d e 0.05.

L a p ru e b a final es un te st co n ju n to d e lo s d a to s a u s e n te s p ara c o m p ro b a r q u e la a u s e n c ia d e d a
to s e s c o m p le ta m e n te a le a to ria (M C A R ). E l te st h a c e u n a c o m p a ra c i n d e lo s d a to s a u s e n te s co n
lo q u e se e s p e ra ra si lo s d a to s a u s e n te s s e d is trib u y e s e n d e u n a fo rm a c o m p le ta m e n te alea to ria.
E n e s te ca so , c o m o se m u e stra e n la T a b la 2 .6 , el n iv e l d e sig n ific a c i n d e lo s te st M C A R es d e
0 .1 9 0 , in d ic a n d o q u e lo s p ro c e so s d e a u s e n c ia d e d a to s p u e d e n s e r c o n s id e ra d o s c o m o M C A R .
C o m o resu ltad o , el in v e stig a d o r p u e d e e m p le a r c u a lq u ie ra d e las so lu c io n e s p a ra la au sen c ia d e d a
tos. p o rq u e n o e x iste n se sg o s p o te n c ia le s e n las p a u ta s q u e sig u e n lo s d a to s a u s e n te s.

Soluciones para la ausencia de datos

C o m o se ha d isc u tid o p re v ia m e n te , e x iste n n u m e ro s a s so lu c io n e s p a ra tratar c o n la a u se n c ia d e los


d ato s. P ero en este ca so , m u c h a s de e lla s tie n e n c la ra s d e s v e n ta ja s . Si s e c o n s id e ra la a p ro x im a
ci n d e c a so c o m p le to , el ta m a o d e la m u e s tra se re d u c e a 2 6 o b se rv a c io n e s, a p e n a s su fic ie n te in
c lu so p a ra el a n lis is u n iv a ria n te m s s im p le , y m u c h o m e n o s p a ra a p lic a c io n e s m u ltiv a ria n te s.
N u e s tro a n te rio r e x a m e n d e las p a u ta s d e lo s d a to s a u s e n te s d e m o str q u e no e x is ta u n co n ju n to
p e q u e o de c a so s q u e p u d ie ra n s e r d e s tru id o s y a s i re d u c ir s u sta n c ia lm e n te la c u a n ta d e lo s d a
to s a u se n te s. A d e m s, la n ic a a lte rn a tiv a v ia b le es la e lim in a c i n d e X r q u e tie n e d a to s au sen tes
e n c a si u n 30 p o r c ie n to d e lo s c a so s. P ero in c lu so si X l fu e ra e lim in a d a , to d o s lo s c a so s c o n d a
to s a u s e n te s to d a v a te n d ra n al m e n o s o tra v a ria b le c o n d a to s a u s e n te s; p o r ta n to , e s ta a lte rn a tiv a
es la a p ro x im a c i n m e n o s a tra c tiv a c o m o m e d io d e c r e a r m s o b s e rv a c io n e s c o n d a to s c o m p le to s
e n to d a s las v aria b les.
54 A N L IS IS M U L TIV A R IA N TE

L a o p c i n q u e n o s resta es e m p le a r a lg u n a fo rm a d e im p u ta c i n p a ra e s tim a r lo s v a lo re s que


re e m p la z a r n a lo s v a lo re s a u se n te s. A l se le c c io n a r u n a t c n ic a d e im p u ta c i n , el p r im e r p a s o es
s e le c c io n a r e n tre u sa r s lo o b se rv a c io n e s co n d a lo s c o m p le to s o u s a r to d a s la in fo rm a c i n d is p o
n ib le . L a v e n ta ja de la a p ro x im a c i n de in fo rm a c i n c o m p le ta e s q u e m a n tie n e la c o n s is te n c ia de
la m a triz de co rrela ci n : pero p u e d e ta m b i n re d u c ir el n m e ro d e o b se rv a c io n e s u tiliz a d o a un c o n
ju n to ta n p e q u e o de la m u e stra (2 8 c a s o s ), q u e las c o rre la c io n e s re s u lta n te s u tiliz a d a s p a ra la
im p u ta c i n d ifie ra n sig n ific a tiv a m e n te de a q u e lla s o b se rv a c io n e s o b te n id a s d e las a p ro x im a c io n e s
d e in fo rm a c i n y d is p o n ib ilid a d c o m p le ta .
L a a p ro x im a c i n d e d is p o n ib ilid a d c o m p le ta m a x im tz a el n m e ro d e c a s o s u s a d o s en el c l
c u lo d e c o rre la c io n e s. U n a te rc e ra o p c i n e s el u so d e u n a su stitu c i n d e m e d ia p a ra to d o s lo s d a
to s a u s e n te s y d e s p u s c a lc u la r las c o rre la c io n e s .
L a T ab la 2 .7 c o n tie n e tas c o rre la c io n e s o b te n id a s d e las a p ro x im a c io n e s d e d is p o n ib ilid a d e in
fo rm a c i n c o m p le ta y su stitu c i n d e la m e d ia . E n m u c h o s ca so s la s c o rre la c io n e s so n m u y s im i
la re s , p e r o e x is te n n u m e ro s a s p a u ta s d e d if e r e n c ia s s u s ta n c ia le s . E n p r im e r lu g a r, h a y una
c o n s iste n c ia e n tre las c o rre la c io n e s o b te n id a s c o n las a p ro x im a c io n e s d e d is p o n ib ilid a d c o m p le ta
y la su stitu c i n p o r la m ed ia. L as d ife re n c ia s su rg e n e n tre las c o rre la c io n e s o b te n id a s c o n la ap ro -

T A B L A 2 . 7 . C o m p a r a c i n d e l a s c o r r e l a c i o n e s o b t e n i d a s c o n l a s a p r o x i m a c i o n e s d e d i s p o n i b i l i d a d c o m p l e t a (en
t r m i n o s d e p a r e j a ) , d e c a s o c o m p l e t o ( e n t r m i n o s d e lista) y s u s t i t u c i n d e la m e d i a

X, A'. A', x f Aj X. A, x.
Velocidad Nivel Flexibilidad Imanen Servicio Imagi n Calidad Nivel Nivel
de de de de! con/unto d e fuerza de de de
entrena precios precios productor de venta< producto fid elid a d satisfcuin

X. 1.000
] .000
1.000
X, -0.470 1.000
-0.502 1.000
-0.349 1.000
x. 0.416 -0.357 1,000
0.429 -0,294 1,000
0.329 -0,289 1.000
Xt -0.099 0,299 -0.065 1.000
-0.245 0.320 -0.061 1,000
-0.086 0.245 -0.057 1,000
0.366 0.440 0.047 0.432 1.000
0.566 0,421 0.157 0.046 1.000
0.232 0.3X2 0,042 0,422 1.000
. 0.031 0.260 0,035 0.810 0.344 1.000
-0.094 0,356 -0.066 0.804 0.213 1,000
0.027 0,219 -0.032 0,769 0.323 1,000
X. -0.138 0.348 -0.358 0.398 0,066 0,402 1,000
-0.416 0,354 0,230 0.382 0.150 0.529 1.000
-0.106 0,310 -0,297 0.374 0.061 0.395 1.000
x. 0.376 0,149 0,601 0.223 0,712 0.268 - 0.202 1.000
0.599 0.048 0,648 0.191 0,683 0.301 - 0,099 1.000
0.265 0,134 0,503 0.216 0,656 0.260 0,195 1,000
0.514 -0,184 0,702 0.378 0.533 0,233 -0 ,2 5 6 0.669 1.000
0.549 -0.278 (J.725 0.170 0.304 0.064 -0,405 0.566 1,000
0.381 -0.173 0,626 0.344 0,477 0,229 -0 .2 5 0 0.647 1,000

Interpretacin: El v alo r su p erio r es la correlacin obtenida con una apro x im aci n en leo n in o s de pareja o d isp o n ib ilid ad co m p leta, el segundo
v a lo re s la correlacin obten id a con una aproxim acin en trm inos de lisia o inform acin com pleta, y el lerecr v a lo re s la correlacin obtenida
con la sustitucin de m edia. Los tam aos m ustrales para la aproxim acin d e la disponibilidad de inform acin com pleta variaban: los tam aos
m ustrales reales estn listados en la T abla 2.5. Se u tiliz un tam a o m ucsiral de 2 6 para las co rre la cio n es de info rm aci n co m p leta; no
haba d ato s au sen tes d esp u s d e la sustitucin de la m edia, por lo q u e el tam a o m u estral para esta ap ro x im aci n fue 64.
A N L IS IS P R E V IO DE LOS DATOS 55

TABLA 2 . 8 . R e s u l t a d o s d e lo s m t o d o s d e r e g r e s i n e i m p u t a c i n EM

Media iistimada

A X X, A, A', x* X, , x
Mtodos Velocidad Nivel Flexibilidad Imagen Servicio Imagen Calidad Nivel Nivel
de de de de del conjunto de fuerza de de de
imputacin entrega precios precios productor de venias producto fidelidad satisfaccin

EM 3.71 2,03 8.11 5.15 2,82 2.60 6.84 45,85 4.77


Regresin 3.84 1,96 8,10 5,15 2,81 2.59 6,88 45,77 4.77

Desviaciones estndares estimadas

A', A, A1, a; a; A', A


Mtodos Velocidad Nivel Flexibilidad Imagen Servicio !mugen Calidad Nivel Nivel
de de de de del conjunto de fuerza de de de
imputacin entrega precios precios productor de ventas producto fidelidad satisfaccin

EM 1,15 LOO 1,27 1.16 0.75 0,71 1,68 9,29 0,82


Regresin 0,99 0,83 1.26 1.15 0.75 0,72 1,69 9,18 0,82

x im a c i n d e in fo rm a c i n c o m p le ta . En s e g u n d o lu g a r, p u e d e n o b se rv a rse d ife re n c ia s n o ta b le s en
las c o rre la c io n e s e n tre X t y X UI c o n X t , X y X h y X r E sta s d ife re n c ia s p u e d e n in d ic a r el im p a c to del
p ro c e so d e d a to s a u s e n te s, q u e no se h a d e te c ta d o en las m e d id a s d e d ia g n o sis p re v ia s. A u n q u e el
in v e s tig a d o r n o te n g a u n a p ru e b a de m a y o r v a lid e z p a ra c a d a a p ro x im a c i n , e s to s re s u lta d o s d e
m u e stra n las m a rc a d a s d ife re n c ia s q u e se o b tie n e n a v e c e s e n tre d o s a p ro x im a c io n e s . C u a lq u ie ra
q u e se a la a p ro x im a c i n q u e se elija , e! in v e s tig a d o r d e b e ra e x a m in a r las c o rre la c io n e s o b te n id as
p o r m to d o s a lte rn a tiv o s p a ra e n te n d e r el ra n g o d e v a lo re s p o sib les.
S e p u e d e e le g ir ta m b i n el m to d o d e im p u ta c i n p a ra e s tim a r lo s v a lo re s q u e v a n a re e m p la
z a r a lo s d a to s a u se n te s. L a T ab la 2.8 c o n tie n e a lg u n o s re s u lta d o s o b te n id o s al e m p le a r la a p ro x i
m a c i n d e re g re si n de su stitu c i n d e la m e d ia y E M p a ra la im p u ta c i n d e v a lo re s a u s e n te s. E stos
re su lta d o s in c lu y en la s d e s v ia c io n e s d e m e d ia y e s t n d a r q u e se o b tie n e n d e s p u s d e re e m p la z a r
lo s v a lo re s a u s e n te s p o r lo s d a to s im p u ta d o s. T al y c o m o h e m o s o b s e rv a d o en c o m p a ra c io n e s de
c o rre la c io n e s a n te rio re s, se p u e d e n d e te c ta r a lg u n a s d ife re n c ia s , p e ro no e x iste u n a p a u ta c o n
sisten te . P a ra las v a ria b le s X f y X 2, e x iste n d ife re n c ia s n o ta b le s en lo s v a lo re s e s tim a d o s. P a ra las
v a ria b le s re sta n te s lo s re su lta d o s s o n en g e n e ra l m u y sim ila re s e in c lu so id n tic o s. P o r ta n to , e! in
v e s tig a d o r n o tie n e q u e te n e r u n a in d ic a c i n d e fin itiv a d e cu l d e las a p ro x im a c io n e s es a p ro p ia
da. E n su lu g a r, tie n e q u e u n ir las p a u ta s d e d ato s a u s e n te s c o n lo s p u n to s fu e rte s y d b ile s para
c a d a a p ro x im a c i n y d e s p u s se le c c io n a r el m to d o m s a p ro p ia d o . E n el c a so d e e stim a c io n e s d i
fe re n te s, e l m to d o m a s ap ro p ia d o p o d ra se r la a p ro x im a c i n m s c o n s e rv a d o ra d e c o m b in a r las
e s tim a c io n e s en u n a n ic a e s tim a c i n (la a p ro x im a c i n d e im p u ta c i n m ltip le ). S ea cu a l se a la
a p ro x im a c i n q u e s e u sa , el c o n ju n to d e d a to s c o n v a lo re s d e re e m p la z o se d e b e ra c o n s e rv a r p ara
a n lis is p o ste rio re s.

Un repaso del anlisis de valores ausentes


N u e s tra e v a lu a c i n d e la s c u e stio n e s q u e ro d e a n lo s d a to s a u s e n te s en lo s d a to s a n te rio re s a la
p ru e b a p u e d e se r re su m id a m e d ia n te c u a tro co n c lu sio n e s:

1. E l p r o c e s o d e d a to s a u se n te s es M C A R . T o d as las t c n ic a s d e d ia g n o s is re s p a ld a n la c o n
c lu si n d e q u e n o e x iste un p ro c e so d e d ato s a u s e n te s s is te m tic o , q u e c o n v ie rte lo s d ato s
56 A N L IS IS M U L TIVA RIAN TE

a u s e n te s en M C A R (p ro c e so d e d a to s a u s e n te s c o m p le ta m e n te a le a to rio ). E ste in d ic io
p ro p o rc io n a al in v e stig a d o r d o s v e n ta ja s. E n p rim e r lu g a r, n o d e b e ra h a b e r un im p a c to
o c u lto " so b re lo s re su lta d o s q u e h a y a q u e c o n s id e ra r a la h o ra d e in te rp re ta r lo s re s u lta
d o s. En s e g u n d o lugar, se p u e d e a p lic a r c u a lq u ie ra do lo s m to d o s d e im p u ta c i n c o m o
so lu c i n p ara lo s d a to s a u se n te s. Su se le c c i n n o d e b e b a s a rs e e n su c a p a c id a d p ara tratar
c o n p ro c e s o s no a le a to rio s , sin o en la c a p a c id a d d e a p lic a r el p ro c e s o y s u im p a c to
so b re lo s resu ltad o s.
2. L a im p u ta c i n e s In fo r m a tic a c tu a r m s l g ica . D ad o el b e n e fic io m n im o d e la su p resi n
de ca so s y v a ria b le s, el in v e s tig a d o r d e b e e x c lu ir la s o lu c i n m s s im p le (s u p rim ir c a so s
o v a ria b le s ). A d em s, el m to d o del c a s o c o m p le to te n d ra c o m o re su lta d o u n ta m a o d e
m u e stra in a d e c u a d o . P o r ta n to , e s n e c e s a rio lle v a r a c a b o u n a im p u ta c i n c o n ei fin d e
m a n te n e r un ta m a o d e m u e stra a d e c u a d o p a ra c u a lq u ie r a n lis is m u ltiv a ria n te .
3. L a s c o rre la c io n e s im p u ta d a s so n d ife r e n te s en to d a s la s t c n ic a s. C u a n d o s e e s tim a n las
c o rre la c io n e s en tre v a ria b le s e n p re s e n c ia d e d a to s a u s e n te s, e l in v e s tig a d o r p u e d e e le g ir
e n tre tre s t c n ic a s c o m u n e s: el m to d o d e in fo rm a c i n c o m p le ta , el m to d o d e in fo rm a
c i n co n d is p o n ib ilid a d c o m p le ta y el m to d o d e su s titu c i n d e la m e d ia . N o o b sta n te , en
e sta situ a c i n se e n fre n ta co n d ife re n c ia s en los re su lta d o s e n tre e s to s tr e s m to d o s. L as
a p ro x im a c io n e s de in fo rm a c i n de d is p o n ib ilid a d c o m p le ta y d e su s titu c i n d e la m e d ia
c o n d u c e n , p o r re g la g e n e ra l, a re s u lta d o s c o n s iste n te s , a u n q u e lo s v a lo re s d e su stitu c i n
d e la m e d ia son g en e ralm e n te alg o m s b a jo s. H ay d iferen c ia s n o ta b les e n tre estas d o s api o-
xim acio rtes y la a p ro x im a c i n d e in fo rm a c i n c o m p le ta . M ie n tra s q u e la a p ro x im a c i n d e
in fo rm a c i n c o m p le ta p a re c e se r e l m to d o m s se g u ro y c o n s e rv a d o r, e n este c a s o no
e s re c o m e n d a b le d a d o el ta m a o re d u c id o d e la m u e stra u tiliz a d a (so la m e n te 2 0 o b s e rv a
c io n e s) y su s d ife re n c ia s d e s ta c a d a s c o n lo s o tro s d o s m to d o s . Si e s n e c e s a rio , e! in v e s
tig a d o r d eb e e le g ir e n tre las d o s a p ro x im a c io n e s a lte rn a tiv a s.
4. L o s m 'tods m ltip le s p a r a re e m p la za r lo s d a lo s a u se n te s est n d isp o n ib le s y \o n a p ro
p ia d o s . Tal y c o m o se h a m e n c io n a d o a n te rio rm e n te , la su stitu c i n d e la m e d ia es u n a d e
la s m a n e ra s a c e p ta b le s d e g e n e ra r v a lo re s d e s u stitu c i n p a ra lo s d ato s a u s e n te s. A denitis
el in \ e s tig a d o r tie n e a su d isp o s ic i n lo s m to d o s d e re g re si n y im p u tac i n E M . ca d a uno
de los c u a le s d an e s tim a c io n e s c o n s is te n te s p a ra la m a y o ra d e las v a ria b le s . La p rese n cia
de tres m to d o s a c e p ta b le s ta m b i n p e rm ite al in v e s tig a d o r c o m b in a r la s tre s e m u la c io
n e s en un co m p u esto , c o n la e s p e ra n z a d e m itig a r c u a lq u ie r efe cto q u e se d eb a esln ctu m eiu c
a u n o de e sto s m to d o s.

E n c o n c lu si n , las h e rra m ie n ta s y lo s p ro c e s o s d e d ia g n o sis q u e se h an p re s e n ta d o en e sta s e c


ci n h a n p ro p o rc io n a d o u n a b a s e a d e c u a d a p a ra c o m p re n d e r y a c o m o d a r los d a to s a s u se n ie s. Tai
y c o m o d e m u e stra este eje m p lo , e! in v e stig a d o r n o d e b e ra te m e r q u e la p re se n c ia d e d ato s au se n te s
im p o s ib ilite la a p lic a c i n d e un a n lis is m u lliv a ria n ie o lim ite su c a p a c id a d p a ra g e n e ra l iz a r ios r e
sillad o s. En su lugar, se p u ed e id e n tific a r el p o s ib le im p a c to o c u lto d e lo s d a lo s a u s e n te s y r e a
liz a r las a c c io n e s n e c e s a ria s p a ra m in im iz a r su e fe c to s o b re lo s an lisis.

Resum en
L o s p ro c e d im ie n to s d isp o n ib le s p ara tr a ta r co n d a to s a u s e n te s v a ra n en fo rm a , c o m p le jid a d e
in te n c i n . El in v e stig a d o r d e b e e s ta r s ie m p re p re p a ra d o p a ra e v a lu a r y tra ta r co n lo s d a lo s a u s e n
tes q u e se e n c o n tra r co n fre c u e n c ia e n el a n lis is m u ltiv a ria n te . L a d e c isi n d e e m p le a r slo
o b s e rv a c io n e s c o n d ato s c o m p le to s tie n e u n a n a tu ra le z a c o n s e rv a d o ra y se g u ra , p e ro c o m o se
ha m o stra d o en las p g in a s a n te rio re s , e x is te n lim ita c io n e s in h e re n te s y se sg o s en este m to d o , as
c o m o en o tra s ap ro x im acio n es. El in v e stig a d o r n o tie n e un n ic o m to d o q u e se a ju ste m e jo r a ca d a
situ a c i n , sin o q u e d e b e h a c e r un ju ic io ra z o n a d o d e la situ a c i n , c o n s id e ra n d o to d o s lo s fac to re s
d e s c rito s a n te rio rm e n te .
A N L IS IS P R E V IO DE L O S DATOS 57

"t : s ' e

ii i - . iti- S * - ,

L o s c a so s a tp ic o s s o n o b s e rv a c io n e s c o n u n a c o m b in a c i n n ic a d e c a ra c te rs tic a s id e n tifica b le s
q u e les d ife re n c ia c la ra m e n te d e las o tra s o b se rv a c io n e s. L o s c a so s a tp ic o s no p u e d e n s e r c a ra c
te riz a d o s c a te g ric a m e n te c o m o b e n fic o s o p ro b le m tic o s sin o q u e d e b e n s e r c o n te m p la d o s en el
c o n te x to del a n lisis y d e b e n se r e v a lu a d o s p o r lo s tip o s d e in fo rm a c i n q u e p u e d e n p ro p o rcio n ar.
C u a n d o so n b e n fic o s, lo s c a s o s a tp ic o s , a u n q u e d ife re n te s a la m a y o r p a rte d e la m u e stra , p u e
d e n se r in d ic a tiv o s de las c a ra c te rs tic a s se g m e n to d e la p o b la c i n q u e se lle g ara n a d e s c u b rir en
e l c u rso n o rm a l d e l a n lis is. P o r e l c o n tra rio , lo s c a s o s a tp ic o s p ro b le m tic o s n o so n re p re se n ta
tiv o s de la p o b la c i n y e s t n en c o n tra d e lo s o b je tiv o s d e l a n lis is. L o s c a so s a tp ic o s p ro b le m
tic o s p u e d e n d isto rsio n a r se ria m e n te lo s te s t e s ta d stic o s. D e b id o a la v a ria b ilid a d e n la e v a lu a ci n
d e lo s c a so s a tp ic o s, se h a c e im p e ra tiv o q u e e l in v e s tig a d o r e x a m in e lo s d a to s en b u sc a d e la p re
s e n c ia d e c a so s a tip ic o s c o n el fin d e a v e rig u a r e l tip o d e in flu e n c ia q u e e je rc e n . S e re m ite al lec
to r a las e x p o s ic io n e s de! C a p tu lo 4 y al a p n d ic e d e e s e c a p tu lo , q u e a b o r d a el p ro b le m a d e las
o b s e rv a c io n e s in flu y e n te s. E n e s ta s d is c u s io n e s , lo s c a s o s a tp ic o s se sit a n en u n e sc e n a rio p a r
tic u la rm e n te a p ro p ia d o p a ra e v a lu a r la in flu e n c ia d e las o b s e rv a c io n e s in d iv id u a le s y d e te rm in a r
si e s ta in flu e n c ia e s b e n fic a o d a in a.
P o r q u su c e d e n lo s c a so s a tp ic o s ? P u e d e n s e r c la s ific a d o s e n c u a tro c a te g o ra s . L a p rim e ra
c a te g o ra c o n tie n e a q u e llo s c a so s a tp ic o s q u e s u rg e n d e u n e rro r d e p ro c e d im ie n to , ta le s c o m o la
e n tra d a d e d ato s o u n e rro r d e c o d ific a c i n . E sto s tip o s d e c a s o s a tp ic o s d e b e ra n id e n tific a rse en
e l n iv e l d e filtra d o de d a to s, p e ro si se p a s a n p o r a lto , d e b e ra n e lim in a rs e o re c o d ifc a rs e co m o
d a to s a u se n te s. L a se g u n d a c la se d e c a so a tp ic o es la o b se rv a c i n q u e o c u rre c o m o c o n se c u e n c ia
d e u n a c o n te c im ie n to e x tra o rd in a rio . E n e s te c a so , e x iste u n a e x p lic a c i n p a ra la u n ic id a d d e la
o b se rv a c i n . El in v e stig a d o r d e b e d e c id ir s i e l c a so a tp ic o d e b e ra s e r re p re s e n ta d o e n la m u estra.
Si es asi, el c a so atp ic o tie n e q u e s e r re te n id o en e l a n lis is; si no e s as, h a y q u e su p rim irlo . L a te r
c e r a c la se de c a so atp ic o c o m p re n d e las o b s e rv a c io n e s e x tra o rd in a ria s p a ra las q u e el in v e stig a d o r
n o tie n e ex p lic a c i n . A u n q u e e sto s s o n lo s c a s o s a tp ic o s m s a p ro p ia d o s p a ra se r o m itid o s, p u e
d e n re te n e rse si el in v e stig a d o r c re e q u e re p re s e n ta n u n s e g m e n to v lid o d e la p o b la c i n . L a c u a r
ta y ltim a c la se d e caso a tp ic o c o n tie n e las o b s e rv a c io n e s q u e s e s it a n fu e ra d el ra n g o o rd in ario
d e v alo re s de c a d a v a ria b le p e ro q u e so n n ic o s e n s u co m b in a c i n d e v a lo re s e n tre las v ariab les.
E n estas situ a c io n e s, e l in v e stig a d o r d e b e ra re te n e r la o b s e rv a c i n a m e n o s q u e se d isp o n g a d e
e v id e n c ia e sp e c fic a q u e e x c lu y a al c a s o a tp ic o c o m o un m ie m b ro v lid o d e la p o b laci n .
L a s sig u ie n te s se c c io n e s d e ta lla n lo s m to d o s u s a d o s e n la d e te c c i n d e c a s o s a tp ic o s p a ra las
s itu a c io n e s u n iv a ria n te s, b iv a ria n te s y m u ltiv a ria n te s . U n a v e z q u e lo s c a s o s a tp ic o s h an sid o
id e n tific a d o s, p u e d e n e sp e c ific a rse p a ra a y u d a r a s itu a rlo s en u n a d e las c u a tro c la se s a n te rio rm e n
te d e s c rita s . F in a lm e n te , el in v e s tig a d o r d e b e d e c id ir s o b re la re te n c i n o e x c lu s i n d e ca d a
c a s o a tp ic o , ju z g a n d o n o s lo las c a ra c te rs tic a s d e l c a s o a tp ic o , sin o ta m b i n lo s o b je tiv o s del
an lisis.

D eteccin de casos atpicos


L o s c a so s atp ico s p u ed en id e n tifica rse d e sd e u n a p e rsp e ctiv a u n iv a rian te , b iv a ria n te o m ultivariante.
E l in v e s tig a d o r d e b e ra u tiliz a r c u a n ta s p e rs p e c tiv a s se a n p o sib le s , b u s c a n d o u n a c o n s iste n c ia
e n tre lo s m to d o s d e id e n tific a c i n d e c a so s a tp ic o s. L a s ig u ie n te e x p o s ic i n d e ta lla lo s p ro ce so s
re s u lta n te s d e c a d a u n a de e s ta s tre s p e rsp e c tiv a s.

Deteccin univariante

L a p e rsp e c tiv a u n iv a ria n te d e id e n tific a c i n d e c a so s a tp ic o s e x a m in a la d is trib u c i n d e o b se r


v a c io n e s, se le c c io n a n d o co m o c a so s a tp ic o s a q u e llo s c a s o s q u e c a ig a n fu e ra d e lo s ra n g o s d e la
A N L IS IS M U L TIV A R IA N TE

d istrib u c i n . L a c u e sti n p rin c ip a l c o n s iste en el e s ta b le c im ie n to d e u n u m b ra l p a ra la d e sig n a c i n


c o m o c a so atip ic o . El e n fo q u e tp ic o c o n v ie rte en p r im e r lu g a r lo s v a lo re s d e lo s d a to s e n v alo re s
es t n d a r, q u e tie n e n u n a m e d ia c e ro y u n a d e s v ia c i n e s t n d a r d e uno.
D ad o q u e lo s v a lo re s e s t n e x p re s a d o s en un fo rm a to e s ta n d a riz a d o , se p u e d e n r e a liz a r f c il
m e n te c o m p a ra c io n e s e n tre las v a ria b le s . P a ra m u e s tra s p e q u e a s (d e 80 o in c lu so m e n o s o b s e r
v ac io n e s), las p a u ta s su g e rid a s id e n tifica n c o m o a tip ic o s a q u e llo s c a so s co n v a lo re s e s t n d a r d e 2,5
o su p e rio re s. C u a n d o lo s ta m a o s m u s tra le s so n m a y o re s, las p a u ta s su g ie re n q u e el v a lo r u m b ral
d e l e s ta n d a riz a d o se sit e e n tre 3 y 4. Si n o se u sa n lo s v a lo re s e s t n d a re s, e n to n c e s el in v e s tig a
d o r p u e d e id e n tifica r lo s ca so s q u e tie n en lu g a r fu e ra d e las g a m a s d e 2 ,5 fren te a 3 o 4 d e s v ia c io n e s
e stn d a re s, lo cual d ep e n d e del ta m a o m u e stral. E n c u a lq u ie r caso , el in v e stig a d o r d e b e d arse c u e n
ta q u e n o rm a lm e n te p u e d e o c u rrir q u e un c ie rto n m e ro d e o b se rv a c io n e s c a ig a n fu e ra d e e s o s r a n
g o s d e la d istribucin. El in v e stig a d o r d e b e ra e s fo rz a rs e p ara id e n tifica r s lo a q u e lla s o b se rv a cio n e s
v e rd a d e ra m e n te d istin tiv a s y d e s ig n a rla s c o m o c a so s atip ic o s.

Deteccin bivariante

A d e m s de la e v a lu a ci n u n iv a ria n te , p u e d e n e v a lu a rse c o n ju n ta m e n te p are s d e v a ria b le s m e d ian te


u n g r fic o d e d isp e rs i n . C a s o s q u e c a ig a n m a n ifie s ta m e n te fu e ra d el ra n g o d e l re s to d e las o b
se rv a c io n e s p u e d e n id e n tific a rse c o m o p u n to s a is la d o s e n e l g r fic o d e d is p e rs i n . P a ra a y u d a r a
d e te rm in a r el ra n g o e s p e ra d o d e la s o b s e rv a c io n e s , s e p u e d e s u p e rp o n e r s o b r e e l g r f ic o d e
d isp e rs i n u n a e lip se q u e r e p r e s e n te un in te rv a lo d e c o n fia n z a e s p e c ific a d o ( v a ria n d o e n tre 5 0 y
9 0 p o r c ie n to de la d is trib u c i n ) p a ra u n a d is trib u c i n n o rm a l b iv a ria n te . E s to p r o p o rc io n a u n a
re p re s e n ta c i n g r fic a de lo s lm ite s d e c o n f ia n z a y f a c ilita la id e n tific a c i n d e c a s o s a tip ic o s.
E l g r fic o d e in flu e n c ia es o tra v a ria n te d e l g r fic o d e d is p e rs i n . E n s te , c a d a p u n to v a ria en
ta m a o se g n su in flu e n c ia e n las r e la c io n e s . E s to s m to d o s p r o p o rc io n a n c ie rta e v a lu a c i n
d e la in flu e n c ia d e ca d a o b s e rv a c i n q u e c o m p le m e n ta a la d e s ig n a c i n d e c a s o s c o m o c a s o s
a tip ic o s.

Deteccin muitivariante

L a te rc e ra p e rsp e c tiv a p a ra id e n tific a r c a s o s a tip ic o s im p lic a u n a e v a lu a c i n m u ltiv a ria n te d e


c a d a o b se rv a c i n a lo larg o d e un c o n ju n to d e v a ria b le s . D ad o q u e la m a y o ra d e lo s a n lis is m u l
tiv a ria n te s tie n e n m s d e d o s v a ria b le s , el in v e s tig a d o r n e c e s ita u n a fo rm a d e m e d ic i n o b je tiv a
d e la p o s ic i n m u ltid im e n sio n a l d e c a d a o b s e rv a c i n re la tiv a a u n p u n to c o m n . L a m e d id a D 2 d e
M a h a la n o b is p u e d e u sa rse co n e s te fin. L a D 2 d e M a h a la n o b is es u n a m e d id a d e la d ista n c ia d e cad a
o b se rv a c i n en un e sp a c io m u ltid im e n s io n a l re sp e c to d el c e n tro m e d io d e la s o b s e rv a c io n e s . D e
b id o a q u e p ro p o rc io n a u n a m e d id a c o m n d e c e n tra lid a d m u ltid im e n sio n a l, ta m b i n tie n e p ro
p ie d a d e s e s ta d stic a s q u e tie n e n en c u e n ta las p ru e b a s d e sig n ific a c i n . D a d a la n a tu ra le z a d e los
te st e s ta d stic o s, se su g ie re q u e se use un n iv el m u y c o n s e rv a d o r, q u iz 0 ,0 0 1 , c o m o v a lo r u m b ral
p a ra la d e s ig n a c i n c o m o c a so atip ico .

Designacin como caso atipico

C u a n d o la s o b se rv a c io n e s c a n d id a ta s a la d e s ig n a c i n c o m o un c a s o a tip ic o h a n sid o id e n tific a


d as p o r m to d o s univariantcs, b iv a ria n te s o m u ltiv aria n tes, el in v e stig a d o r d eb e en to n c e s se lec cio n a r
a q u e lla s o b s e rv a c io n e s q u e d e m u e stra n u n a u n ic id a d real en c o m p a ra c i n co n el re s to d e la p o
b la c i n . El in v e stig a d o r d e b e ra a b s te n e rs e d e d e s ig n a r m u c h a s o b s e rv a c io n e s c o m o c a s o s a tp i-
c o s y n o d e b e ra c a e r en la te n ta c i n d e e lim in a r a q u e llo s ca so s q u e n o so n c o n s is te n te s c o n los
c a so s re sta n te s, sim p le m e n te p o rq u e so n d ife re n te s.
A N L IS IS P R E V IO DE L O S DATOS 59

D escripcin de casos atpicos y especificacin

U n a v ez q u e se h an id e n tifica d o lo s p o te n c ia le s ca so s a tp ic o s, el in v e stig a d o r d e b e ra g e n e ra r id en
tific a c io n e s d e ca d a o b se rv a c i n a tp ic a y e x a m in a r c u id a d o s a m e n te q u e lo s d a to s d e las v aria b les
re s p o n s a b le s se a n c a s o s a tp ic o s. A d e m s d e e s to s e x m e n e s v is u a le s , el in v e s tig a d o r p u ed e
e m p le a r ta m b i n t cn ic as m u ltiv a ria n te s c o m o e l a n lisis d isc rim in a n te o la reg resi n m ltip le para
id e n tific a r las d ife re n c ia s e n tre io s c a s o s a tp ic o s y las o tra s o b se rv a c io n e s. El in v e s tig a d o r d eb e
ra c o n tin u a r este a n lis is h a s ta q u e s e a s a tis fa c to rio el a s p e c to d e lo s d a to s q u e d is tin g u e n el caso
a tp ic o d e l re sto d e las o b se rv a c io n e s. Si e s p o s ib le d e b e ra a s ig n a r el c a s o a tip ic o a u n o d e los
c u a tro tip o s y a estu d ia d o s.

M antenim iento o elim inacin de ios casos atpicos


U n a v e z q u e se h a n id e n tific a d o , e s p e c ific a d o y c a ta lo g a d o lo s c a s o s a tp ic o s, el in v e stig a d o r debe
d e c id ir en tre m a n te n e rlo s o d e s tru irlo s. H a y m u c h a s d o c trin a s e n tre los in v e stig a d o re s so b re co m o
tra ta r c o n los c a so s a tp ic o s. N u e s tra c re e n c ia es q u e d e b e ra n m a n te n e rs e a m e n o s q u e e x is ta u n a
p a ie b a d e m o stra b le d e q u e s o n v e rd a d e ra s a b e rra c io n e s y no s o n re p re se n ta tiv o s d e las o b s e rv a
c io n e s d e ia p o b la c i n . P e ro si re p re s e n ta n a u n s e g m e n to d e la p o b la c i n , d e b e ra n re te n e rse p a ra
a s e g u ra r s u g e n e ra lid a d al c o n ju n to d e la p o b la c i n . S i se e lim in a n lo s c a s o s a tip ic o s, el in v e sti
g a d o r c o rre el rie sg o de m e jo ra r e l a n lis is p e ro lim ita r s u g e n e ra lid a d . Si lo s c a so s a tp ic o s son
p ro b le m tic o s e n u n a t c n ic a p artic u la r, m u c h a s v e c e s p u e d e n se r m a n e ja d o s d e u n a fo rm a tal que
se a ju s te n al a n lisis s in q u e lo d is to rs io n e n sig n ific a tiv a m e n te .

Un ejem plo del anlisis de casos atpicos


C o m o e je m p lo d e la d e te c c i n d e c a s o s a tp ic o s , e x a m in a re m o s a h o ra las o b s e rv a c io n e s d e la b ase
d e d a to s d e H A T C O in tro d u c id a s e n e l C a p tu lo 1 p a ra c a so s a tp ic o s. L as v a ria b le s co n sid e ra d a s
e n el a n lisis so n la s v a ria b le s m tric a s X r X v X y X , X f X (, X 1 y X 9 El a n lis is d e c a so s atp ico s
te n d r en cu e n ta d ia g n stic o u n iv a ria n te , b iv a ria n te y m u ltiv a ria n te . Si se e n c u e n tra n c a n d id a to s
p a ra la d e s ig n a c i n c o m o c a so s a tp ic o s , se r n e x a m in a d o s y s e p ro c e d e r a d e c id ir s u m a n te n i
m ie n to o elim in a ci n .

Deteccin univariante y bivariante

E l p rim e r p aso es e x a m in a r la s o b s e rv a c io n e s d e c a d a u n a d e la s v a ria b le s in d iv id u a lm e n te . L a


T a b la 2 .9 c o n tie n e las o b se rv a c io n e s c o n v a lo re s e s ta n d a riz a d o s d e v a ria b le s q u e e x c e d e n 2 ,5 .
D e s d e e s ta p e rsp e c tiv a u n iv a ria n te , s lo u n a s p o c a s o b s e rv a c io n e s e x c e d e n e l u m b ra l e n u n a so la
v a ria b le , p e ro n in g u n a o b se rv a c i n fu e u n c a s o a tp ic o u n iv a ria n te so b re m s d e u n a v a ria b le . D e s
d e u n a p e rsp e c tiv a b iv a ria n te , lo s g r fic o s d e d is p e rs i n e s t n fo rm a d o s p a ra X v X 2, A j, X A, X $ X 0
y X 7 v e rsu s X 9, u n a d e las v a ria b le s m tric a s u sa d a s c o m o u n a v a ria b le d e p e n d ie n te en m u c h a s d e
la s t c n ic a s m u ltiv a ria n te s. S e su p e rp o n e u n a e lip s e q u e re p re se n ta el 9 0 p o r c ie n to d e l in te rv alo
d e c o n fia n z a de u n a d istrib u c i n n o rm al b iv a ria n te s o b re el g rfico d e d isp e rsi n (v a se F ig u ra 2.6).
L a se g u n d a p a rte d e la T ab la 2 .9 c o n tie n e la s o b s e rv a c io n e s q u e q u e d a n fu e ra d e e s te elip se . E ste
e s e l 9 0 p o r cien to de un in te rv a lo d e c o n fia n z a ; p o r ta n to e s p e ra ra m o s q u e a lg u n a s o b se rv a c io
n e s c a ig a n fu e ra d e la elip se . S in e m b a rg o , v a ria s o b s e rv a c io n e s (3 , 5, 5 7 y 9 6 ) a p a re c e n v aria s v e
c e s, q u iz in d ic an d o q u e e x iste n c a so s a tp ic o s b iv a ria n te s.
60 A N L IS IS M U L TIV A R IA N TE

-V,. Velocidad de enrrcga

AL: Nivel de fidelidad X: Nivel de fidelidad


X, Flexibilidad de! precio

Xg: Nivel de fidelidad


X<: Servicio conjunto

20 30 4o 50 MI 70
X: Nixel de lideliduJ X,/ Nivel de fidelidad
: Calidad del produelo

X.,: Nivel de fidelidad

F IG U R A 2 .6 . Identificacin grfica de c a s o s atipicos bivariantes.


ANLISIS PREVIO DE LOS DATOS 61

TABLA 2 .9 . I d e n ti f i c a c i n d e c a s o s a t p i c o s u n i v a r i a n t e s y b i v a r i a n t e s

Casos atpicos univariantes Casos atipicos bivariantes que estn fuera


con valores estandarizados de la elipse de intervalo
/valores Z) que exceden 2 ,5 de confianza d el 90 p o r ciento

Variable Casos A', con Casos

x i 39 x, 1 .3 9 , 9 5 .9 6
*2 71 a; 3 ,4 9 ,5 7 ,7 ,9 6 , 97
X, ninguno A', 1 1 ,5 7 ,9 6 , IDO
*4 82 Aj 5, 22, 42, 50, 72, 82, 93, 96
x. 96 X. 3 ,2 2 ,3 9 , 57, 7 1 ,9 6
X, 5 .4 2 X 5 .7 ,4 2 ,8 2 , 96
X, ninguno a; 57, 58, 9 5 ,9 6
X9 ninguno
x ia ninguno

Deteccin multivariante

El ltim o m to d o d e d ia g n stic o es e v a lu a r lo s c a s o s a tp ic o s m u itiv a ria n te s c o n la m e d id a D l de


M a h a la n o b is (v a se T a b la 2 .1 0 ). E ste m to d o e v a l a la p o s ic i n d e c a d a o b se rv a c i n co m p arad a
c o n el c e n tro d e to d a s la s o b s e rv a c io n e s d e un c o n ju n to d e v a ria b le s . E n este c a s o , s e u sa ro n p ara
la e v a lu a c i n to d a s las v a ria b le s m tric a s. C o m o y a s e h a a p u n ta d o , lo s te st d e sig n ific a c i n esta
d s tic a co n e sta m e d id a so n m u y c o n s e rv a d o re s (e x c e d ie n d o 0 ,0 0 1 ). C o n e ste u m b ra l, se id e n tifi
c a n d o s o b s e rv a c io n e s (2 2 y 5 5 ) c o m o s ig n if ic a tiv a m e n te d if e r e n te s . E s in te r e s a n te
r e s a lta r q u e e s ta s o b se rv a c io n e s n o fu ero n a p re c ia d a s en el a n lis is u n iv a ria n te y b iv a ria n te y q u e
a p a re c e n s lo en ios te st m u itiv a ria n te s . E sto in d ic a q u e no so n n ic a s en c a d a v a ria b le aisla d a sino
q u e so n n ic a s en la c o m b in a c i n d e v a rib a le s .

Mantenimiento o eliminacin de casos atpicos

C o m o re su lta d o d e e sto s te st d e d ia g n stic o , n in g u n a o b se rv a c i n p a re c e m o stra r las ca ractersticas


d e u n c a so a tip ic o q u e d e b ie ra se r e lim in a d o . C a d a v a ria b le tie n e a lg u n a s o b s e rv a c io n e s q u e son
e x tre m a s , y q u e d e b e ra n c o n s id e ra rs e si s e v a a u tiliz a r la v a ria b le en e l a n lis is. P e ro n in g u n a de
la s o b se rv a c io n e s so n e x tre m a s so b re u n n m e ro su fic ie n te d e v a ria b le s c o m o p a ra se r c o n s id e ra
d a s n o re p re se n ta tiv a s de la p o b la c i n . E n to d o s lo s c a so s, las o b se rv a c io n e s d e n o m in a d a s com o
c a so s a tip ic o s, in c lu so c o n lo s te st m u itiv a ria n te s . p a re c e n su fic ie n te m e n te sim ila re s al resto d e las
v a ria b le s c o m o p a ra re te n e rla s e n el a n lis is m u ltiv a ria n te . N o o b sta n te , el in v e s tig a d o r d eb e ra
sie m p re e x a m in a r lo s re su lta d o s d e c a d a t c n ic a e s p e c ific a p a ra id e n tific a r o b se rv a c io n e s q u e p u e
d e n lle g a r a s e r a tp ic a s e n esa a p lic a c i n p articu la r.

L a ltim a e ta p a del ex a m e n d e lo s d a to s c o n s iste e n la c o m p ro b a c i n d e lo s s u p u e sto s su b y a c e n


tes b s ic o s d e l anlisis m u ltiv arian te. L a n e c e s id a d d e c o m p ro b a r los su p u e sto s e sta d stic o s au m en ta
e n las a p lic a c io n e s m u itiv a ria n te s c o m o c o n s e c u e n c ia d e d o s c a ra c te rs tic a s d e e s te tip o d e a n li
sis . E n p rim e r lugar, la c o m p le jid a d d e las re la c io n e s, d e b id o al u so h a b itu a l d e u n a g ra n ca n tid ad
d e v a ria b le s , h a c e q u e las d is to rs io n e s y lo s s e s g o s p o te n c ia le s se a n m s p o te n te s c u a n d o se
in c u m p la n lo s su p u e sto s. E n re a lid a d , la s v io la c io n e s c o m b in a d a s lle g a r a s e r in c lu so m s p erju -
62 A N A L IS I S M U I.T 1V A R 1A N T L

T A B LA 2 .1 0 . Id e n tific a c i n d e c a s o s a tip ic o s m u ltiv a ra n ie s

N m ero M a h id u n o h is N m e ro M a h t ih m o h is
d e casos D' D '-igl & S ig n ific a c i n d e casos D: D fg ! gl S i g n if i c a c i n

l 7 ,0 3 1 1 .0 0 4 7 0 .4 2 5 6 51 6 .3 6 2 0 .9 0 9 7 0 ,4 9 8 2
i 6 ,6 9 1 0 .9 5 6 7 0 .4 6 1 7 52 8 .4 6 7 1.210 7 0 ,2 9 3 2
3 7 .5 6 7 ! .081 7 0 .3 7 2 3 53 6 .9 1 3 0 .9 8 8 7 0 ,4 3 8 0
4 7 ,1 0 3 1 .0 1 5 7 0 .4 1 8 2 54 3 .2 4 4 0 .4 6 3 7 0 .8 6 1 5
5 1 2 ,8 7 0 1 .8 3 9 7 0 .0 7 5 3 55 3 5 .1 9 7 5 .0 2 8 7 0.0000
6 0 .5 1 7 0 .9 3 1 7 0 .4 8 0 9 56 3 .0 8 2 0 ,4 4 0 7 0 ,8 7 7 3
7 8 ,6 3 4 1 ,2 3 3 7 0 .2 8 0 0 57 1 0 .4 8 8 1 .4 9 8 7 0 ,1 6 2 6
8 6 .5 6 3 0 .9 3 8 7 0 .4 7 5 8 58 5 ,2 6 5 0 ,7 5 2 7 0 .6 2 7 6
9 6 ,3 7 5 0 ,9 1 1 7 0 .4 9 6 7 59 4 .3 4 8 0 ,6 2 1 7 0 ,7 3 9 0
10 3 .6 2 6 0 .5 1 8 7 0 .8 2 1 7 60 7 .0 1 2 1.002 7 0 ,4 2 7 6
11 4 .2 3 7 0 ,6 0 5 7 0 ,7 5 2 2 61 1 3 .0 0 ! 1 .8 5 7 7 0 .0 7 2 1
12 3 .3 8 9 0 ,4 8 4 7 0 ,8 4 6 8 62 5 ,7 9 8 0 ,8 2 8 7 0 ,5 6 3 5
13 3 ,7 6 8 0 ,5 3 8 7 0 ,8 0 6 1 63 3 .3 2 2 0 .4 7 5 7 0 .8 5 3 7
14 5 ,0 3 0 0 .7 1 9 7 0 .6 5 6 3 64 6 .9 2 6 0 ,9 8 9 7 0 ,4 3 6 7
15 8 ,9 6 2 1 ,2 8 0 7 0 ,2 5 5 4 65 1 1 .6 8 3 1 .6 6 9 7 0 .1 1 1 5
16 6 .3 9 8 0 ,9 1 4 7 0 .4 9 4 2 66 2 .1 0 9 0 ,3 0 1 7 0 ,9 5 3 6
17 7 .2 1 2 1 ,0 3 0 7 0 .4 0 7 1 67 4 .3 8 2 0 .6 2 6 7 0 ,7 3 4 9
18 5 .3 5 0 0 ,7 6 4 7 0 ,6 1 7 3 68 5 .9 2 5 0 .8 4 6 7 0 .5 4 8 6
19 5 .8 9 9 0 .8 4 3 7 0 ,5 5 1 6 69 4 .8 7 8 0 .6 9 7 7 0 .6 7 4 9
20 8 ,9 6 2 1 .2 8 0 7 0 .2 5 5 4 70 5 .0 5 7 0 ,7 2 2 7 0 .6 5 3 0
21 2 .9 7 8 0 ,4 2 5 7 0 .8 8 7 0 71 8 .2 9 4 1 ,1 8 5 7 0 ,3 0 7 4
os 3 5 ,3 9 0 5 ,0 5 6 7 0.0000 72 1 0 .0 9 5 1 .4 4 2 7 0 .1 8 3 3
23 8 ,3 3 3 1 .1 9 0 7 0 .3 0 4 2 73 5 ,8 8 7 0 .8 4 1 7 0 ,5 5 3 0
24 2 .9 7 4 0 ,4 2 5 7 0 ,8 8 7 4 74 5 ,3 6 3 0 ,7 6 6 7 0 ,6 1 5 7
25 4 .9 0 9 0 ,7 0 1 7 0 ,6 7 1 1 75 6 ,4 7 1 0 ,9 2 4 7 0 .4 8 5 9
26 3 ,4 6 3 0 ,4 9 ? 7 0 ,8 3 9 1 76 4 .9 2 5 0 ,7 0 4 7 0 .6 6 9 1
>7 3 ,1 7 1 0 ,4 5 3 7 0 .8 6 8 7 77 5 .8 4 7 0 ,8 3 5 7 0 .5 5 7 7
28 5 ,7 6 5 0 .8 2 4 7 0 .5 6 7 4 78 7 .5 2 2 1 ,0 7 5 7 0 .3 7 6 6
29 7 .6 0 1 1 ,0 8 6 7 0 .3 6 9 1 79 1 2 .2 7 9 1 ,7 5 4 7 0 .0 9 1 8
30 5 .1 8 8 0 ,7 4 1 7 0 .6 3 7 0 80 2 ,2 7 0 0 ,3 2 4 7 0 .9 4 3 4
31 2 ,7 5 1 0 ,3 9 3 7 0 .9 0 7 1 8! 4 ,9 4 3 0 ,7 0 6 7 0 ,6 6 6 9
32 7 .0 2 4 1 .0 0 3 7 0 .4 2 6 4 82 1 4 .1 1 8 2 ,0 1 7 7 0 .0 4 9 1
33 5 .6 7 8 0 .8 1 1 7 0 .5 7 7 8 83 6 ,8 3 7 0 ,9 7 7 7 0 .4 4 6 0
34 3 .5 2 9 0 .5 0 4 7 0 .8 3 2 1 84 2 ,3 6 6 0 ,3 3 8 7 0 ,9 3 6 9
35 6 .5 3 9 0 ,9 3 4 7 0 .4 7 8 4 85 3 .0 1 6 0 .4 3 1 7 0 .8 8 3 5
36 2 .9 0 0 0 ,4 1 4 7 0 .8 9 4 1 86 3 ,4 9 3 0 ,4 9 9 7 0 ,8 3 5 9
37 6 .7 0 4 0 .9 5 8 7 0 ,4 6 0 3 87 3 ,3 5 4 0 ,4 7 9 7 0 .8 5 0 4
38 3 .0 3 0 0 .4 3 3 7 0 .8 8 2 3 88 2 .4 1 7 0 ,3 4 5 7 0 .9 3 3 2
39 1 0 .2 1 3 1 ,4 5 9 7 0 .1 7 6 8 89 6.011 0 ,8 5 9 7 0 ,5 3 8 5
40 3 .8 2 7 0 .5 4 7 7 0 ,7 9 9 5 90 4 .8 6 0 0 .6 9 4 7 0 .6 7 7 1
41 2 .8 9 8 0 .4 1 4 7 0 ,8 9 4 3 91 3 ,7 6 3 0 ,5 3 8 7 0 .8 0 6 7
42 1 2 .2 8 2 1 ,7 5 5 7 0 ,0 9 1 7 92 5 ,8 4 1 0 ,8 3 4 7 0 ,5 5 8 4
43 7 .1 2 9 1. 0 ) 8 7 0 ,4 ) 5 6 93 1 4 .3 2 8 2 .0 4 7 7 0 ,0 4 5 6
44 4 ,8 1 9 0,688 7 0 .6 8 2 1 94 5 ,4 0 7 0 ,7 7 2 7 0 .6 1 0 5
45 6 .6 7 0 0 ,9 5 3 7 0 ,4 6 4 0 95 7 ,3 9 1 1 ,0 5 6 7 0 .3 8 9 3
46 7 .4 7 5 1 ,0 6 8 7 0 .3 8 1 1 96 1 6 ,7 0 8 2 ,3 8 7 7 0 .0 1 9 4
47 1 4 .0 9 4 2 .0 1 3 7 0 .0 4 9 5 97 8 ,1 9 5 1,171 7 0 ,3 1 5 7
48 6 ,1 5 2 0 ,8 7 9 7 0 .5 2 2 1 98 4 ,9 9 0 0 ,7 1 3 7 0 .6 6 1 2
49 7 ,5 6 1 1 ,0 8 0 7 0 ,3 7 2 9 99 5 ,5 8 7 0 ,7 9 8 7 0 .5 8 8 8
50 9 ,0 2 9 1 ,2 9 0 7 0 ,2 5 0 6 100 4 .7 0 4 0 ,6 7 2 7 0 .6 9 6 0

x l = G rad o s d e libertad.
M altalanobis D - v alo r q u e se b a sa en las sig u ien tes v ariab les (A . .V,. A,. A'., A,, X h y A'.). El v alo r D'-lgl est d istrib u id o ap ro x im ad am en te
c o m o un t alo r /.
d ic ia le s si se c o n s id e ra n se p a ra d a m e n te . E n se g u n d o lugar, la c o m p le jid a d d e lo s a n lis is y d e los
re su lta d o s p u e d e n e n m a sc a ra r los s ig n o s d e la s v io la c io n e s d e los s u p u e sto s q u e so n ap a ren te s
e n los m s s e n c illo s a n lisis m u ltiv a ria n te s . E n c a si to d o s lo s e je m p lo s , lo s p ro c e d im ie n to s m u l
tiv a ria n te s e s tim a r n el m o d e lo m u ltiv a ria n te y p ro d u c ir n re su lta d o s in c lu s o c u a n d o lo s su p u e s
to s s e v e a n se v e ra m e n te in c u m p lid o s . P o r ta n to , el in v e stig a d o r d e b e e s ta r a te n to a c u a lq u ie r
in c u m p lim ie n to de lo s su p u e sto s y a las im p lic a c io n e s q u e p u e d a n te n e r p a ra e! p ro c e so d e e s ti
m a c i n o in te rp re ta c i n de lo s re su lta d o s.

Valoracin de las variables individuales


frente al m odelo univariante
El a n lis is m u ltiv a ria n te re q u ie re q u e lo s s u p u e s to s su b y a c e n te s a la s t c n ic a s e s ta d s tic a s sean
c o n tra sta d o s d o s v c c c s: en p rim e r lu g a r p a ra las v a ria b le s a isla d a s, s e m e ja n te a las p ru e b a s d e los
s u p u e sto s del a n lis is u n iv a ria n te , y en s e g u n d o lu g a r p a ra el v a l o r te r ic o d e l m o d e lo m u lti
v aria n te, q u e ac t a co lectiv am en te so b re las v aria b les a an alizar y p o r tan to d eb e c u m p lir los m ism os
s u p u e sto s q u e la s v a ria b le s in d iv id u a le s. E ste c a p itu lo se c e n tra e n ei e x a m e n d e las v aria b les
u n iv a ria n te s e n re la c i n al c u m p lim ie n to d e lo s s u p u e s to s s u b y a c e n te s a lo s p ro c e d im ie n to s
m u ltiv a ria n te s . E n c a d a c a p tu lo se a n a liz a r n lo s m to d o s u tiliz a d o s p a ra e v a lu a r los su p u e sto s
s u b y a c e n te s al v a lo r te ric o d e c a d a t c n ic a m u ltiv a ria n te .

N orm alidad
El s u p u e s to fu n d a m e n ta l del a n lis is m u ltiv a ria n te es la n o r m a l id a d d e lo s d a to s, e n re fe re n c ia al
p e rfil d e la d istrib u c i n de lo s d a to s p a ra u n a n ic a v a ria b le m tric a y s u c o rre s p o n d e n c ia co n una
d is t r ib u c i n n o r m a l , p u n to d e re fe re n c ia d e lo s m to d o s e s ta d stic o s. Si la v a ria c i n re sp e c to d e
la d istrib u c i n n o rm a l es su fic ie n te m e n te a m p lia , to d o s lo s te st e s ta d stic o s re s u lta n te s n o son
v lid o s, d a d o q u e se re q u ie re la n o rm a lid a d p a ra el u so d e lo s e s ta d stic o s d e ia t y d e la F . Tanto
los m to d o s e s ta d s tic o s u n iv a ria n te s c o m o lo s m u ltiv a ria n te s an a liz a d o s en e s te te x to se b a s a n en
el su p u e sto de la n o rm alid ad u n iv a rian te , su p o n ie n d o ta m b i n los m u ltiv aria n tes la n o rm a lid a d m ul
tiv a ria n te . L a n o rm a lid a d u n iv a ria n te p a ra u n a n ic a v a ria b le e s f c il d e c o n tra sta r, sie n d o p o sib le
v a ria s m e d id a s c o rre c to ra s, tal y c o m o se d e m u e s tra m s ad e la n te. D ic h o d e fo rm a se n c illa , la n o r
m a lid a d m u ltiv a ria n te (la c o m b in a c i n de d o s o m s v a ria b le s ) im p lic a q u e la s v a ria b le s in d iv i
d u a le s so n n o rm a le s en un se n tid o u n iv a ria n te y q u e su s c o m b in a c io n e s ta m b i n s e a n n o rm ales.
P o r ta n to , si u n a v a ria b le es u n a n o rm a l m u ltiv a ria n te , es ta m b i n n o rm a l u n iv a ria n te . S in e m b a r
g o , lo c o n tra rio n o e s n e c e s a ria m e n te c ie rto (d o s o m s v a ria b le s n o rm a le s u n iv a ria n te s n o so n n e
c e s a ria m e n te n o rm a l m ultiv aria n te). P o r ta n to , u n a s itu a c i n en la q u e to d a s las v a ria b le s ex h ib en
n o rm a lid a d u n iv a rian te ay u d ar a o b te n e r n o rm a lid a d m u ltiv aria n te, au n q u e n o la g ara n tiza . L a nor
m a lid a d m u ltiv a ria n te es m u c h o m s difcil d e co n trastar, au n q u e e x iste n v ario s te st p a ra situ acio n es
en las q u e la t c n ic a m u ltiv aria n te se ve p artic u la rm e n te afe cta d a p o r u n a v io la ci n d e los supuestos.
E n e s te te x to , n o s c e n tra re m o s e n e v a lu a r y a lc a n z a r la n o rm a lid a d u n iv a ria n te p a ra to d a s las
v a ria b le s y ac u d irem o s a la m u ltiv aria n te cu a n d o se a esp ec ialm en te crtica. In clu so au n q u e las m u es
tr a s g ra n d e s tie n d a n a d is m in u ir lo s e f e c to s p e rn ic io s o s d e la n o n o rm a lid a d , e l in v e stig a d o r
d e b e ra e v a lu a r la n o rm a lid a d d e to d a s las v a ria b le s in c lu id a s e n el an lisis.

Anlisis grfico de ia normalidad

El te st m s s im p le p a ra d ia g n o stic a r la n o rm a lid a d es u n a co m p ro b a c i n v is u a l d el h is to g ra m a que


c o m p a re lo s v alo re s d e lo s d ato s o b se rv a d o s c o n u n a d istrib u c i n a p ro x im a d a a la d istrib u c i n n o r
m a l (v a se F ig u ra 2 .1 ). A u n q u e a tra c tiv o p o r su s im p lic id a d , este m to d o e s p ro b le m tic o p ara
m u e s tra s p e q u e a s , d o n d e la c o n s tru c c i n d e l h is to g ra m a ( p o r e je m p lo , e l n m e ro d e ca te g o ra s
A N L IS IS M U L TIV A R IA N TE

o la a n c h u ra de las c a te g o ra s) p u e d e d is to rs io n a r la re p re s e n ta c i n v isu a l d e tal fo rm a q u e el a n


lisis se a intil. U n a a p ro x im a c i n d e m a y o r c o n fia n z a es el g r f ic o d e d is t r ib u c i n n o r m a l , q u e
c o m p a ra la d istrib u c i n a c u m u la d a de lo s v a lo re s re a le s d e los d a to s co n la d is trib u c i n a c u m u la
d a d e u n a d istrib u c i n n o rm al. L a d istrib u c i n n o rm a l s ig u e u n a lin c a re c ta en d ia g o n a l, c o m p a
r n d o la co n el g r fic o de lo s v a lo re s d e lo s d a to s . Si u n a d istrib u c i n es n o rm a l, la lin e a q u e
re p re se n ta la d istrib u c i n real d e lo s d a to s s ig u e d e c e rca a la d ia g o n a l.
L a F ig u ra 2 .7 m u e stra v a rio s g r fic o s d e d istrib u c i n n o rm a l y la c o rre s p o n d ie n te d is trib u c i n
u n iv a ria n te d e la v a ria b le . E n lo s g r fic o s do d istrib u c i n n o rm a l se re p re se n ta u n a c a ra c te rstic a
d e l p e rfil de la d istrib u c i n , la c u rto sis. L a c u r to s i s se re fie re al a p u n ta m ie n to o lla n u ra d e a
d istrib u c i n , co m p a ra d a co n la d istrib u c i n n o rm a l. C u a n d o la ln e a c a e p o r d e b a jo d e la d ia g o n a l,
la d istrib u c i n es m s lla n a de lo e s p e ra d o (p la tic rtic a ). C u a n d o la ln e a c a e p o r e n c im a d e la
d ia g o n a l, la d istrib u c i n es m s p u n tia g u d a q u e la c u m a n o rm a l (le p to c rtic a ). P o r e je m p lo , e n el
g r fic o d e d istrib u c i n n o rm a l d e u n a d is trib u c i n n o rm a l { F ig u ra 2 .7 d ), v e m o s u n a c u rv a c o n un
n tid o p erfil en S. In icialm e n te la d istrib u c i n es m s p la n a , y la linea c a e p o r d e b a jo d e la d ia g o n al.
E n to n c e s, la p a rte p u n tia g u d a d e la d istrib u c i n se m u e v e r p id a m e n te p o r e n c im a d e la d ia g o n al
y se d e s p la z a o tra v e z p o r d e b a jo d e la d ia g o n a l a m e d id a q u e la d is trib u c i n se a p la n a . U n a
d is trib u c i n n o p u n tia g u d a (p la tic r tic a ) tie n e u n a p a u ta o p u e s ta (F ig u ra 2 .7 c ). O tr o m o d e lo
co m n es un sim p le a rc o , ta n to p o r e n c im a c o m o p o r d e b a jo d e la d ia g o n a l, q u e in d ic a la sim etra
d e la d istrib u c i n . U n a sim e tra n e g a tiv a (F ig u ra 2 .7 e ) se in d ic a m e d ia n te un a rc o p o r d e b a jo d e

G rfico de Dislnhucin G rfico de Distribucin


probabilidad normal univariante probabilidad norm al univariante
(a) D istrib u ci n n o rm a l (hl D istrib u ci n u n ifo rm e

G rfico de Distribucin G r lic o d e Distribucin


probabilidad normal univariante probabilidad norm al univarianlc
(O D istrib u ci n nu p u n tia |iu d a (d) D istrib u ci n p u n tia g u d a

G rfico de G rfico de
probabilidad normal univariante probabilidad norm al univariante
fe) D istrib u ci n negativa (l i D istrib u ci n positiva

1 G rfico de distribucin univarianlc . . . . . Distribucin normal acum ulativa

FIG U R A 2 .7 . G r fic o s d e d is tr ib u c i n n o r m a l y la s c o r r e s p o n d ie n te s d is tr ib u c io n e s u n iv a r ia n te s .
A N L IS IS P R E V IO DE L O S DATOS 65

la d ia g o n a l, m ie n tr a s q u e un a r c o p o r e n c im a d e la d ia g o n a l r e p r e s e n ta u n a d is tr ib u c i n
p o s itiv a m e n te s im tr ic a ( F ig u ra 2 .7 0 - U n a e x c e le n te fu e n te p a ra in te r p r e ta r lo s g r fic o s d e
d is trib u c i n n o rm a l q u e m u e stre n lo s d iv e rs o s m o d e lo s e in te rp re ta c io n e s es D an ie l y W o o d [5],
E sto s m o d e lo s e sp ec fico s no s lo id e n tifica n la n o n o rm a lid a d , sin o q u e ta m b i n n o s d ic en la form a
d e la d istrib u c i n o rig in a l y la so lu c i n a p ro p ia d a a ap lica r.

Test estadsticos de normalidad

A d e m s d e e x a m in a r el g r fic o d e d is trib u c i n n o rm a !, p u e d e n u tiliz a rs e ta m b i n te st e sta d stic o s


p a ra e v a lu a r la n o rm a lid a d . E l te st m s s im p le es u n a re g la b a s a d a e n e l v a lo r d e s im e tra (d isp o
n ib le c o m o p a rte d e lo s e s ta d stic o s d e s c rip tiv o s b s ic o s p a ra u n a v a ria b le p ro c e s a d a en to d o s los
p ro g ra m a s e sta d stic o s). El v a lo r e s ta d s tic o (z) s e c a lc u la co m o

sim e tra
s im e tr a
i

d o n d e N es e l ta m a o de la m u e stra . U n v a lo r z ta m b i n p u e d e s e r c a lc u la d o p a ra el v a lo r d e cur-
to s is u tiliz a n d o la s ig u ie n te fo rm u la:

c u rto s is
cur,osis^ y 2 4 V

S i el v a lo r c a lc u la d o d e r ex c ed e u n v a lo r c rtic o , e n to n c e s la d istrib u c i n es n o n o rm a l p o r lo que


se re fie re a e s ta c a ra c te rstic a . E l v a lo r c rtic o es d e u n a d istrib u c i n r , b a s a d a e n lo s n iv e le s d e
sig n ific a c i n q u e d eseem o s. P o r eje m p lo , u n v a lo r c a lc u la d o q u e ex c ed a 2 ,58 in d ic a q u e p o d em o s
re c h a z a r e l su p u e sto so b re la n o rm a lid a d d e la d is trib u c i n a u n n iv el d e p ro b a b ilid a d d e 0 ,0 1 . O tro
v a lo r c r itic o h a b itu a lm e n te u tiliza d o e s 1,96, q u e c o rre s p o n d e a un n iv el d e e rro r d e 0,05.
L o s te s t e s ta d stic o s e s p e c fic o s se e n c u e n tra ta m b i n e n S P S S , S A S , B M D P y la m a y o r p arte
d e lo s p ro g ra m a s . L o s d o s m s c o m u n e s s o n e l te s t d e S h a p iro -W ilk s y u n a m o d ific a c i n d el test
d e K o lm o g o ro v -S m im o v . C a d a u n o c a lc u la e l n iv e l d e sig n ific a c i n p a ra las d ife re n c ia s resp e cto
a u n a d is trib u c i n n o rm al. E l in v e s tig a d o r d e b e ra s ie m p re re c o rd a r q u e los te s t d e sig n ific a c i n
s o n m e n o s tile s e n m u e stra s p e q u e a s (m e n o re s d e 3 0 ) y m u y se n s ib le s p a ra g ra n d e s m u e stras
( s u p e r io r e s a 1 .000 o b s e rv a c io n e s). P o r ta n to , e l in v e s tig a d o r d e b e ra s ie m p re u s a r ta n to los
g r fic o s c o m o c u a lq u ie r c o m p ro b a c i n e s ta d s tic a p a r a e v a lu a r e l g ra d o re a l d e d e s v ia c i n d e la
n o rm a lid a d .

Soluciones para la no normalidad

E x iste n a lg u n a s tra n sfo rm a c io n e s d e d a to s p a ra a c o m o d a r las d istrib u c io n e s n o n o rm a le s q u e se


e x p o n d r n p o ste rio rm e n te . E ste c a p tu lo se lim ita a la d isc u s i n d e lo s te st d e n o rm a lid a d u n iv a-
ria n te y las tra n sfo rm a c io n e s. S in e m b a rg o , c u a n d o e x a m in e m o s los o tro s m to d o s m u ltiv a ria n te s,
ta le s c o m o la re g re si n m ltip le o el a n lis is m u ltiv a ria n te d e la v a ria n z a , d is c u tire m o s ta m b i n
lo s te st d e n o rm a lid a d m u ltiv aria n te. M s a n , e n m u c h a s d e las o c a sio n e s e n q u e se in d ic a n o n o r
m a lid a d es e n re a lid a d u n re su lta d o d e o tra s v io la c io n e s d e lo s su p u e sto s; p o r ta n to , rem e d ian d o
lo s o tro s in c u m p lim ie n to s e lim in a m o s el p ro b le m a d e la n o rm a lid a d . P o r esta raz n , d e b e ra re a
liz a r te st d e n o rm alid ad d esp u s o ju n to c o n lo s an lisis y so lu cio n es p ara las o tras v io la cio n es. (P ara
a q u e llo s in te re s a d o s en la n o rm a lid a d m u ltiv a ria n te , v a se [8 , I I ] .)
66 A N L IS IS M U L TIVA RIAN TE

H om ocedasticidad
L a h o m o c e d a s tic id a d es u n su p u e sto re la tiv o p rim o rd ia lm e n te a las rela cio n e s d e d e p e n d e n c ia e n
tre v a ria b le s. S e re fie re al su p u e sto d e q u e las v a ria b le s d e p e n d ie n te s e x h ib a n ig u a le s n iv e le s d e
v a ria n z a a lo larg o del ra n g o d e l p re d ic to r d e la v a ria b le s . L a h o m o c e d a s tic id a d es d e s e a b le p o r
q u e la v a ria n z a d e la v a ria b le d e p e n d ie n te q u e se e s t e x p lic a n d o en la re la c i n d e d e p e n d e n c ia 110
d e b e ra c o n c e n tra rse s lo en u n lim ita d o ra n g o d e lo s v a lo re s in d e p e n d ie n te s. A u n q u e la s v a r ia
b le s d e p e n d ie n te s d e b e n s e r m tric a s , e s te c o n c e p to d e ig u al d isp e rs i n d e la v a ria n z a a lo larg o
d e la s v a ria b le s in d e p e n d ie n te s p u e d e a p lic a rs e c u a n d o las v a ria b le s s o n m tric a s o n o m tric a s.
C o n v a ria b le s in d e p e n d ie n te s m tric a s , el c o n c e p to d e h o m o c e d a stic id a d se b a s a e n la d isp e rs i n
d e la v a ria n z a de la v a ria b le d e p e n d ie n te a lo la rg o d el ra n g o d e lo s v a lo re s d e la v a ria b le in d e
p e n d ie n te , q u e se e n c u e n tra en t c n ic a s c o m o la re g re si n m ltip le . El m is m o c o n c e p to s e a p lica
ta m b i n cu a n d o las v a ria b le s in d e p e n d ie n te s s o n n o m tric a s. E n e s to s c a so s, tal y c o m o se e n
c u e n tra n e n A N O V A y M A N O V A , el c e n tro e s a h o ra la ig u a ld a d d e la v a ria n z a (u n a v a ria b le d e
p e n d ie n te ) o la m a triz de v a ria n z a /c o v a ria n z a (v a ria s v a ria b le s in d e p e n d ie n te s) a lo la rg o d e los
g ru p o s fo rm a d o s p o r la s v a ria b le s in d e p e n d ie n te s n o m tric a s. L a ig u a ld a d d e las m a tric e s d e v a
ria n z a /c o v a ria n z a se o b se rv a ta m b i n en el a n lis is d isc rim in a n te , p e ro en e sta t c n ic a el n fa sis
es e n la d isp e rs i n de la s v a ria b le s in d e p e n d ie n te s a lo la rg o d e lo s g ru p o s f o rm a d o s p o r la m e d i
da d e p e n d ie n te no m trica. E n c a d a u n o d e e s to s c a s o s, e l p ro p sito es el m is m o : a s e g u r a r q u e la
v a ria n z a u sa d a en la e x p lic a c i n y p re d ic c i n se d isp e rs e a trav s d el ran g o d e v a lo re s, p e rm itie n d o
as u n te st lim p io de las re la c io n e s a lo la rg o d e to d o s lo s v a lo re s d e las v a ria b le s n o m tric a s.
E n la m ay o ra d e las situ acio n es, te n e m o s d iferen tes v alo re s d e la v aria b le d e p e n d ie n te p a ra cad a
v a lo r d e la v aria b le in d ep en d ien te. P ara q u e e s ta rela ci n se cap te co m p le ta m e n te , la d isp e rs i n (v a
ria n z a ) d e lo s v a lo re s de la v a ria b le d e p e n d ie n te d e b e s e r ig u al p a ra c a d a v a lo r d e la v a ria b le p re
d ic to r. L a m a y o ra de lo s p ro b le m a s c o n v a ria n z a s d e s ig u a le s su rg en d e una d e e s ta s d o s fu en te s.
L a p rim e ra es el tip o de v a ria b le s in c lu id a s en el m o d e lo . P o r e je m p lo , a m e d id a q u e u n a v a ria b le
a u m e n ta en v a lo r (es decir, c u a n d o la s u n id a d e s v a n d e s d e c e ro a m illo n e s ), e x iste u n ra n g o m s
a m p lio d e re sp u e sta s p o sib le s p a ra lo s v a lo re s m s ele v a d o s. L a se g u n d a fu e n te s u rg e d e u n a d is
trib u c i n sim trica q u e cre a h e tero ce d aslicid a d . E n la F ig u ra 2 .8 a, los g r tic o s d e d isp e rs i n d e p u n
to s d e lo s d a to s p a ra d o s v a r ia b le s ( f j y I',) c o n d is trib u c io n e s n o rm a le s e x h ib e n la m ism a
d is p e rs i n a lo larg o d e to d o s lo s v a lo re s d e lo s d a to s (es d ecir, h o m o c e d a s tic id a d ). S in e m b a rg o ,
en la F ig u ra 2 .8 b , o b se rv a m o s ta m b i n u n a d isp e rs i n d e s ig u a l ( h e te r o c e d a s tic id a d ) p ro v o c a d a
p o r la sim e tra de u n a d e las v a ria b le s ( F ,). P a ra d ife re n te s v a lo re s d e V r te n e m o s d ife r e n te s p a u
ta s d e d isp e rs i n p a ra F ,. E sto p ro v o c a r q u e las p re d ic c io n e s se a n m e jo re s a c ie r to s n i\ d e s d e !a
v a ria b le in d e p e n d ie n te q u e a o tro s. V io la n d o e s te su p u e sto a m e n u d o re a liz a m o s u n o s te st d e las
h ip te s is m uy c o n se rv a d o re s o d e m a s ia d o se n sib le s.

(;ii HomncciJuslicidad (h) H cicrnccdauicida

FIG U R A 2 .8 . G r fic o s d e d is p e r s i n d e r e la c io n e s d e h o m o c e d a s tic id a d y h e te r o c e d a s tic id a d .


A N L IS IS P R E V IO DE L O S DATOS 67

El efe cto de !a h e te ro ce d asticid a d e s t a m e n u d o ta m b i n rela cio n a d o c o n el ta m a o d e la m u es


tra, e s p e c ia lm e n te c u a n d o e x a m in a m o s la d is p e rs i n d e la v a ria n z a e n tre g ru p o s . P o r e je m p lo , en
A N O V A o M A N O V A , el im p a cto d e la h e te ro c e d a s tic id a d d e lo s te st e s ta d stic o s d e p e n d e d e los
ta m a o s d e la m u e s tra a s o c ia d o s c o n lo s g ru p o s d e m e n o r o m a y o r v a ria n z a . E n el a n lis is d e la
re g re si n m ltip le o c u rrir n e fe c to s s im ila re s en d is trib u c io n e s a lta m e n te s im tric a s d o n d e ex is
ta n u n n m e ro d e s p ro p o rc io n a d o d e c n c u e s ta d o s e n c ie rto s ra n g o s d e la v a ria b le in d e p en d ie n te .

Test grficos de igual dispersin de la varianza


L a p ru e b a d e h o m o c e d a stic id a d d e d o s v a ria b le s m tric a s s e e v a l a m e jo r g r fic a m e n te . L a a p li
c a c i n m s c o m n d e e sta fo rm a d e e v a lu a c i n se p ro d u c e en la re g re si n m ltip le , e n re la c i n con
la d isp e rs i n d e la v a ria b le d e p e n d ie n te a lo la rg o d e la s v a ria b le s in d e p e n d ie n te s m tric a s. D ado
q u e el e je del a n lisis d e la re g re si n e s e l v a lo r te ric o , el g r fic o d e re sid u o s s e u s a p a ra rev e lar
la p re s e n c ia d e h o m o c e d a stic id a d (o s u o p u e s to , h e te ro c e d a stic id a d , d e s ig u a l d isp e rs i n d e la v a
ria n z a ). E n e l C a p itu lo 4 se d e ta lla n e sto s p ro c e d im ie n to s en la d is c u si n d e l a n lis is d e los r e s i
d u o s. L os g r fic o s d e c a ja s sirv e n b ie n p a ra re p re s e n ta r e! g ra d o d e v a ria c i n e n tre lo s g ru p o s
fo rm a d o s p o r u n a v a ria b le c a te g ric a . El la rg o d e la c a ja y d e lo s b ig o te s in d ic a la v a ria c i n d e los
d a to s e n tre este grupo.

Test estadsticos de homocedasticidad

L o s te st e s ta d stic o s d e ig u al d isp e rs i n d e la v a ria n z a se re fie re n a la v a ria n z a en g ru p o s fo rm a


d o s p o r v a ria b le s m trica s. E l te st m s c o m n , el te st d e L e v e n e , p u e d e u sa rse p a ra e v a lu a r si las
v a ria n z a s d e u n a n ic a v a ria b le m tric a s o n ig u a le s a lo larg o d e c u a lq u ie r c a n tid a d d e g ru p o s. Si
se e s t c o n tra sta n d o m s d e u n a v a ria b le m tric a , im p lic a n d o la c o m p a ra c i n d e la ig u a ld a d d e las
m a tric e s d e v a ria n z a s/c o v a ria n z a s, s e a p lic a e l te s t M d e B o x . El te st M d e B o x e x is te ta n to e n el
a n lis is m u ltiv a ria n te c o m o e n el a n lis is d is c rim in a n te y se d is c u te co n m s d e ta lle e n los c a p
tu lo s d e d ic a d o s a e s ta s t cn ic as.

Soluciones para la heterocedasticidad


L o s p ro b le m a s d e h e te ro c e d a stic id a d p u e d e n so lu c io n a rs e a trav s d e tra n s fo rm a c io n e s d e d atos,
s im ila re s a la s u sa d a s p a ra c o n s e g u ir la n o rm a lid a d . C o m o y a se h a m e n c io n a d o , e n m u c h a s o c a
s io n e s la h e te ro c e d a stic id a d e s e l re s u lta d o d e la n o n o rm a lid a d d e u n a d e las v a ria b le s , y la c o
rre c c i n d e la n o n o rm a lid a d re su e lv e ig u a lm e n te la d is p e rs i n d e la v a ria n z a . E n u n a se cc i n
p o s te rio r se d isc u te n las tra n sfo rm a c io n e s d e lo s d a to s d e la s v a ria b le s q u e h a c e n q u e to d o s lo s v a
lo re s te n g a n u n e fe c to p o te n c ia lm e n te ig u a l e n la p re d ic c i n .

Linealidad
L a lin e a l id a d es u n su p u e sto im p lc ito d e to d a s las t c n ic a s m u ltiv a ria n te s b a s a d a s e n m e d id a s d e
c o rre la c i n , in c lu y e n d o la re g re si n m ltip le , re g re s i n lo g stic a , a n lisis fa c to ria l y lo s m o d elo s
d e e c u a c io n e s estru c tu ra le s. D ad o q u e la s c o rre la c io n e s re p re se n ta n s lo la a s o c ia c i n lin e al e n
tre v a ria b le s , lo s e fe c to s no lin e a le s n o e s ta r n re p re se n ta d o s en e l v a lo r d e la c o rre la c i n . C o m o
re s u lta d o , es s ie m p re p ru d e n te e x a m in a r to d a s la s re la c io n e s p a ra id e n tific a r c u a lq u ie r d e s p la z a
m ie n to de la lin e alid ad q u e p u e d a im p a c ta r la c o rre la c i n .

Identificacin de relaciones no lineales


L a fo rm a m s c o m n de e v a lu a r la lin e a lid a d es e x a m in a r lo s g r fic o s d e d is p e rs i n d e las v a ria
b le s e id e n tific a r c u a lq u ie r p a u ta no lin e a l e n lo s d a to s . U n a a p ro x im a c i n a lte rn a tiv a es ir a un
68 A N L IS IS M U L TIV A R IA N TE

a n lis is d e re g re si n m ltip le (lo s d e ta lle s d e e s ta t c n ic a se t en en el C a p itu lo 4 ) y e x a m in a r los


resid u o s. L os re sid u o s reflejan la p a rte n o e x p lic a d a d e la v a ria b le d e p e n d ie n te : p o r ta n to , c u a lq u ie r
p a rte n o lin e al d e la rela ci n q u e d a r re fle ja d a en lo s resid u o s. E l e x a m e n d e lo s r e s id u o s p u e d e
a p lic a rs e a la re g re si n m ltip le , d o n d e el in v e s tig a d o r p u ed e d e te c ta r c u a lq u ie r e fe c to n o lin eal
n o re p re se n ta d o en el v a lo r te ric o d e la re g re si n . U n a d is c u si n m s d e ta lla d a d el a n lis is de
r e s id u o s e s t en el C a p itu lo 4.

Soluciones para la no linealidad

Si s e d e te c ta u n a re la c i n no lin e a l, la a p ro x im a c i n m s d ire c ta es tr a n s fo rm a r u n a o a m b a s v a
riab les p a ra co n se g u ir la linealidad. P o ste rio rm e n te en este cap im lo . se d isc u tirn u n as c u a n ta s tra n s
fo rm a c io n e s. U n a a lte rn a tiv a a la tra n s fo rm a c i n d e lo s d a to s es la c re a c i n d e u n a n u e v a v a ria b le
q u e re p re se n te la p a rle no lin e a l d e la re la c i n . El p ro c e so d e c re a r e in te rp re ta r e s to s re su lta d o s
a d ic io n a le s, q u e p u e d e n u sa rse e n to d a s la s re la c io n e s lin e a le s, se d is c u te en e l C a p tu lo 4.

Ausencia de errores correlacionados


L a p re d ic c io n e s c o n c u a lq u ie ra d e las t c n ic a s d e d e p e n d e n c ia n o so n p e rfe c ta s , y r a r a v e z e n
c o n tra re m o s u n a situ a c i n d o n d e lo se an . S in e m b a rg o , in te n ta m o s a s e g u ra r q u e c u a lq u ie ra d e lo s
e rro re s d e p re d ic c i n no est c o rre la c io n a d o c o n el re sto . P o r e je m p lo , si e n c o n tra m o s un in d ic io
q u e su g ie ra q u e lo s e rro re s so n p o s itiv o s y n e g a tiv o s a lte rn a tiv a m e n te , e n te n d e ra m o s q u e h a y a l
g u n a re la c i n sis te m tic a n o e x p lic a d a d e la v a ria b le d e p e n d ie n te . Si e x is te ta l s itu a c i n , no p o
d e m o s e s ta r se g u ro s de q u e n u e s tro s e rro re s d e p re d ic c i n se a n in d e p e n d ie n te s d e lo s n iv e le s q u e
e sta m o s in te n ta n d o p red ecir. E x is te o tro f a c to r q u e e s t a fe c ta n d o lo s re s u lta d o s , p e ro q u e no est
in c lu id o e n el an lisis.

La identificacin de errores correlacionados

L a s s itu a c io n e s m s c o m u n e s d e in c u m p lim ie n to d e este su p u e sto se d e b e n a l p ro c e s o d e re c o g i


d a de d a to s. F a c to re s an o g o s p u e d e n a fe c ta r a u n g ru p o y n o a fe c ta r a o tro . S i se a n a liz a n s e p a
ra d a m e n te , lo s e fe c to s c o n ju n to s so n c o n s ta n te s y no in flu y e n e n la e s tim a c i n d e la re la c i n . P ero
si se c o m b in a n la s o b s e n a c io n e s d e a m b o s g ru p o s, en to n c e s la re la c i n fin a l e s tim a d a d e b e s e r un
c o m p ro m is o e n tre lo s d o s tip o s d e re la c io n e s . E s to p ro v o c a un se sg o d e lo s d a to s p o rq u e una
c a u s a sin e s p e c ific a r esta in flu y e n d o e n la e s tim a c i n d e la rela ci n .
P a ra id e n tific a r lo s erro re s c o rre la c io n a d o s , en p rim e r lu g a r el in v e s tig a d o r tie n e q u e id e n tifi
c a r las c a u sa s p o sib les. E n n u e s tro e je m p lo a n te rio r, la c a u sa v e n d ra d e q u e h a y d o s g ru p o s s e
p a r a d o s en la re c o g id a d e d a to s . U n a v e z q u e la c a u s a p o te n c ia l h a y a s id o id e n tif ic a d a , el
in v e s tig a d o r p o d ra o b s e rv a r si e x iste n d ife re n c ia s e n tre lo s g ru p o s. El h a lla z g o d e d ife re n c ia s en
lo s e rra re s de p re d ic c i n p a ra lo s d o s g ru p o s se ria e n to n c e s la b a s e p a ra d e te rm in a r q u e u n e fe c
to no e s p e c ific a d o es la c a u sa d e lo s e rro re s c o rre la c io n a d o s.

Soluciones para los errores correlacionados

L o s e rra re s c o rre la c io n a d o s tie n e n q u e s e r c o rre g id o s c o n la in c lu si n d el f a c to r c a u sa n te o m iti


d o en el a n lis is m u ltiv a ria n te . E n n u e s tro e je m p lo an terio r, el in v e s tig a d o r a a d ira u n a v a ria b le
p ara in d ic a r la c la se d o n d e e s ta b a n lo s e n c u e s ta d o s . L a so lu c i n m s c o m n es la a d ic i n d e un a(s)
v a ria b le (s ) al a n lis is q u e re p re se n ta el f a c to r o m itid o . L a ta re a c la v e a la q u e se e n fre n ta el in
v e s tig a d o r no es la so lu c i n en si, sin o la id e n tific a c i n d el e fe c to n o e s p e c ific a d o y u n a m a n era
d e re p re s e n ta rlo en el an lisis.
A N L IS IS P R E V IO DE L O S DATOS 69

Transform aciones de los datos


L as tr a n s f o r m a c io n e s d e lo s d a t o s p ro p o rc io n a n un m e d io d e m o d ific a r v a ria b le s p o r u n a o d o s
ra z o n e s: c o rre g ir el in c u m p lim ie n to de lo s su p u e sto s e s ta d stic o s s u b y a c e n te s a las t c n ic a s m u l
tiv a ria n te s o m e jo ra r la re la c i n (c o rre la c i n ) e n tre v a ria b le s . L a tra n s fo rm a c i n d e los d ato s p u e
d e b asarse e n ra z o n e s tan to te ricas (tra n sfo rm a c io n e s c u y a c o n v e n ie n c ia se b a sa en la natu raleza
d e lo s d a to s) c o m o d e riv a d a s d e lo s d a to s (d o n d e las tra n sfo rm a c io n e s se su g ie re n a p a rtir d e un
e x a m e n de lo s d a to s). A s, en c a d a c a so el in v e s tig a d o r d eb e p ro c e d e r m u c h a s v e c e s p o r e n sa y o y
erro r, p o n d e ra n d o la m e jo ra fre n te a la n e c e s id a d d e tra n s fo rm a c io n e s a d ic io n a le s.
T o d as las tra n sfo rm a c io n e s d e s c rita s p u e d e n lle v a rs e a c a b o f c ilm e n te m e d ia n te s im p le s c o
m a n d o s d e to d o s lo s p ro g ra m a s e s ta d stic o s. N o s o tro s n o s c e n tra re m o s en tra n s fo rm a c io n e s que
p u e d a n c a lc u la rse d e esta fo rm a , a u n q u e ta m b i n e x iste n m to d o s m s c o m p lic a d o s y so fistic a d o s
( p o r e je m p lo , v a s e B ox a n d C o x [2],

Transformaciones de los datos para conseguir la normalidad


y la homocedasticidad

L as tra n sfo rm a c io n e s d e lo s d a to s p ro p o rc io n a n el m e d io p rin c ip a l d e c o rre g ir la n o n o rm a lid a d y


h e te ro c e d a stic id a d . E n a m b o s c a so s, la fo rm a d e las v a ria b le s su g ie re tra n sfo rm a c io n e s e s p e c fi
ca s. P a ra la s d istrib u c io n e s no n o rm a le s, las d o s fo rm a s m s c o m u n e s so n las d is trib u c io n e s p la
n a s y las d istrib u c io n e s a sim tric a s. P ara la d istrib u c i n p la n a , la s tra n sfo rm a c io n e s m s co m u n es
s o n la in v e rsa (e s decir, 1 / Ko \!X ). L as d is trib u c io n e s a s im tric a s p u ed e n s e r tra n s fo rm a d a s e m
p le a n d o la ra z c u a d ra d a , lo g a ritm o s o in c lu so la in v e rsa d e la v a ria b le . N o rm a lm e n te , las d istri
b u c io n e s n e g a tiv a m e n te s im tr ic a s s e tr a n s fo rm a n d e fo rm a m s e fe c tiv a e m p le a n d o la raz
c u a d ra d a , m ie n tra s q u e p o r lo g e n e ra l, el lo g a ritm o fu n c io n a m e jo r p a ra la s im e tra p o s itiv a . D e
to d o s m o d o s, el in v e stig a d o r d e b e ra a p lic a r to d a s las tran sfo rm ac io n e s p o sib le s y lu e g o se leccio n ar
la v a ria b le tra n sfo rm a d a m s a p ro p ia d a .
L a h e te ro c e d a stic id a d es un p ro b le m a a s o c ia d o a la n o rm a lid a d , y en m u c h a s c a so s la so lu c i n
del p ro b le m a tie n e q u e v e r ta m b i n c o n ios p ro b lem as d e n o rm alid ad . L a h e te ro c e d a stic id a d se d eb e
ta m b i n a la d istrib u c i n de la v a ria b le (s). C u a n d o s e e x a m in a n lo s re sid u o s d el a n lisis d e la
re g re si n b u sc a n d o la h e te ro c e d a stic id a d , se o b s e rv a q u e un in d ic io d e v a ria n z a s d e s ig u a le s es u n a
d is trib u c i n c o n p erfil d e c o n o d e lo s re s id u o s (v a s e C a p tu lo 4 p a ra d e ta lle s m s e s p e c fic o s del
a n lis is g r fic o d e lo s re sid u o s ). Si ei c o n o se a b re a la d e re c h a , c o g e m o s la in v e rsa ; si se a b re a
la izq u ierd a, c o g e m o s la raz cu ad rad a. A lg u n a s tran sfo rm ac io n e s p u ed e n aso cia rse c o n cierto s tipos
d e d a to s. P o r e je m p lo , el re c u e n to de fre c u e n c ia s s u g ie re u n a tra n sfo rm a c i n d e r a z c u a d ra d a ; las
p ro p o rc io n es se tran sfo rm an m e jo r p o r la tra n sfo rm a c i n d el arc o sen o (.Y ucia = 2 arc o sen o v/ I nlipjJ ;
y un c a m b io p ro p o rc io n a l s e m a n e ja m e jo r to m a n d o el lo g a ritm o d e la v a ria b le . E n to d o s lo s casos,
u n a v e z q u e se h a n rea lizad o las tran sfo rm ac io n e s, lo s d ato s tran sfo rm ad o s d eb e ran s e r co n trastad o s
p a ra v e r si se h a lo g ra d o la so lu c i n d e s e a d a . r

Transformaciones para conseguir la linealidad

E x iste n n u m e ro so s p ro c e d im ie n to s p a ra c o n s e g u ir la lin e a lid a d e n tre d o s v a ria b le s , p e ro las re la


c io n e s n o lin e a le s m s sim p le s p u e d e n c la sific a rs e e n c u a tro c a te g o ra s (v a se F ig u ra 2.9 ). E n ca d a
c u a d ra n te , se m u e stra n la s tra n s fo rm a c io n e s p o te n c ia le s p a r a v a ria b le d e p e n d ie n te e in d e p e n
d ie n te . P o r e je m p lo , si la s re la c io n e s lo c a le s s o n c o m o la s d e la F ig u ra 2 .9 a, se a p lic a la ra z c u a
d r a d a p a ra c o n s e g u ir la lin e a lid a d . C u a n d o s e m u e s tr a n la s p o s ib ilid a d e s d e tra n s fo rm a c i n
m ltip le , se e m p ie z a co n el m to d o m s ad e c u a d o p a ra ca d a c u a d ra n te p a ra d e s p u s b a ja r h a s ta que
se c o n s ig u e la lin e a lid a d . U n a a p ro x im a c i n a lte rn a tiv a c o n s is te e n u tiliz a r v a ria b le s ad ic io n a le s,
d e n o m in a d a s p o lin m ic a s. q u e re p re se n ta n lo s c o m p o n e n te s n o lin e ales. E ste m to d o s e d isc u te
c o n m a y o r d e ta lle en el C a p itu lo 4.
70 A N L IS IS M U L T IV A R IA N T E

(a)

ib ) (d i

FIG U R A 2 .9 . S e l e c c i n d e t r a n s f o r m a c i o n e s p a r a c o n s e g u i r la l i n e a l i d a d .
F u e n te : F. M o s te lle r y J . W . T u k e y . D a ta A n a ly s is a n d R e g r e s i n . R e a d irtg , M a s s .: A d d is o n - W e s le y , 1977.

Normas generales para las transformaciones


E x iste n v a rio s p u n to s a r e c o rd a r c u a n d o s e lle v a n a c a b o u a m fo r m a c io n e s d e lo s d ato s. In clu y en
lo s sig u ie n te s:

1. P a ra o b te n e r u n e le c to p e rc e p tib le d e la tra n sfo rm a c i n , el ra tio e n tre la m e d id a d e la \ a-


ria b le y su d e s v ia c i n e s t n d a r d e b e ra se r m e n o r d e 4.0 .
2. C u a n d o la tra n sfo rm a c i n p u e d e re a liz a rs e s o b re u n a d e las d o s v a ria b le s , se le c c io n a r ;j
v a ria b le c o n el ratio m s p e q u e o d el item 1.
3. L a s tra n sfo rm a c io n e s d e b e ra n a p lic a rs e a las v a ria b le s in d e p e n d ie n te s e x c e p to en el caso
d e la h e te ro c e d a stic id a d .
4. L a h e te ro c e d a stic id a d s lo p u e d e s o lu c io n a rs e m e d ia n te la tra n s fo rm a c i n d e la \a r ia b le
d e p e n d ie n te e n u n a re la c i n d e d e p e n d e n c ia . Si u n a re la c i n h e te ro c e d s tic a es a d e m s no
lin e al, d e b e ra n tra n s fo rm a rs e ia v a ria b le d e p e n d ie n te y q u iz la in d e p e n d ie n te .
5. L as tra n sfo rm a c io n e s p u e d e n c a m b ia r la in te rp re ta c i n d e las v a ria b le s . P o r e je m p lo , las
v a ria b le s tra n s fo rm a d a s to m a n d o su s lo g a ritm o s tra sla d a n la re la c i n e n u n a m e d id a de
c a m b io p ro p o rc io n a l (e la stic id a d ). S ie m p re h a y q u e a s e g u ra rs e la e x p lo ra c i n d e to d a s las
p o s ib le s in te rp re ta c io n e s de las v a ria b le s tra n sfo rm a d a s.

Un ejem plo de contrastacin d e los supuestos bsicos


del anlisis m ultivariante
C o n el fin d e ilu s tra r las t c n ic a s d e c o n tra s ta c i n d e d a to s p a ra c o n s e g u ir el c u m p lim ie n to d e los
s u p u e sto s s u b y a c e n te s al a n lis is m u ltiv a ria n te y p ro p o rc io n a r un fu n d a m e n to e n el u so d e lo s d a
lo s e n lo s c a p tu lo s sig u ie n te s, e x a m in a re m o s el c o n ju n to d e d a to s in tro d u c id o s e n el C a p itu lo 1.
E n el c u rso del a n lis is, se c u b rir n lo s s u p u e s to s d e n o rm a lid a d , h o m o c e d a s lie id a d y lin e alid ad .
A N L IS IS P R E V IO D E LOS DATOS 71

El c u a rto su p u e sto b s ic o , la a u s e n c ia d e c o rre la c i n e n tre lo s e rro re s , s lo p u e d e a p re c ia rs e e n el


c o n te x to d e u n m o d e lo m u ltiv a ria n te e s p e c fic o y p o r ta n to , s e r c u b ie rto e n lo s ltim o s c a p tu lo s
p a ra c a d a t c n ic a m u ltiv a ria n te . S e p o n d r m a y o r n fa s is e n la s v a ria b le s m tric a s , a u n q u e las v a
ria b le s n o m tric a s s e r n e v a lu a d a s c u a n d o s e a a p ro p ia d o .

Normalidad

El p r im e r a n lis is a re a liz a r p a ra e v a lu a r la n o rm a lid a d d e la s v a ria b le s m tric a s e s la d e riv a c i n


d e lo s g r fic o s d e p ro b a b ilid a d n o rm a l. L a F ig u ra 2 .1 0 c o n tie n e lo s g r fic o s d e c a d a u n a d e las n u e
v e v a ria b le s . E n n u e s tro e x a m e n d e lo s g r fic o s , o b se rv a m o s c ie rto s d e s p la z a m ie n to d e la d ia g o
n al, in d ic a tiv o d e u n a a u s e n c ia d e n o rm a lid a d . E n re fe re n c ia a lo s m o d e lo s v is to s e n la F ig u ra 2.7 ,
v e m o s q u e X 2 p a re c e s im tric a p o s itiv a , X 2 s e a p ro x im a a u n a d is trib u c i n u n ifo rm e y X %p a re c e
s im tric a n e g a tiv a .

o.oo
0.00 0,25 0,50 0.75 1.00 0,00 0,25 0,50 0.75 1.00
X| (Velocidad de entrega) X (Nivel de precios) X 3 (Flexibilidad de precios)

I.UO 1.00 i .00


/ y

0.75
y 0.75 y
0.75 y
0.50
y y y
/ y
OJO OJO

0.25 - 0,25 005 .

0,00
0.00 0,25 OJO 0.75 1,00
0.00
0,00

0.25

0.50 0,75 1.00
0.00
' 0,00
y 0,25 0.50 0,75 1.00
X-j (Calidad del producto) Xg (Nivel de fidelidad) X0 (Nivel de satisfaccin)

FIGURA 2 .1 0 . Grficos de probabilidad normal de variables mtricas.


-J
tU

ANALISIS
M U LTIV A RIA N TE
TABLA 2 .1 1 . C a r a c t e r s t i c a s d e la d i s t r i b u c i n , la p r u e b a d e la n o r m a l i d a d y p o s i b l e s s o l u c i o n e s

D escripcin d e form a1'

Simetra Curtosis Soluciones posibles


Test d e norm alidad
Valor Valor Descripcin Significacin
Variable Estadstica z Estadstica Estadstica Significacin de la distribucin Transformacin

A'j Velocidad de entrega -0,085 -0,35 -0,511 1,07 0,063 > 0,200 Distribucin normal Ninguna
X Nivel de precios 0,469 1,95* -0,509 1.06 0,095 0,028 Simetra positiva Raz cuadrada > 0,200
X$ Flexibilidad -0,289 1,19 -1,073 2,24* 0,095 0,027 Acercam iento a la Ninguna
de precios distribucin normal
Imagen 0.218 0,91 0.085 0,18 0,107 0,007 Simetra positiva ligera Sin mejora
del productor posible
A5 Servicio conjunto -0,373 1,55 0,141 0,29 0.085 0,069 Distribucin normal Ninguna
A'(, Imagen de la 0,493 2,04* 0,107 0,22 0.122 0,001 Cola cargada con Raiz cuadrada 0,032
fuerza de ventas sim etra positiva
Xy Calidad del producto 0,229 0,95 -0 ,8 5 0 1,77 0,091 0.041 Ligeramente plana Ninguna
A9 Nivel de fidelidad -0,069 0,26 -0,725 1,52 0,079 0,131 D istribucin normal N inguna
A j0 Nivel de satisfaccin 0.089 0,37 -0,763 1,60 0,078 0,142 Distribucin normal N inguna

" L os v a lo re s : se d e riv an c o n la d iv isi n d e las estad sticas p o r los erro re s estndares a p ro p iad o s de 0,241 (sim etra ) y 0 ,4 7 8 (cu rto sis). S e p ro p o rcio n an la s ecu ac io n e s p a ra ca lc u la r los
erro re s est n d a re s e n el texto.
* S ie n ific a n tc al nivel d e 0,05.
A N L IS IS P R E V IO D E LOS DATOS 73

P o d e m o s c o m p le m e n ta r e ste a n lis is v isu a l c o n e s ta d stic o s q u e re fle je n el p erfil d e la d istri


b u c i n (s im e tra y c u rto sis) asi c o m o u n te s t e s ta d s tic o d e n o rm a lid a d (el te s t m o d ific a d o d e K ol-
m o g o ro v -S m irn o v ). L a T ab la 2 . 11 m u e s tra e s to s v a lo re s p a ra to d a s la s v a ria b le s m trica s. C u a tro
v a ria b le s e x h ib e n un ale ja m ie n to e s ta d s tic a m e n te sig n ific a tiv o d e la n o rm a lid a d (A",, X y X i y A j .
L a T a b la 2.11 ta m b i n su g ie re el c rite rio a p ro p ia d o . D o s v a ria b le s (X 2 y A ) fu e ro n tran sfo rm ad a s
u sa n d o la ra z c u a d ra d a . E n c a d a c a so , las v a ria b le s tra n s fo rm a d a s d e m u e stra n la n o rm a lid a d (v
ase T a b la 2.11).
L a F ig u ra 2 . 1 1 d e m u e stra el e fe c to de la tra n s fo rm a c i n s o b re A, p a ra a lc a n z a r la n o rm alid ad .
A , a p a re c e n o ta b le m e n te m s n o rm a l e n a m b a s g r fic a s, y los d e s c rip to re s e sta d stic o s ta m b i n han
m e jo ra d o . E l in v e stig a d o r s ie m p re d e b e e x a m in a r las v a ria b le s tra n s fo rm a d a s c o n ig u al rig o r q u e
la s v a ria b le s o rig in a le s p o r lo q u e s e re fie re a su n o rm a lid a d y su fo rm a d e d istrib u c i n .
E n el c a so d e las d o s v a ria b le s re sta n te s (A , y A 4), n in g u n a d e las tra n s fo rm a c io n e s p o d ra n m e
j o r a r s u n o rm a lid a d . E sta s v a ria b le s te n d r n q u e s e r u tiliz a d a s e n su fo rm a o rig in a l.

V ariable original

V ariable transform ada

C aractersticas de distribucin antes y despus de la Iransform acin

D escriptores de distribucin11 Test de norm alidad

S im etra C urtosis

F orm a variable E stadstica V alor z E stadstica Valor z Estadstica S ignicacin

O riginal X2 0.469 1.95 -0 .5 0 9 1,06 0.095 0,028

T ransform ada X2 -0 .1 0 6 0.44 -0.46S 0.97 0.062 > 0,200

L os valores z se derivan con la divisin d e las estadsticas p o r ios errores estndares apropiados de 0.241 (si
m etra) y 0.478 (curtosis). Se proporcionan las ecuaciones para calcular los errores estndares en e! texto.

F IG U R A 2 .1 1 . T r a n s f o r m a c i n d e X 2 ( n iv e l d e p r e c i o ) p a r a l o g r a r la n o r m a l i d a d .
74 A N L I S IS M U L T I V A R I A N T E

E n la s situ a c io n e s e n d o n d e la n o rm a lid a d d e e s ta s v a ria b le s so n c ritic a s, lo s v a lo re s tra n s fo r


m a d o s p u e d e n u sa rse co n la g a ra n ta d e q u e m a n tie n e n e l su p u e sto d e n o rm a lid a d . P ero el a le ja
m ie n to d e la n o rm a lid a d n o es ta n e x tre m o c o m o p a ra q u e la s v a ria b le s o rig in a le s n o p u ed a n
u tiliz a rs e e n el a n lisis e n su fo rm a o rig in a l. Si la t c n ic a es ro b u sta en lo q u e se re fie re a a le ja
m ie n to s de la n o rm a lid a d , en to n c e s p u e d e n p re fe rirs e las v a ria b le s o rig in a le s p a r a p o d e r re a liz a r
u n a c o m p a ra c i n en la fase d e in te rp re ta c i n .

H om ocedasticidad
T o d o s lo s p a q u e te s e s ta d stic o s c o n tie n e n te s t p a ra e v a lu a r la h o m o c e d a s tic id a d s o b re u n a b a se
u n iv a ria n te (p o r e je m p lo , el te st d e L e v e n e e n S P S S ) d o n d e se c o m p a ra la v a ria n z a d e u n a v a ria b le
m tric a a lo la rg o d e io s n iv e le s d e la s v a ria b le s n o m tric a s. D e a c u e rd o c o n n u e s tro s o b je tiv o s,
e x a m in a re m o s ca d a u n a d e las v a ria b le s m tric a s a lo la rg o d e la s c in c o v a ria b le s n o m tric a s en
el c o n ju n to de d ato s. E sto s a n lis is so n a p ro p ia d o s e n p re p a ra c i n ta n to d el a n lis is d e la v a ria n z a
c o m o d e l a n lisis m u ltiv a ria n te de la v a ria n z a d o n d e las v a ria b le s n o m tric a s s o n las v a ria b le s
in d e p e n d ie n te s , o el a n lis is d is c rim in a n te d o n d e la s v a r ia b le s n o m tr ic a s s o n la s m e d id a s
d e p e n d ie n te s.
L a T ab la 2 .1 2 c o n tie n e lo s re s u lta d o s d e l te s t d e L e v e n e p a ra c a d a u n a d e la s v a ria b le s . L a s v a
ria b le s n o m tric a s X Ky A'n m u e stra n a m b a s h e te ro c e d a stic id a d e s s ig n ific a tiv a s s o b re lo s m is m o s
fa c to re s de d esarro llo {X, A ', X 6 y X 7), m ie n tra s q u e A ', y A' 4 tie n e n p o c a s o c u rre n c ia s e n tre el c o n
ju n to c o m p le to de v aria b les. L a s im p lic a c io n e s d e e s to s e je m p lo s d e h e te ro c e d a s tic id a d d e b e n s e r
e x a m in a d a s d o n d e q u ie ra q u e se a n e v a lu a d a s las d ife re n c ia s d e g ru p o s, u sa n d o ta n to v a ria b le s no
m tric a s c o m o v a ria b le s in d e p e n d ie n te s, c o m o v a ria b le s m tric a s q u e se c o n s id e re n d e p e n d ie n te s .
S i se e n c o n tra ra alg n in c u m p lim ie n to d e lo s su p u e sto s , e x iste n tra n s fo rm a c io n e s d e la v a ria b le
p a ra a y u d a r a re m e d ia r la d isp e rs i n de la v a ria n z a .

T A B L A 2 .1 2 . T e st d e h o m o c e d a s tic id a d

Variable no mtrica/categrica

*: *13
Tamao Compra Estructura Tipo Tipo de situacin
de la empresa de especificacin de obtencin de industria de compra

Variable Estadstica Estadstica Estadstica Estadstica Estadstica


mtrica Levene % Levene Sig. Levene Sig. Levene Sig. Levene Sig.

X, Velocidad 0.934 0.336 0,934 0,336 0,382 0,538 0,377 0,540 0.114 0,892
de entrega
X . Nivel de precios 1,582 0,2 U 1,582 0,211 13,76! 0,000 1,345 0,249 8,081 0,001
A, Flexibilidad 1,194 0,277 1,194 0.277 4,765 0,031 0,192 0.662 14,383 0,000
de precios
X t Imagen 6,549 0.012 6,549 0,012 0,281 0,597 0.040 0,842 2,030 0,137
del productor
A', Servicio 7,819 0.006 7,819 0.006 5,141 0,026 0,003 0,957 2,888 0,060
conjunto
X (t Imagen de la 5,279 0,024 5,279 0,024 1,626 0,205 0,264 0,609 1,735 0,182
fuerza de ventas
X , Calidad 8,748 0,004 8,748 0,004 4,129 0,045 2,532 0,115 2,051 0,134
de producto
A, Nivel 1,377 0,243 1,377 0,243 1,575 0,212 0,091 0,763 0,056 0,945
de fidelidad
Aj(l Nivel de 0,323 0,571 0,323 0,571 0,000 0,986 0,054 0,817 3,302 0,041
satisfaccin

S o ia : L os v alo res re p re se n ta n el v alo r y la sig n ificaci n esta d stic a (S ig .) d e l test d e L ev en e c o n la valo raci n do la d isp e rsi n d e la varianza
de ca d a v a ria b le m tric a a tra v s d e los n iv eles d e la s v a ria b le s n o m tric a s'c a tc g ric a s.
A N L IS IS P R E V IO D E L O S D A T O S 75

L o s te st d e h o m o c e d a stic id a d d e d o s v a ria b le s m tric a s, q u e e n c o n tra m o s en lo s m to d o s


c o m o el d e re g resi n m ltip le , se re a liz a n m e jo r a tra v s d el a n lis is g r fic o , p a rtic u la rm e n te un
a n lis is d e los resid u o s. S e re m ite a l le c to r in te re sa d o al C a p tu lo 4 p a ra u n a d is c u s i n c o m p leta
del a n lis is de lo s re sid u o s y lo s m o d e lo s d e lo s re sid u o s in d ic a tiv o s d e h e te ro c e d a stic id a d .

Linealidad
E l su p u e sto fin a l a e x a m in a r e s la lin e a lid a d d e las re la c io n e s. E n el c a so d e v a ria b le s in d iv id u a
les, se re la c io n a n la s p a u ta s d e a s o c ia c i n e n tre c a d a p a r d e v a ria b le s y la c a p a c id a d d e l co eficien te
de c o rre la c i n p a ra re p re s e n ta r a d e c u a d a m e n te la re la c i n . S i h a y u n in d ic io d e re la c io n e s no li
n e a le s, en to n c e s el in v e stig a d o r p u e d e , ta n to tra n s fo rm a r u n a o a m b a s v a ria b le s p a ra c o n s e g u ir la
lin e a lid a d . c o m o c re a r v a ria b le s a d ic io n a le s p a ra re p re s e n ta r lo s c o m p o n e n te s n o lin e ales. N o s p o
d e m o s a p o y a r e n la in sp e c c i n v isu a l d e la s re la c io n e s p a ra d e te rm in a r si e s t n p re s e n te s re la c io
n e s n o lin eales. E l le c to r p u e d e i r a la F ig u ra 2 .3 , q u e p re se n ta lo s g r fic o s d e d isp e rs i n p a ra to d as
la s v a ria b le s m tric a s e n e l c o n ju n to d e d a to s . E l e x a m e n d e lo s g r fic o s d e d is p e rs i n n o rev e la
n in g u n a rela ci n ap a ren te . P o r ta n to , las tra n sfo rm a c io n e s n o se c o n sid e ra n n e c e sa ria s. E l su p u esto
d e lin e a lid a d se c o m p ro b a r ta m b i n p a ra e l m o d e lo m u ltiv a ria n te en te ro y c u n a d o se lle v e a cab o
e l e x a m e n de lo s re sid u o s e n la r e g re s i n m ltip le .

Resumen
L a s se rie s d e te st g r fic o s y e s ta d s tic o s d irig id o s h a c ia la e v a lu a c i n d e lo s su p u e sto s su b y a c e n
te s e n la s t c n ic a s m u ltiv a ria n te s d e s c u b re re a lm e n te p o c o e n t rm in o s d e v io la c io n e s d e o s su
p u esto s. D o n d e se h an in d icad o v io la c io n e s, s ta s h an sid o rela tiv a m en te p eq u e as y no p resen taran
n in g n p ro b le m a se rio p a ra el a n lis is d e d a to s p o ste rio r. S e a n im a al in v e s tig a d o r a re a liz a r sie m
p re e s to s e x m e n e s d e lo s d a to s s im p le s, a u n q u e re v e la d o re s , p a ra a s e g u ra r q u e p u e d a n id e n tifi
c a rse y re so lv e rse lo s p ro b le m a s p o te n c ia le s a n te s d e c o m e n z a r e l an lisis.

U n fa c to r c rtic o e n la e le c c i n y a p lic a c i n d e la t c n ic a m u ltiv a ria n te c o rre c ta es la m e d ic i n d e


las p ro p ie d a d e s d e las v a ria b le s d e p e n d ie n te s e in d e p e n d ie n te s. A lg u n a s t c n ic a s, ta le s c o m o el
a n lis is d isc rim in a n te o e l a n lis is m u ltiv a ria n te d e la v a ria n z a , re q u ie re n e s p e c ific a m e n te d ato s
n o m tric o s c o m o v a ria b le s d e p e n d ie n te s o in d e p e n d ie n te s. S in em b a rg o , e n m u c h o s caso s, las
v a ria b le s m tric a s tie n e n q u e s e r u tiliz a d a s c o m o v a ria b le s in d e p e n d ie n te s, c o m o o c u rre en el
a n lisis de reg resi n , en el an lisis d is c rim in a n te y en la co rre la c i n ca n n ic a. A d em s, las tcnicas
d e in te rd e p e n d e n c ia d e a n lis is fa c to ria l y c lu s te r n o rm a lm e n te re q u ie re n v a ria b le s m trica s. C on
e ste fin , to d o s lo s d e b a te s h a n a s u m id o la m e d ic i n m tric a d e v aria b les. P ero , q u p o d e m o s h acer
c u a n d o las v a ria b le s so n n o m tric a s, c o n d o s o m s c a te g o ra s? S e e x c lu y e n e n m u c h a s t cn ic as
m u ltiv a ria n te s las v a ria b le s n o m tric a s ta le s c o m o g n e ro , situ a c i n m a rita l u o c u p a c i n ? L a
re s p u e s ta es n eg a tiv a . A c o n tin u a c i n , d is c u tire m o s c o m o in c o rp o ra r las v a ria b le s n o m tric a s a
m u c h a s d e e s ta s situ a c io n e s q u e r e q u ie re n v a ria b le s m trica s.
E l in v e s tig a d o r tie n e a su d is p o s ic i n u n m to d o p a ra u s a r v a ria b le s d ic o t m ic a s , c o n o c id a s
c o m o v a r ia b le s fic tic ia s , q u e a c t a n c o m o v a ria b le s d e su stitu c i n . U n a v a ria b le fic tic ia es u n a
v a ria b le d ic t m ic a q u e re p re se n ta u n a c a te g o ra d e v a ria b le in d e p e n d ie n te n o m tric a . C u a lq u ie r
v a ria b le n o m trica c o n k c a te g o ra s p u e d e se r re p re se n ta d a c o m o v a ria b le ficticia k - 1. E l siguiente
e je m p lo a y u d a r a c la rific a r e s te co n c e p to .
E n p rim e r lugar, su p o n g a m o s q u e q u e r e m o s in c lu ir el g n e ro , q u e tie n e d o s c a te g o ra s, fem e
n in a y m a sc u lin a . T a m b i n h e m o s m e d id o e l n iv e l d e re n ta d o m stic a c o n tre s c a te g o ra s (v ase
76 A N L IS IS M U LTIVA RIAN TE

T A B L A 2 .1 3 . R e p r e s e n t a c i n d e v a r i a b l e s n o m t r i c a s c o n v a r i a b l e s f ic tic ia s

Variable no mtrica Variable no mtrica con tres categoras


con dos categoras (gnero) (nivel d e renta domstica)

Gnero Variables ficticias N ivel de renta domstica Variables ficticia s

fem enino Aj = l , o bien Aj = 0 si < 15.000$ A j = l , o bien Aj = 0


M asculino .Y- = l . o bien X i = 0 s i> 15.000S& <25.000 $ A j = l . o bien A j = 0
si > 25.000$ A j = l . o bien Aj = 0

T ab la 2 .1 3 ). P a ra re p re se n ta r el g n e ro n o m tric o d e la v a ria b le , c re a re m o s d o s n u e v a s v a ria b le s


fic tic ia s (Aj y A-,), tal y c o m o s e m u e s tra e n !a T a b la 2 .1 3 . A re p re se n ta a a q u e llo s in d iv id u o s d e
se x o fe m e n in o co n un v a lo r d e 1, y d a r a to d o s lo s v a ro n e s u n v a lo r d e 0. D el m is m o m o d o , A'
re p re se n ta a to d o s lo s v a ro n e s c o n el v a lo r d e 1 y d a a to d a s las m u je re s el v a lo r d e 0 . A m b a s v a
ria b le s, (Aj y A',) n o so n n e c e s a ria s , n o o b sta n te , p o rq u e c u a n d o Aj - 0 , e l g n e ro tie n e q u e se r fe
m e n in o p o r d efin ici n . P o r ta n to , n e c e s ita m o s in c lu ir s lo u n a d e las v a ria b le s (Aj o A j) p a ra p ro b a r
el e fe c to del gnero.
D e la m is m a form a, si m e d im o s ta m b i n la re n ta d o m stic a c o n tre s n iv e le s tal y c o m o se m u e s
tra e n la T a b la 2 .1 3 . n u e s tra p r im e ra d e fin ic i n s e ra n tre s v a ria b le s fic tic ia s (A j, X 4 y A j). S in e m
b a rg o . tal y c o m o o c u rre e n el c a s o d e g n e ro , n o n e c e s ita m o s el c o n ju n to e n te ro d e v a ria b le s
ficticia s, y en su lu g a r u sa m o s v a ria b le s fic tic ia s k - ! , d o n d e K es el n m e ro d e c a te g o ra s . P o r
ta n to , u sa re m o s d o s d e la s v a ria b le s fic tic ia s p a ra re p re se n ta r lo s efe c to s d e la re n ta d o m e stic a .
E x is te n tres m an eras d e r e p re s e n ta r lo s n iv e le s d e re n ta d o m s tic a c o n d o s v a ria b le s fic tic ia s,
tal y c o m o se m u e stra en la T a b la 2 .1 4 . E s ta fo rm a d e co d ific a c i n d e v a ria b le s fic tic ia s s e c o n o
ce c o m o c o d ific a c i n d e in d ic a d o r e s . U n a c o n s id e ra c i n im p o rta n te e n es ta fo rm a d e c o d ific a
c i n d e v a ria b le s fic tic ia s es r e c o rd a r la c a te g o ra q u e se o m ite , q u e se c o n o c e c o m o g r u p o d e
c o m p a r a c i n . E sta es la c a te g o ra q u e re c ib e lo s c e ro s p a ra las v a ria b le s fic tic ia s. P o r e je m p lo , en
el a n lisis d e re g re si n , lo s c o e fic ie n te s d e re g re s i n p a ra las v a ria b le s fic tic ia s re p re s e n ta n d e s
v ia c io n e s del gru p o de c o m p a ra c i n en c u a n to a la v aria b le d e criterio. L as d e sv ia c io n e s re p re se n ta n
las d ife re n c ia s en tre las m e d ia s p a ra c a d a g ru p o d e e n c u e s ta d o s c o m p u e sto p o r u a v a ria b le ficti
cia y u n g ru p o d e c o m p a ra c i n . E s ta fo rm a e s m s a p ro p ia d a c u a n d o e x iste un g ru p o d e c o m p a
ra c i n l g ic a , c o m o en el c a so d e u n e x p e rim e n to . E n u n e x p e rim e n to c o n e l g ru p o d e c o n tro l que
a c t a c o m o el g ru p o de c o m p a ra c i n , lo s c o e fic ie n te s so n las d ife re n c ia s d e m e d ia so b re la \ aria-
b le d e p e n d ie n te p a ra c a d a g ru p o tra ta m ie n to d e l g ru p o d e co n tro l. C a d a v e z q u e se u s a la c o d ifi
c a ci n d e v a ria b le s ficticia s, te n e m o s q u e se r c o n s c ie n te s d el g ru p o d e c o m p a ra c i n y r e c o rd a r los
im p a c to s q u e tie n e en n u e s tra in te rp re ta c i n d e las v a ria b le s resta n te s.
U n m to d o alte rn a tiv o d e c o d ific a c i n d e v a ria b le s fic tic ia s se d e n o m in a c o d if ic a c i n d e
e fe c to s. E s lo m ism o q u e la c o d ific a c i n d e in d ic a d o re s e x c e p to q u e el g ru p o d e c o m p a ra c i n (el
g ru p o q u e re c ib e to d o s lo s c e ro s en la c o d ific a c i n d e in d ic a d o re s) re c o g e el v a lo r d e - 1 e n v e z de
0 p a ra las v a ria b le s ficticia s. A h o ra lo s c o e fic ie n te s re p re se n ta n las d ife re n c ia s d e c u a lq u ie r g ru
p o re sp e c to a ia m e d ia de to d o s lo s g ru p o s en v e z d e a la d el g ru p o o m itid o . A m b a s fo rm a s d e c o
d ific a c i n d e v a ria b le s d a r n lo s m is m o s re su lta d o s ; las n ic a s d ife re n c ia s te n d r n lu g a r en la
in te rp re ta c i n d e lo s c o e fic ie n te s d e las v a ria b le s ficticia s.

T A B L A 2 .1 4 . P a u ta s d e c o d if ic a c i n d e v a r ia b le s f ic tic ia s a lte r n a tiv a s p a r a v a r ia b le s n o m tr ic a s d e


tr e s c a te g o ra s

N ivel de rema Pauta i Pauta 2 Pauta 3


dom stica X. A, A", Aj Aj .Yj

Si < 15. 000S 1 0 i 0 0 0


Si > 1 5 . 0 0 0 $ &< 25. 000$ 0 i 0 0 1 0
Si > 25. 000S 0 0 0 1 0 1
A N L IS IS P R E V IO D E L O S DATOS 77

L a u tiliz a c i n m s fre c u e n te d e v a ria b le s f ic tic ia s se p ro d u c e en el a n lis is d e re g re si n y d is


c rim in a n te , d o n d e lo s c o e fic ie n te s tie n e n u n a in te rp re ta c i n d ire c ta . S u e m p le o e n o tra s tcn icas
m u ltiv a ria n te s es m s lim ita d o , e s p e c ia lm e n te e n la s q u e d e p e n d e n d e p a u ta s c o rre la c i n a le s , ta
les c o m o el a n lis is fa c to ria l, p o rq u e la c o rre la c i n d e u n a v a ria b le b in a ria n o q u e d a m u y bien re
p re s e n ta d a p o r la c o rre la c i n d e c o e fic ie n te s tra d ic io n a l d e P e a rs o n . N o o b s ta n te , se p u ed en
h a c e r c o n s id e ra c io n e s e s p e c ia le s e n e s to s c a s o s , ta l y c o m o se in d ic a e n lo s c a p tu lo s c o rre sp o n
d ie n tes.

A.-
S:J

E ste c a p tu lo h a p ro p o rc io n a d o al in v e s tig a d o r el in stru m e n ta l n e c e s a rio p a r a e x a m in a r y e x p lo ra r


la n a tu ra le z a d e lo s d a to s y las r e la c io n e s e n tre v a ria b le s a n te s d e la a p lic a c i n d e c u a lq u ie ra de
las t c n ic a s m u ltiv a ria n te s . A u n q u e e s te a n lis is re q u ie re n u n a c a n tid a d c o n s id e ra b le d e tie m p o y
e s fu e rz o , el in v e stig a d o r p ru d e n te in v ie rte s a b ia m e n te lo s re c u rso s n e c e s a rio s e n un p ro fu n d o exa
m e n d e lo s d a to s p a ra a s e g u ra rse d e q u e s e a p lic a n lo s m to d o s m u ltiv a ria n te s en las situ ac io n es
a p r o p i a d a s y p a r a e v a l u a r d e f o r m a m s a d e c u a d a la i n t e r p r e t a c i n d e lo s r e s u lt a d o s .

1. E n u m e re la s c a u sa s p o te n c ia le s d e e x is te n c ia d e c a so s a tp ic o s. A s e g re s e d e in c lu ir lo s atri
b u id o s ta n to al in v e stig a d o r c o m o al e n c u e s ta d o .
2. D isc u ta p o r q u lo s c a so s a tp ic o s p u e d e n c la s ific a rs e c o m o b e n e fic io s o s y p ro b le m tic o s.
3. D istin g a e n tre lo s p ro c e so s a le a to rio s d e d a to s au se n te s (M A R ) y lo s c o m p le ta m e n te aleato rio s
(M C A R ). E x p liq u e c m o in flu y e c a d a tip o d e p ro c e so e n e l a n lisis d e lo s d a to s au sen tes.
4. D e sc rib a la s c o n d ic io n e s b a jo las c u a le s u n a n a lis ta e lim in a ra u n c a s o c o n d a to s au sen te s y
las c o n d ic io n e s b a jo las c u a le s u n a n a lis ta u tiliz a ra un m to d o d e im p u ta c i n .
5. E v a l e la s ig u ie n te a firm a c i n : p a ra u tiliz a r la m a y o ra d e lo s a n lis is m u ltiv a ria n te s no es
n e c e s a rio q u e se c u m p la n to d o s lo s s u p u e sto s d e n o rm a lid a d , lin e a lid a d , h o m o c e d a s tic id a d e
in d e p e n d e n c ia .
6. D isc u ta la sig u ien te afirm aci n : lo s a n lisis m u ltiv aria n tes p u e d e rea liza rse s o b re c u a lq u ie r co n
ju n to d e d a to s, e n la m e d id a e n q u e e l ta m a o d e la m u e s tra s e a el a d e c u a d o .

X- *

3k i
/T

1. Anderson, Edgar (1969), A Semigraphical M ethod for vioral Sciences, 2d ed. Hillsdale, N.J.: Lawrence Erl-
the A nalysis o f Com plex Problem s. Technometrcs 2 baum Associates.
(August): 387-91. 5. Daniel, C ..an d F. S. Wood (1980). Fitting Eipiations to
2. Box, G. E. P., and D. R. Cox (1964), An A nalysis o f D ata, 2d ed. N ew York: W iley-Interscicncc.
T ransform ations. Jo u rn a l o f th e R o ya l S ta tistic a l 6. Dempster. A. P., and D. B. Rubin (1983), OverView,
Society B (26): 211-43. in Inconiplete D ata in S am ple Surveys: Theo/y and
3. C hernoff, H erm n. G raphical R epresentation as a A nnotated B ibliography. vol. 2. M adow, Olkin. and
D iscipline, in G raphical R epresentation o f M ulti- Rubin, eds. N ew York: Academ ic Press.
v a r a te D a ta , P e te r C . C . W ang, ed . N ew Y ork: 7. F ein b erg , Stcphen (1 9 7 9 ), G rap h ical M othods in
A cadem ic Press, pp. 1-11. S tatistic s. A m erica n S ta tistic ia n 33 (N ovem ber):
4. C ohn, Jacob, and P atricia C ohn (1983), A p p lie d 165-78.
M ltiple Regression/Correlation Analysis f o r the Beha 8. Johnson, R. A., and D. W. W ichem (1982), Applied
78 A N L IS IS M U L T IV A R IA N T E

Multivariale Statistical Analysis. U pper Saddie River, I!. Wcisbcrg, S. (1985), A pplied L inear Regression. New
N.J.: Pventice-Hall. York: Wilcy.
9. Little, Rodcrick J. A., and D onald B. Rubn (987), 12. Wilkinson. L. (1982), A Experim ental Evalualion of
Statisiica! Analysis f/i Mlssing Data. New York: Wilcy. M u ltiv ariate G raphical P o in t R c p re sc n tatio n s. In
10. Wang, PeterC . C ed. (1978), GraphicalRcpiesentation lla m a n Factors in C om puter System s: Praceedirtgs,
o/M ultivarlae Data. N ew York: Academic Press. N ew York: ACM Press, pp. 202-9.

Вам также может понравиться