Академический Документы
Профессиональный Документы
Культура Документы
Lectura seleccionada:
A n lisis M u ltivarian te
Autores:
Rolph E. ANDERSON
Drexel University
Ronald L. TATHAM
Burke Marketing Research
William C, BLACK
Louisiana State University
Traduccin:
Esm e Prentsce
Diego C ano
Universidad Autnoma de Madrid
PRENTICE HALL
M adrid Upper Saddle River Buenos Aires * Londres M xico Nueva Delhi Ro de Janeiro
Santaf' de Bogot Singapur Sydney Tokio * Toronto
^ /~ D a l o s J e c a ta lo g a c i n b ib lio g r fic a
J . F. H a ir . J r R . E . A n d c r s o n , R . L . T a i h a m , \V . C . B la c k
A N L IS IS M U L T JV A R IA N T E . 5 . ' c d .
P R E N T IC E H A L L I B E R IA . M a d rid . 1999
IS B N : 8 4 -8 3 2 2 -0 3 5 -0
M a te ria : E s ta d is tic a -T c o ria , p r o c e d im ie n to s y m to d o s . 311
F o rm a to 195 X 2 6 5 P g in a s : S32
J . F. H a ir, J r ., R . E . A n d c r s o n . R . L . T a ih a m , W . C . B la c k
A N L IS IS M U L T IV A R IA N T E , 5. ed .
D E R E C H O S R E SER V A D O S
O 19 9 9 resp ec to a la p rim e ra ed ici n en e s p a o l por.
P R E N T IC E H A L L IB E R IA . S.R .L .
N ez de B alboa, 120
2 8 0 0 6 M aurid
IS B N : 8 4 -8 3 2 2 -0 3 5 -0
D ep sito L egal: M 3 1 .5 1 3 -1 9 9 9
T r a d u c id o d e :
M U LT IV A R IA TE DA TA A N A LY S1S, F ifth ed itio n
P renlicc Hall In tern atio n al. Inc.
M C M X C V 1 II
ISB N : 0 -1 3 -9 3 0 5 8 7 -4
E d ic i n e n e s p a o l:
E ditor: A ndrs O lero
A sstem e e d ito ria l: A n a Isabel G arca
D ise o tle cu b ierta: D o m in g o R ufo
C o m p o sici n : C O P IB O O K . S . L.
Im p reso por:
IM P R E S O E N E S P A A - P R IN T E D IN SPA1N
O B JE T IV O S DE A P R E N D IZ A JE
Explicar qu es el anlisis m ultivarian te y cu n d o es apropiada su aplicacin.
D efinir y com entar las tcnicas concretas incluidas en el anlisis m ultivariante.
D eterm inar q u tcnica m ultivariante es la indicada para un problem a de investigacin
especifico.
Explicarte naturaleza d las escalas d e m edida y su relacin con las tcnicas multivariantes.
Describir los aspectos conceptuales y estadsticos propios del anlisis m ultivariante.
E l C a p tu lo 1 constituye una re v isi n sim p lific ad a de las tcnicas del anlisis m ultivariante. Se
resalta la influ en cia crecien te de lo s m to d o s del an lisis m ultivariante, n o s lo e n los aspectos
a n a ltic o s de la investigacin, sino ta m b i n e n el^diseo y form a en q u e se reco g en datos para la
ad opcin d e decisiones y la resolucin de problem as. A unque las tcnicas m ultivariantes com parten
b astantes caractersticas con sus anlogas u n i y bivariantes, son evidentes las d iferencias que exis
ten al p a sa r al m b ito del anlisis m u ltiv ariante. P ara ilu strar stas, este captulo p resen ta u n a c la
sificaci n d e las tcnicas m ultiv arian tes. D espus, p ro p o rcio n a unas indicaciones generales para
la ap licaci n d e estas tcnicas ju n to c o n u n a ap ro x im aci n estructurada a su fo rm ulacin, esti
m aci n y a la interpretacin de resu ltad o s m ultivariantes. El captulo co n clu y e co n u n co m en ta
rio so b re la b ase de datos u tilizad a en la m a y o r parte d e l libro para ilustrar las ap licacio n es de las
tcnicas.
A N L IS IS M U L T IV A R lA N T lf
L a te c n o lo g a in fo rm tic a d isp o n ib le b o y e n d ia , ca si in im ag in a b le h a c e s lo d o s d c a d a s , h a h e c h o
p o s ib le a v a n c e s e x tra o rd in a rio s e n el a n lis is d e d a to s p sic o l g ic o s, so c io l g ic o s y d e o tro tip o d e
d a to s re fe rid o s al c o m p o rta m ie n to h u m a n o . E s te im p a c to es m s e v id e n te en la r e la tiv a fa c ilid a d
co n la q u e lo s o rd e n a d o re s p u ed e n a n a liz a r e n o rm e s ca n tid a d e s d e d a to s c o m p le jo s. C a si c u a lq u ie r
p r o b le m a s e p u e d e a n a liz a r f c ilm e n te h o y e n d a p o r u n n m e ro ilim ita d o d e p r o g r a m a s
e s ta d stic o s, in c lu so e n o rd e n a d o re s p e rs o n a le s . A d e m s , lo s e fe c to s d el p ro g re s o te c n o l g ic o h an
e x te n d id o a n m s la c a p a c id a d d e m a n ip u la r d a to s , lib e r a n d o a lo s in v e s tig a d o r e s d e las
re stric c io n e s del p a s a d o y p e rm iti n d o le s as a b o rd a r in v e stig a c io n e s m s s u sta n tiv a s y e n s a y a r sus
m o d e lo s te ric o s. L a s lim ita c io n e s m e to d o l g ic a s n o so n y a u n a s u n to c rtic o p a r a e l te ric o
e m p e a d o e n la b sq u e d a de e v id e n c ia em p rica . G ra n p a rte d e esta c re c ie n te c o m p re n si n y p ericia
e n e l a n lis is d e d a to s h a v e n id o a tra v s d e l e s tu d io d e la e s ta d stic a y d e la in fe re n c ia e s ta d stic a .
I g u a lm e n te im p o rta n te , sin e m b a rg o , h a sid o el d ila ta d o c o n o c im ie n to y a p lic a c i n d e un g ru p o d e
t c n ic a s e s ta d stic a s c o n o c id a s c o m o a n lis is m u lt iv a r ia n te .
L a s t c n ic a s d e l a n lis is m u ltiv a r ia n te e s t n s ie n d o a m p lia m e n te a p lic a d a s a la in d u stria ,
ad m in istra c i n y ce n tro s d e in v e stig a c i n d e m b ito u n iv e rsita rio . P o r o tra p a rte , p o c o s c a m p o s de
in v e stig a c i n o e s tu d io h a n fra c a sa d o e n in te g ra r las t c n ic a s m u ltiv a ria n te s en s u c a ja d e h e r r a
m ie n ta s a n a ltic a . P a ra a te n d e r este c re c ie n te in te r s, se h a n p u b lic a d o n u m e ro s o s lib ro s y a rt
c u lo s so b re lo s a s p e c to s te ric o s y m a te m tic o s d e e s ta s h e rra m ie n ta s, y h a n a p a re c id o te x to s
in tro d u c to rio s e n ca si to d o s lo s c a m p o s. S in e m b a rg o , s e h a n e s c rito p o c o s lib ro s p a ra e) in v e s ti
g a d o r q u e n o es u n e sp e c ia lista e n m a te m tic a s o e s ta d s tic a . Y m e n o s a n q u e tra te n las a p lic a
c io n e s d e la e s ta d stic a m u ltiv a ria n te a s c o m o q u e s u m in istre n u n tra ta m ie n to c o n c e p tu a l d e los
m to d o s e s ta d stic o s. E ste lib ro se ha e s c rito p a ra c u b r ir e s te v aco.
L o s lib ro s o rie n ta d o s a la s a p lic a c io n e s s o n d e u n in te r s c ru c ia l p a ra lo s e s tu d io s o s del
c o m p o rta m ie n to , lo s d ire c tiv o s d e e m p re s a o lo s fu n c io n a rio s d e la a d m in is tra c i n p b lic a , sea
c u a l s e a su e n lo m o , q u e tie n e n q u e d e s a r ro lla r su s c o n o c im ie n to s d e l a n lis is m u ltiv a r ia n te p ara
c o n s e g u ir u n a m e jo r c o m p re n s i n d e lo s c o m p le jo s fe n m e n o s d e s u s m b ito s d e tra b a jo .
C u a lq u ie r in v e s tig a d o r q u e e x a m in a s lo re la c io n e s d e d o s v a r ia b le s y q u e e v ita ei a n lis is
m u ltiv a r ia n te e s t ig n o r a n d o p o d e r o s a s h e r r a m ie n ta s q u e p o d r a n s u m i n is tr a r in f o rm a c i n
p o te n c ia lm e n te til. C o m o a firm a u n in v e s tig a d o r, p a ra lo s p r o p s ito s d e... c u a lq u ie r... d is c ip li
n a a p lic a d a , la m a y o r p a rte d e n u e s tra s h e rra m ie n ta s so n , o d e b e r a n ser, m u ltiv a ria n te s . Lino
lle g a a u n a c o n c lu si n q u e a m e n o s.... q u e e l p r o b le m a se a tra ta d o c o m o u n p r o b le m a m u ltiv a ra n -
te , e s t tra ta d o s u p e rfic ia lm e n te . S e g n lo s e s ta d s tic o s H a rd y c k y P e trin o v ic b :
El anlisis de los m todos m ultivariantes predom inar en el futuro y dar por resultado cam bios
drsticos en el m odo en que los investigadores piensan sobre los problem as y en cm o disean sus
in v e stig a cio n e s. E sos m to d o s h a c e n p o s ib le p la n te a r p re g u n ta s e s p e c ific a s y p re c is a s de
considerable com plejidad en m arcos idneos, lo que p o sib ilita llev ar a cab o in v estig acio n es
tericam ente significativas y evaluar los efectos de las variaciones param ctricas ocurridas de forma
natural en el contexto en que norm alm en te ocu rren . De esta form a, se p ueden p rese rv a r las
correlaciones naturales entre las m ltiples influencias sobre el com portam iento y se pueden estudiar
estadsticam ente los efectos aislados de esas influencias sin provocar el tpico aislam iento de esos
individuos o variables.
G tQ Etirtfi
Algunos coriceptosfo
A u n q u e el a n lis is m u ltiv a ria n te tie n e s u s r a c e s e n la e s ta d s tic a u n iv a ria n te y b iv a ria n te , la e x
te n s i n a l d o m in io m u ltiv a ria n te in tro d u c e c o n c e p to s y c u e stio n e s ad icio n a le s. E sto s c o n c e p to s van
d e s d e la n e c e s id a d d e u n e n te n d im ie n to c o n c e p tu a l d e l e le m e n to b s ic o d e l a n lis is m u ltiv a ria n
te e l v a lo r te ric o a la s c u e s tio n e s e s p e c ific a s a c e rc a d e lo s tip o s d e e s c a la s d e m e d id a u tili
z a d a s y lo s re su lta d o s e s ta d stic o s d e lo s te s t d e sig n ific a c i n y lo s in te rv a lo s d e c o n fia n z a . C ada
c o n c e p to ju e g a u n p a p e l im p o rta n te e n la c o rre c ta a p lic a c i n d e c u a lq u ie r t c n ic a m u ltiv a ria n te
E vaor terico
C o m o y a se h a m e n c io n a d o , el e le m e n to e s e n c ia l d e l a n lisis m u ltiv a ria n te es el v a l o r te r ic o , un.
c o m b in a c i n lin e a l d e v a ria b le s c o n p o n d e ra c io n e s d e te rm in a d a s e m p ric a m e n te . E l in v e stig a d o
e s p e c ific a las v a ria b le s , m ie n tras q u e las p o n d e ra c io n e s so n o b je to e s p e c fic o d e d e te rm in a c i n po
p a r te d e la t c n ic a m u ltiv a ria n te . U n v a lo r te ric o d e n v a ria b le s p o n d e ra d a s (A", a X ) pu ed i
e x p r e s a r s e m a te m tic a m e n te asi:
V a lo r le rc o = w tX + w 7X 2 + w 2X 2 + ... + w l
IN TRO D U C CI N 5
d o n d e X e s la v a ria b le o b s e rv a d a y w n e s la p o n d e ra c i n d e te rm in a d a p o r la t c n ic a m u ltiv a
ria n te .
E l re su lta d o es u n v a lo r n ic o q u e re p re se n ta u n a c o m b in a c i n d e to d o e l c o n ju n to d e v ariab les
q u e m e jo r se a d a p ta n a l o b je to d e l a n lis is m u ltiv a ria n te e sp e c fic o . E n re g re s io n e s m ltip le s, el
v a lo r te ric o s e d e te rm in a de ta l fo rm a q u e g u a rd e la m e jo r c o rre la c i n c o n la v a ria b le q u e se est
p re d ic ie n d o . E n e l a n lis is d isc rim in a n te , e l v a lo r te ric o s e fo rm a d e ta l m a n e ra q u e p ro d u zc a
re s u lta d o s p a ra c a d a o b se rv a c i n q u e d ife re n c ie n d e fo rm a m x im a e n tre g ru p o s d e o b se rv a cio n e s.
Y e n el a n lis is fa c to ria l, lo s v a lo re s te ric o s s e fo rm a n p a ra re p re s e n ta r m e jo r la s e stru c tu ra s
s u b y a c e n te s o la d im e n sio n a lid a d d e las v a ria b le s ta l y c o m o se re p re s e n ta n e n s u s in te rco rre -
la c io n e s.
E n c a d a c a so , el v a lo r te ric o c a p ta e l c a r c te r m u ltiv a ria n te d e l a n lis is. P o r ta n to , e n n u e s
tra s d is c u s io n e s d e c a d a t c n ic a , e l v a lo r te ric o es e l p u n to c e n tra l de! a n lis is p o r v a ria s razo n es.
D e b e m o s en te n d e r n o s lo su im p a cto c o n ju n to p a ra lo g ra r c u m p lir el o b je tiv o d e c a d a t cn ic a, sino
ta m b i n la c o n trib u c i n d e c a d a v a ria b le s e p a ra d a a l e fe c to d e l v a lo r te ric o e n su co n ju n to .
Escalas de m edida
El a n lis is d e lo s d a to s im p lic a la s e p a ra c i n , id e n tific a c i n y m e d id a d e la v a r ia c i n e n un
c o n ju n to d e v a ria b le s , ta n to e n tre e lla s m is m a s c o m o e n tre u n a v a ria b le d e p e n d ie n te y u n a o m s
v a ria b le s in d e p e n d ie n te s. E l t rm in c la v e a q u i e s m e d id a , d a d o q u e e l in v e s tig a d o r n o p u ed e
s e p a r a r o id e n tific a r u n a v a ria c i n a m e n o s q u e p u e d a s e r m e su ra b le . L a m e d id a es im p o rta n te p ara
r e p re s e n ta r c o n p re c isi n el c o n c e p to d e n u e s tro in te r s y es c ru c ia l e n la s e le c c i n d e l m to d o de
a n lis is m u ltiv a ria n te ap ro p ia d o . E n lo s sig u ie n te s p rra fo s v a m o s a d is c u tir e l c o n c e p to d e m ed id a
e n lo q u e s e r e f ie r e a l a n lis is d e d a to s y p a r ti c u la r m e n te a la s d iv e r s a s t c n ic a s m u lti-
v a ria n te s.
E x iste n d o s tip o s b s ic o s de d ato s: n o m tr ic o s (c u a lita tiv o s ) y m tr ic o s (c u a n tita tiv o s). L o s
d ato s n o m trico s so n atributos, ca ra c te rstic a s o p ro p ie d a d e s ca te g ric as q u e id e n tific a n o describen
a u n su je to . D e sc rib e n d ife re n c ia s en tip o o c la s e in d ic a n d o la p re s e n c ia o a u s e n c ia d e u n a ca ra c
te rs tic a o p ro p ie d a d . M u c h a s p ro p ie d a d e s s o n d isc re ta s p o rq u e tie n e n u n a c a ra c te rs tic a p ec u lia r
q u e e x c lu y e to d a s las d e m s c a ra c te rstic a s . P o r e je m p lo , si u n o es h o m b re , n o p u e d e s e r m ujer.
N o h a y c a n tid a d d e g n e ro , s lo la c o n d ic i n d e s e r h o m b re o m u jer. P o r e l c o n tra rio , la s m e
d id a s d e d a to s m tric o s e st n c o n s titu id a s d e ta! fo rm a q u e lo s s u je to s p u e d e n s e r id e n tific a d o s p o r
d ife re n c ia s e n tre g ra d o o c a n tid a d . L as v a ria b le s m e d id a s m tric a m e n te re fle ja n c a n tid a d e s re la
tiv a s o g ra d o . L a s m e d id a s m tric a s so n las m s a p ro p ia d a s p a ra c a s o s q u e in v o lu c ra n c a n tid a d o
m a g n itu d , ta le s c o m o el n iv el de s a tis fa c c i n o la d e m a n d a d e trab a jo .
Producto A P ro d u c to B Producto C
M uy No .satisfecho
satisfecho en absoluto
E l e r r o r d e m e d id a es el g ra d o e n q u e lo s v a lo re s o b se rv a d o s n o so n re p re s e n ta tiv o s d e los
v alo re s v erd ad ero s . E l e rro r de m e d id a tie n e m ltip le s fuentes, q u e v an d e sd e e rro re s e n la entrada
d e d a to s a la im p re c isi n en la m e d ic i n ( p o r e je m p lo , im p o n ie n d o e s c a la s d e p u n tu a c i n d e siete
p u n to s a la a c titu d m e d id a c u a n d o el in v e s tig a d o r sa b e q u e lo s e n c u e s ta d o s s lo p u e d e n resp o n d e r
c o n p re c isi n a u n a p u n tu a c i n d e tre s p u n to s ) p a s a n d o p o r la in c a p a c id a d d e lo s e n c u e s ta d o s a
p ro p o rc io n a r in fo rm a c i n p re c is a ( p o r e je m p lo , la s re sp u e s ta s a la re n ta d e u n a e c o n o m a fam iliar
p u e d e n s e r ra z o n a b le m e n te p re c is a s p e ro ra ra v e z lo so n c o m p le ta m e n te ). P o r ta n to , se d eb e
a s u m ir q u e to d a s la s v a ria b le u s a d a s e n la s t c n ic a s m u ltiv a ria n te s tie n e n a lg n g ra d o d e e rro r d e
m e d id a . E l im p a cto d e l e rro r d e m e d id a es a a d ir m id o a las v a ria b le s m e d id a s u o b se rv a d as.
P o r ta n to , el v a lo r o b se rv a d o o b te n id o re p re se n ta tan to e l nivel v erd a d ero c o m o el m id o . C u a n
d o se c a lc u la n c o rre la c io n e s o m e d ia s , n o rm a lm e n te el e fe c to v e rd a d e ro e s t p a rc ia lm e n te
c a m u fla d o p o r el e rro r d e m e d id a , c a u s a n d o la d e b ilid a d d e las c o rre la c io n e s y la p rd id a d e
p re c isi n d e las m e d ias. E l im p a cto e s p e c fic o del e rro r d e m e d id a e n la s re la c io n e s d e d ep e n d en c ia
se tr a ta c o n m s d e ta lle e n el C a p tu lo 11.
El o b je tiv o del in v e s tig a d o r d e r e d u c ir el e rro r d e m e d id a p u e d e s e g u ir v a rio s c a m in o s. Al
v a lo ra r e l g rad o d e erro r d e m e d id a p re s e n te e n c u a lq u ie r m e d ici n , el a n a lista d eb e e n fren ta rse tan
to c o n la v a lid e z c o m o c o n la f ia b i lid a d d e la m e d id a . L a v a lid e z e s el g ra d o e n q u e la m e d id a
re p re se n ta co n p re c isi n lo q u e s e su p o n e q u e re p re se n ta . P o r e je m p lo , si q u e re m o s m e d ir ia ren
ta d isc re c io n a l, n o p re g u n ta re m o s p o r ia re n ta to ta l d e las e c o n o m a s d o m stic a s. A se g u ra r la
v a lid e z e m p ie z a c o n u n c o n o c im ie n to p r o fu n d o d e lo q u e se v a a m e d ir y s lo e n to n c e s re a liz a r la
m e d id a ta n c o rre c ta y p re c is a c o m o s e a p o sib le . S in em b a rg o , la p re c isi n n o a s e g u ra la v a li
d e z . E n n u e s tro e je m p lo d e la ren ta , e l in v e s tig a d o r p o d ra d e fin ir m u y p re c isa m e n te e l to tal d e la
re n ta fa m ilia r p e ro n o tie n e u n a m e d id a v lid a d e la re n ta d isc re c io n a l p o rq u e n o s e h a p la n tea d o
la p re g u n ta c o rre c ta .
S i la v a lid e z e s t a se g u ra d a , e l in v e s tig a d o r d e b e c o n s id e ra r la fia b ilid a d d e las m e d id as. La
fia b ilid a d es el g ra d o e n q u e la v a ria b le o b se rv a d a m id e e l v a lo r v erd a d ero y e s t lib re d e error;
p o r ta n to es lo o p u esto al e rro r d e m e d id a . S i la m is m a m e d id a se rea liza re p e tid a s v e c e s , p o r ejem
p lo , la s m e d id a s m s fia b le s m o stra r n u n a m a y o r c o n s iste n c ia q u e la s m e d id a s m e n o s fiab les. El
in v e s tig a d o r d e b e r v a lo ra r sie m p re las v a ria b le s q u e e st n sie n d o u sa d a s y si s e p u e d e n e n c o n
tra r m e d id a s a lte rn a tiv a s v lid a s , e le g ir la v a ria b le c o n la m a y o r fiab ilid ad .
E ! in v e s tig a d o r p u e d e ta m b i n o p ta r p o r d e s a rro lla r m e d ic io n e s m u lt iv a r ia n te s , ta m b i n c o
n o c id a s co m o e s c a la s s u m a d a s , d o n d e d iv e rs a s v a ria b le s se u n en en u n a m e d id a c o m p u e s ta p ara
re p rese n tar un co n c ep to (p o r eje m p lo , u n a e sc a la d e p e rso n a lid a d d e e n tra d a m ltip le o p u n tu a cio n e s
su m a d a s d e u n p ro d u cto ). El o b je tiv o es e v ita r u sa r s lo u n a n ic a v aria b le p a ra re p re se n ta r un c o n
c e p to , y e n su lu g a r u tiliz a r v a ria s v a ria b le s c o m o in d ic a d o r e s , re p re se n ta n d o to d o s ello s d iferen tes
fa c e ta s del c o n c e p to p a ra o b te n e r u n a p e r s p e c tiv a m s c o m p le ta . E l uso d e in d ic a d o re s m ltip le s
p e rm ite al in v e stig a d o r lle g a r a u n a e s p e c ific a c i n m s p re c is a d e las re sp u e sta s d e s e a d a s y no d eja
la fia b ilid a d p le n a a u n a n ic a re s p u e s ta s in o e n la re s p u e sta m e d ia o tp ic a d e u n co n ju n to
d e re sp u e sta s re la c io n a d a s . P o r e je m p lo , a l m e d ir la s a tisfa c c i n , u n o p o d ra p re g u n ta r u n a n ic a
c u e s ti n , c u l es s u g ra d o d e s a tis fa c c i n ? , y b a s a r el a n lis is e n u n a n ic a re sp u e sta . O se p o
d ra d e s a rro lla r u n a e s c a la a d itiv a q u e c o m b in a ra v a ria s re sp u e sta s d e sa tisfa c c i n , q u iz e n d ife
re n te s fo rm a to s de re sp u e sta y e n d ife re n te s re a s d e in te r s, q u e c o n te m p le la sa tisfa c c i n total.
L a p re m is a b s ic a es q u e la s re sp u e sta s m ltip le s re fle ja n c o n m a y o r p re c isi n la re s p u e sta v er
d a d e ra q u e la re sp u e sta n ic a . P a ra u n a in tro d u c c i n m s d e ta lla d a d e lo s m o d e lo s d e m e d id as
m ltip le s y c o n s tru c c i n d e e s c a la s, v a s e el C a p tu lo 3 (A n lisis fa c to ria l) y e l C a p itu lo 11 (M o
d e la c i n m e d ia n te e c u a c io n e s e s tru c tu ra le s ) o re c u rso s a d ic io n a le s [10], A d e m s, se h a n p u b lic a
d o e n lo s ltim o s a o s c o m p ila c io n e s d e e s c a la s q u e p ro p o rc io n a n al in v e s tig a d o r u n a esca la
lis ta p a ra s e r e m p le a d a c o n u n a f ia b ilid a d d e m o s tra d a [ l , 5].
E l im p a c to del e rro r d e m e d id a y la e s c a s a fia b ilid a d n o p u e d e n s e r o b s e rv a d a s d ire c ta m e n te ,
d a d o q u e se e n c u e n tra n e n las v a ria b le s o b se rv a d a s. E l in v e stig a d o r d e b e , p o r ta n to , tra b a ja r sie m
p re p a r a a u m e n ta r la v a lid e z y la fia b ilid a d , lo q u e a l fin a l lle v a r a u n re tra to m s a u t n tic o d e
las v a ria b le s d e in te rs. L o s m a lo s re s u lta d o s n o sie m p re se d e b e n al e rro r d e m e d id a , p e ro la p re
se n c ia d e l e rro r de m e d id a es g a ra n ta de d is to rs i n e n las re la c io n e s o b se rv a d a s y h a c e m e n o s p o
d e ro sa s las t c n ic a s m u ltiv a ria n te s . R e d u c ir e l e rro r d e m e d id a , a u n q u e im p liq u e e s fu e rz o , tie m p o
8 A N L IS IS M U L TIV A R IA N TE
R e a lid a d
H: C ierta i! : Falsa
H: A ceplar 1- s
P
E rror T ipo II
D e cisi n
e sta d stic a
Ha: N o aceplar
2 1-P
E rror T ipo I Potencia
la m e d ia s e d e te rm in a n e n t rm in o s d e d e s v ia c io n e s e s t n d a r, a s q u e u n e fe c to ta m a o
d e 0 ,5 in d ic a q u e !a d if e r e n c ia re s p e c to d e la m e d ia es la m ita d d e la d e s v ia c i n e s t n
d ar. P a r a la s c o r r e la c io n e s , e l e f e c to ta m a o s e b a s a e n la c o r r e la c i n e fe c tiv a e n tre las
v a ria b le s.
2. A lfa (a) C o m o y a se h a d isc u tid o , a m e d id a q u e alfa se v u elv e m s restric tiv o , la p o ten cia
d ec rece . E sto s ig n ific a q u e c o m o e l a n a lis ta re d u c e la o p o rtu n id a d d e e n c o n tra r un efecto
in c o rre c to sig n ific a tiv o , la p ro b a b ilid a d d e e n c o n tra r c o rre c ta m e n te u n e fe c to ta m b i n d is
m in u y e. L as d ire c tric e s c o n v e n c io n a le s su g ie re n n iv e le s a lfa d e 0 ,0 5 o 0 ,0 1 . P ero el in
v estig a d o r d eb e c o n s id e ra r el im p a cto d e e sta d ec isi n so b re la p o te n c ia a n te s d e seleccio n ar
el n iv e l alfa. E n d isc u sio n e s p o s te rio re s se ilu stra r n las re la c io n e s e n tre las d o s p ro b a b i
lid ad es.
3. El ta m a o de la m u estra P a ra c u a lq u ie r n iv el d e alfa d a d o , el a u m e n to d e la m u e stra sie m
p re p ro d u c e u n a m a y o r p o te n c ia d e l te st e s ta d stic o . P ero a u m e n ta r ei ta m a o d e la m u e s
tra ta m b i n p u e d e p r o d u c ir d e m a s ia d a p o te n c ia . P o r e s te h e c h o , e n te n d e m o s q u e a!
a u m e n ta r el ta m a o de a m u e stra , se o b s e rv a r q u e e fe c to s c a d a v e z m s y m s p e q u e
o s se r n sig n ific a tiv o s, h a s ta q u e p a r a m u e s tra s m u y g ra n d e s ca si c u a lq u ie r e fe c to e s sig
n ific a tiv o . El in v e s tig a d o r d e b e te n e r s ie m p re p re s e n te q u e el ta m a o d e la m u e stra p u ed e
a fe c ta r a la p ru e b a e s ta d s tic a ta n to p o r h a c e rlo in se n s ib le (p a ra m u e s tra s m u y p e q u e a s)
o d e m a sia d o s e n sib le (p a ra m u e s tra s m u y g ra n d e s).
T A B L A 1 .1 . N i v e l e s d e p o t e n c i a p a r a la c o m p a r a c i n e n t r e d o s m e d i a s : v a r i a c i o n e s p o r el t a m a o d e
la m u e s t r a , e l n iv e l d e s i g n i f i c a c i n y e l e f e c t o t a m a o
20 0 ,0 9 5 0 ,3 3 8 0 ,0 2 5 0 ,1 4 4
40 0 ,1 4 3 0 ,5 9 8 0 ,0 4 5 0 ,3 4 9
60 0 ,1 9 2 0 ,7 7 5 0 ,0 6 7 0 ,5 4 9
80 0 ,2 4 2 0 ,8 8 2 0 .0 9 2 0 ,7 0 9
100 0 ,2 9 0 0 ,9 4 0 0.120 0 .8 2 3
150 0 .4 1 1 0 ,9 9 0 0,201 0 ,9 5 9
200 0 ,5 1 6 0 ,9 9 8 0 ,2 8 4 0 ,9 9 2
Potencia
F IG U R A 1 . 1 . I m p a c t o d e l t a m a o d e la m u e s t r a e n la p o t e n c i a d e a l g u n o s n iv e l e s a lf a (0 ,0 1 ; 0 ,0 5 ; 0 ,1 0 ) c o n e f e c t o
t a m a o d e 0 ,3 5 .
R egresin m ltiple
L a re g re s i n m ltip le es el m to d o d e a n lis is a p ro p ia d o c u a n d o e l p r o b le m a d e l in v e stig a d o r in
clu y e u n a n ic a variab le m trica d e p e n d ie n te q u e se s u p o n e est rela cio n a d a c o n u n a o m s variables
m tric a s in d e p e n d ie n te s. El o b je tiv o d e l a n lis is d e la re g re si n m ltip le es p re d e c ir lo s c a m b io s
e n la v a ria b le d e p e n d ie n te en re s p u e s ta a c a m b io s e n v a ria s d e las v a ria b le s in d e p e n d ie n te s . E ste
o b je tiv o s e c o n s ig u e m u y a m e n u d o a tra v s d e la r e g la e s ta d stic a d e lo s m n im o s cu a d rad o s.
L a re g re si n m ltip le es til s ie m p re q u e e l in v e s tig a d o r es t in te re sa d o e n p r e d e c ir la ca n tid a d
o la m a g n itu d d e la v a ria b le d e p e n d ie n te . P o r e je m p lo , se p u e d e h a c e r la p re d ic c i n d e lo s g asto s
m e n s u a le s d e c e n a r fu e ra d e c a s a (v a ria b le s d e p e n d ie n te s) c o n in fo rm a c i n re fe re n te a la ren ta
fa m ilia r, su ta m a o y la e d a d d e l c a b e z a d e fa m ilia (v a ria b le s in d e p e n d ie n te s). D e la m is m a fo rm a,
el in v e s tig a d o r p u e d e in te n ta r p re d e c ir la s v e n ta s d e u n a c o m p a a a p a rtir d e in fo rm a c i n so b re
su s g a s to s e n p u b lic id a d , el n m e ro d e v e n d e d o re s y el n m e ro d e tie n d a s q u e d istrib u y e n sus
p ro d u c to s.
Anlisis conjunto
E l a n lis is co n ju n to es u n a t c n ic a d e d e p e n d e n c ia e m e rg e n te q u e h a in tro d u c id o u n a n u e v a s o
fistic a c i n en la e v a lu a c i n de o b je to s, sean n u e v o s p ro d u c to s, se rv ic io s o id e as. L a a p lic a c i n m s
d ire c ta est en p ro d u c to s n u e v o s o d e s a rro llo d e s e rv ic io s, p e rm itie n d o la e v a lu a c i n d e p ro d u c
to s c o m p le jo s m ie n tra s q u e m a n tie n e u n c o n te x to d e d e c isi n re a lis ta p a ra el e n c u e s ta d o . E l a n a
lista de m e rc a d o es c a p a z de ev a lu a r la im p o rta n cia d e atrib u to s as c o m o lo s n iv e le s d e cad a atrib u to
m ie n tra s q u e lo s c o n s u m id o re s e v a l a n s lo lo s p e rfile s d e u n o s p o c o s p ro d u c to s , q u e s o n c o m
b in a c io n e s d e n iv e le s de p ro d u c to . P o r e je m p lo , u n c o n c e p to d e un p ro d u c to q u e tie n e tre s a trib u
to s (p re cio , calid ad y color), ca d a u n o de lo s cu a le s a tres n iv e le s (p o r ejem p lo , ro jo , a m a rillo y azul).
En lu g a r d e te n e r q u e e v a lu a r to d a s la s 27 c o m b in a c io n e s p o sib le s (3 X 3 X 3 ), se p u e d e ev a lu a r
un su b c o n ju n to (9 o m s) p o r su a tra c tiv o p a ra lo s c o n s u m id o re s, y e l in v e s tig a d o r sa b e n o s lo
c u l es la im p o rta n c ia d e ca d a a trib u to sin o ta m b i n la im p o rta n c ia d e ca d a n iv e l (e l a tra c tiv o del
ro jo fre n te al a m a rillo y fre n te al az u l). M s a n . c u a n d o se c o m p le ta n las e v a lu a c io n e s d el c o n
su m id o r, p u e d e n u sa rse lo s re s u lta d o s del a n lis is c o n ju n to en s im u la d o re s d el d is e o d el p ro d u c
to . q u e m o stra r n la a c e p ta c i n d e l c lie n te p a ra c u a lq u ie r n m e ro d e fo rm u la c io n e s d e p ro d u c to y
a y u d a r e n el d ise o del p ro d u c to p tim o .
Correlacin cannica
El a n lis is de c o rre la c i n c a n n ic a p u e d e v e rs e c o m o u n a e x te n si n l g ic a d e un a n lis is d e re
g re si n m ltip le . R e c o rd e m o s q u e el a n lis is d e re g re si n m ltip le im p lic a u n a n ic a v a ria b le d e
p e n d ie n te m tric a y v a ria s v a ria b le s m tric a s in d e p e n d ie n te s. C o n el a n lisis c a n n ic o el o b je tiv o
e s c o rre la c io n a r sim u lt n e a m e n te v a ria s v a ria b le s d e p e n d ie n te s m tric a s y v a ria s v a ria b le s m tri
c a s in d e p e n d ie n te s. M ie n tra s q u e la re g re s i n m ltip le im p lica u n a n ic a v a ria b le d e p e n d ie n te , la
co rrela ci n can n ica im p lica m ltip les v aria b les d ep e n d ie n tes. El p rin cip io su b y a ce n te es d esarro llar
u n a c o m b in a c i n lin e al de ca d a c o n ju n to d e v a ria b le s (ta n to in d e p e n d ie n te s c o m o d e p e n d ie n te s )
p ara m a x im iz a r la c o rre la c i n e n tre lo s d o s c o n ju n to s. O d ic h o d e o tra fo rm a , el p ro c e d im ie n to im
p lic a o b te n e r un co n ju n to de p o n d e ra c io n e s p a ra la s v a ria b le s d e p e n d ie n te s e in d e p e n d ie n te s que
p ro p o rc io n e la co rre la c i n n ic a m x im a e n tre el c o n ju n to d e v a ria b le s d e p e n d ie n te s y el c o n ju n
to d e v a ria b le s in d e p en d ie n te s.
I N T R O D U C C I N 13
A nlisis de correspondencias
P a ra fin alizar, el an lisis de c o rre sp o n d e n c ia s e s u n a t c n ic a d e in te rd e p e n d e n c ia re c ie n te m e n te d e
sa rro lla d a q u e fac ilita ta n to la re d u c c i n d im e n sio n a l d e u n a c la s ific a c i n d e o b je to s (p o r ejem p lo ,
p ro d u c to s , p e rso n a s, e tc .,) so b re un c o n ju n to d e a trib u to s y el m a p a p e rc e p tu a l d e o b je to s re la ti
v o s al e s to s a trib u to s. L os in v e stig a d o re s s e e n fre n ta n c o n s ta n te m e n te a la n e c e s id a d d e cu a n ti-
f ic a r d a to s c u a lita tiv o s q u e e n c u e n tra n e n v a ria b le s n o m in a le s. El a n lis is d e co rre sp o n d e n c ia s
d ifie re d e o tra s t c n ic a s de in te rd e p e n d e n c ia d is c u tid a s a n te s e n su c a p a c id a d p a r a a c o m o d a r ta n
to d a to s n o m tric o s c o m o re la c io n e s n o lin e ales.
E n su fo rm a m s b s ic a , el a n lis is d e c o r r e s p o n d e n c ia s e m p le a u n a ta b la d e c o n tin g e n c ia ,
q u e e s la ta b u la c i n c r u z a d a de d o s v a r ia b le s c a te g ric a s . A c o n tin u a c i n tra n s f o r m a lo s d ato s
n o m tr ic o s e n u n n iv e l m tr ic o y r e a liz a u n a re d u c c i n d im e n s io n a l ( s im ila r a l a n lis is fa c to
r ia l) y u n m a p a p e rc e p tu a l ( s im ila r al a n lis is m u ltid im e n s io n a l). A m o d o d e e je m p lo , las p r e
f e re n c ia s p o r u n a m a rc a d e lo s e n c u e s ta d o s p u e d e n s e r ta b u la d a s d e fo rm a c r u z a d a c o n v a ria b le s
d e m o g r fic a s (p o r e je m p lo , g e n e ro , c a te g o ra s d e re n ta , o c u p a c i n ) in d ic a n d o c u n ta g e n te q u e
p r e f ie r e c a d a u n a d e la s m a rc a s e n tra d e n tro d e c a d a c a te g o ra d e la s v a ria b le s d e m o g r fic a s . A
tr a v s d e l a n lis is d e c o rre s p o n d e n c ia s , la a s o c ia c i n o c o r r e s p o n d e n c ia d e m a rc a s y la s c a
r a c te r s tic a s d is tin tiv a s d e a q u e llo s q u e p re f ie r e n c a d a m a rc a s e m u e s tra n e n un m a p a bi o tr i
d im e n s io n a l, ta n to d e m a rc a s c o m o c a r a c te r s tic a s d e lo s e n c u e s ta d o s . L a s m a rc a s p e rc ib id a s
c o m o s im ila re s e s t n lo c a liz a d a s en u n a c e r c a n a p r o x im id a d u n a s d e o tra s. D e la m is m a fo rm a ,
las c a r a c te r s tic a s m s d is tin tiv a s d e lo s e n c u e s ta d o s q u e p re f ie r e n c a d a m a rc a e s t n d e te r m i
n a d a s ta m b i n p o r la p r o x im id a d d e las c a te g o ra s d e la s v a r ia b le s d e m o g r fic a s re s p e c to d e la
p o s ic i n d e la m a rc a . E l a n lis is d e las c o rr e s p o n d e n c ia s p r o p o rc io n a u n a re p re s e n ta c i n m u l-
tiv a r ia n te d e la in te r d e p e n d e n c ia d e d a to s n o m tric o s q u e n o es p o s ib le r e a liz a r c o n o tro s
m to d o s .
14 A N L IS IS M U LTIVA RIAN TE
,.Cul e s la escala
J e mcdiila
J e las variables
prediclor?
I
Mtrica No mtrica
F IG U R A 1 .2 . S e le c c i n d e u n a t c n ic a m u ltiv a ria n te .
I N T R O D U C C I N
Interdependencia
i
Es la estructura
de relaciones entre:
No mtrico
/-
rx r
L ey en d a
i
A nlisis A nlisis de
m ultidim ensional correspondencias
(C aptulo 10) (C aptulo 10)
j
........ -r- _ J
Tcnica
m ultivariante
elegida
A N L IS IS M U L T IV A R IA N T E
T A B L A 1 .2 . L as r e la c io n e s e n tr e m to d o s d e d e p e n d e n c ia m u ltiv a ria n te
C o r r e la c i n c a n n ic a
y, + y, + y, + . . . + y = x, + x 2 + xy+ . . . + x
(m trica, no m trica) (m trica, no m trica)
A n l i s i s m u l t i v a r i a n t e d e l a v a r ia n z a
y | + y: + y , + . . . + y = , v , + a > a; + ... + ^,
(mtrica) (no mtrica)
A n l i s i s d e la v a r i a n z a
y , = A 1 + A ', + X, + . . . + X
(mtrica) (no mtrica)
A n l i s i s d i s c r i m i n a n t e m l t ip le
Y, =., + A", + A + . . . + X
(no mtrica) (m trica)
A n l i s i s d e r e g r e s i n m lt ip le
y , = A '1+ Ar; +Ar, + ... + A-,
(mtrica) (m trica, no mtrica)
A n lis is c o n ju n to
)', = A , + A-, + A'j + . . . + X a
(no mtrica, m trica) (no m trica)
M o d e lo d e e c u a c io n e s e s t r u c t u r a le s
F , = A 'n + A-, , + A j , + . . . * X u
y,=A f: i + A y
* L a s v a r ia b le s fic tic ia s se tra ta n con m s d e ta lle m s ad elan te. En resum en, la c o d ific a c i n d e la v a ria b le ficticia es
una m a n e ra d e tra n sfo rm a r dalos n o m tric o s en d a to s m tric o s, in c lu y e la creaci n d e las d e n o m in a d a s v a ria b le s ficticias,
en la s cu a le s se asig n an unos y ce ro s al su je to , d e p e n d ie n d o d e si cu e n ta o n o con cie rta c aracterstica. P o r e je m p lo , si un
su je to e s m asc u lin o se le asigna un 0 y si el su je to e s fem en in o se le a sig n a un 1. o al con trario .
IN TRODUCCIN 19
T A B L A 1 .3 . D e s c r i p c i n d e i a s v a r i a b l e s d e la b a s e d e d a t o s
P E R C E P C IO N E S D E HATCO
Xt Velocidad de entrega M trica
X, Nivel de precios M trica
X. Flexibilidad de precios M trica
X4 Imagen del fabricante M trica
X, Servicio conjunto M trica
X. Imagen de fuerza de ventas M trica
Xn Calidad de producto M trica
RESULTADO S D E CO M PRA
A, Nivel de fidelidad Mtrica
X n Nivel de satisfaccin M trica
C A R A C T E R IS T IC A S D E L C O M P R A D O R
Xf Tamao de em presa No mtrica
Xu Com pra al detalle No mtrica
X l2 Estructura de adquisicin No mtrica
An Tipo de industria No mtrica
X lt Tipo de situacin de com pra No mtrica
Percepciones de HATCO
C a d a u n a de e s ta s v a ria b le s se m id i c o n u n a e s c a la d e p u n tu a c i n g r fic a , d o n d e s e d ib u j u n a
ln e a e n tre lo s p u n to s fin a le s d e d ie z c e n tm e tro s , q u e se d e n o m in a ro n P o b re y E x c e le n te :
Pobre E xcelente
L o s e n c u e s ta d o s in d ic an s u s in g re s o s h a c ie n d o u n a m a rc a en la ln e a . L a m a rc a s e m id i y se
re g is tr la d is ta n c ia d e sd e c e ro (e n c e n tm e tro s ). E l re su lta d o fue u n a e s c a la q u e ib a d e s d e cero a
d ie z , re d o n d e a d o a u n n ic o d e c im a l. L o s sie te a trib u to s d e H A T C O p u n tu a d o s p o r lo s en c u esta-
d o s so n lo s sig u ien te s:
Resultados de compra
S e o b tu v ie ro n d o s m e d id a s e s p e c fic a s q u e re fle ja ro n lo s re su lta d o s d e las re la c io n e s d e c o m p ra
d e l e n c u e s ta d o c o n H A T C O . E sta s m e d id a s in c lu y en :
Xy T a m a o de la e m p re sa ta m a o d e la e m p re sa re la tiv o re sp e c to a o tra s e m p re s a s en el
m is m o m e rc a d o . E s ta v a ria b le tie n e d o s c a te g o ra s: 1 = g ra n d e y 0 = p e q u e a .
X C o m p ra d e ta lla d a m e d id a p o r la c u a l un c o m p ra d o r p a rtic u la r e v a l a c a d a c o m p ra se
p a ra d a m e n te (a n lisis del v a lo r to ta l) o en fu n c i n d e u n a c o m p ra d e ta lla d a , d o n d e se e s
p e c ific a n p re c isa m e n te las c a ra c te rs tic a s d el p ro d u c to d es e a d o . E sta v a ria b le tie n e d o s
c a te g o ra s: 1 = e m p le a la a p ro x im a c i n a l a n lis is d e l v a lo r to ta l, e v a lu a n d o c a d a c o m
p ra p o r se p a ra d o y 0 = u so d e la c o m p ra d etallad a .
X 2 E stru c tu ra d e la a d q u isic i n m to d o d e a d q u isic i n /c o m p ra d e p r o d u c to s a u n a c o m
p a a en p articu la r. E s ta v a ria b le tie n e d o s c a te g o ra s: 1 = a d q u is ic i n c e n tra liz a d a y
0 = a d q u isic i n d e s c e n tra liz a d a .
X t. T ip o d e in d u stria c la s ific a c i n d e la in d u s tria a la q u e p e rte n e c e e l c o m p ra d o r d el
p ro d u c to . E sta v a ria b le tie n e d o s c a te g o ra s : 1 = in d u s tria d e la c la s e A y 0 = o tra s
in d u strias.
X ]A T ip o de situ a c i n d e c o m p ra tip o d e situ a c i n a la q u e se e n fre n ta e l c o m p ra d o r. E sta
v a ria b le tie n e tre s c a te g o ra s: 1 = n u e v a ta re a . 2 = re -c o m p ra s im ila r m o d if ic a d a y 3 = re
c o m p ra sim p le.
S e c c i n 1: P r e p a r a c i n p a r a e l a n l i s i s m u l t i v a r i a n t e se p ro n u n c ia so b re c u e stio n e s
q u e d e b e n s e r re su e lta s a n te s d e la e je c u c i n del an lisis m u ltiv a ria n te . E sta se c c i n c o m ie n z a
co n el C a p itu lo 2, q u e a b o rd a lo s te m a s d e d e c isio n e s s o b re d a to s a u s e n te s , c u m p lim ie n to d e
su p u e sto s estad stic o s su b y a ce n tes e id en tificaci n d e facto res q u e p o d ra n te n e r u n a in flu en cia
d e s p ro p o rc io n a d a s o b re lo s re su lta d o s. E l C a p itu lo 3 c u b re el a n lis is fa c to ria l, u n a t c n ic a
q u e r e s u l t a e s p e c ia lm e n te a d e c u a d a p a r a e x a m in a r la s r e l a c i o n e s e n t r e v a r i a b l e s y
o p o rtu n id a d e s p ara c re a r e s c a la s su m a d a s. S e co m b in an e sto s d o s c a p tu lo s p a ra p ro p o rc io n a r
al in v e stig a d o r ta n to las h e rra m ie n ta s d e d ia g n o sis n e c e sa ria s p a ra la p re p a ra c i n d e lo s d ato s,
c o m o las m e d id a s p a ra la re d u c c i n d e d a to s y c o n s tru c c i n d e e s c a la s q u e se p u e d a n in c lu ir
e n o tra s t c n ic a s de a n lis is in u ltiv a ria n te .
IN T R O D U C C I N 27
| B e a rd c n , W illia m O ., R ic h a r d G . N c t e m e y c r . a n d M a r y te m M e a su re s. C h i c a g o : A m e r i c a n M a r k e t i n g
F M o b l e y ( 1 9 9 3 ) , H andhook o f M arketing Scales, A s s o c ia t io n .
M itlti- lr e n i M ensures f o r M arketing a nd Consum ar Statisticai P ow er A n a lysis f o r the
6 . C o h n , J. (1 9 7 7 ),
ffehavior. N c w b u r y P a r k , C a lif .: S a g e . B ehavioral Sciences. N e w Y o rk : A c a d c m i c P re s s .
2 B M D P S t a tis tic a i S o f t w a r e , I n c . ( 1 9 9 1 ) , SO LO Power 7 . G a tty , R . ( 1 9 6 6 ) , M u l l i v a r i a t e A n a l y s i s f o r M a r k e t in g
AnuIr-iis. L o s A n g e le s . R e search : An E v a l u a tio n . A pplied Statistics 15
3. B rc n i, E d w a r d E ., E d w a r d J . M ir ie l li . a n d A la n (N o v e m b e r): 1 5 7 -1 7 2 .
T h o m p s o n ( 1 9 9 3 ) , Ex-Sample : An Expert System lo 8 . H avdyck, C. D .. and L. F. P c trin o v ic h (1 9 7 6 ),
Assist in D ctennining Santple Size, Versin 3.0. ntroduction to Statistics fo r the B ehavioral Sciences,
C o tu m b a , M o .: I d e a W o r k s . 2 d e d . P h ila d e lp h ia : S a u n d e r s .
4 . B re n t, E d w a r d E ., e t a l. ( 1 9 9 1 ) ,Statisticai Navigator 9 . M o o n e y , C h r i s t o p h c r Z ., a n d R o b e r t D . D u v a l ( 1 9 9 3 ) ,
pm fcssional : A n E xpert System to A ssist in B o o ts tr a p p in g : A N o n p a r a m e tr ic A p p r o a c h to
Selecting Appropriate Statisticai Analyses. Versin Statisticai lnference. B e v c r l y H i i l s , C a li f .: S a g e .
1.0. C o lu m b ia , M o .: I d e a W o r k s . 10. S u l l i v a n , J o h n L . , a n d S t a n l e y F e l d m a n ( 1 9 7 9 ) ,
5. B r u n n e r , G o r d o n C . , a n d P a u l J . H e n s e l ( 1 9 9 3 ) , M ltiple Indieators: Alt ntroduction. B e v e r l y H ills ,
Marketing Scales Handhook, A Compilado o f Multi- C a lif .: S a g e .
SE CC I N
P r e p a r a c i n p a r a e l a n l is is
M U L T IV A R IA N T E
V a lo r a c i n g e n e ra l
La Seccin 1 proporciona una serie de herram ientas y anlisis que ayudan a preparar
al investigador para la naturaleza crecientem ente compleja del anlisis multivariante.
El investigador p ru de n te aprecia la necesidad de un conocim iento ms pro fu n do de
los datos, tan to en trm inos estadsticos com o de concepto. A unque las tcnicas
m ultivariantes que se abordan en este texto ofrecen al investigador una serie de
herram ientas poderosas de anlisis, tam bin presentan el riesgo de [a) separar ei
investigador an ms de la posibilidad de a d q u irir una com prensin slida de los
datos y |b) conducir a nociones errneas que presentan una manera fcil y rpida
de identificar relaciones. Dado q ue el investigador depende ms de estas tcnicas
para encontrar la respuesta y m enos d e una base conceptual y de com prensin de las
propiedades fundam entales de los datos, aum enta el riesgo de que aparezcan
problem as serios de aplicacin errnea de las tcnicas, de violacin de las propiedades
estadsticas, o de inferencia e interpretacin de los resultados errneos. Nunca se
pueden elim inar com pletam ente estos riesgos. N o obstante, las herram ientas y anlisis
abordados en esta seccin m ejorarn la capacidad del investigador a la hora de
reconocer muchos de estos problem as conform e aparecen y aplicar el remedio
apropiado.
C a p t u lo s d o la S e c c i n I
Esta seccin comienza con el Captulo 2, Anlisis previo de los datos, q ue aborda los
temas de decisin sobre datos ausentes, cum plim iento de los supuestos estadsticos
subyacentes e identificacin de factores que podran tener un im pacto
desproporcionado sobre los resultados. Estos anlisis proporcionan valoraciones
empricas simples que detallan las propiedades estadsticas crticas de los datos. El
C aptulo 3, referido al anlisis factorial, presenta un debate sobre una tcnica de
interdependencia particularm ente adecuada para exam inar las relaciones entre las
variables y la creacin de escalas sumadas. La bsqueda de la estructura con el
A N L IS IS M U L TIV A R IA N TE
O B J E T IV O S DE A P R E N D IZ A JE
Seleccionar el m todo grfico a prop iad o para exam inar las caractersticas de los datos o
relaciones de inters.
C om prender los diferentes tipos de procesos de datos ausentes.
Evaluar el tip o y el im pacto p otencial d e los datos ausentes.
Explicar las ventajas y desventajas de los enfoques disponibles para tratar con los datos
ausentes.
Identificar los casos atpicos univariantes, bivarlantes y multivariantes.
C om probar en los datos la m ayor parte de los supuestos de las tcnicas multivariantes.
D eterm inar el m ejor m todo de transform acin de los datos dado un problem a especfico.
C om prender la m anera de in co rp o ra r variables n o mtricas com o ciatos mtricos.
L a s ta re a s im p lc ita s e n el e x a m e n p r e v io d e lo s d a to s p u e d e n p a r e c e r in s ig n if ic a n te s y sin
c o n s e c u e n c ia s a p rim e ra v ista , p e ro s o n u n a p a rte e s e n c ia l d e l a n lis is m u ltiv a ria n te . S i b ie n las
t c n ic a s m u ltiv a ria n te s s u p o n e n un Ire m e n d o p o d e r a n a ltic o e n m a n o s d el in v e s tig a d o r, ta m b i n
c re a n u n a g ra n ca rg a p a ra s te , y a q u e tie n e q u e a s e g u ra rse d e q u e se m a n te n g a n lo s c im ie n to s
te ric o s y e s ta d s tic o s so b re la s q u e se b a s a n . E x a m in a n d o c o n a n te r io r id a d lo s d a to s d e ht
a p lic a c i n de u n a t c n ic a m u ltiv a ria n te , el in v e s tig a d o r g a n a u n a c o m p re n si n b s ic a d e lo s d ato s
y las re la c io n e s e n tre las v a ria b le s. E n p rim e r lu g a r, el in v e s tig a d o r o b tie n e u n c o n o c im ie n to
b sic o d e lo s d ato s y las re la c io n e s e n tre las v a ria b le s. L as t cn ic as m u ltiv a ria n te s p la n te a n g ra n d e s
d e m a n d a s al a n a lis ta en la c o m p re si n , in te rp re ta c i n y a rtic u la c i n d e re s u lta d o s b a s a d o s en
re la c io n e s c u y a c o m p le jid a d e s t e n c o n tin u o a u m e n to . El c o n o c im ie n to d e las in ie rre la e io n c s de
v a ria b le s p u ed e a y u d a r e n o rm e m e n te e n la e s p e c ific a c i n y re fin a m ie n to d el m o d e lo m u ll uriante.
asi c o m o p ro p o rc io n a r u n a p e rs p e c tiv a ra z o n a b le p a ra la in te rp re ta c i n d e lo s r e s u lta d o s . En
se g u n d o lugar, las t c n ic a s m u ltiv a ria n te s d e m a n d a n m u c h o m s d e lo s d ato s q u e s e v a n a analizar.
L a p o te n c ia e s ta d s tic a d e la s t c n ic a s m u ltiv a r ia n te s re q u ie re g ra n d e s c o n ju n to s d e d a to s y
s u p u e sto s m s c o m p le jo s q u e lo s q u e e n c o n tra m o s en lo s a n lis is u n iv a ria n te s. L a s o fistic a c i n
a n a ltic a n e c e s a ria p a ra a s e g u ra r q u e se c o n s ig u e n lo s re q u e rim ie n to s e s ta d s tic o s al a p lic a r la
t c n ic a m u ltiv a ria n te e le g id a , o b lig a al a n a lis ta a u s a r u n a se rie d e t c n ic a s d e e x a m e n d e lo s d ato s
q u e en m u c h a s o c a sio n e s r iv a liz a en c o m p le jid a d c o n la p ro p ia t c n ic a m u ltiv a ria n te . A d e m s, los
e fe c to s d e lo s d a to s a u s e n te s, lo s c u a le s p o r d e fin ic i n n o se re p re se n ta n d ire c ta m e n te en los
re su lta d o s, p u e d e n s e r su sta n c ia le s p o r el im p a c to q u e tie n e n s o b re la n a tu ra le z a y c a r c te r d e lo s
re su lta d o s. El p ro p sito d e e s te c a p itu lo es p ro p o rc io n a r u n a v isi n g e n e ra l d e la s t c n ic a s d e
ex a m e n d e los d ato s, q u e v an d esd e el sim p le p ro c e so d e in sp ecci n v isu al d e lo s g r fic o s al p ro ceso
e s ta d stic o m u ltiv a ria n te q u e re q u ie re el a n lis is d e d a to s a u s e n te s y a la c o m p ro b a c i n d e los
s u p u e sto s su b y a c e n te s en lo d o s los m to d o s m u ltiv a ria n te s .
T an to lo s a n a lis ta s n o v e le s c o m o lo s e x p e rim e n ta d o s p u e d e n se n tirse te n ta d o s d e le e r p o r
e n c im a o in c lu so s a lta rse e s te c a p tu lo , p a ra ir d ire c ta m e n te a lo s c o n o c im ie n to s re fe r e n te s a la
a p lic a c i n d e u n a t c n ic a o t c n ic a s m u ltiv a ria n te s . A u n q u e p u e d a p a re c e r q u e es m a lg a s ta r el
tie m p o , el esfu e rz o y los re c u rso s d e d ic a d o s al p ro c e s o d e ex a m e n d e los d a to s, el in v e s tig a d o r d eb e
v e r e s ta s t c n ic a s co m o u n a in v e rsi n en un s e g u ro m u ltiv a ria n te . In c lu so a u n q u e u n a t c n ic a
sirv a p a ra h a c e r u n a e s tim a c i n a d e c u a d a y o b te n e r re s u lta d o s , lo s p ro b le m a s o c u lto s q u e
su rg en d e las c u e stio n e s e x p u e sta s en e s te c a p tu lo p u e d e n c o n d u c ir a p ro b le m a s p o te n c iu lm e n te
ca ta str fic o s. S e p u ed e n e v ita r e sto s p ro b le m a s al s e g u ir e sto s a n lis is ca d a v e z q u e se a p liq u e una
t c n ic a m u ltiv a ria n te . E sto s e s fu e rz o s re c o m p e n s a r n el e s fu e rz o a larg o p la z o , e v ita n d o c o m e te r
A N L IS IS P R E V IO D E L O S DATOS 33
X ,: V elocidad de entrega
F IG U R A 2 .1 . U n a r e p r e s e n t a c i n g r f i c a d e u n a d i s t r i b u c i n u n i v a r i a n t e : El h i s t o g r a m a .
F rc cu en d a Tallo y hojas
1.00 0 * 0
1,00 0 6
3,00 1 * 013
7,00 1 6688999
12,00 2 001333444444
10,00 2 5566788899
18.00 3 N, 000001111233444444
10,00 3 5666777889
10,00 4 * (XII122233
10,00 4 556778999
11.00 5 * OOII2223344
5.00 5 55689
2,00 6 * 01
F IG U R A 2 .2 . G r f ic o d e t a l l o y h o j a s d e X , ( v e l o c i d a d d e e n t r e g a ) .
36 A N L I S IS M U L T IV A R IA N T E
- 0 .3 4 9 0 .5 0 9 0 .0 5 0 0 .6 1 2 0 .0 7 7 - 0 .4 8 3 0 ,6 7 6
- 0 .4 8 7 0 .2 7 2 0 .5 1 3 0 ,1 8 6 0 .4 7 0 0 ,0 8 2
Gk
A' - 0 .1 1 6 0 .0 6 7 - 0 ,0 3 4 - 0 .4 4 8 0 ,5 5 9
nll
0 .2 9 9 0 .7 8 8 0.200 0 ,2 2 4
0,241 - 0 .0 5 5 0,701
0 .1 7 7 0 ,2 5 6
x7 - 0 ,1 9 2
.* #>
JL
th
X; A, X, X* x7 X*
V e lo c id a d N iv e l F le x ib ilid a d Im a g e n S e rv ic io tin a g e n d e la C a lid a d d e l N iv e l d e
d e en tres: d e p re c io s d e p re c io s d e l f a b ric a n te c o n ju n to f u e rz a d e v e n ta s p ro d u c to fid e lid a d
F IG U R A 2 .3 . M a tr iz d e l g r f i c o d e d i s p e r s i n d e v a r i a b l e s m t r i c a s .
N ota: L os v a lo re s p o r e n c im a d e ia d ia g o n a l s o n c o r re la c io n e s b i v a ria n te s, c o n g r fic o s d e d is p e r s i n c o r r e s p o n d ie n te s p o r d e b a jo d e
la d ia g o n a l. La d ia g o n a l p r e s e n ta la d is trib u c i n d e c a d a v a ria b le .
to s so n lo s d o s m a y o re s v a lo re s p a ra A j. E! d ia g ra m a d e h o ja s y ta llo s p r o p o rc io n a un p erfil g e
n e ra l d e la d istrib u c i n d e la m is m a fo rm a q u e se e n c u e n tra en e l h isto g ra m a , a d e m s d e lo s v a
lo re s d e lo s d a to s reales.
,
U
l 4
3
.*2
j* 2
*
>T
o
-2
i 2 3
X] 4* T ipo de situacin de com pra
F IG U R A 2 .4 . G r fic o d e c a ja s y b ig o te s .
Perfiles m ultivariantes
H a sta a h o ra , lo s m to d o s g rfico s s e h a n c e id o a re p re se n ta c io n e s u n iv a ria n te s o b iv a rian te s. P ero
e n m u c h a s in sta n c ia s, e l in v e stig a d o r p u e d e d e s e a r c o m p a ra r o b s e rv a c io n e s c a ra c te riz a d a s p o r la
p re s e n c ia d e m s de d o s v a ria b le s , n e c e s ita n d o u n m e d io d e p r e s e n ta r u n p e rfil m u ltiv a ria n te de
u n a o b se rv a c i n , ta n to si es p a ra p ro p sito s d e s c rip tiv o s c o m o si e s u n c o m p le m e n to p a ra p ro c e
d im ien to s analticos. P a ra sa lv ar estas d ific u lta d e s se h an elab o rad o v ario s m to d o s d e g rfico s m u l
tiv a ria n te s q u e se c e n tra n e n u n a d e e s ta s tr e s a p ro x im a c io n e s [7 ], L o s p rim e ro s s o n (a ) lo s g ly p h s
o m e tro g ly p h s, q u e so n un tip o d e c rc u lo c o n ra d io s q u e c o rre s p o n d e n a los v a lo re s d e lo s d ato s
o (b ) u n p e rfil m u ltiv a ria n te , q u e re p re s e n ta u n d ia g ra m a d e b a rra s p a ra c a d a o b s e rv a c i n . U n a se
g u n d a fo rm a d e re p re se n ta c i n m u ltiv a ria n te im p lic a u n a tra n s fo rm a c i n m a te m tic a d e lo s d ato s
o rig in a le s e n u n a re la c i n m a te m tic a , q u e p u e d a se r re p re s e n ta d a g r fic a m e n te . L a t c n ic a m s
c o m n es la tra n sfo rm a c i n d e A n d re w F o u rie r. L a ltim a a p ro x im a c i n es e l u so d e re p re se n ta
c io n e s g r fic a s c o n re p re se n ta tiv id a d ic n ic a , s ie n d o la m s p o p u la r la c a ra [3 ]. E l v a lo r d e este
tip o d e re p re se n ta c i n es la in h e re n te c a p a c id a d q u e tie n en lo s se re s h u m a n o s p a ra p ro c e s a r su
in te rp re ta c i n . C o m o s e a la C h e m o f f [3. p a g . 9]:
C r e o q u e a p r e n d e m o s m u y p r o n to a e s t u d i a r y r e a c c i o n a r a lo s r o s tr o s . N u e s t r o c a t l o g o d e r e s p u e s ta s
a l o s r o s t r o s a g o ta u n a g r a n p a r t e d e n u e s t r o d i c c i o n a r i o d e e m o c i o n e s e id e a s . P e r c i b i m o s l a s c a r a s
c o m o u n e s p r it u y n u e s t r o o r d e n a d o r e s m u y r p i d o e n o b t e n e r la i n f o r m a c i n r e le v a n t e y f iltr a r
e l r u id o c u a n d o n o s e n f r e n t a m o s a u n n m e r o lim i ta d o d e c a r a s .
L a s re p re se n ta c io n e s fa c ia le s p ro p o rc io n a n u n p o te n te fo rm a to g r fic o p e ro ta m b i n d a n lu g a r
a u n n m e ro de c o n s id e ra c io n e s e n tre las q u e se e n c u e n tra n la a s ig n a c i n d e v a ria b le s a ca ra c te
re s fa c ia le s, p e rc e p c io n e s in v o lu n ta ria s y la c a n tid a d d e in fo rm a c i n q u e re a lm e n te p u e d e se r tra
ta d a . L a d isc u si n d e e sto s a su n to s est m s a ll d el o b je tiv o d e es te te x to y a c o n se ja m o s a los
le c to r e s in te re sa d o s q u e lo s T epasen a n te s d e u tiliz a r e s to s m to d o s [10- 1
L a F ig u ra 2 .5 c o n tie n e u n a ilu s tra c i n d e e s to s tre s tip o s d e r e p r e s e n ta c io n e s g r f ic a s m u l
t i v a r i a n t e s q u e fu e ro n re a liz a d a s c o n SY S T A T , p e ro q u e se p u e d e n o b te n e r c o n m u c h o s p ro g ra
m a s estad stic o s d e o rd e n a d o r perso n al. L a p a rte su p e rio r d e la F ig u ra 2.5 c o n tie n e e je m p lo s d e cad a
u n a d e las re p re se n ta c io n e s g r fic a s m u ltiv a ria n te s : p e rfile s, tra n sfo rm a c io n e s d e F o u rie r y caras
c n ic as. L o s v a lo re s d e c u a tro o b s e rv a c io n e s s o b re sie te v a ria b le s e s t n en u n a ta b la a! fin al d e
la fig u ra . E n este e je m p lo , lo s d a to s so n p e rfile s d e lo s c u a tro g ru p o s d e c lie n te s re sp e c to d e los
sie te fa c to re s d e re su lta d o s d e la b a se d e d a to s d e H A T C O . A p a rtir d e lo s v a lo re s d e lo s d ato s
38 A N L IS IS M U L TIV A R IA N TE
P e rfile s n w lU v a ria n te s
G rupo I G rupo 2 G rupo 3 G rupo 4
T ra n s fo rm a c io n e s d e A n d rc w F o u r ie r
G rupo 1 G rupo 2 G rupo 3 G rupo 4
Componentes Fourier
3
O o
Si. u-
E
a o
U u 6
C a r a s d e C h e rn o f f
G rupo 1 G rupo 2 G rupo 3
D a to s re a le s
Resum en
N o h a y q u e e n te n d e r las r e p r e s e n ta c io n e s g r fic a s d e e s ta s e c c i n c o m o un s u s titu to d e las
m e d id a s de d ia g n stic o e s ta d s tic o d is c u tid a s en las ltim a s se c c io n e s d e e s te c a p tu lo y en otros
c a p tu lo s, P ero p ro p o rc io n a n u n a fo rm a a lte rn a tiv a d e d e s a rro lla r u n a p e rs p e c tiv a d e l c a r c te r d e
los d a to s y de las in te rre la c io n e s q u e e x is te n , in c lu so si so n m u ltiv a ria n te s en s u n atu ra lez a. El
a n tig u o re fr n u n a im a g en v a le m s q u e m il p a la b ra s es v e rd a d m u c h a s v e c e s en el u so d e las
re p re se n ta c io n e s g r fic a s p a ra las a p lic a c io n e s c o m p a ra tiv a s o d e d ia g n stic o .
l 1.3 9 .9 6 .7 3 .0 2.6 0 0
2 4.1 5 .7 2 .9 2 40
3 9 .9 3 .0 3 60
4 0 .9 8.6 2.1 1,8 1 20
5 0 .4 8 .3 1.2 .7 ) 20
6 1.5 6 .7 4 .8 2 ,5 1 20
7 0.2 8,8 4 .5 3 .0 2 .4 0 0
8 2.1 8.0 3 ,0 3 .8 1,4 0 0
9 1.8 7 .6 3 .2 2 .5 1 20
10 4 .5 8.0 3 .3 2.2 1 20
II 2 .5 9 .2 3 .3 3 .9 j 20
(2 4 .5 6 ,4 5 .3 3 .0 2 .5 0 9
13 2 .7 4 80
14 2,8 6.1 6 ,4 3 ,8 I 20
15 3 .7 3 .0 3 60
16 1.6 6 .4 5 .0 2.1 1 20
17 0 .5 9 .2 3 ,3 2.8 1 20
18 2.8 5 ,2 5 .0 2 ,7 1 20
19 2.2 6 .7 2,6 2 .9 1 20
20 1.8 9 .0 5 ,0 2,2 3 .0 0 0
DATOS AUSHNTf.S POR VARIABLE TOTAL VALORES Al'SPNTRS
Nmero 2 2 11 6 2 Nmero: 2 3
Porcentaje 10 10 55 30 10 Porcentaje; 2 3
A N L IS IS P R E V IO D E L O S DATOS 41
M todos de im putacin
U n a te rc e ra c a te g o ra p ara tr a ta r c o n d a to s a u s e n te s es a tra v s d e u n o d e lo s m u c h o s m to d o s d e
im p u ta c i n . La im p u ta c i n es e l p ro c e s o d e e s tim a c i n d e v a lo re s a u s e n te s b a s a d o e n v a lo re s v
lid o s de o tra s v a ria b le s y /o c a s o s d e la m u e stra . F.l o b je tiv o es e m p le a r re la c io n e s c o n o c id a s q u e
p u e d a n id e n tific a rse en lo s v a lo re s v lid o s d e la m u e stra p a ra a y u d a r en la e s tim a c i n d e v alo re s
a u s e n te s. S in e m b a rg o , el in v e s tig a d o r d e b e ra c o n s id e ra r c u id a d o s a m e n te el u so d e la im p u ta c i n
en c a d a in sta n c ia , d a d o s sus p o te n c ia le s im p a c to s s o b re el a n lis is []:
A N L IS IS P R E V IO D E LOS DATOS 45
La idea de imputacin es lan seductora com o peligrosa. Es seductora porque puede llevar al usuario
a erecr que los datos estn com pletos despus de todo, y es peligrosa porque une situaciones donde
el problem a es suficientem ente m enor con situaciones donde los estim adores estndar aplicados a los
datos reales e imputados tienen sesgos sustanciales.
R g n g o d e r n = r ^ r ^ J { \ - r ; ;) ( l - r'~y )
v ic ia c io n e s d e 0 .6 y 0 .4 r e s p e c tiv a m e n te c o n 2 e n to n c e s el ra n g o d e c o r r e la c io n e s p o s ib le s
e n tre X t T e s 0 .2 4 ( ) . " . o d e - 0 .4 0 a 0 .9 7 . C u a lq u ie r v a lo r fu e ra d e e s te ra n g o es m a te
m tic a m e n te in c o n s is te n te , a u n q u e p o d ra o c u r r ir si se o b tie n e la c o r r e la c i n c o n u n n m e ro y
c o n ju n to d e c a s o s d if e r e n te s p a ra las d o s c o r r e la c io n e s e n el e n f o q u e d e d is p o n ib ilid a d c o m
p le ta .
U n p ro b le m a a s o c ia d o es q u e lo s a u to v a io r e s d e la m a triz d e c o r r e la c i n p u e d e n lle g a r a ser
n e g a tiv o s , a lte r a n d o a s las p r o p ie d a d e s d e v a ria n z a d e la m a tr iz d e c o r r e la c i n . A u n q u e la
m o lr ia d e c o r r e la c i n p u e d e a ju s fa r s e p a r a e lim in a r e s te p r o b le m a ( p o r e je m p lo , ia o p c i n
A L L Y A L U E e n B M D P ), m u c h o s p r o g ra m a s n o in c lu y e n e s te p r o g ra m a d e a ju s te . E n c a s o s e x
tre m o s . la m a tr iz e s tim a d a d e v a r ia n z a s /c o v a r ia n z a s n o es p o s itiv a d e fin id a . T o d o s e s to s p r o
b le m a s d e b e n s e r c o n s id e ra d o s al s e le c c io n a r e s ta a p ro x im a c i n , fre n te a e x c lu ir c a s o s c o n d ato s
a u s e n te s .
L a s e g u n d a fo rm a d e im p u ta c i n c o n s is te e n e l m to d o e fe c tiv o d e s u s titu c i n d e lo s d a to s
au s e n te s p o r v a lo re s e s tim a d o s s o b re la b a s e d e o tra in fo rm a c i n e x iste n te e n la m u e stra . E sta
m e d id a p u e d e lle v a rse a c a b o d e m u c h a s m a n e r a s , q u e v a n d e s d e u n a s u s titu c i n d ire c ta d e
valo re s, a p ro c e so s de e stim a c i n b a s a d o s e n re la c io n e s en tre v aria b les. L a e x p o s ic i n sig u ie n te se
c e n tra r en lo s m to d o s m s a m p lia m e n te u tiliz a d o s , a u n q u e e x is te n o tra s m u c h a s fo rm a s de
im p u ta c i n [9].
S u s titu c i n p o r la m e d ia U n o de lo s m to d o s m s e m p le a d o s c o n s is te e n s u s titu ir lo s v a lo
re s a u s e n te s p o r u n a v a ria b le c u y o v a lo r m e d io se c a lc u la s o b re to d a s la s re sp u e sta s v lid a s . De
e s ta fo rm a , las re s p u e sta s d e la m u e s tra v lid a se u sa n p a ra c a lc u la r el v a lo r d e su stitu c i n . L a l
g ic a de e s ta ap ro x im a c i n es q u e la m e d ia es el m e jo r v a lo r d e su stitu c i n . E sta a p ro x im a c i n , a u n
q u e es e x te n sa m e n te u tiliz a d a , tie n e tre s d e s v e n ta ja s . E n p rim e r lugar, in v a lid a la s e s tim a c io n e s de
la v a ria n z a d e riv a d a s de las f rm u la s e s t n d a r d e la v a ria n z a p a ra c o n o c e r la v e rd a d e ra v aria n za
d e lo s d alo s. E n s e g u n d o lugar, la d istrib u c i n real d e lo s v a lo re s se e n c u e n tra d is to rs io n a d a p o r
la s u stitu c i n d e lo s d a to s a u s e n te s p o r la m e d ia . E n te rc e r lu g a r, e s te m to d o m o d ific a la c o rre la
ci n o b se rv a d a p o rq u e to d o s lo s d ato s a u s e n te s te n d r n un v a lo r n ic o c o n s ta n te . S in e m b a rg o , tie
ne la v e n ta ja d e q u e se p u ed e lle v a r a c a b o f c ilm e n te y d e p ro p o rc io n a r u n a in fo rm a c i n co m p leta
p a ra to d o s lo s caso s.
Im p u ta c i n p o r r e g r e s i n E n e s te m to d o (ta l y c o m o se in d ic a e n e l C a p tu lo 4 ) se u s a
e l a n lis is d e r e g re s i n p a ra p r e d e c ir lo s v a lo re s a u s e n te s d e u n a v a ria b le b a s n d o s e en su re la
c i n c o n o tra s v a ria b le s d e l c o n ju n to d e d a to s. AI m is m o tie m p o q u e tie n e el a tra c tiv o d e u s a r
las r e la c io n e s ya e x is te n te s en la m u e s tra c o m o b aso d e p re d ic c i n , ta m b i n te n e m o s v a ria s d e s
v e n ta ja s a s o c ia d a s c o n e s te m to d o . E n p r im e r lu g a r, r e f u e r z a las re la c io n e s y a e x is te n te s en los
d a to s . C o n fo rm e a u m e n te el u so d e e s te m to d o , lo s d a to s re s u lta n te s s o n m s c a r a c te r s tic o s d e
la m u e s tr a y m e n o s g e n e ra liz a b le . E n s e g u n d o lu g a r, a m e n o s q u e s e a a d a n v a lo re s e s to c sti-
co s a lo s v a lo re s e s tim a d o s, se s u b e s tim a la v a ria n z a d e la d is trib u c i n . E n te r c e r lu g ar, e ste m
to d o s u p o n e q u e la v a r ia b le c o n d a to s a u s e n te s tie n e c o r r e la c io n e s s u s ta n c ia le s c o n o tra s
v a r ia b le s . S i e s ta s c o r r e la c io n e s n o s o n s u f ic ie n te s p a r a p ro d u c ir u n a e s tim a c i n s ig n ific a tiv a ,
e n to n c e s s o n p re fe rib le s o tr o s m to d o s , c o m o la su s titu c i n p o r la m e d ia . F in A lm cn te, el p ro c e
d im ie n to d e re g re si n nu e st re s trin g id o en las e s tim a c io n e s q u e h a c e . P o r ta n to , lo s v a lo re s pre-
d ie h o s p u e d e q u e n o c o rre s p o n d a n a lo s ra n g o s v lid o s d e la s v a ria b le s ( p o r e je m p lo , p re d e c ir
un v a lo r d e 11 p a ra u n a e s c a la d e 10 p u n to s ), r e q u irie n d o p o r ta n to a lg u n a f o rm a d e a ju s te a d i
c io n a l. In c lu s o c o n to d o s e s to s p ro b le m a s p o te n c ia le s , el m to d o d e re g r e s i n d e im p u ta c i n es
p r o m e te d o r en a q u e llo s c a s o s d o n d e se p r e s e n te n n iv e le s m o d e ra d o s d e d is p e rs i n d e lo s d ato s
a u s e n te s y d o n d e la s r e la c io n e s e n tre la s v a r ia b le s e s t n lo s u f ic ie n te m e n te e s ta b le c id a s co m o
p a r a q u e el in v e s tig a d o r c o n fie e n q u e el u so d el m to d o no te n d r im p a c to so b re la g e n e ra lid a d
d e lo s re su lta d o s.
Vemos por tanto los datos ausentes com o un hecho prctico que debe ser investigado, en lugar de como
un desastre a ser mitigado. A dem s, implcita en esta filosofa est la idea de que com o otros aspectos
de la m uestra de datos, los datos ausentes son una propiedad de la poblacin a la que se busca
generalizar.
48 A N L IS IS M U L TIV A R IA N TE
U n f a c to r q u e p o d r a a liv ia r a lg u n o s d e lo s a lto s n iv e le s d e d a to s a u s e n te s p a r a c ie r ta s v a r ia
b le s e s la e lim in a c i n de lo s c a s o s d e l a n lis is . P a ra d e te r m in a r si lo s d a to s a u s e n te s s e co n -
A N L IS IS P R E V IO D E L O S DATOS 49
c e n tr a n e n u n c o n ju n to s e le c c io n a d o d e c a s o s , la T a b la 2.3 p r o p o rc io n a u n a r e p r e s e n ta c i n g r
f ic a d e la s p a u ta s d e d a to s a u s e n te s . E x c e p to lo s s e is c a s o s y a e lim in a d o s d e b id o a lo s n iv e le s
e x tre m a d a m e n te a lto s d e d a to s a u s e n te s , v e m o s q u e n in g n o tro c a s o tie n e u n n m e ro d e s p ro
p o r c io n a d o d e d a to s a u s e n te s . D e h e c h o , s lo d o s c a s o s tie n e n m s d e d o s d a to s a u s e n te s . P o r
ta n to , d e lo s 38 c a s o s c o n d a to s a u s e n te s , s o la m e n te c u a tro c a s o s tie n e n m s d e d o s v a lo re s a u
s e n te s .
Clase de caso
202 2 S s
203 2 S s
204 3 S s s
205 1 s
207 3 s s s
213 2 s s
216 2 s s
218 2 s s
219 2 s s
220 1 s
221 3 s s s
222 2 s s
224 3 s s s
225 2 s s
227 2 s s
228 2 s s
229 1 s
231 1 s
232 2 s s
235 2 s s
237 1 s
238 1 s
240 1 s
A N A L I S IS M U L TIV A R IA N TE
Clase de cusa
241 2 s s
244 I s
246 1 s
248 2 S S
249 1 s
250 2 S s
253 1 s
255 2 s s
256 1 s
257 2 s s
259 1 s
260 I s
267 2 s s
268 I s
269 2 s s
L ey en d a: S = un v a lo r ausente.
L a T ab la 2 .4 re p re se n ta la s p a u ta s d e lo s d a to s a u se n te s. L a p a u ta m s fre c u e n te e s la q u e se
e n c u e n tra en lo s d ato s a u s e n te s d e X (s e is c a s o s ), y la s ig u ie n te p a u ta m s c o m n e s t e n lo s da-
26
1 X
4 X X
6 X
1 X X
1 X
2 X X
o X X
X
X X
2 X X
3 X
2 X X
1 X X
1 X
1 X X
1 X
1 X X
1 X X X
X
X X
X X X
X X X
TABLA 2 .5 . E v a l u a c i n d e la a l e a t o r i e d a d d e l o s d a t o s a u s e n t e s a t r a v s d e c o m p a r a c i o n e s d e g r u p o s d e
o b s e r v a c i o n e s c o n d a to s a u s e n te s fren te a d a to s v lid o s
Grupos fo rm ados p o r
daros ausentes sobre: Aj *4 x. a; x, x. x,
X, X, x, x, x -v x>
Velocidad Nivel Flexibilidad Imagen Servicio imagen Calidad Nivel Nivel
de de de del conjunto de Jerza de de de
entrega precios precios productor d e ventas producto fidelidad satisfaccin
1,000
45
X, 0,003 1,000
38 54
x, 0.235 - 0,020 1.000
38 42 50
Xt 0.026 - 0,111 0,176 1,000
42 50 48 60
V 0,066 -0,125 0.128 -0,075 i .000
42 49 47 55 59
x -0.082 -0.054 -0,067 -0.033 -0 ,0 3 7 1,000
44 53 49 59 58 63
A'. -0.026 0,067 0.020 -0,067 -0 .0 7 5 -0.033 1,000
42 51 47 56 55 59 60
K 0,026 0,244 -0,137 -0.067 -0 .0 7 5 -0,033 0,200 \ ,000
42 52 46 56 55 59 57 60
X ia 0.115 - 0.111 0.176 -0,067 -0,075 0,488* -0,067 -0 .0 6 7 1,000
43 50 48 56 55 60 56 56 60
L a p ru e b a final es un te st co n ju n to d e lo s d a to s a u s e n te s p ara c o m p ro b a r q u e la a u s e n c ia d e d a
to s e s c o m p le ta m e n te a le a to ria (M C A R ). E l te st h a c e u n a c o m p a ra c i n d e lo s d a to s a u s e n te s co n
lo q u e se e s p e ra ra si lo s d a to s a u s e n te s s e d is trib u y e s e n d e u n a fo rm a c o m p le ta m e n te alea to ria.
E n e s te ca so , c o m o se m u e stra e n la T a b la 2 .6 , el n iv e l d e sig n ific a c i n d e lo s te st M C A R es d e
0 .1 9 0 , in d ic a n d o q u e lo s p ro c e so s d e a u s e n c ia d e d a to s p u e d e n s e r c o n s id e ra d o s c o m o M C A R .
C o m o resu ltad o , el in v e stig a d o r p u e d e e m p le a r c u a lq u ie ra d e las so lu c io n e s p a ra la au sen c ia d e d a
tos. p o rq u e n o e x iste n se sg o s p o te n c ia le s e n las p a u ta s q u e sig u e n lo s d a to s a u s e n te s.
T A B L A 2 . 7 . C o m p a r a c i n d e l a s c o r r e l a c i o n e s o b t e n i d a s c o n l a s a p r o x i m a c i o n e s d e d i s p o n i b i l i d a d c o m p l e t a (en
t r m i n o s d e p a r e j a ) , d e c a s o c o m p l e t o ( e n t r m i n o s d e lista) y s u s t i t u c i n d e la m e d i a
X, A'. A', x f Aj X. A, x.
Velocidad Nivel Flexibilidad Imanen Servicio Imagi n Calidad Nivel Nivel
de de de de! con/unto d e fuerza de de de
entrena precios precios productor de venta< producto fid elid a d satisfcuin
X. 1.000
] .000
1.000
X, -0.470 1.000
-0.502 1.000
-0.349 1.000
x. 0.416 -0.357 1,000
0.429 -0,294 1,000
0.329 -0,289 1.000
Xt -0.099 0,299 -0.065 1.000
-0.245 0.320 -0.061 1,000
-0.086 0.245 -0.057 1,000
0.366 0.440 0.047 0.432 1.000
0.566 0,421 0.157 0.046 1.000
0.232 0.3X2 0,042 0,422 1.000
. 0.031 0.260 0,035 0.810 0.344 1.000
-0.094 0,356 -0.066 0.804 0.213 1,000
0.027 0,219 -0.032 0,769 0.323 1,000
X. -0.138 0.348 -0.358 0.398 0,066 0,402 1,000
-0.416 0,354 0,230 0.382 0.150 0.529 1.000
-0.106 0,310 -0,297 0.374 0.061 0.395 1.000
x. 0.376 0,149 0,601 0.223 0,712 0.268 - 0.202 1.000
0.599 0.048 0,648 0.191 0,683 0.301 - 0,099 1.000
0.265 0,134 0,503 0.216 0,656 0.260 0,195 1,000
0.514 -0,184 0,702 0.378 0.533 0,233 -0 ,2 5 6 0.669 1.000
0.549 -0.278 (J.725 0.170 0.304 0.064 -0,405 0.566 1,000
0.381 -0.173 0,626 0.344 0,477 0,229 -0 .2 5 0 0.647 1,000
Interpretacin: El v alo r su p erio r es la correlacin obtenida con una apro x im aci n en leo n in o s de pareja o d isp o n ib ilid ad co m p leta, el segundo
v a lo re s la correlacin obten id a con una aproxim acin en trm inos de lisia o inform acin com pleta, y el lerecr v a lo re s la correlacin obtenida
con la sustitucin de m edia. Los tam aos m ustrales para la aproxim acin d e la disponibilidad de inform acin com pleta variaban: los tam aos
m ustrales reales estn listados en la T abla 2.5. Se u tiliz un tam a o m ucsiral de 2 6 para las co rre la cio n es de info rm aci n co m p leta; no
haba d ato s au sen tes d esp u s d e la sustitucin de la m edia, por lo q u e el tam a o m u estral para esta ap ro x im aci n fue 64.
A N L IS IS P R E V IO DE LOS DATOS 55
TABLA 2 . 8 . R e s u l t a d o s d e lo s m t o d o s d e r e g r e s i n e i m p u t a c i n EM
Media iistimada
A X X, A, A', x* X, , x
Mtodos Velocidad Nivel Flexibilidad Imagen Servicio Imagen Calidad Nivel Nivel
de de de de del conjunto de fuerza de de de
imputacin entrega precios precios productor de venias producto fidelidad satisfaccin
x im a c i n d e in fo rm a c i n c o m p le ta . En s e g u n d o lu g a r, p u e d e n o b se rv a rse d ife re n c ia s n o ta b le s en
las c o rre la c io n e s e n tre X t y X UI c o n X t , X y X h y X r E sta s d ife re n c ia s p u e d e n in d ic a r el im p a c to del
p ro c e so d e d a to s a u s e n te s, q u e no se h a d e te c ta d o en las m e d id a s d e d ia g n o sis p re v ia s. A u n q u e el
in v e s tig a d o r n o te n g a u n a p ru e b a de m a y o r v a lid e z p a ra c a d a a p ro x im a c i n , e s to s re s u lta d o s d e
m u e stra n las m a rc a d a s d ife re n c ia s q u e se o b tie n e n a v e c e s e n tre d o s a p ro x im a c io n e s . C u a lq u ie ra
q u e se a la a p ro x im a c i n q u e se elija , e! in v e s tig a d o r d e b e ra e x a m in a r las c o rre la c io n e s o b te n id as
p o r m to d o s a lte rn a tiv o s p a ra e n te n d e r el ra n g o d e v a lo re s p o sib les.
S e p u e d e e le g ir ta m b i n el m to d o d e im p u ta c i n p a ra e s tim a r lo s v a lo re s q u e v a n a re e m p la
z a r a lo s d a to s a u se n te s. L a T ab la 2.8 c o n tie n e a lg u n o s re s u lta d o s o b te n id o s al e m p le a r la a p ro x i
m a c i n d e re g re si n de su stitu c i n d e la m e d ia y E M p a ra la im p u ta c i n d e v a lo re s a u s e n te s. E stos
re su lta d o s in c lu y en la s d e s v ia c io n e s d e m e d ia y e s t n d a r q u e se o b tie n e n d e s p u s d e re e m p la z a r
lo s v a lo re s a u s e n te s p o r lo s d a to s im p u ta d o s. T al y c o m o h e m o s o b s e rv a d o en c o m p a ra c io n e s de
c o rre la c io n e s a n te rio re s, se p u e d e n d e te c ta r a lg u n a s d ife re n c ia s , p e ro no e x iste u n a p a u ta c o n
sisten te . P a ra las v a ria b le s X f y X 2, e x iste n d ife re n c ia s n o ta b le s en lo s v a lo re s e s tim a d o s. P a ra las
v a ria b le s re sta n te s lo s re su lta d o s s o n en g e n e ra l m u y sim ila re s e in c lu so id n tic o s. P o r ta n to , e! in
v e s tig a d o r n o tie n e q u e te n e r u n a in d ic a c i n d e fin itiv a d e cu l d e las a p ro x im a c io n e s es a p ro p ia
da. E n su lu g a r, tie n e q u e u n ir las p a u ta s d e d ato s a u s e n te s c o n lo s p u n to s fu e rte s y d b ile s para
c a d a a p ro x im a c i n y d e s p u s se le c c io n a r el m to d o m s a p ro p ia d o . E n el c a so d e e stim a c io n e s d i
fe re n te s, e l m to d o m a s ap ro p ia d o p o d ra se r la a p ro x im a c i n m s c o n s e rv a d o ra d e c o m b in a r las
e s tim a c io n e s en u n a n ic a e s tim a c i n (la a p ro x im a c i n d e im p u ta c i n m ltip le ). S ea cu a l se a la
a p ro x im a c i n q u e s e u sa , el c o n ju n to d e d a to s c o n v a lo re s d e re e m p la z o se d e b e ra c o n s e rv a r p ara
a n lis is p o ste rio re s.
1. E l p r o c e s o d e d a to s a u se n te s es M C A R . T o d as las t c n ic a s d e d ia g n o s is re s p a ld a n la c o n
c lu si n d e q u e n o e x iste un p ro c e so d e d ato s a u s e n te s s is te m tic o , q u e c o n v ie rte lo s d ato s
56 A N L IS IS M U L TIVA RIAN TE
a u s e n te s en M C A R (p ro c e so d e d a to s a u s e n te s c o m p le ta m e n te a le a to rio ). E ste in d ic io
p ro p o rc io n a al in v e stig a d o r d o s v e n ta ja s. E n p rim e r lu g a r, n o d e b e ra h a b e r un im p a c to
o c u lto " so b re lo s re su lta d o s q u e h a y a q u e c o n s id e ra r a la h o ra d e in te rp re ta r lo s re s u lta
d o s. En s e g u n d o lugar, se p u e d e a p lic a r c u a lq u ie ra do lo s m to d o s d e im p u ta c i n c o m o
so lu c i n p ara lo s d a to s a u se n te s. Su se le c c i n n o d e b e b a s a rs e e n su c a p a c id a d p ara tratar
c o n p ro c e s o s no a le a to rio s , sin o en la c a p a c id a d d e a p lic a r el p ro c e s o y s u im p a c to
so b re lo s resu ltad o s.
2. L a im p u ta c i n e s In fo r m a tic a c tu a r m s l g ica . D ad o el b e n e fic io m n im o d e la su p resi n
de ca so s y v a ria b le s, el in v e s tig a d o r d e b e e x c lu ir la s o lu c i n m s s im p le (s u p rim ir c a so s
o v a ria b le s ). A d em s, el m to d o del c a s o c o m p le to te n d ra c o m o re su lta d o u n ta m a o d e
m u e stra in a d e c u a d o . P o r ta n to , e s n e c e s a rio lle v a r a c a b o u n a im p u ta c i n c o n ei fin d e
m a n te n e r un ta m a o d e m u e stra a d e c u a d o p a ra c u a lq u ie r a n lis is m u ltiv a ria n te .
3. L a s c o rre la c io n e s im p u ta d a s so n d ife r e n te s en to d a s la s t c n ic a s. C u a n d o s e e s tim a n las
c o rre la c io n e s en tre v a ria b le s e n p re s e n c ia d e d a to s a u s e n te s, e l in v e s tig a d o r p u e d e e le g ir
e n tre tre s t c n ic a s c o m u n e s: el m to d o d e in fo rm a c i n c o m p le ta , el m to d o d e in fo rm a
c i n co n d is p o n ib ilid a d c o m p le ta y el m to d o d e su s titu c i n d e la m e d ia . N o o b sta n te , en
e sta situ a c i n se e n fre n ta co n d ife re n c ia s en los re su lta d o s e n tre e s to s tr e s m to d o s. L as
a p ro x im a c io n e s de in fo rm a c i n de d is p o n ib ilid a d c o m p le ta y d e su s titu c i n d e la m e d ia
c o n d u c e n , p o r re g la g e n e ra l, a re s u lta d o s c o n s iste n te s , a u n q u e lo s v a lo re s d e su stitu c i n
d e la m e d ia son g en e ralm e n te alg o m s b a jo s. H ay d iferen c ia s n o ta b les e n tre estas d o s api o-
xim acio rtes y la a p ro x im a c i n d e in fo rm a c i n c o m p le ta . M ie n tra s q u e la a p ro x im a c i n d e
in fo rm a c i n c o m p le ta p a re c e se r e l m to d o m s se g u ro y c o n s e rv a d o r, e n este c a s o no
e s re c o m e n d a b le d a d o el ta m a o re d u c id o d e la m u e stra u tiliz a d a (so la m e n te 2 0 o b s e rv a
c io n e s) y su s d ife re n c ia s d e s ta c a d a s c o n lo s o tro s d o s m to d o s . Si e s n e c e s a rio , e! in v e s
tig a d o r d eb e e le g ir e n tre las d o s a p ro x im a c io n e s a lte rn a tiv a s.
4. L o s m 'tods m ltip le s p a r a re e m p la za r lo s d a lo s a u se n te s est n d isp o n ib le s y \o n a p ro
p ia d o s . Tal y c o m o se h a m e n c io n a d o a n te rio rm e n te , la su stitu c i n d e la m e d ia es u n a d e
la s m a n e ra s a c e p ta b le s d e g e n e ra r v a lo re s d e s u stitu c i n p a ra lo s d ato s a u s e n te s. A denitis
el in \ e s tig a d o r tie n e a su d isp o s ic i n lo s m to d o s d e re g re si n y im p u tac i n E M . ca d a uno
de los c u a le s d an e s tim a c io n e s c o n s is te n te s p a ra la m a y o ra d e las v a ria b le s . La p rese n cia
de tres m to d o s a c e p ta b le s ta m b i n p e rm ite al in v e s tig a d o r c o m b in a r la s tre s e m u la c io
n e s en un co m p u esto , c o n la e s p e ra n z a d e m itig a r c u a lq u ie r efe cto q u e se d eb a esln ctu m eiu c
a u n o de e sto s m to d o s.
Resum en
L o s p ro c e d im ie n to s d isp o n ib le s p ara tr a ta r co n d a to s a u s e n te s v a ra n en fo rm a , c o m p le jid a d e
in te n c i n . El in v e stig a d o r d e b e e s ta r s ie m p re p re p a ra d o p a ra e v a lu a r y tra ta r co n lo s d a lo s a u s e n
tes q u e se e n c o n tra r co n fre c u e n c ia e n el a n lis is m u ltiv a ria n te . L a d e c isi n d e e m p le a r slo
o b s e rv a c io n e s c o n d ato s c o m p le to s tie n e u n a n a tu ra le z a c o n s e rv a d o ra y se g u ra , p e ro c o m o se
ha m o stra d o en las p g in a s a n te rio re s , e x is te n lim ita c io n e s in h e re n te s y se sg o s en este m to d o , as
c o m o en o tra s ap ro x im acio n es. El in v e stig a d o r n o tie n e un n ic o m to d o q u e se a ju ste m e jo r a ca d a
situ a c i n , sin o q u e d e b e h a c e r un ju ic io ra z o n a d o d e la situ a c i n , c o n s id e ra n d o to d o s lo s fac to re s
d e s c rito s a n te rio rm e n te .
A N L IS IS P R E V IO DE L O S DATOS 57
"t : s ' e
ii i - . iti- S * - ,
L o s c a so s a tp ic o s s o n o b s e rv a c io n e s c o n u n a c o m b in a c i n n ic a d e c a ra c te rs tic a s id e n tifica b le s
q u e les d ife re n c ia c la ra m e n te d e las o tra s o b se rv a c io n e s. L o s c a so s a tp ic o s no p u e d e n s e r c a ra c
te riz a d o s c a te g ric a m e n te c o m o b e n fic o s o p ro b le m tic o s sin o q u e d e b e n s e r c o n te m p la d o s en el
c o n te x to del a n lisis y d e b e n se r e v a lu a d o s p o r lo s tip o s d e in fo rm a c i n q u e p u e d e n p ro p o rcio n ar.
C u a n d o so n b e n fic o s, lo s c a s o s a tp ic o s , a u n q u e d ife re n te s a la m a y o r p a rte d e la m u e stra , p u e
d e n se r in d ic a tiv o s de las c a ra c te rs tic a s se g m e n to d e la p o b la c i n q u e se lle g ara n a d e s c u b rir en
e l c u rso n o rm a l d e l a n lis is. P o r e l c o n tra rio , lo s c a s o s a tp ic o s p ro b le m tic o s n o so n re p re se n ta
tiv o s de la p o b la c i n y e s t n en c o n tra d e lo s o b je tiv o s d e l a n lis is. L o s c a so s a tp ic o s p ro b le m
tic o s p u e d e n d isto rsio n a r se ria m e n te lo s te s t e s ta d stic o s. D e b id o a la v a ria b ilid a d e n la e v a lu a ci n
d e lo s c a so s a tp ic o s, se h a c e im p e ra tiv o q u e e l in v e s tig a d o r e x a m in e lo s d a to s en b u sc a d e la p re
s e n c ia d e c a so s a tip ic o s c o n el fin d e a v e rig u a r e l tip o d e in flu e n c ia q u e e je rc e n . S e re m ite al lec
to r a las e x p o s ic io n e s de! C a p tu lo 4 y al a p n d ic e d e e s e c a p tu lo , q u e a b o r d a el p ro b le m a d e las
o b s e rv a c io n e s in flu y e n te s. E n e s ta s d is c u s io n e s , lo s c a s o s a tp ic o s se sit a n en u n e sc e n a rio p a r
tic u la rm e n te a p ro p ia d o p a ra e v a lu a r la in flu e n c ia d e las o b s e rv a c io n e s in d iv id u a le s y d e te rm in a r
si e s ta in flu e n c ia e s b e n fic a o d a in a.
P o r q u su c e d e n lo s c a so s a tp ic o s ? P u e d e n s e r c la s ific a d o s e n c u a tro c a te g o ra s . L a p rim e ra
c a te g o ra c o n tie n e a q u e llo s c a so s a tp ic o s q u e s u rg e n d e u n e rro r d e p ro c e d im ie n to , ta le s c o m o la
e n tra d a d e d ato s o u n e rro r d e c o d ific a c i n . E sto s tip o s d e c a s o s a tp ic o s d e b e ra n id e n tific a rse en
e l n iv e l d e filtra d o de d a to s, p e ro si se p a s a n p o r a lto , d e b e ra n e lim in a rs e o re c o d ifc a rs e co m o
d a to s a u se n te s. L a se g u n d a c la se d e c a so a tp ic o es la o b se rv a c i n q u e o c u rre c o m o c o n se c u e n c ia
d e u n a c o n te c im ie n to e x tra o rd in a rio . E n e s te c a so , e x iste u n a e x p lic a c i n p a ra la u n ic id a d d e la
o b se rv a c i n . El in v e stig a d o r d e b e d e c id ir s i e l c a so a tp ic o d e b e ra s e r re p re s e n ta d o e n la m u estra.
Si es asi, el c a so atp ic o tie n e q u e s e r re te n id o en e l a n lis is; si no e s as, h a y q u e su p rim irlo . L a te r
c e r a c la se de c a so atp ic o c o m p re n d e las o b s e rv a c io n e s e x tra o rd in a ria s p a ra las q u e el in v e stig a d o r
n o tie n e ex p lic a c i n . A u n q u e e sto s s o n lo s c a s o s a tp ic o s m s a p ro p ia d o s p a ra se r o m itid o s, p u e
d e n re te n e rse si el in v e stig a d o r c re e q u e re p re s e n ta n u n s e g m e n to v lid o d e la p o b la c i n . L a c u a r
ta y ltim a c la se d e caso a tp ic o c o n tie n e las o b s e rv a c io n e s q u e s e s it a n fu e ra d el ra n g o o rd in ario
d e v alo re s de c a d a v a ria b le p e ro q u e so n n ic o s e n s u co m b in a c i n d e v a lo re s e n tre las v ariab les.
E n estas situ a c io n e s, e l in v e stig a d o r d e b e ra re te n e r la o b s e rv a c i n a m e n o s q u e se d isp o n g a d e
e v id e n c ia e sp e c fic a q u e e x c lu y a al c a s o a tp ic o c o m o un m ie m b ro v lid o d e la p o b laci n .
L a s sig u ie n te s se c c io n e s d e ta lla n lo s m to d o s u s a d o s e n la d e te c c i n d e c a s o s a tp ic o s p a ra las
s itu a c io n e s u n iv a ria n te s, b iv a ria n te s y m u ltiv a ria n te s . U n a v e z q u e lo s c a s o s a tp ic o s h an sid o
id e n tific a d o s, p u e d e n e sp e c ific a rse p a ra a y u d a r a s itu a rlo s en u n a d e las c u a tro c la se s a n te rio rm e n
te d e s c rita s . F in a lm e n te , el in v e s tig a d o r d e b e d e c id ir s o b re la re te n c i n o e x c lu s i n d e ca d a
c a s o a tp ic o , ju z g a n d o n o s lo las c a ra c te rs tic a s d e l c a s o a tp ic o , sin o ta m b i n lo s o b je tiv o s del
an lisis.
Deteccin univariante
Deteccin bivariante
Deteccin muitivariante
U n a v ez q u e se h an id e n tifica d o lo s p o te n c ia le s ca so s a tp ic o s, el in v e stig a d o r d e b e ra g e n e ra r id en
tific a c io n e s d e ca d a o b se rv a c i n a tp ic a y e x a m in a r c u id a d o s a m e n te q u e lo s d a to s d e las v aria b les
re s p o n s a b le s se a n c a s o s a tp ic o s. A d e m s d e e s to s e x m e n e s v is u a le s , el in v e s tig a d o r p u ed e
e m p le a r ta m b i n t cn ic as m u ltiv a ria n te s c o m o e l a n lisis d isc rim in a n te o la reg resi n m ltip le para
id e n tific a r las d ife re n c ia s e n tre io s c a s o s a tp ic o s y las o tra s o b se rv a c io n e s. El in v e s tig a d o r d eb e
ra c o n tin u a r este a n lis is h a s ta q u e s e a s a tis fa c to rio el a s p e c to d e lo s d a to s q u e d is tin g u e n el caso
a tp ic o d e l re sto d e las o b se rv a c io n e s. Si e s p o s ib le d e b e ra a s ig n a r el c a s o a tip ic o a u n o d e los
c u a tro tip o s y a estu d ia d o s.
20 30 4o 50 MI 70
X: Nixel de lideliduJ X,/ Nivel de fidelidad
: Calidad del produelo
TABLA 2 .9 . I d e n ti f i c a c i n d e c a s o s a t p i c o s u n i v a r i a n t e s y b i v a r i a n t e s
x i 39 x, 1 .3 9 , 9 5 .9 6
*2 71 a; 3 ,4 9 ,5 7 ,7 ,9 6 , 97
X, ninguno A', 1 1 ,5 7 ,9 6 , IDO
*4 82 Aj 5, 22, 42, 50, 72, 82, 93, 96
x. 96 X. 3 ,2 2 ,3 9 , 57, 7 1 ,9 6
X, 5 .4 2 X 5 .7 ,4 2 ,8 2 , 96
X, ninguno a; 57, 58, 9 5 ,9 6
X9 ninguno
x ia ninguno
Deteccin multivariante
N m ero M a h id u n o h is N m e ro M a h t ih m o h is
d e casos D' D '-igl & S ig n ific a c i n d e casos D: D fg ! gl S i g n if i c a c i n
l 7 ,0 3 1 1 .0 0 4 7 0 .4 2 5 6 51 6 .3 6 2 0 .9 0 9 7 0 ,4 9 8 2
i 6 ,6 9 1 0 .9 5 6 7 0 .4 6 1 7 52 8 .4 6 7 1.210 7 0 ,2 9 3 2
3 7 .5 6 7 ! .081 7 0 .3 7 2 3 53 6 .9 1 3 0 .9 8 8 7 0 ,4 3 8 0
4 7 ,1 0 3 1 .0 1 5 7 0 .4 1 8 2 54 3 .2 4 4 0 .4 6 3 7 0 .8 6 1 5
5 1 2 ,8 7 0 1 .8 3 9 7 0 .0 7 5 3 55 3 5 .1 9 7 5 .0 2 8 7 0.0000
6 0 .5 1 7 0 .9 3 1 7 0 .4 8 0 9 56 3 .0 8 2 0 ,4 4 0 7 0 ,8 7 7 3
7 8 ,6 3 4 1 ,2 3 3 7 0 .2 8 0 0 57 1 0 .4 8 8 1 .4 9 8 7 0 ,1 6 2 6
8 6 .5 6 3 0 .9 3 8 7 0 .4 7 5 8 58 5 ,2 6 5 0 ,7 5 2 7 0 .6 2 7 6
9 6 ,3 7 5 0 ,9 1 1 7 0 .4 9 6 7 59 4 .3 4 8 0 ,6 2 1 7 0 ,7 3 9 0
10 3 .6 2 6 0 .5 1 8 7 0 .8 2 1 7 60 7 .0 1 2 1.002 7 0 ,4 2 7 6
11 4 .2 3 7 0 ,6 0 5 7 0 ,7 5 2 2 61 1 3 .0 0 ! 1 .8 5 7 7 0 .0 7 2 1
12 3 .3 8 9 0 ,4 8 4 7 0 ,8 4 6 8 62 5 ,7 9 8 0 ,8 2 8 7 0 ,5 6 3 5
13 3 ,7 6 8 0 ,5 3 8 7 0 ,8 0 6 1 63 3 .3 2 2 0 .4 7 5 7 0 .8 5 3 7
14 5 ,0 3 0 0 .7 1 9 7 0 .6 5 6 3 64 6 .9 2 6 0 ,9 8 9 7 0 ,4 3 6 7
15 8 ,9 6 2 1 ,2 8 0 7 0 ,2 5 5 4 65 1 1 .6 8 3 1 .6 6 9 7 0 .1 1 1 5
16 6 .3 9 8 0 ,9 1 4 7 0 .4 9 4 2 66 2 .1 0 9 0 ,3 0 1 7 0 ,9 5 3 6
17 7 .2 1 2 1 ,0 3 0 7 0 .4 0 7 1 67 4 .3 8 2 0 .6 2 6 7 0 ,7 3 4 9
18 5 .3 5 0 0 ,7 6 4 7 0 ,6 1 7 3 68 5 .9 2 5 0 .8 4 6 7 0 .5 4 8 6
19 5 .8 9 9 0 .8 4 3 7 0 ,5 5 1 6 69 4 .8 7 8 0 .6 9 7 7 0 .6 7 4 9
20 8 ,9 6 2 1 .2 8 0 7 0 .2 5 5 4 70 5 .0 5 7 0 ,7 2 2 7 0 .6 5 3 0
21 2 .9 7 8 0 ,4 2 5 7 0 .8 8 7 0 71 8 .2 9 4 1 ,1 8 5 7 0 ,3 0 7 4
os 3 5 ,3 9 0 5 ,0 5 6 7 0.0000 72 1 0 .0 9 5 1 .4 4 2 7 0 .1 8 3 3
23 8 ,3 3 3 1 .1 9 0 7 0 .3 0 4 2 73 5 ,8 8 7 0 .8 4 1 7 0 ,5 5 3 0
24 2 .9 7 4 0 ,4 2 5 7 0 ,8 8 7 4 74 5 ,3 6 3 0 ,7 6 6 7 0 ,6 1 5 7
25 4 .9 0 9 0 ,7 0 1 7 0 ,6 7 1 1 75 6 ,4 7 1 0 ,9 2 4 7 0 .4 8 5 9
26 3 ,4 6 3 0 ,4 9 ? 7 0 ,8 3 9 1 76 4 .9 2 5 0 ,7 0 4 7 0 .6 6 9 1
>7 3 ,1 7 1 0 ,4 5 3 7 0 .8 6 8 7 77 5 .8 4 7 0 ,8 3 5 7 0 .5 5 7 7
28 5 ,7 6 5 0 .8 2 4 7 0 .5 6 7 4 78 7 .5 2 2 1 ,0 7 5 7 0 .3 7 6 6
29 7 .6 0 1 1 ,0 8 6 7 0 .3 6 9 1 79 1 2 .2 7 9 1 ,7 5 4 7 0 .0 9 1 8
30 5 .1 8 8 0 ,7 4 1 7 0 .6 3 7 0 80 2 ,2 7 0 0 ,3 2 4 7 0 .9 4 3 4
31 2 ,7 5 1 0 ,3 9 3 7 0 .9 0 7 1 8! 4 ,9 4 3 0 ,7 0 6 7 0 ,6 6 6 9
32 7 .0 2 4 1 .0 0 3 7 0 .4 2 6 4 82 1 4 .1 1 8 2 ,0 1 7 7 0 .0 4 9 1
33 5 .6 7 8 0 .8 1 1 7 0 .5 7 7 8 83 6 ,8 3 7 0 ,9 7 7 7 0 .4 4 6 0
34 3 .5 2 9 0 .5 0 4 7 0 .8 3 2 1 84 2 ,3 6 6 0 ,3 3 8 7 0 ,9 3 6 9
35 6 .5 3 9 0 ,9 3 4 7 0 .4 7 8 4 85 3 .0 1 6 0 .4 3 1 7 0 .8 8 3 5
36 2 .9 0 0 0 ,4 1 4 7 0 .8 9 4 1 86 3 ,4 9 3 0 ,4 9 9 7 0 ,8 3 5 9
37 6 .7 0 4 0 .9 5 8 7 0 ,4 6 0 3 87 3 ,3 5 4 0 ,4 7 9 7 0 .8 5 0 4
38 3 .0 3 0 0 .4 3 3 7 0 .8 8 2 3 88 2 .4 1 7 0 ,3 4 5 7 0 .9 3 3 2
39 1 0 .2 1 3 1 ,4 5 9 7 0 .1 7 6 8 89 6.011 0 ,8 5 9 7 0 ,5 3 8 5
40 3 .8 2 7 0 .5 4 7 7 0 ,7 9 9 5 90 4 .8 6 0 0 .6 9 4 7 0 .6 7 7 1
41 2 .8 9 8 0 .4 1 4 7 0 ,8 9 4 3 91 3 ,7 6 3 0 ,5 3 8 7 0 .8 0 6 7
42 1 2 .2 8 2 1 ,7 5 5 7 0 ,0 9 1 7 92 5 ,8 4 1 0 ,8 3 4 7 0 ,5 5 8 4
43 7 .1 2 9 1. 0 ) 8 7 0 ,4 ) 5 6 93 1 4 .3 2 8 2 .0 4 7 7 0 ,0 4 5 6
44 4 ,8 1 9 0,688 7 0 .6 8 2 1 94 5 ,4 0 7 0 ,7 7 2 7 0 .6 1 0 5
45 6 .6 7 0 0 ,9 5 3 7 0 ,4 6 4 0 95 7 ,3 9 1 1 ,0 5 6 7 0 .3 8 9 3
46 7 .4 7 5 1 ,0 6 8 7 0 .3 8 1 1 96 1 6 ,7 0 8 2 ,3 8 7 7 0 .0 1 9 4
47 1 4 .0 9 4 2 .0 1 3 7 0 .0 4 9 5 97 8 ,1 9 5 1,171 7 0 ,3 1 5 7
48 6 ,1 5 2 0 ,8 7 9 7 0 .5 2 2 1 98 4 ,9 9 0 0 ,7 1 3 7 0 .6 6 1 2
49 7 ,5 6 1 1 ,0 8 0 7 0 ,3 7 2 9 99 5 ,5 8 7 0 ,7 9 8 7 0 .5 8 8 8
50 9 ,0 2 9 1 ,2 9 0 7 0 ,2 5 0 6 100 4 .7 0 4 0 ,6 7 2 7 0 .6 9 6 0
x l = G rad o s d e libertad.
M altalanobis D - v alo r q u e se b a sa en las sig u ien tes v ariab les (A . .V,. A,. A'., A,, X h y A'.). El v alo r D'-lgl est d istrib u id o ap ro x im ad am en te
c o m o un t alo r /.
d ic ia le s si se c o n s id e ra n se p a ra d a m e n te . E n se g u n d o lugar, la c o m p le jid a d d e lo s a n lis is y d e los
re su lta d o s p u e d e n e n m a sc a ra r los s ig n o s d e la s v io la c io n e s d e los s u p u e sto s q u e so n ap a ren te s
e n los m s s e n c illo s a n lisis m u ltiv a ria n te s . E n c a si to d o s lo s e je m p lo s , lo s p ro c e d im ie n to s m u l
tiv a ria n te s e s tim a r n el m o d e lo m u ltiv a ria n te y p ro d u c ir n re su lta d o s in c lu s o c u a n d o lo s su p u e s
to s s e v e a n se v e ra m e n te in c u m p lid o s . P o r ta n to , el in v e stig a d o r d e b e e s ta r a te n to a c u a lq u ie r
in c u m p lim ie n to de lo s su p u e sto s y a las im p lic a c io n e s q u e p u e d a n te n e r p a ra e! p ro c e so d e e s ti
m a c i n o in te rp re ta c i n de lo s re su lta d o s.
N orm alidad
El s u p u e s to fu n d a m e n ta l del a n lis is m u ltiv a ria n te es la n o r m a l id a d d e lo s d a to s, e n re fe re n c ia al
p e rfil d e la d istrib u c i n de lo s d a to s p a ra u n a n ic a v a ria b le m tric a y s u c o rre s p o n d e n c ia co n una
d is t r ib u c i n n o r m a l , p u n to d e re fe re n c ia d e lo s m to d o s e s ta d stic o s. Si la v a ria c i n re sp e c to d e
la d istrib u c i n n o rm a l es su fic ie n te m e n te a m p lia , to d o s lo s te st e s ta d stic o s re s u lta n te s n o son
v lid o s, d a d o q u e se re q u ie re la n o rm a lid a d p a ra el u so d e lo s e s ta d stic o s d e ia t y d e la F . Tanto
los m to d o s e s ta d s tic o s u n iv a ria n te s c o m o lo s m u ltiv a ria n te s an a liz a d o s en e s te te x to se b a s a n en
el su p u e sto de la n o rm alid ad u n iv a rian te , su p o n ie n d o ta m b i n los m u ltiv aria n tes la n o rm a lid a d m ul
tiv a ria n te . L a n o rm a lid a d u n iv a ria n te p a ra u n a n ic a v a ria b le e s f c il d e c o n tra sta r, sie n d o p o sib le
v a ria s m e d id a s c o rre c to ra s, tal y c o m o se d e m u e s tra m s ad e la n te. D ic h o d e fo rm a se n c illa , la n o r
m a lid a d m u ltiv a ria n te (la c o m b in a c i n de d o s o m s v a ria b le s ) im p lic a q u e la s v a ria b le s in d iv i
d u a le s so n n o rm a le s en un se n tid o u n iv a ria n te y q u e su s c o m b in a c io n e s ta m b i n s e a n n o rm ales.
P o r ta n to , si u n a v a ria b le es u n a n o rm a l m u ltiv a ria n te , es ta m b i n n o rm a l u n iv a ria n te . S in e m b a r
g o , lo c o n tra rio n o e s n e c e s a ria m e n te c ie rto (d o s o m s v a ria b le s n o rm a le s u n iv a ria n te s n o so n n e
c e s a ria m e n te n o rm a l m ultiv aria n te). P o r ta n to , u n a s itu a c i n en la q u e to d a s las v a ria b le s ex h ib en
n o rm a lid a d u n iv a rian te ay u d ar a o b te n e r n o rm a lid a d m u ltiv aria n te, au n q u e n o la g ara n tiza . L a nor
m a lid a d m u ltiv a ria n te es m u c h o m s difcil d e co n trastar, au n q u e e x iste n v ario s te st p a ra situ acio n es
en las q u e la t c n ic a m u ltiv aria n te se ve p artic u la rm e n te afe cta d a p o r u n a v io la ci n d e los supuestos.
E n e s te te x to , n o s c e n tra re m o s e n e v a lu a r y a lc a n z a r la n o rm a lid a d u n iv a ria n te p a ra to d a s las
v a ria b le s y ac u d irem o s a la m u ltiv aria n te cu a n d o se a esp ec ialm en te crtica. In clu so au n q u e las m u es
tr a s g ra n d e s tie n d a n a d is m in u ir lo s e f e c to s p e rn ic io s o s d e la n o n o rm a lid a d , e l in v e stig a d o r
d e b e ra e v a lu a r la n o rm a lid a d d e to d a s las v a ria b le s in c lu id a s e n el an lisis.
G rfico de G rfico de
probabilidad normal univariante probabilidad norm al univariante
fe) D istrib u ci n negativa (l i D istrib u ci n positiva
FIG U R A 2 .7 . G r fic o s d e d is tr ib u c i n n o r m a l y la s c o r r e s p o n d ie n te s d is tr ib u c io n e s u n iv a r ia n te s .
A N L IS IS P R E V IO DE L O S DATOS 65
la d ia g o n a l, m ie n tr a s q u e un a r c o p o r e n c im a d e la d ia g o n a l r e p r e s e n ta u n a d is tr ib u c i n
p o s itiv a m e n te s im tr ic a ( F ig u ra 2 .7 0 - U n a e x c e le n te fu e n te p a ra in te r p r e ta r lo s g r fic o s d e
d is trib u c i n n o rm a l q u e m u e stre n lo s d iv e rs o s m o d e lo s e in te rp re ta c io n e s es D an ie l y W o o d [5],
E sto s m o d e lo s e sp ec fico s no s lo id e n tifica n la n o n o rm a lid a d , sin o q u e ta m b i n n o s d ic en la form a
d e la d istrib u c i n o rig in a l y la so lu c i n a p ro p ia d a a ap lica r.
sim e tra
s im e tr a
i
d o n d e N es e l ta m a o de la m u e stra . U n v a lo r z ta m b i n p u e d e s e r c a lc u la d o p a ra el v a lo r d e cur-
to s is u tiliz a n d o la s ig u ie n te fo rm u la:
c u rto s is
cur,osis^ y 2 4 V
H om ocedasticidad
L a h o m o c e d a s tic id a d es u n su p u e sto re la tiv o p rim o rd ia lm e n te a las rela cio n e s d e d e p e n d e n c ia e n
tre v a ria b le s. S e re fie re al su p u e sto d e q u e las v a ria b le s d e p e n d ie n te s e x h ib a n ig u a le s n iv e le s d e
v a ria n z a a lo larg o del ra n g o d e l p re d ic to r d e la v a ria b le s . L a h o m o c e d a s tic id a d es d e s e a b le p o r
q u e la v a ria n z a d e la v a ria b le d e p e n d ie n te q u e se e s t e x p lic a n d o en la re la c i n d e d e p e n d e n c ia 110
d e b e ra c o n c e n tra rse s lo en u n lim ita d o ra n g o d e lo s v a lo re s in d e p e n d ie n te s. A u n q u e la s v a r ia
b le s d e p e n d ie n te s d e b e n s e r m tric a s , e s te c o n c e p to d e ig u al d isp e rs i n d e la v a ria n z a a lo larg o
d e la s v a ria b le s in d e p e n d ie n te s p u e d e a p lic a rs e c u a n d o las v a ria b le s s o n m tric a s o n o m tric a s.
C o n v a ria b le s in d e p e n d ie n te s m tric a s , el c o n c e p to d e h o m o c e d a stic id a d se b a s a e n la d isp e rs i n
d e la v a ria n z a de la v a ria b le d e p e n d ie n te a lo la rg o d el ra n g o d e lo s v a lo re s d e la v a ria b le in d e
p e n d ie n te , q u e se e n c u e n tra en t c n ic a s c o m o la re g re si n m ltip le . El m is m o c o n c e p to s e a p lica
ta m b i n cu a n d o las v a ria b le s in d e p e n d ie n te s s o n n o m tric a s. E n e s to s c a so s, tal y c o m o se e n
c u e n tra n e n A N O V A y M A N O V A , el c e n tro e s a h o ra la ig u a ld a d d e la v a ria n z a (u n a v a ria b le d e
p e n d ie n te ) o la m a triz de v a ria n z a /c o v a ria n z a (v a ria s v a ria b le s in d e p e n d ie n te s) a lo la rg o d e los
g ru p o s fo rm a d o s p o r la s v a ria b le s in d e p e n d ie n te s n o m tric a s. L a ig u a ld a d d e las m a tric e s d e v a
ria n z a /c o v a ria n z a se o b se rv a ta m b i n en el a n lis is d isc rim in a n te , p e ro en e sta t c n ic a el n fa sis
es e n la d isp e rs i n de la s v a ria b le s in d e p e n d ie n te s a lo la rg o d e lo s g ru p o s f o rm a d o s p o r la m e d i
da d e p e n d ie n te no m trica. E n c a d a u n o d e e s to s c a s o s, e l p ro p sito es el m is m o : a s e g u r a r q u e la
v a ria n z a u sa d a en la e x p lic a c i n y p re d ic c i n se d isp e rs e a trav s d el ran g o d e v a lo re s, p e rm itie n d o
as u n te st lim p io de las re la c io n e s a lo la rg o d e to d o s lo s v a lo re s d e las v a ria b le s n o m tric a s.
E n la m ay o ra d e las situ acio n es, te n e m o s d iferen tes v alo re s d e la v aria b le d e p e n d ie n te p a ra cad a
v a lo r d e la v aria b le in d ep en d ien te. P ara q u e e s ta rela ci n se cap te co m p le ta m e n te , la d isp e rs i n (v a
ria n z a ) d e lo s v a lo re s de la v a ria b le d e p e n d ie n te d e b e s e r ig u al p a ra c a d a v a lo r d e la v a ria b le p re
d ic to r. L a m a y o ra de lo s p ro b le m a s c o n v a ria n z a s d e s ig u a le s su rg en d e una d e e s ta s d o s fu en te s.
L a p rim e ra es el tip o de v a ria b le s in c lu id a s en el m o d e lo . P o r e je m p lo , a m e d id a q u e u n a v a ria b le
a u m e n ta en v a lo r (es decir, c u a n d o la s u n id a d e s v a n d e s d e c e ro a m illo n e s ), e x iste u n ra n g o m s
a m p lio d e re sp u e sta s p o sib le s p a ra lo s v a lo re s m s ele v a d o s. L a se g u n d a fu e n te s u rg e d e u n a d is
trib u c i n sim trica q u e cre a h e tero ce d aslicid a d . E n la F ig u ra 2 .8 a, los g r tic o s d e d isp e rs i n d e p u n
to s d e lo s d a to s p a ra d o s v a r ia b le s ( f j y I',) c o n d is trib u c io n e s n o rm a le s e x h ib e n la m ism a
d is p e rs i n a lo larg o d e to d o s lo s v a lo re s d e lo s d a to s (es d ecir, h o m o c e d a s tic id a d ). S in e m b a rg o ,
en la F ig u ra 2 .8 b , o b se rv a m o s ta m b i n u n a d isp e rs i n d e s ig u a l ( h e te r o c e d a s tic id a d ) p ro v o c a d a
p o r la sim e tra de u n a d e las v a ria b le s ( F ,). P a ra d ife re n te s v a lo re s d e V r te n e m o s d ife r e n te s p a u
ta s d e d isp e rs i n p a ra F ,. E sto p ro v o c a r q u e las p re d ic c io n e s se a n m e jo re s a c ie r to s n i\ d e s d e !a
v a ria b le in d e p e n d ie n te q u e a o tro s. V io la n d o e s te su p u e sto a m e n u d o re a liz a m o s u n o s te st d e las
h ip te s is m uy c o n se rv a d o re s o d e m a s ia d o se n sib le s.
Linealidad
L a lin e a l id a d es u n su p u e sto im p lc ito d e to d a s las t c n ic a s m u ltiv a ria n te s b a s a d a s e n m e d id a s d e
c o rre la c i n , in c lu y e n d o la re g re si n m ltip le , re g re s i n lo g stic a , a n lisis fa c to ria l y lo s m o d elo s
d e e c u a c io n e s estru c tu ra le s. D ad o q u e la s c o rre la c io n e s re p re se n ta n s lo la a s o c ia c i n lin e al e n
tre v a ria b le s , lo s e fe c to s no lin e a le s n o e s ta r n re p re se n ta d o s en e l v a lo r d e la c o rre la c i n . C o m o
re s u lta d o , es s ie m p re p ru d e n te e x a m in a r to d a s la s re la c io n e s p a ra id e n tific a r c u a lq u ie r d e s p la z a
m ie n to de la lin e alid ad q u e p u e d a im p a c ta r la c o rre la c i n .
Si s e d e te c ta u n a re la c i n no lin e a l, la a p ro x im a c i n m s d ire c ta es tr a n s fo rm a r u n a o a m b a s v a
riab les p a ra co n se g u ir la linealidad. P o ste rio rm e n te en este cap im lo . se d isc u tirn u n as c u a n ta s tra n s
fo rm a c io n e s. U n a a lte rn a tiv a a la tra n s fo rm a c i n d e lo s d a to s es la c re a c i n d e u n a n u e v a v a ria b le
q u e re p re se n te la p a rle no lin e a l d e la re la c i n . El p ro c e so d e c re a r e in te rp re ta r e s to s re su lta d o s
a d ic io n a le s, q u e p u e d e n u sa rse e n to d a s la s re la c io n e s lin e a le s, se d is c u te en e l C a p tu lo 4.
(a)
ib ) (d i
FIG U R A 2 .9 . S e l e c c i n d e t r a n s f o r m a c i o n e s p a r a c o n s e g u i r la l i n e a l i d a d .
F u e n te : F. M o s te lle r y J . W . T u k e y . D a ta A n a ly s is a n d R e g r e s i n . R e a d irtg , M a s s .: A d d is o n - W e s le y , 1977.
Normalidad
o.oo
0.00 0,25 0,50 0.75 1.00 0,00 0,25 0,50 0.75 1.00
X| (Velocidad de entrega) X (Nivel de precios) X 3 (Flexibilidad de precios)
0.75
y 0.75 y
0.75 y
0.50
y y y
/ y
OJO OJO
0,00
0.00 0,25 OJO 0.75 1,00
0.00
0,00
0.25
0.50 0,75 1.00
0.00
' 0,00
y 0,25 0.50 0,75 1.00
X-j (Calidad del producto) Xg (Nivel de fidelidad) X0 (Nivel de satisfaccin)
ANALISIS
M U LTIV A RIA N TE
TABLA 2 .1 1 . C a r a c t e r s t i c a s d e la d i s t r i b u c i n , la p r u e b a d e la n o r m a l i d a d y p o s i b l e s s o l u c i o n e s
A'j Velocidad de entrega -0,085 -0,35 -0,511 1,07 0,063 > 0,200 Distribucin normal Ninguna
X Nivel de precios 0,469 1,95* -0,509 1.06 0,095 0,028 Simetra positiva Raz cuadrada > 0,200
X$ Flexibilidad -0,289 1,19 -1,073 2,24* 0,095 0,027 Acercam iento a la Ninguna
de precios distribucin normal
Imagen 0.218 0,91 0.085 0,18 0,107 0,007 Simetra positiva ligera Sin mejora
del productor posible
A5 Servicio conjunto -0,373 1,55 0,141 0,29 0.085 0,069 Distribucin normal Ninguna
A'(, Imagen de la 0,493 2,04* 0,107 0,22 0.122 0,001 Cola cargada con Raiz cuadrada 0,032
fuerza de ventas sim etra positiva
Xy Calidad del producto 0,229 0,95 -0 ,8 5 0 1,77 0,091 0.041 Ligeramente plana Ninguna
A9 Nivel de fidelidad -0,069 0,26 -0,725 1,52 0,079 0,131 D istribucin normal N inguna
A j0 Nivel de satisfaccin 0.089 0,37 -0,763 1,60 0,078 0,142 Distribucin normal N inguna
" L os v a lo re s : se d e riv an c o n la d iv isi n d e las estad sticas p o r los erro re s estndares a p ro p iad o s de 0,241 (sim etra ) y 0 ,4 7 8 (cu rto sis). S e p ro p o rcio n an la s ecu ac io n e s p a ra ca lc u la r los
erro re s est n d a re s e n el texto.
* S ie n ific a n tc al nivel d e 0,05.
A N L IS IS P R E V IO D E LOS DATOS 73
V ariable original
S im etra C urtosis
L os valores z se derivan con la divisin d e las estadsticas p o r ios errores estndares apropiados de 0.241 (si
m etra) y 0.478 (curtosis). Se proporcionan las ecuaciones para calcular los errores estndares en e! texto.
F IG U R A 2 .1 1 . T r a n s f o r m a c i n d e X 2 ( n iv e l d e p r e c i o ) p a r a l o g r a r la n o r m a l i d a d .
74 A N L I S IS M U L T I V A R I A N T E
H om ocedasticidad
T o d o s lo s p a q u e te s e s ta d stic o s c o n tie n e n te s t p a ra e v a lu a r la h o m o c e d a s tic id a d s o b re u n a b a se
u n iv a ria n te (p o r e je m p lo , el te st d e L e v e n e e n S P S S ) d o n d e se c o m p a ra la v a ria n z a d e u n a v a ria b le
m tric a a lo la rg o d e io s n iv e le s d e la s v a ria b le s n o m tric a s. D e a c u e rd o c o n n u e s tro s o b je tiv o s,
e x a m in a re m o s ca d a u n a d e las v a ria b le s m tric a s a lo la rg o d e la s c in c o v a ria b le s n o m tric a s en
el c o n ju n to de d ato s. E sto s a n lis is so n a p ro p ia d o s e n p re p a ra c i n ta n to d el a n lis is d e la v a ria n z a
c o m o d e l a n lisis m u ltiv a ria n te de la v a ria n z a d o n d e las v a ria b le s n o m tric a s s o n las v a ria b le s
in d e p e n d ie n te s , o el a n lis is d is c rim in a n te d o n d e la s v a r ia b le s n o m tr ic a s s o n la s m e d id a s
d e p e n d ie n te s.
L a T ab la 2 .1 2 c o n tie n e lo s re s u lta d o s d e l te s t d e L e v e n e p a ra c a d a u n a d e la s v a ria b le s . L a s v a
ria b le s n o m tric a s X Ky A'n m u e stra n a m b a s h e te ro c e d a stic id a d e s s ig n ific a tiv a s s o b re lo s m is m o s
fa c to re s de d esarro llo {X, A ', X 6 y X 7), m ie n tra s q u e A ', y A' 4 tie n e n p o c a s o c u rre n c ia s e n tre el c o n
ju n to c o m p le to de v aria b les. L a s im p lic a c io n e s d e e s to s e je m p lo s d e h e te ro c e d a s tic id a d d e b e n s e r
e x a m in a d a s d o n d e q u ie ra q u e se a n e v a lu a d a s las d ife re n c ia s d e g ru p o s, u sa n d o ta n to v a ria b le s no
m tric a s c o m o v a ria b le s in d e p e n d ie n te s, c o m o v a ria b le s m tric a s q u e se c o n s id e re n d e p e n d ie n te s .
S i se e n c o n tra ra alg n in c u m p lim ie n to d e lo s su p u e sto s , e x iste n tra n s fo rm a c io n e s d e la v a ria b le
p a ra a y u d a r a re m e d ia r la d isp e rs i n de la v a ria n z a .
T A B L A 2 .1 2 . T e st d e h o m o c e d a s tic id a d
Variable no mtrica/categrica
*: *13
Tamao Compra Estructura Tipo Tipo de situacin
de la empresa de especificacin de obtencin de industria de compra
X, Velocidad 0.934 0.336 0,934 0,336 0,382 0,538 0,377 0,540 0.114 0,892
de entrega
X . Nivel de precios 1,582 0,2 U 1,582 0,211 13,76! 0,000 1,345 0,249 8,081 0,001
A, Flexibilidad 1,194 0,277 1,194 0.277 4,765 0,031 0,192 0.662 14,383 0,000
de precios
X t Imagen 6,549 0.012 6,549 0,012 0,281 0,597 0.040 0,842 2,030 0,137
del productor
A', Servicio 7,819 0.006 7,819 0.006 5,141 0,026 0,003 0,957 2,888 0,060
conjunto
X (t Imagen de la 5,279 0,024 5,279 0,024 1,626 0,205 0,264 0,609 1,735 0,182
fuerza de ventas
X , Calidad 8,748 0,004 8,748 0,004 4,129 0,045 2,532 0,115 2,051 0,134
de producto
A, Nivel 1,377 0,243 1,377 0,243 1,575 0,212 0,091 0,763 0,056 0,945
de fidelidad
Aj(l Nivel de 0,323 0,571 0,323 0,571 0,000 0,986 0,054 0,817 3,302 0,041
satisfaccin
S o ia : L os v alo res re p re se n ta n el v alo r y la sig n ificaci n esta d stic a (S ig .) d e l test d e L ev en e c o n la valo raci n do la d isp e rsi n d e la varianza
de ca d a v a ria b le m tric a a tra v s d e los n iv eles d e la s v a ria b le s n o m tric a s'c a tc g ric a s.
A N L IS IS P R E V IO D E L O S D A T O S 75
Linealidad
E l su p u e sto fin a l a e x a m in a r e s la lin e a lid a d d e las re la c io n e s. E n el c a so d e v a ria b le s in d iv id u a
les, se re la c io n a n la s p a u ta s d e a s o c ia c i n e n tre c a d a p a r d e v a ria b le s y la c a p a c id a d d e l co eficien te
de c o rre la c i n p a ra re p re s e n ta r a d e c u a d a m e n te la re la c i n . S i h a y u n in d ic io d e re la c io n e s no li
n e a le s, en to n c e s el in v e stig a d o r p u e d e , ta n to tra n s fo rm a r u n a o a m b a s v a ria b le s p a ra c o n s e g u ir la
lin e a lid a d . c o m o c re a r v a ria b le s a d ic io n a le s p a ra re p re s e n ta r lo s c o m p o n e n te s n o lin e ales. N o s p o
d e m o s a p o y a r e n la in sp e c c i n v isu a l d e la s re la c io n e s p a ra d e te rm in a r si e s t n p re s e n te s re la c io
n e s n o lin eales. E l le c to r p u e d e i r a la F ig u ra 2 .3 , q u e p re se n ta lo s g r fic o s d e d isp e rs i n p a ra to d as
la s v a ria b le s m tric a s e n e l c o n ju n to d e d a to s . E l e x a m e n d e lo s g r fic o s d e d is p e rs i n n o rev e la
n in g u n a rela ci n ap a ren te . P o r ta n to , las tra n sfo rm a c io n e s n o se c o n sid e ra n n e c e sa ria s. E l su p u esto
d e lin e a lid a d se c o m p ro b a r ta m b i n p a ra e l m o d e lo m u ltiv a ria n te en te ro y c u n a d o se lle v e a cab o
e l e x a m e n de lo s re sid u o s e n la r e g re s i n m ltip le .
Resumen
L a s se rie s d e te st g r fic o s y e s ta d s tic o s d irig id o s h a c ia la e v a lu a c i n d e lo s su p u e sto s su b y a c e n
te s e n la s t c n ic a s m u ltiv a ria n te s d e s c u b re re a lm e n te p o c o e n t rm in o s d e v io la c io n e s d e o s su
p u esto s. D o n d e se h an in d icad o v io la c io n e s, s ta s h an sid o rela tiv a m en te p eq u e as y no p resen taran
n in g n p ro b le m a se rio p a ra el a n lis is d e d a to s p o ste rio r. S e a n im a al in v e s tig a d o r a re a liz a r sie m
p re e s to s e x m e n e s d e lo s d a to s s im p le s, a u n q u e re v e la d o re s , p a ra a s e g u ra r q u e p u e d a n id e n tifi
c a rse y re so lv e rse lo s p ro b le m a s p o te n c ia le s a n te s d e c o m e n z a r e l an lisis.
T A B L A 2 .1 3 . R e p r e s e n t a c i n d e v a r i a b l e s n o m t r i c a s c o n v a r i a b l e s f ic tic ia s
A.-
S:J
1. E n u m e re la s c a u sa s p o te n c ia le s d e e x is te n c ia d e c a so s a tp ic o s. A s e g re s e d e in c lu ir lo s atri
b u id o s ta n to al in v e stig a d o r c o m o al e n c u e s ta d o .
2. D isc u ta p o r q u lo s c a so s a tp ic o s p u e d e n c la s ific a rs e c o m o b e n e fic io s o s y p ro b le m tic o s.
3. D istin g a e n tre lo s p ro c e so s a le a to rio s d e d a to s au se n te s (M A R ) y lo s c o m p le ta m e n te aleato rio s
(M C A R ). E x p liq u e c m o in flu y e c a d a tip o d e p ro c e so e n e l a n lisis d e lo s d a to s au sen tes.
4. D e sc rib a la s c o n d ic io n e s b a jo las c u a le s u n a n a lis ta e lim in a ra u n c a s o c o n d a to s au sen te s y
las c o n d ic io n e s b a jo las c u a le s u n a n a lis ta u tiliz a ra un m to d o d e im p u ta c i n .
5. E v a l e la s ig u ie n te a firm a c i n : p a ra u tiliz a r la m a y o ra d e lo s a n lis is m u ltiv a ria n te s no es
n e c e s a rio q u e se c u m p la n to d o s lo s s u p u e sto s d e n o rm a lid a d , lin e a lid a d , h o m o c e d a s tic id a d e
in d e p e n d e n c ia .
6. D isc u ta la sig u ien te afirm aci n : lo s a n lisis m u ltiv aria n tes p u e d e rea liza rse s o b re c u a lq u ie r co n
ju n to d e d a to s, e n la m e d id a e n q u e e l ta m a o d e la m u e s tra s e a el a d e c u a d o .
X- *
3k i
/T
1. Anderson, Edgar (1969), A Semigraphical M ethod for vioral Sciences, 2d ed. Hillsdale, N.J.: Lawrence Erl-
the A nalysis o f Com plex Problem s. Technometrcs 2 baum Associates.
(August): 387-91. 5. Daniel, C ..an d F. S. Wood (1980). Fitting Eipiations to
2. Box, G. E. P., and D. R. Cox (1964), An A nalysis o f D ata, 2d ed. N ew York: W iley-Interscicncc.
T ransform ations. Jo u rn a l o f th e R o ya l S ta tistic a l 6. Dempster. A. P., and D. B. Rubin (1983), OverView,
Society B (26): 211-43. in Inconiplete D ata in S am ple Surveys: Theo/y and
3. C hernoff, H erm n. G raphical R epresentation as a A nnotated B ibliography. vol. 2. M adow, Olkin. and
D iscipline, in G raphical R epresentation o f M ulti- Rubin, eds. N ew York: Academ ic Press.
v a r a te D a ta , P e te r C . C . W ang, ed . N ew Y ork: 7. F ein b erg , Stcphen (1 9 7 9 ), G rap h ical M othods in
A cadem ic Press, pp. 1-11. S tatistic s. A m erica n S ta tistic ia n 33 (N ovem ber):
4. C ohn, Jacob, and P atricia C ohn (1983), A p p lie d 165-78.
M ltiple Regression/Correlation Analysis f o r the Beha 8. Johnson, R. A., and D. W. W ichem (1982), Applied
78 A N L IS IS M U L T IV A R IA N T E
Multivariale Statistical Analysis. U pper Saddie River, I!. Wcisbcrg, S. (1985), A pplied L inear Regression. New
N.J.: Pventice-Hall. York: Wilcy.
9. Little, Rodcrick J. A., and D onald B. Rubn (987), 12. Wilkinson. L. (1982), A Experim ental Evalualion of
Statisiica! Analysis f/i Mlssing Data. New York: Wilcy. M u ltiv ariate G raphical P o in t R c p re sc n tatio n s. In
10. Wang, PeterC . C ed. (1978), GraphicalRcpiesentation lla m a n Factors in C om puter System s: Praceedirtgs,
o/M ultivarlae Data. N ew York: Academic Press. N ew York: ACM Press, pp. 202-9.